Die Entwicklung von Proteinen mit gewünschten Eigenschaften ist der heilige Gral der modernen Biotechnologie. So kann die Lebensmittelindustrie beispielsweise von gentechnisch veränderten Enzymen profitieren, die im Vergleich zu natürlichen Enzymen biochemische Reaktionen bei höheren Temperaturen verbessern können. Dadurch können wertvolle Ressourcen wie Arbeit, Geld und Zeit gespart werden. Der Prozess, ein funktionales Protein mit den gewünschten Eigenschaften zu entwickeln, ist jedoch mit erheblichen Herausforderungen verbunden.
Aktuelle Ansätze der Proteintechnik, wie die gerichtete Evolution, verlassen sich stark auf den Zufall, um ideale Varianten des Proteins von Interesse einzugrenzen. Bei der gerichteten Evolution werden wiederholt Veränderungen der Proteinsequenz, sogenannte Mutationen, eingeführt (iterative Mutagenese), gefolgt von einem schnellen Screening einer großen Anzahl der Proteinvarianten (Hochdurchsatz-Screening). Es überrascht nicht, dass diese Methode arbeitsintensiv und ineffizient ist.
Um diese Einschränkungen zu überwinden, entwickelte eine Gruppe chinesischer Forscher unter der Leitung von Dr. Huifeng Jiang vom Tianjin Institute of Industrial Biotechnology der Chinesischen Akademie der Wissenschaften und dem National Center of Technology Innovation for Synthetic Biology eine auf künstlicher Intelligenz basierende Protein-Engineering-Strategie namens „DeepEvo“.
Dr. Jiang erläutert dies weiter: „DeepEvo verwendet eine Strategie der tiefen Evolution und kombiniert dabei die Prinzipien des tiefen Lernens – ein Prozess, der die Funktionsweise des lebenden Gehirns nachahmt – mit der Evolutionsbiologie.“ Die Studie wurde online veröffentlicht in BioDesign Forschung am 20. März 2024.
Die Forscher verwendeten DeepEvo, um ein Enzym namens Glycerinaldehyd-3-phosphat-Dehydrogenase (G3PDH) temperaturbeständiger zu machen. G3PDH baut während der Glykolyse in lebenden Zellen Glukose ab, um Energie zu erzeugen. Als das Team die DeepEvo-Ergebnisse experimentell validierte, erreichte es eine vielversprechende Erfolgsquote von über 26 %.
In der Studie umfassten die für DeepEvo verwendeten Daten Sequenzen von Organismen mit unterschiedlichen optimalen Wachstumstemperaturen (OGT) und natürlich vorkommende Sequenzen mit gewünschten Funktionen. Die entwickelte DeepEvo-Strategie umfasste einen Selektor (Thermo-Selektor) und einen Variantengenerator (Variantengenerator), um funktionelle Proteinsequenzen mit dem gewünschten Merkmal zu erzeugen.
Während der Selektor als Selektionsdruck wirkte, um die gewünschten Proteinsequenzen anzureichern, produzierte der Variantengenerator diese Sequenzen – in diesem Fall G3PDH-Varianten mit Hochtemperaturtoleranz. Die mit OGT markierten Sequenzen trainierten den Thermoselektor, während diejenigen mit der gewünschten Funktion den Variantengenerator trainierten. Der Thermoselektor filterte Sequenzen und leitete den Variantengenerator.
Insbesondere bildete ein Proteinsprachenmodell – eine Art Deep-Learning-Modell – die Grundlage für den in dieser Studie verwendeten Thermo-Selektor. Solche Modelle werden anhand großer Mengen realer Proteinsequenzdaten trainiert, um die diesen Sequenzen innewohnenden Muster und Merkmale zu erlernen. Dieser entwickelte Selektor verwendet eine erlernte Darstellung von Proteinsequenzen, um die Generierung und Auswahl von Sequenzen mit dem gewünschten Merkmal zu steuern.
Darüber hinaus akkumulierten die Forscher durch einen iterativen Prozess, an dem Generator und Selektor beteiligt waren, Hochtemperaturtoleranzmerkmale in den Proteinsequenzen. Die iterative Verfeinerung der als hochtemperaturtolerant vorhergesagten Sequenzen bildete einen Zyklus der Sequenzgenerierung.
Dr. Jiang erläutert dies weiter: „Der iterative Prozess von DeepEvo ahmt den Prozess der natürlichen Selektion nach, bei dem funktionelle Sequenzen bevorzugt und über aufeinanderfolgende Generationen hinweg angesammelt werden, was letztendlich zur Entwicklung von Proteinvarianten mit den gewünschten Eigenschaften führt.“
Anschließend überprüften die Forscher die vorhergesagten hochtemperaturtoleranten Proteinsequenzen, die funktionelle Motive bewahren, durch Nasslaborexperimente. Aus den 30 generierten Sequenzen erhielten sie acht Varianten, was die hohe Effizienz von DeepEvo bei der Entwicklung von Proteinen mit Hochtemperaturtoleranz unterstreicht.
In Zukunft könnte DeepEvo die Auswahl verschiedener interessanter Merkmale unterstützen, nicht nur die Hochtemperaturtoleranz. In diesem Zusammenhang bemerkt Dr. Jiang: „Wir könnten den DeepEvo-Ansatz für die Entwicklung anderer Proteineigenschaften wie Säure-Base-Toleranz, katalytische Aktivität und Antigenaffinität anwenden und so die Erzeugung neuer Proteine mit mehreren gewünschten Eigenschaften erleichtern.“
Dank der Bemühungen von Dr. Jiang und seiner Forschungsgruppe hat DeepEvo somit den Weg für effizientes Protein-Engineering geebnet. Die einfache und effiziente Produktion von Proteinen mit maßgeschneiderten Eigenschaften könnte bald Realität werden.
Mehr Informationen:
Huanyu Chu et al, Hochtemperatur-Toleranz-Protein-Engineering durch Deep Evolution, BioDesign Forschung (2024). DOI: 10.34133/bdr.0031