Wissenschaftler haben einen neuen Weg gefunden, um vorherzusagen, wie Proteine ihre Form verändern, wenn sie funktionieren. Dies ist wichtig, um zu verstehen, wie sie in lebenden Systemen funktionieren. Während es dank neuester künstlicher Intelligenz (KI) möglich ist, vorherzusagen, wie Proteine in ihrem Ruhezustand aussehen, ist es immer noch eine Herausforderung, herauszufinden, wie sie sich bewegen, da nicht genügend direkte Daten aus Experimenten zu Proteinbewegungen vorliegen, um die neuronalen Netzwerke zu trainieren.
In einer neuen Studie veröffentlicht im Verfahren der Nationalen Akademie der WissenschaftenPeter Wolynes von der Rice University und seine Kollegen in China kombinierten Informationen über Protein-Energielandschaften mit Deep-Learning-Techniken, um diese Bewegungen vorherzusagen.
Ihre Methode verbessert AlphaFold2 (AF2), ein Werkzeug, das statische Proteinstrukturen vorhersagt, indem es ihm beibringt, sich auf „energetische Frustration“ zu konzentrieren. Proteine haben sich so entwickelt, dass energetische Konflikte zwischen ihren Teilen minimiert werden, sodass sie in Richtung ihrer statischen Struktur gelenkt werden können. Wo Konflikte bestehen bleiben, spricht man von Frustration.
„Ausgehend von vorhergesagten statischen Grundzustandsstrukturen generiert die neue Methode alternative Strukturen und Wege für Proteinbewegungen, indem sie zunächst die energetischen Frustrationsmerkmale in den eingegebenen multiplen Sequenzalignment-Sequenzen, die die evolutionäre Entwicklung des Proteins kodieren, findet und dann schrittweise verbessert“, sagte Wolynes, Professor für Naturwissenschaften der DR Bullard-Welch Foundation und Co-Autor der Studie.
Die Forscher testeten ihre Methode an der Protein-Adenylat-Kinase und stellten fest, dass die vorhergesagten Bewegungen mit experimentellen Daten übereinstimmten. Sie konnten auch die funktionellen Bewegungen anderer Proteine vorhersagen, die ihre Form deutlich verändern.
„Die Vorhersage der dreidimensionalen Strukturen und Bewegungen von Proteinen ist von entscheidender Bedeutung für das Verständnis ihrer Funktionen und die Entwicklung neuer Medikamente“, sagte Wolynes.
Die Studie untersuchte auch die Funktionsweise von AF2 und zeigte, dass die Kombination physikalischer Kenntnisse über die Energielandschaft mit künstlicher Intelligenz nicht nur dabei hilft, die Bewegung von Proteinen vorherzusagen, sondern auch erklärt, warum die KI die strukturelle Integrität überschätzt und so nur zu den stabilsten Strukturen führt.
Die Energielandschaftstheorie, mit der Wolynes und seine Mitarbeiter seit Jahrzehnten arbeiten, ist ein zentraler Bestandteil dieser Methode, doch neuere KI-Codes wurden darauf trainiert, nur die stabilsten Proteinstrukturen vorherzusagen und die unterschiedlichen Formen zu ignorieren, die Proteine während ihrer Funktion annehmen können.
Die Energielandschaftstheorie geht davon aus, dass die Evolution zwar die Energielandschaft der Proteine so geformt hat, dass sie sich in ihre optimalen Strukturen falten können, Abweichungen von einer perfekt trichterförmigen Landschaft, die sonst die Faltung steuert – die sogenannte lokale Frustration – jedoch für die funktionellen Bewegungen von Proteinen wesentlich sind.
Indem die Forscher diese frustrierten Regionen genau identifizierten, brachten sie der KI bei, sie bei ihren Vorhersagen zu ignorieren, wodurch der Code alternative Proteinstrukturen und funktionelle Bewegungen präzise vorhersagen konnte.
Mithilfe eines im Rahmen der Energielandschaft entwickelten Frustrationsanalysetools identifizierten Forscher frustrierte und daher flexible Regionen in Proteinen.
Anschließend manipulierten die Forscher die evolutionären Informationen in den von AlphaFold verwendeten ausgerichteten Proteinfamiliensequenzen und brachten der KI im Einklang mit den Frustrationsbewertungen bei, diese frustrierten Regionen zu erkennen. Dadurch waren genaue Vorhersagen alternativer Strukturen und Pfade zwischen ihnen möglich, sagte Wolynes.
„Diese Forschung unterstreicht, wie wichtig es ist, physikbasierte Methoden in der Post-AlphaFold-Ära nicht zu vergessen oder aufzugeben, in der der Schwerpunkt auf agnostischem Lernen aus experimentellen Daten ohne theoretischen Input lag“, sagte Wolynes. „Die Integration von KI mit biophysikalischen Erkenntnissen wird zukünftige praktische Anwendungen erheblich beeinflussen, darunter Arzneimitteldesign, Enzymtechnik und das Verständnis von Krankheitsmechanismen.“
Weitere Autoren sind Xingyue Guana, Wei Wanga und Wenfei Lia vom Fachbereich Physik der Universität Nanjing, Qian-Yuan Tang vom Fachbereich Physik der Hong Kong Baptist University, Weitong Ren vom Wenzhou Key Laboratory of Biophysics der University of Chinese Academy of Sciences und Mingchen Chen vom Changping Laboratory in Peking.
Weitere Informationen:
Xingyue Guan et al., Vorhersage von Proteinkonformationsbewegungen mittels energetischer Frustrationsanalyse und AlphaFold2, Verfahren der Nationalen Akademie der Wissenschaften (2024). DOI: 10.1073/pnas.2410662121