Forscher am Center for Algorithmic and Robotized Synthesis des Institute for Basic Science haben durch die Nutzung der Leistungsfähigkeit künstlicher Intelligenz einen bedeutenden Schritt zum Verständnis der Stabilität von Proteinen gemacht.
Das Forschungsteam nutzte AlphaFold2, um zu untersuchen, wie Mutationen die Proteinstabilität beeinflussen – ein entscheidender Faktor, um sicherzustellen, dass Proteine richtig funktionieren und keine Krankheiten wie Alzheimer verursachen. Die Forschung ist veröffentlicht im Journal Briefe zur körperlichen Überprüfung.
Der AlphaFold-Algorithmus von DeepMind, der die Struktur eines Proteins anhand seines Gens genau vorhersagen kann, hat die gesamte Biologie revolutioniert und die Strukturbiologie für jedermann zugänglich gemacht. Trotz dieses immensen Erfolgs bleiben zwei grundlegende Fragen unbeantwortet: Werden die vorhergesagten Strukturen korrekt gefaltet und gefaltet bleiben? Und eine allgemeine Frage zu KI-Algorithmen: Wie funktioniert AlphaFold eigentlich?
Eine entscheidende Einschränkung von AlphaFold besteht darin, dass es anhand einer Reihe stabiler Proteine trainiert wurde, die bei physiologischen Temperaturen gefaltet bleiben. Daher sagt es die wahrscheinlichste gefaltete Struktur voraus, ohne zu wissen, ob sie sich mit Sicherheit falten wird oder instabil sein wird.
Die Kenntnis und Vorhersage der Proteinstabilität ist von entscheidender Bedeutung, da sich instabile Proteine falsch falten können, was zu Funktionsstörungen und möglicherweise schweren Erkrankungen führt. Daher müssen die Zellen viel Energie aufwenden, um sie loszuwerden.
Darüber hinaus sind die meisten Proteine nur bedingt stabil, was sie sehr anfällig für Mutationen macht, die ihre Entfaltung verursachen können. Bei der Proteintechnik geht es also vor allem um vorsichtiges Navigieren in einem Minenfeld dysfunktionaler Proteinsequenzen, die sich nicht falten. All dies impliziert, dass der nächste Schritt bei der Verwendung von AlphaFold darin bestehen sollte, zu versuchen, diese Stabilitätsänderungen aufgrund von Mutationen vorherzusagen.
Eine grundlegende Frage, die in dieser Studie untersucht wurde, war, ob AlphaFold die zugrunde liegende Physik der Proteinfaltung gelernt hat oder einfach eine hochdimensionale Regressionsmaschine ist, die lediglich statistische Muster erkennt. Bei dieser Frage geht es um die Fähigkeit zur Verallgemeinerung: Wenn AlphaFold irgendwie die physikalischen Kräfte gelernt hat, die dabei wirken, sollte es auch bei Proteinsequenzen funktionieren, die es noch nicht gesehen hat.
Genau das wollten die beiden IBS-Forscher John McBride und Tsvi Tlusty in ihrer Studie testen. Sie gingen diese Frage an, indem sie untersuchten, ob AlphaFold die Auswirkungen von Mutationen auf die Stabilität korrekt vorhersagen kann. Es gibt unendlich mehr Mutationen als Datenpunkte, die beim Training von AlphaFold verwendet werden, was bedeutet, dass selbst eine sehr ausgefeilte Regression nicht ausreicht, um die gesamte Bandbreite der Mutationseffekte zu berücksichtigen.
Diese Aufgabe ist sehr anspruchsvoll, da kritische Stabilitätsänderungen häufig kleine strukturelle Änderungen mit sich bringen, die schwer vorherzusagen sind. Dennoch stellt sich heraus, dass die von AlphaFold vorhergesagten strukturellen Änderungen einige nützliche Hinweise enthalten, die wertvolle Informationen über mögliche Stabilitätsänderungen liefern.
Die Forscher des IBS zeigten dies, indem sie die durch Mutationen verursachten Strukturveränderungen mit den experimentell gemessenen Stabilitätsunterschieden zwischen dem Wildtyp-Protein und dem mutierten Protein verglichen. Ein entscheidender Faktor war die Verwendung einer Sonde, die sehr empfindlich auf kleine Veränderungen reagiert. Die Forscher entwickelten eine innovative Messgröße, die als effektiver Stamm bezeichnet wird, um kleine, aber wichtige Veränderungen in der Proteinstruktur festzustellen, die mit der Stabilität in Zusammenhang stehen.
Bei der Untersuchung von Tausenden von Mutationen stellten sie fest, dass das effektive Dehnungsmaß mit dem Ausmaß der Stabilitätsänderung korreliert. Das heißt, große strukturelle Änderungen (vorhergesagt von AlphaFold) sagen auch große Stabilitätsänderungen voraus.
Der Hauptautor McBride erklärte: „Dies ist ein starker Hinweis darauf, dass die von AlphaFold vorhergesagten Strukturen wichtige physikalische Informationen, insbesondere über die Stabilität, kodieren. Um diese Informationen weiter zu entschlüsseln, müssen neue physikalische Modelle entwickelt werden.“
Diese Erkenntnisse eröffnen neue Möglichkeiten für das Protein-Engineering, ein Bereich, in dem Proteine mit spezifischen Funktionen entworfen werden. Durch ein besseres Verständnis, wie Mutationen die Stabilität beeinflussen, können Wissenschaftler sich effektiver in der komplexen Landschaft des Proteindesigns zurechtfinden, was möglicherweise zu Fortschritten bei der Arzneimittelentwicklung und der Behandlung von Krankheiten führen kann, die durch Proteinfehlfaltung verursacht werden.
Diese Forschung stellt einen wichtigen Meilenstein in der laufenden Erforschung der Frage dar, wie KI eingesetzt werden kann, um die Komplexität der Biologie zu entschlüsseln, und unterstreicht die Notwendigkeit weiterer Studien, um das Potenzial der KI für wissenschaftliche Entdeckungen voll auszuschöpfen.
Weitere Informationen:
John M. McBride et al, KI-vorhergesagte Proteindeformation kodiert Energielandschaftsstörung, Briefe zur körperlichen Überprüfung (2024). DOI: 10.1103/PhysRevLett.133.098401. An arXiv: DOI: 10.48550/arxiv.2311.18222