Mithilfe von drei KI-Tools zur Proteinvorhersage deckt die Studie neue Falten in der Faltungsgeschichte „verwaister“ Proteine ​​auf

Wenn Profs. Joel Sussman und Israel Silman wurden während der COVID-19-Pandemie gebeten, chinesische Studenten online zu betreuen. Das Letzte, was sie von dieser Erfahrung erwartet hatten, war eine hochinnovative Forschung zur Proteinevolution, die unser Verständnis darüber, wie neue Proteine ​​entstehen, verändern könnte .

„Zuerst war ich skeptisch – es waren alles Studenten, und die Kommunikation über einen Computerbildschirm erschien mir nicht besonders vielversprechend“, erinnert sich Sussman. Aber er und Silman – ein Professorenduo des Weizmann Institute of Science, das Hunderte gemeinsamer Studien zur Proteinstruktur und -funktion vorzuweisen hat – einigten sich darauf, Tutorials für ein Team von vier Studenten führender Universitäten in ganz China abzuhalten. Das Online-Mentoring war Teil des YutChun-Weizmann-Programms unter der Leitung von Weizmanns Prof. Binghai Yan.

Sussman und Silman forderten die Studenten auf, sie mit ihrem Vornamen anzusprechen, eine an chinesischen Universitäten unbekannte Praxis, und ermutigten sie, kritisches Denken zu entwickeln. Dennoch erwarteten sie nichts weiter als eine respektvolle Zusammenfassung, als sie die Studenten baten, eine alte Arbeit von ihnen über Proteinsequenzvariationen zu rezensieren. Stattdessen brachten die Studierenden eine ausführliche Kritik vor, analysierten die Studie aus einer zeitgenössischen Perspektive und schlugen vor, dass einige ihrer Schlussfolgerungen mit neuen Methoden überarbeitet werden könnten.

Jing Liu, eine der vier Mentees, sagt, dass dies für sie und die anderen Studenten eine dramatische Abkehr von dem war, was sie gewohnt waren. „In China kann ein Student, der beispielsweise einen Master-Abschluss anstrebt, einen Doktoranden oder Postdoktoranden nicht herausfordern – er könnte wütend werden oder es dem Hauptforscher sagen“, erklärt sie. Sie stellt jedoch schnell fest, dass die Umgebung auf dem Guangdong-Campus des Technion – Israel Institute of Technology, wo sie damals studierte, anders war. „Ich hatte einen Betreuer, der bereit war, mir zuzuhören und Diskussionen zu führen, etwas, das man an anderen Universitäten in China kaum findet.“

Die Online-Tutorials verwandelten sich zur Überraschung beider Seiten bald in Diskussionen. Eine Studie tschechischer Wissenschaftler aus dem Jahr 2017, auf die Liu ihre Dozenten aufmerksam machte, wurde zu einem wichtigen Diskussionsthema – eine Studie, die auf eine faszinierende Wendung in der Geschichte der Proteinevolution hinwies.

Risse im Faltdogma

Als sich einzellige Organismen, die einst auf der Erde lebten, zu komplexeren Organismen entwickelten, wurden zufällige Veränderungen in ihrer DNA dank natürlicher Selektion tendenziell konserviert und an höhere Organismen weitergegeben, sofern diese Veränderungen vorteilhaft waren. Aus diesem Grund haben die meisten proteinkodierenden Gene in unserem Körper Äquivalente (der wissenschaftliche Begriff lautet „Homologe“) in vielen anderen Arten entlang des Evolutionsbaums, bis hin zu Hefen oder Bakterien. Als sich Proteine ​​entwickelten, begannen sich viele von ihnen zu komplexen Strukturen zu falten, die es ihnen ermöglichten, spezielle Aufgaben auszuführen.

Wenn man bedenkt, dass die natürliche Selektion seit Milliarden von Jahren am Werk ist, scheint es, dass Proteine ​​genug Zeit gehabt haben müssen, um alle möglichen nützlichen Sequenzen zu entwickeln. Tatsächlich glaubten Wissenschaftler bis vor Kurzem, dass alle existierenden Proteine ​​durch die Verfeinerung bestehender Sequenzen entstanden seien und dass wirklich neue Proteine ​​schon lange nicht mehr auftauchen würden.

Doch vor etwas mehr als einem Jahrzehnt begannen sich in diesem wissenschaftlichen Evangelium Risse zu bilden: Es gab Hinweise darauf, dass ständig neue Proteine ​​entstehen. Als Wissenschaftler begannen, komplette Genome verschiedener Organismen zu sequenzieren, offenbarten Vergleiche das Vorhandensein von Genen, die für „neugeborene“ Proteine ​​in allen Arten, von Bakterien bis hin zu Menschen, kodieren. Es wird angenommen, dass diese Proteine ​​​​aus den nichtkodierenden Regionen stammen, die den größten Teil des Genoms ausmachen. In diesem Szenario erwirbt ein DNA-Abschnitt, dem das Rezept für Proteine ​​fehlt, durch Zufall eine Reihe von Mutationen, die ihn in ein Protein-kodierendes Gen umwandeln.

Die tschechische Studie, die Liu und ihre Lehrer so faszinierte, hatte einen weiteren Riss im Dogma hinterlassen. Die tschechischen Forscher hatten etwa 100 Sequenzen hypothetischer Proteine ​​erstellt, indem sie vorhandene Proteingene wie bei einem Kartenspiel zufällig neu gemischt hatten. Als sie diese „nie geborenen“ Proteine ​​synthetisierten und im Labor testeten, stellten sie fest, dass etwa ein Drittel Anzeichen einer Faltung zu kompakten Strukturen aufwies, ähnlich wie natürliche Proteine.

„Das war absolut erstaunlich“, sagt Sussman. „Wenn mich vorher jemand gefragt hätte, ob sich eine zufällige Proteinsequenz auf diese Weise zusammenfalten könnte, hätte ich nie gesagt.“

Silman erklärt, dass die Fähigkeit von Proteinen, sich zu falten, lebenswichtig ist. Obwohl sich nicht alle Proteine ​​​​falten, sind es die gefalteten Proteine ​​mit geordneten Segmenten, die in lebenden Organismen die entscheidenden katalytischen Funktionen erfüllen. Indem die tschechische Studie zeigte, dass sich „nie geborene“ Proteine ​​falten können, legte sie nahe, dass neue Proteine ​​nicht nur geboren werden können, sondern möglicherweise auch wichtige neue Rollen übernehmen.

Geborene Waisen

Wie entsteht aus einem nichtkodierenden DNA-Abschnitt ein „neugeborenes“ Protein und wie wird dieses Protein aktiv? Wie groß ist der Zeitrahmen für diese Prozesse? Und können die beteiligten Mechanismen eines Tages im Proteindesign genutzt werden?

Um diese Fragen zu beantworten, beschlossen Sussman und Silman, nach ihrem besten Wissen eine der ersten Strukturstudien neugeborener Proteine ​​durchzuführen. Sie starteten das Projekt zusammen mit Liu, dem Erstautor des Papiers, und Rongqing Yuan, damals Student an der Tsinghua-Universität in Peking. Die vier trafen sich anderthalb Jahre lang online, bevor sie die Recherche abschlossen veröffentlicht kürzlich in der Zeitschrift Proteine: Struktur, Funktion und Bioinformatik. Die anderen beiden Studenten, Wei Shao und Jitong Wang, nahmen an der Anfangsphase des Projekts teil; Sie brachen am Ende des geplanten Tutorials ab, sind aber Co-Autoren der veröffentlichten Arbeit.

Das Team erforschte das Faltungspotenzial „neugeborener“ Proteine ​​mithilfe von Werkzeugen der künstlichen Intelligenz (KI), die in den letzten Jahren die Untersuchung von Proteinstrukturen revolutioniert haben. Diese Algorithmen können nun in den meisten Fällen die 3D-Struktur eines Proteins allein auf der Grundlage seiner Aminosäuresequenz zuverlässig vorhersagen, ohne dass Proteinkristalle gezüchtet und ihre Strukturen experimentell bestimmt werden müssen.

Eine der größten Herausforderungen für das Team bestand darin, dass diese Vorhersagealgorithmen am besten funktionieren, wenn das interessierende Protein zahlreiche Homologe (Äquivalente anderer Spezies) aufweist, während „neugeborene“ Proteine ​​per Definition nur in einem oder einer Handvoll davon existieren Spezies. Da sie keine evolutionären Eltern haben, werden sie manchmal als Orphan-Proteine ​​(oder Beinahe-Waisen, wenn sie nur in wenigen verwandten Arten vorkommen) bezeichnet. Es bedurfte des Fachwissens des Teams, um KI-Tools erfolgreich auf homologe Orphan-Proteine ​​anzuwenden. Um die Chancen auf vertrauenswürdige Ergebnisse zu erhöhen, verwendeten die Wissenschaftler drei verschiedene KI-Algorithmen – AlphaFold2, RoseTTAFold und ESMFold – und verglichen ihre Ergebnisse.

Zunächst verwendete das Team die drei Algorithmen, um die 3D-Strukturen der „nie geborenen“, gemischten Proteinsequenzen aus der tschechischen Studie vorherzusagen. Die Vorhersagen ergaben, dass die Struktur jedes Proteins in einer Weise gefaltet oder ungeordnet war, die mit den experimentellen Ergebnissen der Studie übereinstimmte.

Als nächstes wandten Liu, Yuan und ihre israelischen Mentoren die Algorithmen auf „neugeborene“ Orphan-Proteine ​​an, von denen nur sehr wenige gereinigt und experimentell ausreichend charakterisiert worden waren. Nach Durchsicht der wissenschaftlichen Literatur identifizierten die Wissenschaftler sieben solcher Orphan-Proteine, deren Funktion, aber nicht ihre Struktur bekannt war.

Die KI-Tools zeigten, dass fünf der sieben kompakt gefaltet waren, während zwei offenbar keine definierte Struktur hatten. Bei einem der fünf machten die drei Algorithmen so auffallend ähnliche Vorhersagen – was auf eine sehr hohe Wahrscheinlichkeit der Genauigkeit hinweist –, dass die Zeitschrift die drei 3D-Strukturen auf dem Cover zeigte.

Darüber hinaus durchsuchten die Wissenschaftler die Proteindatenbank und fanden drei Orphan-Proteine, deren Kristallstruktur experimentell bestimmt worden war. Bemerkenswerterweise zeigten zwei dieser Proteine ​​Faltungen, von denen man nicht weiß, dass sie anderswo existieren. Da die Struktur die Funktion eines Proteins bestimmt, deuten die neuen Faltungen darauf hin, dass einige verwaiste Proteine ​​bisher unbekannte biologische Funktionen erfüllen könnten, die in Zukunft für eine Vielzahl nützlicher Anwendungen genutzt werden könnten, vom Zerschneiden von Kunststoffen über die Erzeugung sauberer Energie bis hin zur Behandlung von Krankheiten.

Sussman sagt: „Diese Forschung verändert unsere Vorstellung davon, wie die Evolution funktionieren könnte. Die Evolution schreitet normalerweise auf die von Darwin beschriebene Weise voran, aber gelegentlich könnten Proteine ​​gewissermaßen aus dem Nichts auftauchen. Neue Merkmale könnten also aus dem Nichts entstehen.“ sozusagen, anstatt sich über Millionen von Jahren aus Vorfahren entwickelt zu haben. Silman fügt hinzu, dass die Ergebnisse der Studie zusammen mit anderen Studien zu „neugeborenen“ Proteinen das Denken über den Ursprung des Lebens im Allgemeinen und des Menschen im Besonderen verändern: „Es sieht so aus, als wären wir nicht nur die Urenkel von E coli.“

Sussman fasst zusammen: „Wir hoffen, dass unsere Studie andere Wissenschaftler dazu anregen wird, verwaiste Proteine ​​mit KI-Vorhersagetools zu untersuchen, um eine Vorstellung von ihrer Struktur und Funktion zu bekommen. Wenn eine völlig neue Struktur auftaucht, sind alle Wetten hinsichtlich der biochemischen Wirkung des Proteins ungültig.“ . Und dann eröffnen sich spannende neue Forschungshorizonte.“

Liu studiert derzeit für ihren MSc-Abschluss im Labor von Prof. Naama Barkai in der Abteilung für Molekulargenetik von Weizmann, und Yuan ist derzeit Doktorandin am Southwestern Medical Center der University of Texas in Dallas. Prof. Sussman ist in Weizmanns Abteilung für Chemische und Strukturbiologie tätig, Prof. Silman in der Abteilung für Gehirnwissenschaften und Prof. Binghai Yan in der Abteilung für Physik der kondensierten Materie. Prof. Amit Finkler von der Abteilung für chemische und biologische Physik koordinierte das YutChun-Weizmann-Programm an der Fakultät für Chemie.

Das YutChun-Weizmann-Programm ist Teil einer Initiative zur Förderung der akademischen Zusammenarbeit zwischen China und der internationalen Wissenschaftsgemeinschaft. Zu seinen Aktivitäten gehört, dass das Programm herausragenden Bachelor-Studenten Forschungsmöglichkeiten bietet.

Mehr Informationen:
Jing Liu et al.: Erinnern „Newly Born“-Orphan-Proteine ​​an „Never Born“-Proteine? Eine Studie mit drei Deep-Learning-Algorithmen, Proteine: Struktur, Funktion und Bioinformatik (2023). DOI: 10.1002/prot.26496

Bereitgestellt vom Weizmann Institute of Science

ph-tech