Wie maschinelles Lernen die Strukturbiologie vorantreibt

Für Lucas Farnung gibt es keine faszinierendere Frage als die, wie sich aus einer einzelnen befruchteten Eizelle ein voll funktionsfähiger Mensch entwickelt. Als Strukturbiologe untersucht er diesen Prozess im kleinsten Maßstab: die Billionen von Atomen, die ihre Arbeit synchronisieren müssen, damit dies möglich ist.

„Ich sehe keinen großen Unterschied zwischen dem Lösen eines 5.000-teiligen Puzzles und der Forschung, die wir in meinem Labor betreiben“, sagt Farnung, Assistenzprofessor für Zellbiologie am Blavatnik Institute der Harvard Medical School. „Wir versuchen herauszufinden, wie dieser Prozess visuell aussieht, und davon ausgehend können wir uns Vorstellungen davon machen, wie er funktioniert.“

Fast alle Zellen im menschlichen Körper enthalten dasselbe genetische Material, doch zu welchem ​​Gewebetyp sich diese Zellen während ihrer Entwicklung entwickeln – ob sie beispielsweise Leber- oder Hautgewebe werden – wird weitgehend von der Genexpression bestimmt, die bestimmt, welche Gene an- und ausgeschaltet werden. Die Genexpression wird durch einen Prozess namens Transkription reguliert – der Schwerpunkt von Farnungs Arbeit.

Während der Transkription lesen molekulare Maschinen Anweisungen aus dem genetischen Bauplan, der in der DNA gespeichert ist, und erzeugen RNA, das Molekül, das die Anweisungen ausführt. Andere molekulare Maschinen lesen RNA und verwenden diese Informationen, um Proteine ​​herzustellen, die fast alle Aktivitäten im Körper antreiben.

Farnung untersucht die Struktur und Funktion der molekularen Maschinen, die für die Transkription verantwortlich sind.

In einem Gespräch mit Harvard Medicine News sprach Farnung über seine Arbeit und wie maschinelles Lernen die Forschung in seinem Bereich beschleunigt.

Welche zentrale Frage soll mit Ihrer Forschung beantwortet werden?

Ich sage immer, wir sind an dem kleinsten logistischen Problem interessiert, das es gibt. Das menschliche Genom ist in fast jeder Zelle vorhanden, und wenn man die DNA, aus der das Genom besteht, ausdehnen würde, wäre sie etwa zwei Meter lang. Aber dieses zwei Meter lange Molekül muss in den Zellkern passen, der nur wenige Mikrometer groß ist. Das ist so, als würde man eine Angelschnur, die von Boston nach New Haven, Connecticut, also etwa 240 Kilometer, reicht, in einen Fußball quetschen wollen.

Um dies zu erreichen, komprimieren unsere Zellen die DNA in eine Struktur namens Chromatin, doch dann können molekulare Maschinen nicht mehr auf die genomischen Informationen der DNA zugreifen. Dadurch entsteht ein Konflikt, denn die DNA muss kompakt genug sein, um in den Zellkern zu passen, molekulare Maschinen müssen jedoch in der Lage sein, auf die genomischen Informationen der DNA zuzugreifen. Wir sind besonders daran interessiert, den Prozess zu visualisieren, wie eine molekulare Maschine namens RNA-Polymerase II auf genomische Informationen zugreift und DNA in RNA umschreibt.

Welche Techniken verwenden Sie zur Visualisierung molekularer Maschinen?

Unser allgemeiner Ansatz besteht darin, molekulare Maschinen aus Zellen zu isolieren und sie mit speziellen Mikroskopen oder Röntgenstrahlen zu untersuchen. Dazu führen wir genetisches Material, das für eine menschliche molekulare Maschine von Interesse kodiert, in eine Insekten- oder Bakterienzelle ein, sodass die Zelle eine große Menge dieser Maschine produziert. Dann verwenden wir Reinigungstechniken, um die Maschine von der Zelle zu trennen, damit wir sie isoliert untersuchen können.

Allerdings wird es kompliziert, weil wir uns oft nicht nur für eine einzelne molekulare Maschine interessieren, die wir auch als Protein bezeichnen. Es gibt Tausende von Proteinen, die miteinander interagieren, um die Transkription zu regulieren, sodass wir diesen Prozess Tausende Male wiederholen müssen, um diese Protein-Protein-Interaktionen zu verstehen.

Künstliche Intelligenz durchdringt zunehmend viele Facetten der Grundlagenbiologie. Verändert sie Ihre Art der Strukturbiologieforschung?

In den letzten 30 oder 40 Jahren war die Forschung in meinem Bereich ein langwieriger Prozess. Ein Doktorand würde seine Karriere dem Erlernen eines einzigen Proteins widmen, und es würde Tausende von Studenten brauchen, um zu lernen, wie Proteine ​​in einer Zelle interagieren. In den letzten zwei oder drei Jahren konzentrieren wir uns jedoch zunehmend auf computergestützte Ansätze zur Vorhersage von Proteininteraktionen.

Ein großer Durchbruch war die Veröffentlichung von AlphaFold durch Google DeepMind, ein maschinelles Lernmodell, das die Proteinfaltung vorhersagen kann. Wichtig ist, dass die Art und Weise, wie sich Proteine ​​falten, ihre Funktion und Interaktionen bestimmt. Wir verwenden jetzt künstliche Intelligenz, um Zehntausende von Protein-Protein-Interaktionen vorherzusagen, von denen viele noch nie zuvor experimentell beschrieben wurden. Nicht alle dieser Interaktionen finden tatsächlich in Zellen statt, aber wir können sie durch Laborexperimente validieren.

Das ist superspannend, weil es unsere Wissenschaft wirklich voranbringt. Wenn ich auf meine Promotion zurückblicke, waren die ersten drei Jahre im Grunde ein Misserfolg – ​​ich konnte keine Protein-Protein-Interaktionen finden. Dank dieser computergestützten Vorhersagen kann ein Doktorand oder Postdoc in meinem Labor jetzt ziemlich sicher sein, dass ein Laborexperiment zur Bestätigung einer Protein-Protein-Interaktion funktioniert. Ich nenne es Molekularbiologie auf Steroiden – aber legal –, weil wir jetzt viel schneller zu der eigentlichen Frage gelangen, die wir beantworten möchten.

Wie verändert KI Ihr Fachgebiet außer in puncto Effizienz und Geschwindigkeit noch weiter?

Eine spannende Veränderung ist, dass wir jetzt jedes Protein im menschlichen Körper unvoreingenommen mit jedem anderen Protein vergleichen können, um zu sehen, ob es möglicherweise zu Wechselwirkungen kommt. Die Werkzeuge des maschinellen Lernens in unserem Bereich verursachen ähnliche Umbrüche wie die Personalcomputer in der Gesellschaft.

Als ich anfing zu forschen, nutzte man die Röntgenkristallographie, um die Struktur einzelner Proteine ​​zu enthüllen – eine schöne, hochauflösende Technik, die viele Jahre dauern kann. Dann, während meiner Promotion und meiner Postdoc-Zeit, kam die Kryo-Elektronenmikroskopie oder Kryo-EM auf – eine Technik, die es uns ermöglicht, größere und dynamischere Proteinkomplexe in hoher Auflösung zu betrachten. Die Kryo-EM hat in den letzten 10 Jahren große Fortschritte in unserem Verständnis der Biologie ermöglicht und die Arzneimittelentwicklung beschleunigt.

Ich dachte, ich hätte Glück, Teil der sogenannten Auflösungsrevolution zu sein, die durch Kryo-EM ausgelöst wurde. Aber jetzt fühlt es sich an, als würde das maschinelle Lernen zur Proteinvorhersage eine zweite Revolution auslösen, was für mich einfach erstaunlich ist und mich fragen lässt, wie viel mehr Beschleunigung wir noch erleben werden.

Meiner Einschätzung nach können wir heute wahrscheinlich fünf- bis zehnmal schneller forschen als noch vor zehn Jahren. Es wird interessant sein zu sehen, wie maschinelles Lernen unsere biologische Forschung in den nächsten zehn Jahren verändern wird. Natürlich müssen wir vorsichtig sein, wie wir mit diesen Werkzeugen umgehen, aber ich finde es spannend, dass ich zehnmal schneller Erkenntnisse zu Problemen gewinnen konnte, über die ich lange nachgedacht habe.

Welche nachgelagerten Anwendungen hat Ihre Arbeit über das Labor hinaus?

Wir lernen zwar erst auf grundlegender Ebene, wie die Biologie im menschlichen Körper funktioniert, aber es besteht immer die Hoffnung, dass uns das Verständnis grundlegender biologischer Mechanismen dabei helfen kann, wirksame Behandlungen für verschiedene Erkrankungen zu entwickeln. So hat sich beispielsweise herausgestellt, dass die Störung der DNA-Chromatin-Struktur durch molekulare Maschinen eine der Hauptursachen für viele Krebsarten ist. Wenn wir erst einmal die Struktur dieser molekularen Maschinen verstanden haben, können wir verstehen, welche Auswirkungen die Veränderung einiger Atome hat, um Mutationen zu reproduzieren, die zu Krebs führen würden. An diesem Punkt können wir beginnen, Medikamente zu entwickeln, die auf die Proteine ​​abzielen.

Wir haben gerade ein Projekt in Zusammenarbeit mit dem HMS Therapeutics Initiative Dabei geht es um einen Chromatin-Remodeler, ein Protein, das bei Prostatakrebs stark mutiert ist. Wir haben vor Kurzem die Struktur dieses Proteins erhalten und führen virtuelle Screens durch, um zu sehen, welche chemischen Verbindungen sich daran binden. Wir hoffen, dass wir eine Verbindung entwickeln können, die das Protein hemmt und das Potenzial hat, zu einem vollwertigen Medikament entwickelt zu werden, das das Fortschreiten von Prostatakrebs verlangsamen könnte.

Wir untersuchen auch Proteine, die an neurologischen Entwicklungsstörungen wie Autismus beteiligt sind. Dabei kann uns maschinelles Lernen helfen, denn die Werkzeuge, die wir zur Vorhersage von Proteinstrukturen und Protein-Protein-Interaktionen verwenden, können auch vorhersagen, wie sich niedermolekulare Verbindungen an Proteine ​​binden.

Apropos Zusammenarbeit: Welche Bedeutung hat die forschungsbereichs- und disziplinübergreifende Zusammenarbeit für Ihre Forschung?

Für meine Forschung ist Zusammenarbeit extrem wichtig. Die Biologie ist mit ihren vielen verschiedenen Forschungsnischen so komplex geworden, dass es unmöglich ist, alles zu verstehen. Durch Zusammenarbeit können wir Menschen mit unterschiedlichem Fachwissen zusammenbringen, um an wichtigen biologischen Problemen zu arbeiten, beispielsweise daran, wie molekulare Maschinen auf das menschliche Genom zugreifen.

Wir arbeiten auf vielen verschiedenen Ebenen mit anderen Forschern bei HMS zusammen. Manchmal nutzen wir unsere strukturelle Expertise, um die Arbeit anderer Labore zu unterstützen. Manchmal haben wir die Struktur eines bestimmten Proteins entschlüsselt, müssen aber zusammenarbeiten, um die Rolle dieses Proteins im breiteren zellulären Kontext zu verstehen. Wir arbeiten auch mit Laboren zusammen, die andere Arten molekularbiologischer Ansätze verwenden. Zusammenarbeit ist wirklich grundlegend, um Fortschritte voranzutreiben und die Biologie besser zu verstehen.

Zur Verfügung gestellt von der Harvard Medical School

ph-tech