Mit der Veröffentlichung von Plattformen wie DALL-E 2 und Midjourney haben generative Diffusionsmodelle aufgrund ihrer Fähigkeit, eine Reihe absurder, atemberaubender und oft memewürdiger Bilder aus Textaufforderungen wie „Teddybären arbeiten an neuen KI-Forschung auf dem Mond in den 1980er Jahren.“
Ein Forscherteam der Abdul Latif Jameel Clinic for Machine Learning in Health (Jameel Clinic) des MIT glaubt jedoch, dass Diffusionsgenerierungsmodelle mehr sein könnten als nur die Schaffung surrealer Bilder – sie könnten die Entwicklung neuer Medikamente beschleunigen und die Wahrscheinlichkeit von Nebenwirkungen verringern Auswirkungen.
Auf der 11. International Conference on Learning Representations wird ein Papier präsentiert, in dem dieses neue molekulare Docking-Modell mit dem Namen DiffDock vorgestellt wird. Der einzigartige Ansatz des Modells für das rechnergestützte Arzneimitteldesign ist ein Paradigmenwechsel von den aktuellen hochmodernen Tools, die die meisten Pharmaunternehmen verwenden, und bietet eine große Chance für eine Überarbeitung der traditionellen Arzneimittelentwicklungspipeline.
Medikamente wirken typischerweise, indem sie mit den Proteinen interagieren, aus denen unser Körper besteht, oder Proteinen von Bakterien und Viren. Molekulares Docking wurde entwickelt, um Einblick in diese Wechselwirkungen zu gewinnen, indem die atomaren 3D-Koordinaten vorhergesagt werden, mit denen ein Ligand (dh ein Arzneimittelmolekül) und ein Protein aneinander binden könnten.
Während das molekulare Docking zur erfolgreichen Identifizierung von Medikamenten geführt hat, die jetzt HIV und Krebs behandeln, hat jedes Medikament eine durchschnittliche Entwicklungszeit von einem Jahrzehnt und 90 Prozent der Medikamentenkandidaten scheitern in kostspieligen klinischen Studien (die meisten Studien schätzen die durchschnittlichen Kosten für die Medikamentenentwicklung auf etwa 1 Milliarde US-Dollar auf über 2 Milliarden US-Dollar pro Medikament), ist es kein Wunder, dass Forscher nach schnelleren und effizienteren Wegen suchen, um potenzielle Medikamentenmoleküle zu sichten.
Derzeit verfolgen die meisten molekularen Docking-Tools, die für das In-silico-Arzneimitteldesign verwendet werden, einen „Sampling-and-Scoring“-Ansatz, bei dem nach einer Liganden-„Pose“ gesucht wird, die am besten in die Proteintasche passt. Dieser zeitaufwändige Prozess wertet eine große Anzahl verschiedener Posen aus und bewertet sie dann basierend darauf, wie gut der Ligand an das Protein bindet.
In früheren Deep-Learning-Lösungen wird Molecular Docking als Regressionsproblem behandelt. Mit anderen Worten: „Es wird davon ausgegangen, dass Sie ein einziges Ziel haben, für das Sie versuchen zu optimieren, und dass es eine einzige richtige Antwort gibt“, sagt Gabriele Corso, Co-Autorin und MIT-Doktorandin im zweiten Jahr. Student der Elektrotechnik und Informatik, der eine Tochtergesellschaft des MIT Computer Sciences and Artificial Intelligence Laboratory (CSAIL) ist.
„Bei der generativen Modellierung gehen Sie davon aus, dass es eine Verteilung möglicher Antworten gibt – dies ist bei Unsicherheit von entscheidender Bedeutung.“
„Statt einer einzigen Vorhersage wie zuvor lassen sich jetzt mehrere Posen vorhersagen, und zwar jede mit einer anderen Wahrscheinlichkeit“, ergänzt Hannes Stärk, Co-Autor und MIT-Doktorand im ersten Jahr. Student der Elektrotechnik und Informatik, der eine Tochtergesellschaft des MIT Computer Sciences and Artificial Intelligence Laboratory (CSAIL) ist. Infolgedessen muss das Modell keine Kompromisse eingehen, wenn es versucht, zu einer einzigen Schlussfolgerung zu gelangen, was ein Rezept für ein Scheitern sein kann.
Um zu verstehen, wie diffusionsgenerative Modelle funktionieren, ist es hilfreich, sie anhand von bildgenerierenden Diffusionsmodellen zu erklären. Hier fügen Diffusionsmodelle einem 2D-Bild in einer Reihe von Schritten nach und nach zufälliges Rauschen hinzu und zerstören die Daten im Bild, bis es nur noch ein körnig statisches Bild ist. Ein neuronales Netzwerk wird dann darauf trainiert, das ursprüngliche Bild wiederherzustellen, indem es diesen Rauschprozess umkehrt. Das Modell kann dann neue Daten generieren, indem es von einer zufälligen Konfiguration ausgeht und das Rauschen iterativ entfernt.
Im Fall von DiffDock ist das Modell, nachdem es auf eine Vielzahl von Liganden- und Proteinposen trainiert wurde, in der Lage, erfolgreich mehrere Bindungsstellen auf Proteinen zu identifizieren, denen es noch nie zuvor begegnet ist. Anstatt neue Bilddaten zu generieren, generiert es neue 3D-Koordinaten, die dem Liganden helfen, mögliche Winkel zu finden, die es ihm ermöglichen würden, in die Proteintasche zu passen.
Dieser „Blind Docking“-Ansatz schafft neue Möglichkeiten, AlphaFold 2 (2020), DeepMinds berühmtes Proteinfaltungs-KI-Modell, zu nutzen. Seit der Erstveröffentlichung von AlphaFold 1 im Jahr 2018 gab es in der Forschungsgemeinschaft große Aufregung über das Potenzial der rechnerisch gefalteten Proteinstrukturen von AlphaFold zur Identifizierung neuer Wirkmechanismen von Arzneimitteln.
Aber hochmoderne molekulare Docking-Tools müssen noch zeigen, dass ihre Leistung bei der Bindung von Liganden an rechnerisch vorhergesagte Strukturen besser ist als der Zufall.
DiffDock ist nicht nur wesentlich genauer als frühere Ansätze für traditionelle Docking-Benchmarks, dank seiner Fähigkeit, in einem höheren Maßstab zu argumentieren und einen Teil der Proteinflexibilität implizit zu modellieren, behält DiffDock seine hohe Leistung bei, selbst wenn andere Docking-Modelle zu versagen beginnen.
In dem realistischeren Szenario, das die Verwendung von rechnerisch generierten ungebundenen Proteinstrukturen beinhaltet, platziert DiffDock 22 Prozent seiner Vorhersagen innerhalb von 2 Angström (weithin als Schwellenwert für eine genaue Pose angesehen, 1 Å entspricht einer über 10 Milliarden Meter), mehr als das Doppelte andere Docking-Modelle bewegen sich bei einigen kaum über 10 Prozent und fallen bis auf 1,7 Prozent.
Diese Verbesserungen schaffen eine neue Landschaft von Möglichkeiten für die biologische Forschung und Arzneimittelentdeckung. Beispielsweise werden viele Medikamente über einen als phänotypisches Screening bekannten Prozess gefunden, bei dem Forscher die Auswirkungen eines bestimmten Medikaments auf eine Krankheit beobachten, ohne zu wissen, auf welche Proteine das Medikament wirkt.
Die Entdeckung des Wirkmechanismus des Medikaments ist dann entscheidend, um zu verstehen, wie das Medikament verbessert werden kann und welche möglichen Nebenwirkungen es hat. Dieser als „umgekehrtes Screening“ bekannte Prozess kann äußerst anspruchsvoll und kostspielig sein, aber eine Kombination aus Proteinfaltungstechniken und DiffDock kann es ermöglichen, einen großen Teil des Prozesses in silico durchzuführen, wodurch potenzielle „Off-Target“-Nebenwirkungen identifiziert werden können frühzeitig, bevor klinische Studien stattfinden.
„DiffDock macht die Identifizierung von Wirkstoffzielen viel einfacher. Früher musste man mühsame und kostspielige Experimente (Monate bis Jahre) mit jedem Protein durchführen, um das Andocken von Wirkstoffen zu definieren. Aber jetzt kann man viele Proteine screenen und die Triagierung praktisch an einem Tag durchführen “, sagt Tim Peterson, Assistenzprofessor an der University of Washington St. Louis School of Medicine. Peterson nutzte DiffDock, um den Wirkungsmechanismus eines neuartigen Arzneimittelkandidaten zur Behandlung altersbedingter Krankheiten in einer kürzlich erschienenen Veröffentlichung zu charakterisieren.
„Es gibt einen sehr ‚Schicksal liebt Ironie‘-Aspekt, dass Erooms Gesetz – dass die Wirkstoffforschung jedes Jahr länger dauert und mehr Geld kostet – durch das gleichnamige Mooresche Gesetz gelöst wird – dass Computer jedes Jahr schneller und billiger werden – mit Tools wie DiffDock .“
Die Ergebnisse werden auf der veröffentlicht arXiv Preprint-Server.
Mehr Informationen:
Gabriele Corso et al, DiffDock: Diffusion Steps, Twists and Turns for Molecular Docking, arXiv (2022). DOI: 10.48550/arxiv.2210.01776
Diese Geschichte wurde mit freundlicher Genehmigung von MIT News (web.mit.edu/newsoffice/), eine beliebte Website, die Neuigkeiten über MIT-Forschung, -Innovation und -Lehre enthält.