Der Einsatz von KI zur Optimierung der Arzneimittelforschung nimmt explosionsartig zu. Forscher setzen Modelle des maschinellen Lernens ein, um unter Milliarden von Möglichkeiten diejenigen Moleküle zu identifizieren, die möglicherweise die Eigenschaften besitzen, nach denen sie bei der Entwicklung neuer Medikamente suchen.
Allerdings müssen dabei so viele Variablen berücksichtigt werden – vom Materialpreis bis hin zum Risiko, dass etwas schief geht –, dass es selbst dann, wenn Wissenschaftler KI einsetzen, keine leichte Aufgabe ist, die Kosten für die Synthese der besten Kandidaten abzuwägen.
Die unzähligen Herausforderungen bei der Ermittlung der besten und kosteneffizientesten Moleküle für Tests sind ein Grund dafür, dass die Entwicklung neuer Medikamente so lange dauert, und zugleich ein Hauptgrund für die hohen Preise verschreibungspflichtiger Medikamente.
Um Wissenschaftlern dabei zu helfen, kostenbewusste Entscheidungen zu treffen, haben Forscher am MIT ein algorithmisches Framework entwickelt, das optimale Molekülkandidaten automatisch identifiziert. Dies minimiert die Synthesekosten und maximiert gleichzeitig die Wahrscheinlichkeit, dass die Kandidaten die gewünschten Eigenschaften aufweisen. Der Algorithmus identifiziert auch die Materialien und experimentellen Schritte, die zur Synthese dieser Moleküle erforderlich sind.
Ihr quantitativer Rahmen, bekannt als Synthesis Planning and Rewards-based Route Optimization Workflow (SPARROW), berücksichtigt die Kosten für die Synthese einer Charge von Molekülen auf einmal, da sich aus einigen derselben chemischen Verbindungen oft mehrere Kandidaten ableiten lassen. Darüber hinaus erfasst dieser einheitliche Ansatz wichtige Informationen zum Moleküldesign, zur Eigenschaftsvorhersage und zur Syntheseplanung aus Online-Repositorien und weit verbreiteten KI-Tools.
Das Papier ist veröffentlicht im Journal Natur Computerwissenschaften.
SPARROW unterstützt nicht nur Pharmaunternehmen bei der effizienteren Entwicklung neuer Medikamente, sondern könnte auch bei anderen Anwendungen zum Einsatz kommen, wie etwa bei der Erfindung neuer Agrarchemikalien oder der Entdeckung spezieller Materialien für die organische Elektronik.
„Die Auswahl von Verbindungen ist im Moment eine Kunst – und manchmal ist sie eine sehr erfolgreiche Kunst. Aber weil wir all diese anderen Modelle und prädiktiven Werkzeuge haben, die uns Informationen darüber geben, wie Moleküle funktionieren und wie sie synthetisiert werden könnten, können und sollten wir diese Informationen als Orientierung für unsere Entscheidungen nutzen“, sagt Connor Coley, der 1957 in den MIT-Abteilungen für Chemieingenieurwesen und Elektrotechnik und Informatik Assistenzprofessor für Karriereentwicklung war und leitender Autor eines Artikels über SPARROW.
Coley wird an der Abhandlung von der Hauptautorin Jenna Fromer unterstützt.
Komplexe Kostenbetrachtungen
In gewisser Weise läuft die Frage, ob ein Wissenschaftler ein bestimmtes Molekül synthetisieren und testen sollte, auf die Frage der Synthesekosten im Vergleich zum Wert des Experiments hinaus. Die Bestimmung von Kosten oder Wert ist jedoch an sich schon ein schwieriges Problem.
Beispielsweise könnte ein Experiment teure Materialien erfordern oder ein hohes Risiko des Scheiterns bergen. Auf der Wertseite könnte man überlegen, wie nützlich es wäre, die Eigenschaften dieses Moleküls zu kennen oder ob solche Vorhersagen mit einem hohen Maß an Unsicherheit verbunden sind.
Gleichzeitig nutzen Pharmaunternehmen zur Verbesserung der Effizienz zunehmend die Batch-Synthese. Anstatt Moleküle einzeln zu testen, verwenden sie Kombinationen chemischer Bausteine, um mehrere Kandidaten gleichzeitig zu testen. Dies bedeutet jedoch, dass für alle chemischen Reaktionen dieselben experimentellen Bedingungen erforderlich sein müssen. Dies macht die Schätzung von Kosten und Nutzen noch schwieriger.
SPARROW begegnet dieser Herausforderung, indem es die gemeinsamen Zwischenverbindungen berücksichtigt, die an der Synthese von Molekülen beteiligt sind, und diese Informationen in seine Kosten-Nutzen-Funktion einbezieht.
„Wenn man an dieses Optimierungsspiel beim Entwerfen einer Charge von Molekülen denkt, hängen die Kosten für das Hinzufügen einer neuen Struktur von den Molekülen ab, die man bereits ausgewählt hat“, sagt Coley.
Der Rahmen berücksichtigt außerdem Faktoren wie die Kosten der Ausgangsmaterialien, die Anzahl der an jedem Syntheseweg beteiligten Reaktionen und die Wahrscheinlichkeit, dass diese Reaktionen beim ersten Versuch erfolgreich sind.
Um SPARROW zu nutzen, stellt ein Wissenschaftler eine Reihe von Molekülverbindungen bereit, die er testen möchte, und eine Definition der Eigenschaften, die er zu finden hofft.
Von dort aus sammelt SPARROW Informationen über die Moleküle und ihre Synthesewege und wägt dann den Wert jedes einzelnen Moleküls gegen die Kosten für die Synthese einer Reihe von Kandidaten ab. Es wählt automatisch die beste Teilmenge von Kandidaten aus, die die Kriterien des Benutzers erfüllen, und findet die kostengünstigsten Synthesewege für diese Verbindungen.
„Die gesamte Optimierung wird in einem Schritt durchgeführt, sodass alle konkurrierenden Ziele gleichzeitig erreicht werden können“, sagt Fromer.
Ein vielseitiger Rahmen
SPARROW ist einzigartig, weil es Molekülstrukturen integrieren kann, die von Menschenhand entworfen wurden, solche, die in virtuellen Katalogen existieren, oder noch nie dagewesene Moleküle, die von generativen KI-Modellen erfunden wurden.
„Wir haben all diese unterschiedlichen Ideenquellen. Ein Teil des Reizes von SPARROW besteht darin, dass man all diese Ideen auf eine Ebene stellen kann“, fügt Coley hinzu.
Die Forscher evaluierten SPARROW, indem sie es in drei Fallstudien anwendeten. Die Fallstudien basierten auf realen Problemen, mit denen Chemiker konfrontiert sind, und sollten SPARROWs Fähigkeit testen, kosteneffiziente Synthesepläne zu finden und dabei mit einer breiten Palette von Eingangsmolekülen zu arbeiten.
Sie fanden heraus, dass SPARROW die Grenzkosten der Batchsynthese effektiv erfasste und gängige Versuchsschritte und Zwischenchemikalien identifizierte. Darüber hinaus ließ sich das System auf Hunderte potenzieller Molekülkandidaten hochskalieren.
„In der Gemeinschaft des maschinellen Lernens für die Chemie gibt es so viele Modelle, die sich beispielsweise gut für die Retrosynthese oder die Vorhersage molekularer Eigenschaften eignen, aber wie nutzen wir sie eigentlich? Unser Framework zielt darauf ab, den Wert dieser Vorarbeit hervorzuheben. Durch die Entwicklung von SPARROW können wir hoffentlich andere Forscher dazu anregen, über die Herabselektion von Verbindungen unter Verwendung ihrer eigenen Kosten- und Nutzenfunktionen nachzudenken“, sagt Fromer.
In Zukunft wollen die Forscher SPARROW noch komplexer gestalten. So möchten sie den Algorithmus beispielsweise so einrichten, dass er berücksichtigt, dass der Wert des Testens einer Verbindung nicht immer konstant sein muss. Außerdem möchten sie mehr Elemente der parallelen Chemie in die Kosten-Nutzen-Funktion einbeziehen.
„Die Arbeit von Fromer und Coley passt algorithmische Entscheidungsfindung besser an die praktischen Realitäten der chemischen Synthese an. Wenn vorhandene computergestützte Designalgorithmen verwendet werden, bleibt die Arbeit, herauszufinden, wie die Designsätze am besten synthetisiert werden können, dem Medizinalchemiker überlassen, was zu weniger optimalen Entscheidungen und Mehrarbeit für den Medizinalchemiker führt“, sagt Patrick Riley, Senior Vice President für künstliche Intelligenz bei Relay Therapeutics, der an dieser Forschung nicht beteiligt war.
„Dieses Dokument zeigt einen prinzipiellen Weg auf, der die Berücksichtigung der gemeinsamen Synthese einschließt, was meiner Erwartung nach zu einer höheren Qualität und einer stärkeren Akzeptanz der Algorithmen führen wird.“
„Die Identifizierung der zu synthetisierenden Verbindungen unter sorgfältiger Berücksichtigung von Zeit, Kosten und Potenzial für Zielfortschritte bei gleichzeitiger Bereitstellung nützlicher neuer Informationen ist eine der größten Herausforderungen für Arzneimittelforschungsteams.
„Der SPARROW-Ansatz von Fromer und Coley erreicht dies auf effektive und automatisierte Weise. Er stellt ein nützliches Werkzeug für Teams in der Humanmedizinchemie dar und unternimmt wichtige Schritte in Richtung völlig autonomer Ansätze zur Arzneimittelentdeckung“, fügt John Chodera hinzu, ein Computerchemiker am Memorial Sloan Kettering Cancer Center, der an dieser Arbeit nicht beteiligt war.
Mehr Informationen:
Jenna C. Fromer et al., Ein algorithmischer Rahmen für synthetische kostenbewusste Entscheidungsfindung im molekularen Design, Natur Computerwissenschaften (2024). DOI: 10.1038/s43588-024-00639-y
Diese Geschichte wird mit freundlicher Genehmigung von MIT News erneut veröffentlicht (web.mit.edu/newsoffice/), eine beliebte Site mit Neuigkeiten zu Forschung, Innovation und Lehre am MIT.