Forscher haben eine Plattform entwickelt, die automatisierte Experimente mit KI kombiniert, um vorherzusagen, wie Chemikalien miteinander reagieren, was den Designprozess für neue Medikamente beschleunigen könnte.
Die Vorhersage, wie Moleküle reagieren werden, ist für die Entdeckung und Herstellung neuer Arzneimittel von entscheidender Bedeutung. In der Vergangenheit war dies jedoch ein Versuch-und-Irrtum-Prozess, und die Reaktionen scheiterten oft. Um vorherzusagen, wie Moleküle reagieren werden, simulieren Chemiker normalerweise Elektronen und Atome in vereinfachten Modellen, ein Prozess, der rechenintensiv und oft ungenau ist.
Jetzt haben Forscher der Universität Cambridge einen datengesteuerten Ansatz entwickelt, der von der Genomik inspiriert ist und bei dem automatisierte Experimente mit maschinellem Lernen kombiniert werden, um die chemische Reaktivität zu verstehen, was den Prozess erheblich beschleunigt. Sie haben ihren Ansatz, der anhand eines Datensatzes von mehr als 39.000 pharmazeutisch relevanten Reaktionen validiert wurde, das chemische „Reaktom“ genannt.
Ihre Ergebnisseberichtet in der Zeitschrift Naturchemiesind das Produkt einer Zusammenarbeit zwischen Cambridge und Pfizer.
„Das Reaktom könnte die Art und Weise verändern, wie wir über organische Chemie denken“, sagte Dr. Emma King-Smith vom Cavendish Laboratory in Cambridge, die Erstautorin der Arbeit. „Ein tieferes Verständnis der Chemie könnte es uns ermöglichen, Arzneimittel und viele andere nützliche Produkte viel schneller herzustellen. Aber noch grundlegender ist, dass das Verständnis, das wir zu gewinnen hoffen, für jeden von Vorteil sein wird, der mit Molekülen arbeitet.“
Der Reaktom-Ansatz ermittelt aus den Daten relevante Zusammenhänge zwischen Reaktanten, Reagenzien und der Reaktionsleistung und weist auf Lücken in den Daten selbst hin. Die Daten werden aus sehr schnellen oder automatisierten Experimenten mit hohem Durchsatz generiert.
„Die Hochdurchsatzchemie hat das Spiel verändert, aber wir glaubten, dass es einen Weg gibt, ein tieferes Verständnis chemischer Reaktionen zu erlangen, als die ersten Ergebnisse eines Hochdurchsatzexperiments beobachten können“, sagte King-Smith.
„Unser Ansatz deckt die verborgenen Beziehungen zwischen Reaktionskomponenten und Ergebnissen auf“, sagte Dr. Alpha Lee, der die Forschung leitete. „Der Datensatz, auf dem wir das Modell trainiert haben, ist riesig – er wird dazu beitragen, den Prozess der chemischen Entdeckung vom Versuch-und-Irrtum-Verfahren in das Zeitalter der Big Data zu überführen.“
In einem verwandten Papierveröffentlicht in NaturkommunikationDas Team entwickelte einen Ansatz für maschinelles Lernen, der es Chemikern ermöglicht, präzise Transformationen in vorab festgelegten Molekülregionen einzuführen und so ein schnelleres Arzneimitteldesign zu ermöglichen.
Der Ansatz ermöglicht es Chemikern, komplexe Moleküle zu optimieren – etwa bei einer Designänderung in letzter Minute –, ohne sie von Grund auf neu herstellen zu müssen. Die Herstellung eines Moleküls im Labor ist normalerweise ein mehrstufiger Prozess, wie der Bau eines Hauses. Wenn Chemiker den Kern eines Moleküls verändern wollen, besteht der herkömmliche Weg darin, das Molekül neu aufzubauen, als würde man das Haus abreißen und von Grund auf neu aufbauen. Kernvariationen sind jedoch für das Arzneimitteldesign wichtig.
Bei einer Klasse von Reaktionen, die als Funktionalisierungsreaktionen im Spätstadium bekannt sind, wird versucht, chemische Umwandlungen direkt in den Kern einzuleiten, sodass nicht bei Null begonnen werden muss. Es ist jedoch eine Herausforderung, die Funktionalisierung im Spätstadium selektiv und kontrolliert zu gestalten – typischerweise gibt es viele Regionen der Moleküle, die reagieren können, und es ist schwierig, das Ergebnis vorherzusagen.
„Funktionalisierungen im Spätstadium können zu unvorhersehbaren Ergebnissen führen und die aktuellen Modellierungsmethoden, einschließlich unserer eigenen Expertenintuition, sind nicht perfekt“, sagte King-Smith. „Ein prädiktiveres Modell würde uns die Möglichkeit für ein besseres Screening geben.“
Die Forscher entwickelten ein Modell für maschinelles Lernen, das vorhersagt, wo ein Molekül reagieren würde und wie sich der Ort der Reaktion in Abhängigkeit von verschiedenen Reaktionsbedingungen ändert. Dies ermöglicht es Chemikern, Wege zu finden, den Kern eines Moleküls präzise zu verändern.
„Wir haben das Modell anhand einer großen Menge spektroskopischer Daten vorab trainiert und so dem Modell effektiv die allgemeine Chemie beigebracht, bevor wir es verfeinerten, um diese komplizierten Transformationen vorherzusagen“, sagte King-Smith. Dieser Ansatz ermöglichte es dem Team, die Einschränkung der geringen Datenmenge zu überwinden: In der wissenschaftlichen Literatur werden relativ wenige Funktionalisierungsreaktionen im Spätstadium beschrieben. Das Team validierte das Modell experimentell an einer Vielzahl arzneimittelähnlicher Moleküle und konnte die Reaktivitätsorte unter verschiedenen Bedingungen genau vorhersagen.
„Die Anwendung maschinellen Lernens in der Chemie wird oft durch das Problem gebremst, dass die Datenmenge im Vergleich zur Weite des chemischen Raums gering ist“, sagte Lee. „Unser Ansatz – das Entwerfen von Modellen, die aus großen Datensätzen lernen, die dem Problem, das wir zu lösen versuchen, ähneln, aber nicht dasselbe sind – lösen diese grundlegende Herausforderung bei geringer Datenmenge und könnten Fortschritte ermöglichen, die über die Funktionalisierung im Spätstadium hinausgehen.“
Mehr Informationen:
Emma King-Smith et al., Untersuchung des chemischen „Reaktoms“ mit Hochdurchsatz-Experimentierdaten, Naturchemie (2024). DOI: 10.1038/s41557-023-01393-w
Prädiktive Minisci-Funktionalisierung im Spätstadium mit Transferlernen, Naturkommunikation (2024). DOI: 10.1038/s41467-023-42145-1. www.nature.com/articles/s41467-023-42145-1