Chemiker entwickeln und optimieren neue chemische Reaktionen häufig anhand sogenannter Modellsysteme, also einfacher, leicht zugänglicher Substrate. Anschließend zeigen sie anhand von bis zu rund 100 weiteren Substraten, dass die Reaktion funktioniert. Diese Demonstration der vielseitigen Anwendbarkeit wird im Fachjargon „Scope“ genannt.
Eine subjektive Auswahl der Substrate führt jedoch häufig zu einem verzerrten Bild des Anwendungsspektrums der neu entwickelten Reaktion. Oft ist unklar, ob damit ein gewünschtes Produkt synthetisiert werden kann. Um dieses Problem anzugehen, schlägt ein Team um den Chemiker Prof. Frank Glorius von der Universität Münster (Deutschland) eine computergestützte, verzerrungsfreie Methode zur Auswahl der Modellsubstrate zur Bewertung neuer chemischer Reaktionen vor.
Die Auswahl der Substrate orientiert sich an der Komplexität und den Struktureigenschaften realer pharmazeutischer Verbindungen. „Unsere Methode zielt darauf ab, die Qualität und den Informationsgehalt chemischer Reaktionsdaten in Zukunft zu verbessern und Wissenslücken zu schließen“, erklärt Glorius.
Ein tieferes Verständnis neuer Reaktionen senkt die Hürden für ihre Anwendung sowohl im akademischen als auch im industriellen Kontext. Die Verfügbarkeit qualitativ hochwertiger, unvoreingenommener Daten erleichtert zudem den Einsatz von maschinellem Lernen erheblich und ebnet den Weg für eine umfassendere Nutzung der Daten. Die Arbeit war veröffentlicht im Tagebuch ACS Zentralwissenschaft.
Laut den Autoren des Teams sind Versuche, die Entwicklung und Bewertung chemischer Reaktionen zu standardisieren und zu objektivieren, noch recht neu und relativ selten. „Wir möchten mit unserer Publikation einen ‚Umdenkprozess‘ anstoßen. Anstatt möglichst viele Experimente durchzuführen, die oft verzerrt sind oder ein vorhersehbares Ergebnis haben, sollte der Fokus darauf liegen, bestmögliche Daten über neue chemische Reaktionen zu erhalten.“ sagt Erstautor Debanjan Rana.
Auch andere Wissenschaftler haben versucht, chemische Reaktionen anhand „besser“ ausgewählter Substrate zu bewerten. Allerdings beschränkten sich diese Arbeiten auf Sonderfälle – entweder auf fest ausgewählte Strukturen mit pharmazeutischer Relevanz oder auf speziell auf eine einzelne Reaktion zugeschnittene Strukturen, die in einem aufwändigen Prozess berechnet und ausgewählt werden müssen.
Im Gegensatz zu den bisherigen Arbeiten berücksichtigt die vom Münsteraner Team vorgestellte Methode die gesamte Struktur eines Moleküls und ist damit universell auf jede chemische Reaktion anwendbar.
Niklas Hölter, einer der Autoren des Papiers in Münster, erklärt den Gedankengang hinter der Studie: „Der Umfang ist bei allen Veröffentlichungen zur chemischen Synthese von zentraler Bedeutung. Allerdings sind Chemiker oft voreingenommen bei der Auswahl der zu testenden Substratverbindungen.“
„Zum Beispiel wählen sie Substrate, die strukturell sehr einfach sind, dem Modellsubstrat sehr ähnlich sind oder einfach nur im Labor verfügbar sind (‚Selektionsbias‘). Fehlgeschlagene Reaktionen erwähnen sie in ihrer Veröffentlichung oft überhaupt nicht, um zu malen.“ ein besseres Bild („Reporting Bias“).
Bei der Synthese neuer chemischer Verbindungen, etwa von Wirkstoffen oder Materialien, müssen Chemiker aus einer Vielzahl bekannter chemischer Reaktionen und Methoden die am besten geeignete Methode zur Herstellung der Zielverbindung auswählen. Dabei berücksichtigen sie mehrere Faktoren, etwa die Ausbeute des gewünschten Produkts sowie Umwelt- und Sicherheitsaspekte. Die Entwicklung neuer, vielseitig einsetzbarer chemischer Reaktionen steht daher weiterhin im Fokus der aktuellen chemischen Forschung.
Die vom Team der Universität Münster entwickelte Methode nutzt molekulare Fingerabdrücke, um alle zugelassenen Arzneimittelwirkstoffe in einen digitalen Code zu übertragen. Mithilfe unüberwachter maschineller Lern- und Clustering-Methoden erstellten sie ein Modell, das diesen „Raum“ pharmazeutischer Wirkstoffe auf der Grundlage molekularer Strukturen in chemisch bedeutsame Bereiche unterteilt.
Um eine neue chemische Reaktion zu bewerten, können mithilfe des maschinellen Lernmodells Tausende potenzieller Testsubstrate in denselben Raum projiziert werden. Aus der Mitte jedes der zuvor identifizierten Bereiche wird automatisch ein Testsubstrat ausgewählt, um den gesamten Raum ohne Vorspannung abzudecken.
Mehr Informationen:
Debanjan Rana et al., Standardisierung der Substratauswahl: Eine Strategie zur unvoreingenommenen Bewertung der Reaktionsallgemeinheit, ACS Zentralwissenschaft (2024). DOI: 10.1021/acscentsci.3c01638