Neues Programm wandelt 3D-Informationen in Daten um, die typische Modelle verwenden können

Ein neues KI-gestütztes Programm wird es Forschern ermöglichen, ihre Bemühungen zur Arzneimittelentdeckung zu intensivieren.

Das Programm namens TopoFormer wurde von einem interdisziplinären Team unter der Leitung von Guowei Wei entwickelt, einem Professor der Michigan State University Research Foundation im Fachbereich Mathematik. TopoFormer übersetzt dreidimensionale Informationen über Moleküle in Daten, die typische KI-basierte Arzneimittelwechselwirkungsmodelle verwenden können, und erweitert so die Fähigkeiten dieser Modelle, die Wirksamkeit eines Arzneimittels vorherzusagen.

„Mithilfe künstlicher Intelligenz könnte die Arzneimittelentdeckung schneller, effizienter und kostengünstiger werden“, sagte Wei, der auch in der Abteilung für Biochemie und Molekularbiologie sowie in der Abteilung für Elektro- und Computertechnik tätig ist.

Wei und sein Team veröffentlichten einen Artikel über ihre Arbeit in der Zeitschrift Natur-Maschine-Intelligenz.

Hinweise zum Aufbau

In den USA dauert die Entwicklung eines einzigen Medikaments etwa zehn Jahre und kostet etwa 2 Milliarden Dollar, sagte Wei. Etwa die Hälfte dieser Zeit werde für die Erprobung des Medikaments in Studien benötigt, fügte er hinzu, die andere Hälfte aber gehe für die Entdeckung eines neuen therapeutischen Kandidaten drauf, der dann getestet werden könne.

TopoFormer hat das Potenzial, die Entwicklungszeit zu verkürzen. Dadurch können die Entwicklungskosten gesenkt werden, was wiederum den Preis des Medikaments für die späteren Verbraucher senken könnte. Das könnte insbesondere bei seltenen Krankheiten nützlich sein, da die Pharmaunternehmen aufgrund der begrenzten Anzahl an Patienten höhere Preise verlangen müssen, um die Kosten wieder hereinzuholen.

Obwohl Forscher derzeit Computermodelle zur Unterstützung der Arzneimittelentdeckung verwenden, gibt es aufgrund der unzähligen Variablen des Problems auch hier Einschränkungen.

„In unserem Körper gibt es über 20.000 Proteine“, sagte Wei. „Wenn eine Krankheit ausbricht, werden einige oder eines davon angegriffen.“

Der erste Schritt besteht also darin herauszufinden, welches Protein oder welche Proteine ​​von einer Krankheit betroffen sind. Diese Proteine ​​werden auch zum Ziel der Forscher, die Moleküle finden wollen, die die Auswirkungen der Krankheit verhindern, minimieren oder ihnen entgegenwirken können.

„Wenn ich ein Ziel habe, versuche ich, viele potenzielle Medikamente für dieses spezielle Ziel zu finden“, sagte Wei.

Sobald Wissenschaftler wissen, auf welche Proteine ​​sie mit einem Medikament abzielen sollen, können sie Molekülsequenzen des Proteins und der potenziellen Medikamente in herkömmliche Computermodelle eingeben. Die Modelle sagen voraus, wie die Medikamente und das Ziel interagieren werden, und geben so die Entscheidung vor, welche Medikamente entwickelt und in klinischen Studien getestet werden sollen.

Zwar können diese Modelle einige Wechselwirkungen allein auf Grundlage der chemischen Zusammensetzung des Medikaments und des Proteins vorhersagen, doch übersehen sie dabei wichtige Wechselwirkungen, die sich aus der Molekülform und der dreidimensionalen bzw. 3D-Struktur ergeben.

Ein Beispiel hierfür ist Ibuprofen, das in den 1960er Jahren von Chemikern entdeckt wurde. Es gibt zwei verschiedene Ibuprofen-Moleküle, die die exakt gleiche chemische Sequenz aufweisen, aber leicht unterschiedliche 3D-Strukturen haben. Nur eine Anordnung ist so geformt, dass sie sich an schmerzrelevante Proteine ​​binden und Kopfschmerzen lindern kann.

„Aktuelle Deep-Learning-Modelle können die Form von Medikamenten oder Proteinen nicht berücksichtigen, wenn sie vorhersagen, wie sie zusammenwirken werden“, sagte Wei.

Hier kommt TopoFormer ins Spiel. Es handelt sich dabei um ein Transformer-Modell, dieselbe Art künstlicher Intelligenz, die auch der Chatbot ChatGPT von Open AI verwendet (GPT steht für „Generative Pre-Trained Transformer“).

Das bedeutet, dass TopoFormer darauf trainiert ist, Informationen in einer Form zu lesen und in eine andere Form umzuwandeln. In diesem Fall nimmt es dreidimensionale Informationen darüber, wie Proteine ​​und Medikamente auf der Grundlage ihrer Formen interagieren, und rekonstruiert sie als eindimensionale Informationen, die aktuelle Modelle verstehen können.

Tatsächlich steht „Topo“ für „topologischer Laplace-Operator“, was sich auf die mathematischen Werkzeuge bezieht, die Wei und sein Team erfunden haben, um 3D-Strukturen in 1D-Sequenzen umzuwandeln.

Das neue Modell wird anhand von Zehntausenden von Protein-Medikament-Interaktionen trainiert, wobei jede Interaktion zwischen zwei Molekülen als Codestück oder „Wort“ aufgezeichnet wird. Die Wörter werden aneinandergereiht, um eine Beschreibung des Medikament-Protein-Komplexes zu erstellen und so eine Aufzeichnung seiner Form zu erzeugen.

„Auf diese Weise werden viele, viele Wörter zu einem Satz zusammengefügt“, sagte Wei.

Diese Sätze können dann von anderen Modellen gelesen werden, die Wechselwirkungen neuer Medikamente vorhersagen, und ihnen mehr Kontext verleihen. Wenn es sich bei einem neuen Medikament um ein Buch handelt, kann TopoFormer eine grobe Story-Idee in einen vollwertigen Handlungsstrang verwandeln, der dann geschrieben werden kann.

Mehr Informationen:
Dong Chen et al., Multiskaliger topologiegestützter Struktur-Sequenz-Transformator zur Vorhersage von Protein-Liganden-Interaktionen, Natur-Maschine-Intelligenz (2024). DOI: 10.1038/s42256-024-00855-1

Zur Verfügung gestellt von der Michigan State University

ph-tech