KI sagt die Funktion von Enzymen voraus

Enzyme sind die Molekülfabriken in biologischen Zellen. Allerdings ist oft unbekannt und schwer zu messen, aus welchen molekularen Grundbausteinen sie ihre Zielmoleküle zusammenbauen. Ein internationales Team unter Beteiligung von Bioinformatikern der Heinrich-Heine-Universität Düsseldorf (HHU) ist dabei nun einen wichtigen Schritt vorangekommen: Ihre KI-Methode sagt mit hoher Genauigkeit voraus, ob ein Enzym mit einem bestimmten Substrat arbeiten kann. Ihre Ergebnisse präsentieren sie nun im Fachjournal Naturkommunikation.

Enzyme sind wichtige Biokatalysatoren in allen lebenden Zellen: Sie ermöglichen chemische Reaktionen, durch die aus Grundstoffen (Substraten) alle für den Organismus wichtigen Moleküle entstehen. Die meisten Organismen verfügen über Tausende verschiedener Enzyme, von denen jedes für eine ganz bestimmte Reaktion verantwortlich ist. Die Gesamtfunktion aller Enzyme bildet den Stoffwechsel und schafft damit die Voraussetzungen für das Leben und Überleben des Organismus.

Obwohl Gene, die Enzyme kodieren, leicht als solche identifiziert werden können, ist die genaue Funktion des resultierenden Enzyms in der überwiegenden Mehrheit – über 99 % – der Fälle unbekannt. Denn die experimentelle Charakterisierung ihrer Funktion – also welche Ausgangsmoleküle ein bestimmtes Enzym in welche konkreten Endmoleküle umwandelt – ist äußerst zeitaufwändig.

Gemeinsam mit Kollegen aus Schweden und Indien hat das Forschungsteam um Professor Dr. Martin Lercher von der Forschungsgruppe Computational Cell Biology der HHU eine KI-basierte Methode entwickelt, um vorherzusagen, ob ein Enzym ein bestimmtes Molekül als Substrat für die Reaktion nutzen kann es katalysiert.

Professor Lercher sagt: „Das Besondere an unserem ESP-Modell (‚Enzyme Substrate Prediction‘) ist, dass wir uns nicht wie bei früheren Modellen auf einzelne, spezielle Enzyme und andere damit eng verwandte Enzyme beschränken. Unser allgemeines Modell kann funktionieren.“ mit einer beliebigen Kombination aus einem Enzym und mehr als 1.000 verschiedenen Substraten.“

Ph.D. Student Alexander Kroll, Erstautor der Studie, hat ein sogenanntes Deep-Learning-Modell entwickelt, bei dem Informationen über Enzyme und Substrate in mathematischen Strukturen, sogenannten numerischen Vektoren, kodiert wurden. Die Vektoren von rund 18.000 experimentell validierten Enzym-Substrat-Paaren – bei denen Enzym und Substrat bekanntermaßen zusammenarbeiten – wurden als Input für das Training des Deep-Learning-Modells verwendet.

Alexander Kroll sagt: „Nachdem wir das Modell auf diese Weise trainiert hatten, wandten wir es dann auf einen unabhängigen Testdatensatz an, bei dem wir bereits die richtigen Antworten wussten. In 91 % der Fälle hat das Modell richtig vorhergesagt, welche Substrate zu welchen Enzymen passen.“

Diese Methode bietet vielfältige Anwendungsmöglichkeiten. Sowohl in der Arzneimittelforschung als auch in der Biotechnologie ist es von großer Bedeutung zu wissen, welche Stoffe durch Enzyme umgewandelt werden können. Professor Lercher sagt: „Forschung und Industrie können so eine Vielzahl möglicher Paare auf die vielversprechendsten eingrenzen, die sie dann für die enzymatische Produktion neuer Medikamente, Chemikalien oder auch Biokraftstoffe nutzen können.“

Kroll fügt hinzu: „Es wird auch die Erstellung verbesserter Modelle zur Simulation des Stoffwechsels von Zellen ermöglichen. Darüber hinaus wird es uns helfen, die Physiologie verschiedener Organismen zu verstehen – von Bakterien bis hin zu Menschen.“

Neben Kroll und Lercher waren auch Professor Dr. Martin Engqvist von der Chalmers University of Technology in Göteborg, Schweden, und Sahasra Ranjan vom Indian Institute of Technology in Mumbai an der Studie beteiligt. Engqvist half bei der Konzeption der Studie, während Ranjan das Modell implementierte, das die Enzyminformationen kodiert, die in das von Kroll entwickelte Gesamtmodell eingespeist werden.

Mehr Informationen:
Alexander Kroll et al., Ein allgemeines Modell zur Vorhersage niedermolekularer Substrate von Enzymen basierend auf maschinellem und tiefem Lernen, Naturkommunikation (2023). DOI: 10.1038/s41467-023-38347-2

Bereitgestellt von der Heinrich-Heine-Universität Düsseldorf

ph-tech