Ein neues Werkzeug der künstlichen Intelligenz (KI), das logische Rückschlüsse auf die Funktion unbekannter Proteine zieht, verspricht, Wissenschaftlern dabei zu helfen, das Innenleben der Zelle zu entschlüsseln.
Das vom KAUST-Bioinformatikforscher Maxat Kulmanov und Kollegen entwickelte Tool übertrifft bestehende Analysemethoden zur Vorhersage von Proteinfunktionen und ist sogar in der Lage, Proteine zu analysieren, bei denen es keine eindeutigen Übereinstimmungen in vorhandenen Datensätzen gibt.
Die Forschung erscheint in Naturmaschinenintelligenz.
Das DeepGO-SE genannte Modell nutzt große Sprachmodelle, die denen ähneln, die von generativen KI-Tools wie Chat-GPT verwendet werden. Anschließend werden logische Schlussfolgerungen verwendet, um auf der Grundlage allgemeiner biologischer Prinzipien über die Funktionsweise von Proteinen aussagekräftige Schlussfolgerungen über molekulare Funktionen zu ziehen.
Es versetzt Computer im Wesentlichen in die Lage, Ergebnisse logisch zu verarbeiten, indem sie Modelle eines Teils der Welt – in diesem Fall der Proteinfunktion – konstruieren und auf der Grundlage des gesunden Menschenverstands und der Überlegungen darüber, was in diesen Weltmodellen passieren sollte, das plausibelste Szenario ableiten.
„Diese Methode hat viele Anwendungsmöglichkeiten“, sagt Robert Hoehndorf, Leiter der KAUST Bio-Ontology Research Group, der diese Forschung betreute, „insbesondere wenn es notwendig ist, über Daten und Hypothesen nachzudenken, die von einem neuronalen Netzwerk oder einem anderen maschinellen Lernmodell generiert wurden.“ „
Kulmanov und Hoehndorf arbeiteten mit Stefan Arold von KAUST sowie Forschern des Schweizerischen Instituts für Bioinformatik zusammen, um die Fähigkeit des Modells zu bewerten, die Funktionen von Proteinen zu entschlüsseln, deren Rolle im Körper unbekannt ist.
Das Tool nutzte erfolgreich Daten zur Aminosäuresequenz eines kaum verstandenen Proteins und seinen bekannten Wechselwirkungen mit anderen Proteinen und sagte seine molekularen Funktionen präzise voraus. Das Modell war so genau, dass DeepGO-SE in einem internationalen Wettbewerb für Funktionsvorhersagetools unter den Top 20 von mehr als 1.600 Algorithmen landete.
Das KAUST-Team nutzt das Tool nun, um die Funktionen rätselhafter Proteine zu untersuchen, die in Pflanzen entdeckt wurden, die in der extremen Umgebung der Wüste Saudi-Arabiens gedeihen. Sie hoffen, dass die Ergebnisse für die Identifizierung neuartiger Proteine für biotechnologische Anwendungen nützlich sein werden, und möchten, dass andere Forscher das Tool nutzen.
Kulmanov erklärt: „Die Fähigkeit von DeepGO-SE, nicht charakterisierte Proteine zu analysieren, kann Aufgaben wie die Entdeckung von Arzneimitteln, die Analyse von Stoffwechselwegen, Krankheitsassoziationen, Protein-Engineering, das Screening nach spezifischen Proteinen von Interesse und mehr erleichtern.“
Mehr Informationen:
Proteinfunktionsvorhersage als ungefähre semantische Folgerung, Naturmaschinenintelligenz (2024). DOI: 10.1038/s42256-024-00795-w