Wissenschaftler entwickeln neues KI-Tool zur Genentdeckung in klinischen und Forschungsumgebungen

Wissenschaftler des Genome Institute of Singapore (GIS) von A*STAR haben ein neues Tool namens Bambu entwickelt, das mithilfe künstlicher Intelligenz neue Gene identifiziert und charakterisiert und so eine anpassbare Analyse verschiedener Arten und Proben ermöglicht. Durch ein besseres Verständnis darüber, welche Gene in Proben exprimiert werden und wie, ermöglicht Bambu ein besseres Verständnis der Funktionsweise von Zellen.

Dabei handelt es sich um ein Tool zur Long-Read-RNA-Sequenzierung, das sowohl in klinischen als auch in Forschungsumgebungen eingesetzt werden kann, um herauszufinden, wie DNA neuartige Transkripte kodiert und diese quantifiziert. Dieses innovative Werkzeug ist nach der Bambuspflanze benannt, die über extrem lange Schilfrohre verfügt, die den langen Blättern ähneln, die Bambu verwendet. Eine Studie, die die Methodik und Bewertung von Bambu detailliert beschreibt, wurde in veröffentlicht Naturmethoden.

Das menschliche Genom, das aus 3,2 Milliarden Buchstaben, auch Basenpaare genannt, besteht, wird vom Lungenfischgenom mit 43 Milliarden und noch mehr von der japanischen Blume Pari japonica mit 149 Milliarden Basenpaaren in den Schatten gestellt. Obwohl das Genom des Menschen vergleichsweise kleiner ist, gibt es über 140.000 einzigartige Arten, wie Gene darin kodiert werden – auch als Transkripte eines Gens bezeichnet – und angesichts der Komplexität der Organe, Lebensstadien und Reaktionen des Körpers auf Störungen wie Krankheiten wird geschätzt, dass dies der Fall ist Es gibt viele, die noch identifiziert werden müssen.

Dies beschränkt sich nicht nur auf den Menschen, da Wissenschaftler Organismen wie Durian und Singapurs Nationalblume erforscht haben – und es gibt noch eine ganze Reihe neuer Gene zu entdecken.

Um die unbekannten Teile des Genoms zu erforschen, sei es bei Menschen, Fischen oder Blumen, haben die Forscher von A*STAR Bambu entwickelt, das Long-Read-RNA-Sequenzierung zur Identifizierung und Quantifizierung von Transkripten nutzt.

Bambu verwendet ein maschinelles Lernmodell, um die Wahrscheinlichkeit einzustufen, dass Kandidatentranskripte biologisch relevante Produkte darstellen. Es kann neue Transkripte identifizieren und mit hoher Präzision und Empfindlichkeit quantifizieren und so ein umfassenderes Verständnis der genetischen Ausstattung eines Organismus ermöglichen.

Dies wird es Forschern ermöglichen, neue Rollenspieler wie Gene, Proteine ​​und andere Elemente in ihrem Forschungsgebiet zu identifizieren und ihre Möglichkeiten zur Erforschung derzeit wenig erforschter Organismen zu erweitern. Darüber hinaus kann die Entdeckung neuer Gene, insbesondere aus klinischen Proben, zur Identifizierung von Biomarkern zur Früherkennung von Krankheiten oder als Angriffspunkte für Therapeutika führen.

Eine frühe Veröffentlichung von Bambu wurde von zwei unabhängigen Pre-Print-Studien bewertet, in denen gezeigt wurde, dass es unter seinen Zeitgenossen eine Spitzenleistung erbringt.

„Es ist faszinierend zu sehen, dass Wissenschaftler immer noch neue Gene entdecken, selbst in Genomen, die seit vielen Jahren untersucht werden, wie etwa dem Genom von Mensch oder Maus. Die entscheidende Frage ist jedoch, ob diese Transkripte relevant sind oder ob es sich um Artefakte handeln könnte.“ Um dieses Problem anzugehen, quantifiziert Bambu die Wahrscheinlichkeit, dass ein Transkript echt ist, wodurch die Entdeckung von Transkripten und Genen viel zuverlässiger wird“, sagte Dr. Jonathan Goke, Gruppenleiter des Labors für Computational Transcriptomics am GIS von A*STAR und korrespondierender Autor der Studie . Er fügte hinzu: „Durch die Bereitstellung eines solchen Vertrauensmaßstabs kann Bambu zuverlässiger eingesetzt werden, um neue Gene zu finden, die bei menschlichen Krankheiten wie Krebs eine Rolle spielen.“

Dr. Andre Sim, wissenschaftlicher Mitarbeiter am GIS von A*STAR und Co-Erstautor der Studie, bemerkte: „Die Identifizierung neuer Transkriptmodelle erfordert zahlreiche Entscheidungen. Bambu vereinfacht diesen Prozess mithilfe seines maschinellen Lernmodells und macht diese Aufgabe für die wissenschaftliche Gemeinschaft zugänglicher.“ .“

Prof. Patrick Tan, geschäftsführender Direktor des GIS von A*STAR, kommentierte: „Die Annotation von Genomen ist in der modernen Genetik häufig der erste Schritt zum Verständnis eines Organismus da Bambu unerlässlich sein wird.

Mehr Informationen:
Ying Chen et al., Kontextbewusste Transkriptquantifizierung aus Long-Read-RNA-Seq-Daten mit Bambu, Naturmethoden (2023). DOI: 10.1038/s41592-023-01908-w

Bereitgestellt von der Agency for Science, Technology and Research (A*STAR), Singapur

ph-tech