Wissenschaftler am La Jolla Institute for Immunology (LJI) haben eine neue Computermethode entwickelt, um molekulare Markierungen auf unserer DNA mit der Genaktivität zu verknüpfen. Ihre Arbeit könnte Forschern dabei helfen, Gene mit den molekularen „Schaltern“ zu verbinden, die sie an- oder ausschalten.
Diese Forschung, veröffentlicht in Genombiologieist ein wichtiger Schritt zur Nutzung maschineller Lernansätze, um die Zusammenhänge zwischen Genexpression und Krankheitsentwicklung besser zu verstehen.
„Bei dieser Forschung geht es darum, eine dreidimensionale Perspektive in die Untersuchung von DNA-Modifikationen und ihrer Funktion in unserem Genom einzubringen“, sagt LJI-Außerordentlicher Professor Ferhat Ay, Ph.D., der die Studie gemeinsam mit LJI-Professorin Anjana Rao, Ph.D., leitete.
Ay und Rao arbeiten daran, Regionen des Genoms zu lokalisieren, die molekulare Verstärker oder „Schalter“ enthalten, die die Genexpression fein abstimmen und bestimmen, wann und wo Gene an- oder ausgeschaltet werden. Für diese Arbeit müssen die Forscher Computertools entwickeln, mit denen sie komplexe genomische Daten verarbeiten und herausfinden können, welche Verstärker mit welchen Genen verbunden sind.
Für die neue Studie verwendeten die LJI-Forscher maschinelle Lernwerkzeuge, sogenannte lineare und graphische neuronale Netzwerke, um genomische Daten zu verarbeiten und diese Verbindungen herzustellen. Neuronale Netzwerke sind Computerwerkzeuge, die der Art und Weise nachempfunden sind, wie Neuronen im Gehirn Informationen verarbeiten und Muster erkennen. Graphische neuronale Netzwerke sind in der Lage, 3D-Informationen zu integrieren, wie etwa die physikalischen Interaktionen der DNA innerhalb der Zelle.
Edahí González-Avalos, Ph.D., leitete die Entwicklung dieses Graph-Neural-Netzwerks als Doktorand an der UC San Diego, der gemeinsam von Rao und Ay am LJI betreut wurde. „Wir können dies nutzen, um DNA-Interaktionen innerhalb des Genoms zu priorisieren“, sagt González-Avalos, die jetzt bei Guardant Health arbeitet.
Das neuronale Netzwerk macht sich an die Arbeit
Die Forscher trainierten neue neuronale Netzwerke, die lernen, wie das Vorhandensein einer wichtigen DNA-Modifikation namens 5hmC, entweder in der Nähe des Gens oder weit davon entfernt, mit der Genexpressionsaktivität zusammenhängt. Diese Anheftung einer Hydroxymethylgruppe an Cytosin wurde mit Enhancer-Aktivität in Verbindung gebracht.
Tatsächlich scheint 5hmC einen so großen Einfluss auf die Genexpression zu haben, dass Wissenschaftler 5hmC neben A, T, C, G und einer methylierten Zwischenform namens 5mC (der fünften Base) als „sechsten Buchstaben“ des DNA-Alphabets bezeichnet haben. Die Umwandlung von 5mC in 5hmC auf Cytosin ist mit der Enhancer-Aktivität verbunden – je mehr 5hmC, desto höher das Enhancer-Aktivitätsniveau.
In früheren Studien hatten Forscher im Rao Lab entdeckt, dass sich die Position von 5hmC im Genom änderte, je nachdem, welche Zelltypen sie untersuchten – und welche Gene diese Zelltypen exprimierten. Der eigentliche DNA-Code wäre derselbe, aber 5hmC wäre in einer Leberzelle an unterschiedlichen Stellen an das Genom gebunden als in einer Lungenzelle oder einer Gehirnzelle.
Diese 5hmC-Verteilung kontrollierte die Expression verschiedener Gensätze in diesen verschiedenen Zelltypen. Die Forscher hatten herausgefunden, dass 5hmC an Regionen des Genoms bindet, die als Verstärker fungieren – dieselben Regionen, die dabei helfen, die Genexpression ein- und auszuschalten – sowie an die Gene selbst. Diese Unterschiede bei aktiven Genen und Verstärkern unterscheiden eine Leberzelle von Zellen in der Lunge oder Neuronen im Gehirn.
„Die Verteilung von 5hmC unterscheidet sich von Zelltyp zu Zelltyp“, sagt Rao. „Wenn Sie wissen, wo sich 5hmC befindet, können Sie daraus schließen, welcher Zelltyp die DNA produziert, die Sie untersuchen.“ Wenn es sich bei einer Zelle beispielsweise um eine Krebszelle handelt, können Sie daraus schließen, um welche Art von Krebs es sich handelt, selbst wenn sie metastasiert ist (sich weit von ihrem ursprünglichen Ort im Körper entfernt hat).
Durch die neue Untersuchungsmethode ist es möglich, einfachere Verbindungen zwischen Genen und Enhancern herzustellen, als dies mit früheren Methoden möglich war.
„Dieses Papier war ein Proof of Concept, der zeigte, dass wir diese Graph-Neural-Networks nutzen könnten, um Interaktionen zwischen Genen und Enhancern unter Verwendung von 5hmC vorherzusagen“, sagt González-Avalos.
Ay sagt, er sei erfreut darüber gewesen, wie das neuronale Netzwerk Verbindungen zwischen Genen und 5hmC in weit entfernten Regionen des Genoms aufzeigte. Diese Fernverbindungen im gesamten Genom halfen dabei, Regionen zu priorisieren, die die Genexpression steigern können.
„Das Spannende ist, dass einige dieser entfernten Verstärker neuartige regulatorische Elemente sind, die bisher noch nicht entdeckt wurden“, sagt Ay.
In Zukunft hoffen die Forscher, die 5hmC-Verteilung genauer untersuchen zu können, um die Interaktionen zwischen Verstärkern und Genen in menschlichen Zellen besser zu verstehen. „Diese Forschung wurde mit Daten von Mauszellen durchgeführt“, sagt Ay. „Als nächstes möchten wir uns 5hmC und diese Interaktionen in Immunzellen und Krebszellen von Patienten ansehen.“
Hoffnung auf bessere Krebsdiagnostik
Genau wie in normalen Zellen unterscheidet sich die 5hmC-Verteilung zwischen Krebszelltypen. Dies bedeutet, dass sich die neue LJI-Methode als wertvoll erweisen könnte, um die genetischen Mechanismen zu verstehen, die die Krebsentwicklung vorantreiben.
Rao meint, dass die neue Methode möglicherweise auch schnellere und genauere Krebsdiagnosen ermöglichen könnte.
Derzeit ist es für Wissenschaftler sehr schwierig, Blutproben auf Anzeichen von soliden Tumoren im Körper zu untersuchen. „Normalerweise sind im Blut keine soliden Tumorzellen vorhanden. Was vorhanden ist, ist DNA, und diese ist normalerweise teilweise abgebaute DNA“, sagt Rao.
Wie Rao erklärt, könnten Ärzte mehr Patienten helfen – und Krebs möglicherweise früher erkennen –, wenn sie über die DNA selbst hinausblicken und stattdessen die 5hmC-Verteilung analysieren könnten.
Es muss noch mehr Arbeit geleistet werden, bevor Wissenschaftler über die Werkzeuge für diese Art der Krebserkennung verfügen, aber Ay sagt, die neue Arbeit zeige, wie leistungsfähig die Kombination experimenteller Daten mit neuen Computermethoden sei. „Das deutet darauf hin, dass wir durch die Anwendung unserer neuen Methode neue und unannotierte entfernte Enhancer identifizieren können“, sagt Ay.
Mehr Informationen:
Edahi Gonzalez-Avalos et al., Vorhersage des Genexpressionzustands und Priorisierung mutmaßlicher Enhancer mithilfe des 5hmC-Signals, Genombiologie (2024). DOI: 10.1186/s13059-024-03273-z