Zwei neue Ansätze könnten Wissenschaftlern dabei helfen, bestehende Sequenzierungstechnologien zu nutzen, um RNA-Veränderungen besser zu unterscheiden, die sich darauf auswirken, wie der genetische Code gelesen wird.
Wissenschaftler der Universität Kyoto nähern sich der Suche nach Wegen zur Identifizierung von Änderungen an RNA-Sequenzen, die sich auf die Proteinbildung auswirken und Krankheiten verursachen können. Ihr Ansatz, veröffentlicht in der Zeitschrift Genomikverwendet Wahrscheinlichkeitsalgorithmen zusammen mit einem bereits erhältlichen Sequenziergerät im Taschenformat.
„Modifikationen, die in allen Arten von biologischer RNA zu finden sind, beeinflussen die Genregulation, die letztendlich darüber entscheidet, wie verschiedene Zellen in unserem Körper funktionieren“, erklärt Ganesh Pandian Namasivayam vom Institute for Integrated Cell-Material Science (WPI-iCeMS) der Universität Kyoto. „Auffälligkeiten in diesen Modifikationen können zu schweren Krankheiten wie Diabetes, neurologischen Entwicklungsstörungen und Krebs führen. Zu wissen, wie und wo diese RNA-Modifikationen sind, ist aus klinischer Sicht von größter Bedeutung“, ergänzt Soundhar Ramaswamy, der Erstautor der Studie.
Es gibt bereits Möglichkeiten, RNA-Modifikationen zu identifizieren, aber sie sind unzureichend. Biophysikalische Ansätze wie Chromatographie und Massenspektrometrie können nur kleine Mengen an RNA auf einmal verarbeiten. Hochdurchsatz-Sequenzierungsverfahren, die große Mengen an RNA verarbeiten können, erfordern eine aufwändige Probenvorbereitung, können nicht mehrere Modifikationen gleichzeitig abbilden und sind fehleranfällig.
Namasivayam, Hiroshi Sugiyama und Kollegen an der Universität Kyoto testeten und fanden zwei Ansätze, die eine bekannte und häufig vorkommende RNA-Modifikation relativ erfolgreich unterscheiden können, bei der die Nukleotidbase Uracil durch eine andere namens Pseudouridin ersetzt wird.
Ähnlich wie DNA besteht RNA aus einem Strang unterschiedlicher Kombinationen von vier verschiedenen Nukleotidbasen: Uracil, Cytosin, Adenin und Guanin. Wie diese Basen angeordnet sind, bestimmt den Code, der signalisiert, welches Protein hergestellt werden soll. Wenn Pseudouridin Uracil im RNA-Rückgrat ersetzt, kann dies zu einer erhöhten Proteinproduktion führen oder zu einer Änderung des Codes von einem, der die Unterbrechung der Informationsübersetzung signalisiert, zu einem, der die Aminosäurebildung signalisiert.
Der Ansatz des Teams beinhaltet die Verwendung einer bereits verfügbaren direkten RNA-Sequenzierungsplattform, die von Oxford Nanopore Technologies entwickelt wurde. In dieser Plattform passieren RNA-Stränge winzige Poren in einer Membran. Abhängig von der Reihenfolge der verschiedenen RNA-Basen werden Störungen im Stromfluss durch die Membran verursacht. Dadurch können Wissenschaftler die Sequenz „lesen“. Wissenschaftlern, die diesen Ansatz verwenden, fällt es jedoch oft schwer, verschiedene Arten von Modifikationen voneinander zu unterscheiden.
Shubham Mishra, ein gemeinsamer Erstautor dieser Studie, entwickelte Algorithmen, um eine hohe Wahrscheinlichkeit des Vorhandenseins einer Pseudouridin-Substitution im Vergleich zu der Möglichkeit, dass es sich um eine andere Art von Basenänderung handelt, zu identifizieren.
Eine ihrer Strategien vergleicht kurze RNA-Läufe von fünf Nukleotidbasen, in denen Uracil, Pseudouridin oder Cytosin auf beiden Seiten von denselben Basen umgeben sind. Die Messwerte durchlaufen dann Algorithmen, die die Wahrscheinlichkeit berechnen, dass die mittlere Basis eine der drei ist. Sie wandten ihre Indo-Compare (Indo-C) genannte Strategie auf konstruierte RNA-Sequenzen und dann auf Hefe- und menschliche RNA an und stellten fest, dass sie gut darin war, die Pseudouridin-Substitutionen von den anderen zu unterscheiden.
Sie waren auch in der Lage, Pseudouridin-Substitutionen zu identifizieren, indem sie eine chemische Sonde mit RNA-Proben mischten, die sich dann selektiv daran anlagerte. Dadurch wurden die Sequenzablesungen in einer Weise geändert, die die Modifikation identifiziert.
„Wir glauben, dass unsere Arbeit auf Nanoporensequenzierung basierende Methoden zum Nachweis von RNA-Modifikationen weniger arbeitsintensiv und besser in der Lage sein wird, die Auswirkungen dieser Modifikationen auf Entwicklung und Krankheit zu charakterisieren“, sagt Namasivayam.
Als nächstes will das Team die Nutzung beider Ansätze zusammen optimieren, um RNA- und DNA-Modifikationen genauer zu identifizieren. Dazu gehört die Herstellung neuer chemischer Sonden, die spezifischen Veränderungen entsprechen. Sie planen auch die Weiterentwicklung fortschrittlicher maschineller Lernalgorithmen, die die auf chemischen Sonden basierenden direkten RNA-Sequenzierungsansätze ergänzen.
Soundhar Ramasamy et al., Ein Informatikansatz zur Unterscheidung von RNA-Modifikationen bei der Nanoporen-Direkt-RNA-Sequenzierung, Genomik (2022). DOI: 10.1016/j.ygeno.2022.110372