Neues Tool entschlüsselt komplexe Genomdaten einzelner Zellen

Dank des innovativen scLENS-Tools, das von der Biomedical Mathematics Group am IBS Center for Mathematical and Computational Sciences unter der Leitung von Chefforscher Kim Jae Kyoung entwickelt wurde, ist die Erschließung biologischer Informationen aus komplexen Genomdaten einzelner Zellen jetzt noch einfacher und präziser geworden ein Professor am KAIST. Dies stellt einen bedeutenden Fortschritt auf dem Gebiet der Einzelzell-Transkriptomik dar.

Die Forschung ist veröffentlicht im Tagebuch Naturkommunikation.

Die Einzelzell-Genomanalyse ist eine fortschrittliche Technik, die die Genexpression auf der Ebene einzelner Zellen misst und zelluläre Veränderungen und Interaktionen aufdeckt, die mit herkömmlichen Methoden der Genomanalyse nicht beobachtbar sind. Bei der Anwendung auf Krebsgewebe kann diese Analyse die Zusammensetzung verschiedener Zelltypen innerhalb eines Tumors beschreiben, Einblicke in das Fortschreiten des Krebses liefern und wichtige Gene identifizieren, die in jedem Stadium des Fortschreitens beteiligt sind.

Trotz des immensen Potenzials der Einzelzell-Genomanalyse war der Umgang mit den riesigen Datenmengen, die sie generiert, schon immer eine Herausforderung. Die Datenmenge umfasst die Expression von Zehntausenden von Genen in Hunderten bis Tausenden einzelnen Zellen. Dies führt nicht nur zu großen Datensätzen, sondern führt auch zu rauschbedingten Verzerrungen, die teilweise auf aktuelle Messbeschränkungen zurückzuführen sind.

Der korrespondierende Autor Kim Jae Kyoung betonte: „Im letzten Jahrzehnt gab es bemerkenswerte Fortschritte bei den experimentellen Technologien zur Analyse einzelner Zelltranskriptome. Aufgrund der Einschränkungen bei den Datenanalysemethoden gab es jedoch Schwierigkeiten, die gewonnenen wertvollen Daten vollständig zu nutzen.“ erheblicher Kosten- und Zeitaufwand.“

Forscher haben im Laufe der Jahre zahlreiche Analysemethoden entwickelt, um aus diesem Lärm biologische Signale zu erkennen. Die Genauigkeit dieser Methoden war jedoch nicht zufriedenstellend. Ein kritischer Punkt besteht darin, dass die Festlegung von Signal- und Rauschschwellen häufig von subjektiven Entscheidungen der Benutzer abhängt.

Das neu entwickelte scLENS-Tool nutzt die Zufallsmatrixtheorie und den Signalrobustheitstest, um Signale automatisch von Rauschen zu unterscheiden, ohne auf subjektive Benutzereingaben angewiesen zu sein.

Erstautor Kim Hyun erklärte: „Früher mussten Benutzer den Schwellenwert für Signal und Rauschen willkürlich festlegen, was die Reproduzierbarkeit der Analyseergebnisse beeinträchtigte und Subjektivität einführte. scLENS beseitigt dieses Problem, indem es Signale automatisch erkennt und nur die inhärente Struktur der Daten verwendet.“

Während der Entwicklung von scLENS identifizierten Forscher die grundlegenden Gründe für Ungenauigkeiten in bestehenden Analysemethoden. Sie fanden heraus, dass häufig verwendete Datenvorverarbeitungsmethoden sowohl biologische Signale als auch Rauschen verzerren. Der neue Vorverarbeitungsansatz, den scLENS bietet, ist frei von solchen Verzerrungen.

Durch die Lösung von Problemen im Zusammenhang mit der Rauschschwelle, die durch subjektive Benutzerwahl und Signalverzerrung bei der herkömmlichen Datenvorverarbeitung bestimmt wird, übertrifft scLENS die Genauigkeit bestehender Methoden deutlich. Darüber hinaus automatisiert scLENS den mühsamen Prozess der Auswahl der Signaldimension, sodass Forscher biologische Signale bequem und automatisch extrahieren können.

Ci Kim fügte hinzu: „scLENS löst große Probleme bei der Analyse von Einzelzell-Transkriptomdaten und verbessert die Genauigkeit und Effizienz im gesamten Analyseprozess erheblich. Dies ist ein Paradebeispiel dafür, wie grundlegende mathematische Theorien Innovationen in der Biowissenschaftsforschung vorantreiben und es Forschern ermöglichen können, mehr zu erreichen.“ schnell und präzise biologische Fragen beantworten und bisher verborgene Geheimnisse des Lebens aufdecken.“

Mehr Informationen:
Hyun Kim et al., scLENS: Datengesteuerte Signalerkennung für eine unvoreingenommene scRNA-seq-Datenanalyse, Naturkommunikation (2024). DOI: 10.1038/s41467-024-47884-3

Bereitgestellt vom Institute for Basic Science

ph-tech