Stellen Sie sich einen virtuellen menschlichen Körper vor, der reich an Komplexität und Details ist und es Wissenschaftlern ermöglicht, Experimente zu simulieren, die in vivo oder in vitro nicht durchgeführt werden können. Ein Team chinesischer Forscher hat diese Vision der Realität näher gebracht, indem es einen Rahmen für die nahtlose zellzentrierte Datenzusammenstellung entwickelt und den Human Ensemble Cell Atlas (hECA) unter Verwendung von Daten erstellt hat, die aus verstreuten öffentlichen Datensätzen gesammelt wurden.
Sie stellten ihr vereinheitlichtes Informatik-Framework in einer am 28. April veröffentlichten Studie vor iWissenschaft. hECA hat auch einen wegweisenden Beitrag zur Integration menschlicher Einzelzelldaten aus mehreren Quellen und zur Durchführung nachgeschalteter Analysen geleistet, die in veröffentlicht wurden Quantitative Biologie am 4. Juli.
„Fallstudien des hECA demonstrierten die Revolution, die ein solcher zellzentrierter Ensemble-Zellatlas für die biomedizinische Forschung bedeuten kann“, sagte Studienautor Xuegong Zhang von der Tsinghua-Universität.
Die schnelle Entwicklung von Einzelzell-Sequenzierungstechnologien, insbesondere einer als Einzelzell-Transkriptomik bekannten RNA-Sequenzierungsmethode, hat es Wissenschaftlern ermöglicht, einzelne Zellen zu profilieren und zu untersuchen, welche Gene in verschiedenen Zelltypen eingeschaltet sind.
Wissenschaftler auf der ganzen Welt sind damit beschäftigt, in Projekten wie dem Human Cell Atlas (HCA) und dem Human BioMolecular Atlas Program „Atlanten“ mit Einzelzellauflösung aller verschiedenen Zelltypen zu erstellen. Es besteht jedoch noch eine gewisse Unsicherheit darüber, wie ein Zellatlas definiert und zusammengestellt werden sollte.
„Der entscheidende Punkt bei der Zusammenstellung des Zellatlasses ist die Organisation der Zellinformationen“, sagte Zhang.
Seit dem Start des HCA-Projekts im Jahr 2017 wurden viele Artikel über Zellatlanten veröffentlicht, und die meisten davon sind Sammlungen einer Vielzahl von Einzelzelldaten, die auf Projektbasis dokumentiert und indiziert wurden. Frühere Studien argumentierten, dass es bei der Zellkartierung darum geht, ein dreidimensionales Skelett des menschlichen Körpers zu erstellen und die beobachteten Zellen einfach an ihren entsprechenden Positionen zusammenzusetzen. Ein menschlicher Körper ist jedoch zu komplex für diese Art der Montage.
Stattdessen „sollte die Zusammenstellung eines Zellatlasses die Vielschichtigkeit der Daten vermitteln und es den Benutzern ermöglichen, mit angepassten Bedingungen zwischen verschiedenen Indexierungsmethoden zu suchen“, sagte Zhang.
In der Zwischenzeit strömen riesige Mengen an transkriptomischen Einzelzelldaten aus Kooperationen mit mehreren Institutionen in die Öffentlichkeit und erzeugen Petabytes an Daten, die alle wichtigen Organe des erwachsenen Menschen sowie wichtige Entwicklungs- oder pathologische Stadien abdecken.
Für Zhangs Team legten diese verstreuten öffentlichen Einzelzellendaten einen alternativen Ansatz zum Erstellen eines Zellatlasses nahe: Beginnen Sie von unten nach oben, indem Sie Daten aus mehreren Quellen zusammenstellen.
Um Daten dieser Größenordnung aus mehreren Quellen in einem Gesamtatlas zusammenzustellen, entwickelten die Forscher ein einheitliches Informatik-Framework, das eine spezielle Datenbankinfrastruktur zum Speichern von Einzelzellendaten mit ultrahoher Dimensionalität und Volumen sowie ein einheitliches hierarchisches Annotations-Framework umfasste um Zelltypbeschriftungen aus verschiedenen Datensätzen vergleichbar und konsistent zu machen. Die Forscher entwarfen auch eine Anwendungsprogrammierschnittstelle, um Zellen im Atlas effizient abzurufen.
Mit diesen Technologien entwickelte das Team drei neue Schemata zur Anwendung des zusammengesetzten Atlas. Erstens ermöglichten sie die Sortierung von Datenzellen zur Auswahl von Zellen aus dem virtuellen menschlichen Körper zusammengesetzter Zellen unter Verwendung flexibler Kombinationen von logischen Ausdrücken. Sie schufen ein „quantitatives Porträt“-System zur Darstellung der vollständigen Informationen von Genen, Zelltypen und Organen. Sie haben auch eine anpassbare Referenzerstellung erstellt, mit der Benutzer ihre Referenzen für Annotationsaufgaben für Zelltypen anpassen können.
Die Forscher führten eine Reihe von Experimenten durch, um die Qualität und Nutzbarkeit der gesammelten Daten in mehreren Anwendungsszenarien zu verifizieren und zu veranschaulichen. Zu den Fallbeispielen gehörte die Untersuchung von Arzneimittel-Off-Targets – unbeabsichtigten biologischen Folgen eines Arzneimittels – im gesamten Körper, was die Leistungsfähigkeit des Ensemble-Zellatlasses demonstrierte, neue Möglichkeiten in der biomedizinischen Forschung zu eröffnen.
Laut der Studie kann diese Art der In-Data-Zellsortierung wichtige organspezifische Muster aufdecken und Wissenschaftlern dabei helfen, Organe zu bestimmen, die anfälliger für Nebenwirkungen einer gezielten medikamentösen Therapie sind.
Die Forscher haben Strategien und Technologien entwickelt, um qualitativ hochwertigere Daten aus anderen umfassenden Datensätzen zu integrieren, und werden zukünftige Versionen des hECA weiter verbessern und aktualisieren.
Mehr Informationen:
Chenwei Li et al, Integration menschlicher Einzelzelldaten aus mehreren Quellen, Quantitative Biologie (2022). DOI: 10.15302/J-QB-022-0304. journal.hep.com.cn/qb/EN/10.15302/J-QB-022-0304
Sijie Chen et al, hECA: The cell-centric assembly of a cell atlas, iWissenschaft (2022). DOI: 10.1016/j.isci.2022.104318
Bereitgestellt von Higher Education Press