So wie es schwierig ist, ein Gespräch zu verstehen, ohne seinen Kontext zu kennen, kann es für Biologen schwierig sein, die Bedeutung der Genexpression zu erfassen, ohne die Umgebung einer Zelle zu kennen. Um dieses Problem zu lösen, haben Forscher von Princeton Engineering eine Methode entwickelt, um die Umgebung einer Zelle aufzuklären, damit Biologen den Informationen zur Genexpression mehr Bedeutung beimessen können.
Die Forscher unter der Leitung von Professor für Informatik Ben Raphael hoffen, dass das neue System die Tür zur Identifizierung seltener Zelltypen und zur Auswahl von Krebsbehandlungsoptionen mit neuer Präzision öffnen wird. Raphael ist der leitende Autor eines Papiers, das die Methode beschreibt, die am 16. Mai veröffentlicht wurde Naturmethoden.
Die grundlegende Technik zur Verknüpfung der Genexpression mit der Umgebung einer Zelle, genannt räumliche Transkriptomik (ST), gibt es schon seit mehreren Jahren. Wissenschaftler zerlegen Gewebeproben auf ein Mikroraster und verknüpfen jeden Punkt auf dem Raster mit Informationen über die Genexpression. Das Problem ist, dass aktuelle Computerwerkzeuge räumliche Muster der Genexpression nur in zwei Dimensionen analysieren können. Experimente, die mehrere Schnitte aus einer einzigen Gewebeprobe verwenden – wie z. B. eine Region eines Gehirns, Herzens oder Tumors – lassen sich nur schwer zu einem vollständigen Bild der Zelltypen im Gewebe zusammenfassen.
Die Methode der Princeton-Forscher namens PASTE (für probabilistische Ausrichtung von ST-Experimenten) integriert Informationen aus mehreren Schnitten, die derselben Gewebeprobe entnommen wurden, und liefert eine dreidimensionale Ansicht der Genexpression innerhalb eines Tumors oder eines sich entwickelnden Organs. Wenn die Sequenzabdeckung in einem Experiment aufgrund technischer oder Kostenprobleme begrenzt ist, kann PASTE auch Informationen aus mehreren Gewebeschnitten zu einem einzigen zweidimensionalen Konsensusschnitt mit reichhaltigeren Genexpressionsinformationen zusammenführen.
„Unsere Methode wurde durch die Beobachtung motiviert, dass Biologen oft mehrere Experimente mit demselben Gewebe durchführen“, sagte Raphael. „Nun, diese Wiederholungsexperimente sind nicht genau dieselben Zellen, aber sie stammen aus demselben Gewebe und sollten daher sehr ähnlich sein.“
Die Technik des Teams kann mehrere Schnitte aus einer einzigen Gewebeprobe ausrichten und Zellen basierend auf ihren Genexpressionsprofilen kategorisieren, während die physische Position der Zellen innerhalb des Gewebes erhalten bleibt.
Das Projekt begann im Sommer 2020, nachdem Max Land, ein Mathematikkonzentrator aus der Princeton-Klasse von 2021, Raphaels Kurs „Algorithms in Computational Biology“ belegt hatte. Begeistert von dem sich schnell entwickelnden Gebiet und der Möglichkeit, das Verständnis der menschlichen Gesundheit und Krankheit zu verbessern, wandte sich Land an Raphael, um sich an der Forschung zu beteiligen, und begann mit der Arbeit an einem Code zur Entwicklung der PASTE-Methode. Er wurde von Raphael und dem Hauptautor der Studie, Ron Zeira, einem ehemaligen Postdoktoranden in Princeton, der jetzt Forschungswissenschaftler beim Präzisionsgesundheitsunternehmen Verily ist, beraten.
Die Arbeit stand im Mittelpunkt von Lands Abschlussarbeit, und er hat das Papier zusammen mit Zeira, Raphael und Alexander Strzalkowski, einem promovierten Informatiker, geschrieben. Schüler. Land, der jetzt Computerbiologe am Memorial Sloan Kettering Cancer Center in New York City ist, sagte, dass die Mentorenschaft von Zeira und Raphael bei seinem Streben nach einer Forscherkarriere von entscheidender Bedeutung gewesen sei.
Das Team entwickelte seine Methode unter Verwendung simulierter Genexpressionsdaten aus einer räumlichen Transkriptomikstudie eines Brusttumors, bei der zuvor die Übereinstimmung zwischen Gewebeschnitten festgestellt wurde. Anschließend bewerteten sie die Methode anhand von Daten, die aus Proben des präfrontalen Kortex des Gehirns gesammelt wurden, der eine bekannte Struktur aufweist, die aus Schichten verschiedener Zelltypen mit einzigartigen Genexpressionssignaturen besteht.
Die Forscher wendeten PASTE auch auf Daten an, die von Hautkrebsbiopsien von vier verschiedenen Patienten gesammelt wurden. Eine frühere Analyse dieser Daten hatte ein komplexes Flickenteppich von Zelltypen mit einem hohen Grad an vermischten krebsartigen und gesunden Zellen nahegelegt. Die PASTE-Methode zeigte jedoch, dass die scheinbar geringe räumliche Kohärenz in drei der Patientenproben wahrscheinlich auf eine geringe Sequenzabdeckung in den Experimenten zurückzuführen war. Die neue Analyse zeigte, dass die Zellen in zusammenhängendere Cluster gruppiert waren, ein biologisch plausibleres Szenario.
„Nachdem wir mehrere dieser Schnitte integriert und die Abdeckung der Daten effektiv erhöht haben, erhalten wir räumlich kohärentere Gruppierungen von Zellen, was vernünftiger ist, als dass jeder Zelltyp zufällig im Gewebe positioniert wird“, sagte Zeira.
Bisher war der größte Datensatz, den das Team analysiert hat, eine Herzgewebeprobe mit neun Scheiben, aber sie haben Experimente mit Mausembryos im Visier, die mehr als 30 Scheiben enthalten. Abgesehen von rechnerischen Überlegungen bleiben räumliche Transkriptomik-Experimente in diesem Maßstab für viele Labors teuer, sagte Raphael.
Dennoch fügte er hinzu: „Wir hoffen, dass ein Tool wie PASTE mehr Forscher dazu anregen wird, Wiederholungsexperimente durchzuführen, da sie jetzt tatsächlich die Informationen aus zusätzlichen Schnitten auf eine Weise nutzen können, die ihnen vorher nicht ohne weiteres möglich war.“
Ron Zeira et al, Alignment and Integration of Spatial Transcriptomics Data, Naturmethoden (2022). DOI: 10.1038/s41592-022-01459-6