Forscher des Big Data Institute der Universität Oxford haben einen großen Schritt in Richtung Kartierung der gesamten genetischen Beziehungen zwischen Menschen gemacht: eine einzige Genealogie, die die Vorfahren von uns allen nachzeichnet. Die Studie wurde heute in veröffentlicht Wissenschaft.
In den letzten zwei Jahrzehnten wurden außergewöhnliche Fortschritte in der humangenetischen Forschung erzielt, wobei genomische Daten für Hunderttausende von Individuen generiert wurden, einschließlich von Tausenden von prähistorischen Menschen. Dies eröffnet die aufregende Möglichkeit, die Ursprünge der menschlichen genetischen Vielfalt zurückzuverfolgen, um eine vollständige Karte darüber zu erstellen, wie Individuen auf der ganzen Welt miteinander verwandt sind.
Bisher bestanden die größten Herausforderungen für diese Vision darin, einen Weg zu finden, Genomsequenzen aus vielen verschiedenen Datenbanken zu kombinieren, und Algorithmen zu entwickeln, um mit Daten dieser Größe umzugehen. Eine neue Methode, die heute von Forschern des Big Data Institute der Universität Oxford veröffentlicht wurde, kann jedoch problemlos Daten aus mehreren Quellen kombinieren und skalieren, um Millionen von Genomsequenzen aufzunehmen.
Dr. Yan Wong, Evolutionsgenetiker am Big Data Institute und einer der Hauptautoren, erklärte: „Wir haben im Grunde einen riesigen Stammbaum erstellt, eine Genealogie für die gesamte Menschheit, die so genau wie möglich die entstandene Geschichte modelliert all die genetischen Variationen, die wir heute beim Menschen finden. Diese Genealogie ermöglicht es uns zu sehen, wie die genetische Sequenz jeder Person entlang aller Punkte des Genoms miteinander in Beziehung steht.“
Da einzelne genomische Regionen nur von einem Elternteil, entweder der Mutter oder dem Vater, vererbt werden, kann man sich die Abstammung jedes Punktes auf dem Genom wie einen Baum vorstellen. Die Gruppe von Bäumen, die als „Baumsequenz“ oder „Ahnenrekombinationsgraph“ bekannt ist, verbindet genetische Regionen durch die Zeit zurück mit Vorfahren, bei denen die genetische Variation zuerst auftrat.
Hauptautor Dr. Anthony Wilder Wohns, der die Forschung im Rahmen seiner Promotion durchführte. am Big Data Institute und ist jetzt Postdoktorand am Broad Institute von MIT und Harvard, sagte: „Im Wesentlichen rekonstruieren wir die Genome unserer Vorfahren und bauen daraus ein riesiges Beziehungsnetz auf. Wir können dann abschätzen, wann und.“ wo diese Vorfahren lebten. Die Stärke unseres Ansatzes besteht darin, dass er sehr wenige Annahmen über die zugrunde liegenden Daten macht und auch sowohl moderne als auch alte DNA-Proben enthalten kann.“
Die Studie integrierte Daten zu modernen und alten menschlichen Genomen aus acht verschiedenen Datenbanken und umfasste insgesamt 3.609 individuelle Genomsequenzen aus 215 Populationen. Die alten Genome umfassten Proben, die auf der ganzen Welt mit einem Alter von 1.000 bis über 100.000 Jahren gefunden wurden. Die Algorithmen sagten voraus, wo in den Evolutionsbäumen gemeinsame Vorfahren vorhanden sein müssen, um die Muster der genetischen Variation zu erklären. Das resultierende Netzwerk enthielt fast 27 Millionen Vorfahren.
Nach dem Hinzufügen von Standortdaten zu diesen Probengenomen nutzten die Autoren das Netzwerk, um abzuschätzen, wo die vorhergesagten gemeinsamen Vorfahren gelebt hatten. Die Ergebnisse haben Schlüsselereignisse in der menschlichen Evolutionsgeschichte, einschließlich der Migration aus Afrika, erfolgreich wiedererlangt.
Obwohl die genealogische Karte bereits eine äußerst reichhaltige Ressource ist, plant das Forschungsteam, sie noch umfassender zu machen, indem es weiterhin genetische Daten einbezieht, sobald sie verfügbar sind. Da Baumsequenzen Daten auf hocheffiziente Weise speichern, könnte der Datensatz problemlos Millionen zusätzlicher Genome aufnehmen.
Dr. Wong sagte: „Diese Studie legt den Grundstein für die nächste Generation der DNA-Sequenzierung. Da sich die Qualität der Genomsequenzen aus modernen und alten DNA-Proben verbessert, werden die Bäume noch genauer und wir werden schließlich in der Lage sein, a einzige, vereinheitlichte Karte, die die Abstammung aller menschlichen genetischen Variationen erklärt, die wir heute sehen.“
Dr. Wohns fügte hinzu: „Obwohl der Mensch im Mittelpunkt dieser Studie steht, gilt die Methode für die meisten Lebewesen, von Orang-Utans bis hin zu Bakterien. Sie könnte besonders in der medizinischen Genetik von Nutzen sein, um echte Assoziationen zwischen genetischen Regionen und Krankheiten von falschen zu trennen.“ Verbindungen, die sich aus unserer gemeinsamen Vorfahrengeschichte ergeben.“
Anthony Wilder Wohns et al, Eine einheitliche Genealogie moderner und alter Genome, Wissenschaft (2022). DOI: 10.1126/science.abi8264. www.science.org/doi/10.1126/science.abi8264