Forscher des HSE International Laboratory of Statistical and Computational Genomics haben zusammen mit ihren internationalen Kollegen eine neue statistische Methode zur Analyse der Bevölkerungsbeimischung vorgeschlagen, die es ermöglicht, Zeitpunkt und Anzahl von Migrationswellen genauer zu bestimmen. Die Geschichte der Kolumbianer und Mexikaner (Nachkommen der amerikanischen Ureinwohner, Spanier und Afrikaner) weist zwei Episoden der Vermischung auf, die vor etwa 350 und 200 Jahren für Mexikaner und vor 400 und 100 Jahren für Kolumbianer stattfanden. Die Ergebnisse wurden in veröffentlicht PLOS-Genetik.
Als Francis Crick und James Watson 1953 die Struktur der DNA entschlüsselten, erklärten sie, dass sie „das Geheimnis des Lebens gefunden“ hätten. Tatsächlich wird alles Leben auf der Erde durch ständige Zellteilung und das Kopieren seines genetischen Materials reproduziert. DNA wird weitergegeben von Generation zu Generation, und das menschliche Genom stellt ein Mosaik aus genetischen Fragmenten unserer Vorfahren aus verschiedenen Zeiten dar. Um die Ursprünge der genetischen Vielfalt des modernen Menschen zu verstehen, ist es notwendig, die Geschichte der Bevölkerung zu studieren: wo unsere Vorfahren lebten, wann und wohin sie migrierten, wann und wie sie sich vermischten.
Die Geschichte der Bevölkerungsbeimischung kann durch die Analyse der Verbindungen zwischen humangenetischen Varianten aufgedeckt werden. Unser Genom enthält genetisches Material von unserem Vater und unserer Mutter; dann geben wir neue Kombinationen genetischer Varianten, ein Mosaik aus dem Erbgut unserer Eltern, an unsere Nachkommen weiter. Dieses Phänomen wird als Rekombination bezeichnet.
Zum Beispiel haben eine spanische Mutter und ein indianischer Vater ein Kind mit einem spanischen und einem amerikanischen Chromosomensatz. Ihr Kind wiederum wird einen Chromosomensatz, der eine Kombination aus Abschnitten spanischen und amerikanischen Ursprungs enthält, an seine Nachkommen weitergeben (der zweite Chromosomensatz wird vom anderen Elternteil geerbt). Die Herkunft dieser Abschnitte kann durch die für eine bestimmte Population typischen Sequenzen genetischer Varianten bestimmt werden. In jeder neuen Generation werden durch Rekombination Abschnitte unterschiedlicher Herkunft immer mehr vermischt und diese typischen genetischen Sequenzen aufgebrochen. Mit der Zeit lösen sie sich auf und vermischen sich schließlich miteinander.
Indem wir also die Korrelation zwischen genetischen Varianten auf verschiedenen Teilen der Chromosomen berechnen und die Stärke ihrer Verbindungen analysieren, können wir sagen, vor wie vielen Generationen eine Populationsvermischung stattgefunden hat.
Frühere Methoden zur Analyse der genetischen Beimischung von Populationen waren in der Lage, den Zeitpunkt des letzten Beimischungsereignisses abzuschätzen. Der Algorithmus basierte auf der Analyse der Verbindungsstärke zwischen Paaren genetischer Varianten. Forscher des HSE International Laboratory of Statistical and Computational Genomics und ihre internationalen Kollegen schlugen vor, Triple-Varianten zu analysieren. Diese statistische Methode ermöglicht es, komplexere Szenarien der Bevölkerungsbeimischung zu modellieren, um beispielsweise zwei Beimischungsepisoden zu identifizieren und zu bestimmen, vor wie vielen Generationen sie aufgetreten sind.
„Stellen wir uns vor, dass Schiffe mit europäischen Siedlern zum ersten Mal an den Küsten Amerikas landen. Europäer beginnen, neue Gebiete zu erkunden und sich mit der indigenen Bevölkerung Amerikas zu vermischen. Nach einigen Generationen kommen jedoch mehr Schiffe mit Europäern in Amerika an. Unsere Methode lässt uns sehen, dass es zwei Umsiedlungswellen, zwei Beimischungsepisoden in unterschiedlichen Zeiträumen gab“, erklärt Mikhail Shishkin, Co-Autor des Artikels, wissenschaftlicher Mitarbeiter des Labors und MIEM-Student.
Als Beispiel analysierten die Autoren des Papiers genetische Proben der Bevölkerung von Kolumbianern und Mexikanern aus der genetischen Datenbank von 1000 Genomes. Beide Populationen entstanden durch die Vermischung von amerikanischen Ureinwohnern, Spaniern und Afrikanern. Die Ergebnisse zeigten, dass die Geschichte beider Populationen zwei Vermischungswellen aufwies, die vor 13 und 8 Generationen (350 und 200 Jahre) für Mexikaner und vor 15 und 4 Generationen (400 und 100 Jahre) für Kolumbianer stattfanden.
„Unsere Methode erfordert große Datenmengen – wenn frühere Algorithmen Dutzende von Proben benötigten, dann brauchen wir Hunderte. Und heute können wir sie bekommen. In unserem Fall haben wir die genetische Datenbank des 1000 Genomes-Projekts verwendet. In den letzten 10 Jahren haben wir Die Möglichkeiten der Genomsequenzierung und Datenverarbeitung haben sich erheblich erweitert, sodass uns die Anzahl der verfügbaren Proben nicht mehr einschränkt“, sagt Vladimir Shchur, Leiter des Internationalen Labors für Statistik und Computational Genomics der HSE University.
Mason Liang et al, Abschätzung des Timings mehrerer Beimischungsereignisse unter Verwendung von 3-Locus-Kopplungsungleichgewicht, PLOS-Genetik (2022). DOI: 10.1371/journal.pgen.1010281
Bereitgestellt von der National Research University Higher School of Economics