Das Genom eines Organismus besteht aus einer Reihe von DNA-Anweisungen, die für seine Entwicklung, Funktion und Reproduktion erforderlich sind. Das Genom eines heutigen Organismus enthält Informationen von seiner Reise auf einem evolutionären Weg, der mit dem „erster universeller gemeinsamer Vorfahre„alles Leben auf der Erde und gipfelt in diesem Organismus.
Das Genom eines Organismus enthält in sich kodierte Informationen, die Verbindungen zu seinen Vorfahren und Verwandten aufdecken können.
Andere Dimensionen des Genoms
Unsere Forschung untersucht die Hypothese, dass das Genom eines Organismus andere Arten von Informationen enthalten könnte, über Genealogie oder Taxonomie hinaus. Wir fragten: Könnte das Genom eines Organismus Informationen enthalten, die es uns ermöglichen würden, die Art der Umgebung zu bestimmen, in der der Organismus lebt?
So unwahrscheinlich es auch erscheinen mag, unser Team aus Informatik- und Biologieforschern an der University of Waterloo und der Western University hat herausgefunden, dass dies bei Extremophilen der Fall ist – Organismen, die unter extrem rauen Bedingungen leben und gedeihen. Diese Umweltbedingungen reichen von extremer Hitze (über 100 °C) bis hin zu extremer Kälte (unter -12 °C), hoher Strahlung oder extremen Säure- oder Druckverhältnissen.
DNA als Sprache
Wir betrachteten genomische DNA als einen in einer „DNA-Sprache“ geschriebenen Text. Ein DNA-Strang (oder eine DNA-Sequenz) besteht aus einer Abfolge von Grundeinheiten, sogenannte Nukleotide, aneinandergereiht durch ein Zucker-Phosphat-Rückgrat. Es gibt vier so unterschiedliche DNA-Einheiten: Adenin, Cytosin, Guanin und Thymin (A,C,G,T).
Abstrakt betrachtet kann man sich eine DNA-Sequenz als eine Textzeile vorstellen, die mit „Buchstaben“ aus dem „DNA-Alphabet“ geschrieben ist. „CAT“ wäre beispielsweise das aus drei Buchstaben bestehende „DNA-Wort“, das der dreiteiligen DNA-Sequenz Cytosin-Adenin-Thymin entspricht.
In den 1990er Jahren wurde das entdeckt Vorkommnisse zählen Solche DNA-Wörter in einer kurzen DNA-Sequenz, die aus dem Genom eines Organismus extrahiert wurde, könnte man identifizieren die Art des Organismus und der Grad seiner Verwandtschaft mit anderen Organismen in der Evolutionsgeschichte“Baum des Lebens.“
Der Mechanismus dieser Identifizierung oder Klassifizierung eines Organismus basierend auf der Anzahl der DNA-Wörter ähnelt dem Prozess, der es uns ermöglicht, ein englisches Buch von einem französischen Buch zu unterscheiden: Wenn man aus jedem Buch eine Seite nimmt, bemerkt man, dass der englische Text viele Vorkommen hat das aus drei Buchstaben bestehende Wort „the“, während das aus drei Buchstaben bestehende Wort „les“ im französischen Text häufig vorkommt.
Beachten Sie, dass das Worthäufigkeitsprofil jedes Buches nicht von der jeweiligen Seite abhängt, die wir gelesen haben, und auch nicht davon, ob wir mehrere Seiten, eine einzelne Seite oder ein ganzes Kapitel betrachtet haben. Ebenso hängt das Häufigkeitsprofil von DNA-Wörtern in einem Genom nicht von der Position und der Länge der DNA-Sequenz ab, die zur Darstellung dieses Genoms ausgewählt wurde.
Dass DNA-Worthäufigkeitsprofile als „genomische Signatur“ eines Organismus fungieren können, war eine bedeutende Entdeckung, und bis jetzt glaubte man, dass das DNA-Worthäufigkeitsprofil eines Genoms nur evolutionäre Informationen über die Art, Gattung, Familie, Ordnung, Klasse, Stamm, Königreich oder Domäne, zu der der Organismus gehörte.
Unser Team wollte wissen, ob das DNA-Worthäufigkeitsprofil eines Genoms andere Arten von Informationen preisgeben könnte – zum Beispiel Informationen über die Art der extremen Umgebung, in der ein mikrobieller Extremophiler gedeiht.
Umwelteindrücke in extremophiler DNA
Wir verwendeten einen Datensatz von 700 mikrobiellen Extremophilen, die unter extremen Temperaturen (entweder extreme Hitze oder Kälte) oder extremen pH-Bedingungen (stark sauer oder alkalisch) leben. Wir haben beides genutzt überwachtes maschinelles Lernen Und unbeaufsichtigtes maschinelles Lernen Computeransätze, um unsere Hypothese zu testen.
Wir haben festgestellt, dass wir bei beiden Arten von Umweltbedingungen eindeutig ein Umweltsignal erkennen konnten, das auf die Art der extremen Umgebung hinweist, in der ein bestimmter Organismus lebte.
Im Fall des unbeaufsichtigten maschinellen Lernens wurde einem „blinden“ Algorithmus ein Datensatz extremophiler DNA-Sequenzen (und keine weiteren Informationen über deren Taxonomie oder ihr Lebensumfeld) gegeben. Der Algorithmus wurde dann gebeten, diese DNA-Sequenzen in Clustern zu gruppieren, basierend auf den Ähnlichkeiten, die er zwischen ihren DNA-Worthäufigkeitsprofilen finden konnte.
Die Erwartung war, dass alle auf diese Weise entdeckten Cluster taxonomischen Linien folgen würden: Bakterien gruppiert mit Bakterien und Archaeen gruppiert mit Archaeen. Zu unserer großen Überraschung war dies nicht immer der Fall, und einige Archaeen und Bakterien wurden unabhängig von den verwendeten Algorithmen konsistent in Gruppen zusammengefasst.
Die einzige offensichtliche Gemeinsamkeit, die erklären könnte, dass sie von den verschiedenen maschinellen Lernalgorithmen als ähnlich angesehen wurden, war, dass sie wärmeliebende Extremophile waren.
Eine schockierende Entdeckung
Der Baum des Lebensein konzeptioneller Rahmen, der in der Biologie verwendet wird stellt geneaologische Zusammenhänge dar zwischen den Arten hat drei Hauptglieder, sogenannte Domänen: Bakterien, Archaeen und Eukarya.
Eukaryoten sind Organismen mit einem membrangebundenen Kern. Zu dieser Domäne gehören Tiere, Pflanzen, Pilze und die einzelligen mikroskopisch kleinen Protisten. Im Gegensatz dazu sind Bakterien und Archaeen einzellige Organismen, die keinen membrangebundenen Zellkern haben, der das Genom enthält. Was Bakterien von Archaeen unterscheidet, ist die Zusammensetzung ihrer Zellwände.
Die drei Lebensbereiche unterscheiden sich dramatisch voneinander und genetisch unterscheidet sich ein Bakterium von einem Archäon genauso wie ein Eisbär (Eukarya) von einem E. coli (Bakterium).
Man erwartete daher, dass das Genom eines Bakteriums und eines Archaeons in jeder Clusterung nach genomischem Ähnlichkeitsmaß so weit wie möglich voneinander entfernt sein würden. Unsere Feststellung, dass einige Bakterien und Archaeen offenbar nur deshalb zusammenhaufen, weil sie beide an extreme Hitze angepasst sind, bedeutet, dass die extreme Temperaturumgebung, in der sie leben, tiefgreifende, genomweite, systemische Veränderungen in ihrer Genomsprache verursachte.
Diese Entdeckung kommt der Entdeckung einer völlig neuen Dimension des Genoms gleich, nämlich einer Umweltdimension, die zusätzlich zu seiner bekannten taxonomischen Dimension existiert.
Genomische Auswirkungen anderer Umgebungen
Dieser Befund ist nicht nur unerwartet, sondern könnte auch Auswirkungen auf unser Verständnis der Entwicklung des Lebens auf der Erde haben und unser Denken darüber lenken, was es braucht, um im Weltraum zu leben.
Tatsächlich erforschen unsere laufenden Forschungen die Existenz eines Umweltsignals in der genomischen Signatur strahlenresistenter Extremophiler, wie z Deinococcus radioduransdie auch die Strahlenexposition überstehen können kalt, Dehydrierung, Vakuumbedingungen und Säure, und es wurde gezeigt, dass sie darin überleben können Weltraum für bis zu drei Jahre.
Dieser Artikel wurde erneut veröffentlicht von Die Unterhaltung unter einer Creative Commons-Lizenz. Lies das originaler Artikel.