SeqCode bietet einen Weg zur Benennung unkultivierter Prokaryoten

Die meisten Prokaryoten wurden nie in Reinkultur isoliert und können nicht nach dem International Code of Nomenclature of Prokaryotes (ICNP) benannt werden. In vielen Studien wurden jedoch nicht kultivierte Bakterien und Archaeen mithilfe von Metagenom-assemblierten Genomsequenzen (MAGs) oder Einzelzell-amplifizierten Genomen (SAGs) beschrieben, häufig in Kombination mit physiologischen oder ökologischen Daten.

Diese Studien haben unsere Sicht auf das prokaryotische Leben, seine Stoffwechselfähigkeiten und seine Rolle in der Umwelt erheblich erweitert, aber die Kommunikation über diese nicht kultivierten Bakterien und Archaeen ist ohne formale taxonomische Namen schwierig.

Der Code of Nomenclature of Prokaryotes Described from Sequence Data (auch SeqCode genannt) bietet eine Möglichkeit, wissenschaftlich präzise taxonomische Namen für diese nicht kultivierten Prokaryoten zu erstellen, indem Genomsequenzen anstelle von Kulturen als Nomenklaturtypen verwendet werden.

Nomenklaturtypen oder Typen sind Elemente, denen ein taxonomischer Name zugeordnet ist, und werden auch zur Verankerung taxonomischer Namen von Pflanzen, Tieren und Pilzen verwendet. Diese Elemente können mit denen nicht identifizierter Proben verglichen werden, um zu entscheiden, ob die Proben denselben Namen haben sollten oder nicht. SeqCode-Namen sind mit dem ICNP kompatibel und ermöglichen die Erstellung einer einheitlichen Taxonomie für kultivierte und unkultivierte Prokaryoten. Der SeqCode legt außerdem Standards für Metagenome-Assembled-Genomes (MAGs) und Single-Cell-Amplified-Genomes (SAGs) fest, die in der Systematik verwendet werden sollen. Dadurch wird sichergestellt, dass Nomenklaturtypen von ausreichender Qualität sind, um das Taxon eindeutig zu identifizieren, eine aussagekräftige Taxonomie zu erstellen und hochwertige bioinformatische Analysen zu unterstützen.

Warum Namen auf Genomsequenz basieren?

Taxonomische Namen sind wichtig für die wissenschaftliche Kommunikation und SeqCode bietet die Möglichkeit, nicht kultivierte Prokaryoten zu benennen. Die Geschichte hat gezeigt, dass die Nomenklatur ohne ein allgemein anerkanntes Benennungssystem ungenau, überflüssig und verwirrend wird. Eine präzise Benennung ist auch für die Erstellung stabiler und effektiver bioinformatischer Datenbanken und für groß angelegte Analysen, die in der Bioinformatik üblich sind, von entscheidender Bedeutung. Ohne einen einzigen, dauerhaften Namen für Taxa müssten Datenbanken häufig gepflegt werden, was mit zunehmendem Informationsgehalt immer schwieriger würde. Daher ist ein Benennungssystem auch für die Anwendung moderner Informatikwerkzeuge wichtig.

Genomsequenzen eignen sich besonders gut als Nomenklaturtypen für Prokaryoten. Bisher war die Hinterlegung von Typusstämmen in Kultursammlungen erforderlich, um neue Arten von Prokaryoten zu benennen. Stämme mussten aus Umweltproben kultiviert und in der Regel als Reinkulturen isoliert und dann durch eine große Anzahl meist phänotypischer Tests in einem Prozess namens polyphasische Taxonomie verglichen werden, um festzustellen, ob sie neue Arten darstellten.

Als molekulare Methoden zum ersten Mal eingeführt wurden, stellte sich heraus, dass diese früheren Methoden ungenau waren, da sie häufig nicht verwandte Organismen in Gruppen zusammenfassten und eng verwandte Arten nicht erkannten. Zunächst wurden 16S-rRNA-Sequenzen verwendet, um die phylogenetischen Beziehungen zwischen Typusstämmen zu rekonstruieren und ihre Taxonomie zu steuern. Im letzten Jahrzehnt wurden die Genome der meisten Typusstämme sequenziert, was eine genauere Abgrenzung der phylogenetischen Beziehungen zwischen Arten ermöglichte und das Grundwissen über ihre Eigenschaften erheblich erweiterte.

Da die Genomsequenz der Bauplan für die Eigenschaften des gesamten Organismus ist, vereint sie die umfangreiche Literatur zur Physiologie, Molekularbiologie und Ökologie von Prokaryoten mit den Eigenschaften spezifischer Organismen. Darüber hinaus informiert es uns über wichtige Lebensstilmerkmale wie Bioenergetik, Physiologie, Differenzierung, Motilität und Phageninfektionen. Die Verknüpfung von Namen mit Genomsequenzen ermöglicht wichtige Rückschlüsse einer wissenschaftlichen Disziplin auf die anderen Disziplinen. Darüber hinaus gibt es auch praktische Gründe, Genomsequenzen als Typen anstelle von Stämmen zu verwenden. Sequenzen können auf Computern gespeichert und einfach geteilt werden. Stämme müssen in Kultursammlungen aufbewahrt werden, bleiben zukunftsfähig und sind vergleichsweise schwer zu teilen.

Nicht kultivierte Prokaryoten sind häufig

Die Metagenomsequenzierung hat eine enorme Vielfalt an Prokaryoten offenbart, von denen die meisten noch nie kultiviert wurden. Direkte Probenahme Die Analyse von DNA aus vielen Biomen hat MAGs identifiziert, die 135 Phyla repräsentieren. Im Gegensatz dazu werden nur etwa 40 Phyla durch Kulturen repräsentiert, die in Kultursammlungen hinterlegt und unter dem ICNP benannt sind.

Phyla sind die am weitesten entfernten verwandten Abstammungslinien, die üblicherweise in der prokaryotischen Systematik verwendet werden. Zu einem bekannten Stamm gehören die Firmicutes (heute auch Bacillota genannt), zu denen Gattungen wie Bacillus, Clostridium und Staphylococcus gehören. Phyla sind alte Gruppen, die vor Milliarden von Jahren auseinander gingen. Daher unterscheiden sich Mitglieder verschiedener Phyla stark in ihren Wachstumseigenschaften, Zellstrukturen und Stoffwechselvorgängen. Da Vertreter von weniger als einem Drittel der Phyla als Reinkulturen isoliert wurden, besteht eine enorme Lücke in unserem Verständnis der Breite der Prokaryotenvielfalt.

Auch wenn die Schätzungen zur Gesamtzahl der Prokaryontenarten stark variieren, es ist unwahrscheinlich, dass jemals mehr als 0,2 % kultiviert wurden und nach dem ICNP benannt. Beim derzeitigen Beschreibungstempo wird es über 1.000 Jahre dauern, alle vermuteten prokaryotischen Arten zu beschreiben. Selbst im menschlichen Darm, dem wahrscheinlich am gründlichsten untersuchten Mikrobiom, können viele der durch metagenomische Sequenzierung identifizierten Stämme nicht in bekannte Arten oder Gattungen eingeteilt werden. In einer Studie696 Prokaryotenstämme wurden identifiziert, aber nur 460 und 321 konnten den im ICNP beschriebenen Gattungen bzw. Arten zugeordnet werden. So bleibt selbst in einem gut untersuchten Mikrobiom, das eng mit dem menschlichen Körper verbunden ist, ein großer Teil der Prokaryoten unbenannt.

So registrieren Sie Namen unter dem SeqCode

Der SeqCode legt fest SeqCode-Registrierung Namen von Prokaryoten basierend auf Genomsequenzen zu erstellen und zu validieren. Genomsequenzen werden aus Genomassemblierungen abgeleitet, die aus den Rohsequenzdaten berechnet werden, um die beste Schätzung der tatsächlichen Genomsequenz darzustellen. Für metagenomische Studien, die eine groß angelegte Sequenzierung von Umwelt-DNA umfassen, müssen die Genomassemblierungen zu >90 % vollständig und 10-fach sein, um als Typ zu dienen. Darüber hinaus müssen die Zusammenstellung der Typsequenz und die Rohdaten in einer Datenbank der International Nucleotide Sequence Database Collaboration (INSDC) wie GenBank und dem Short Read Archive verfügbar sein. Die Rohsequenzen werden benötigt, damit bei der Entwicklung neuer Montagemethoden die Sequenz verbessert werden kann.

Bei einer typischen Untersuchung wird eine MAG-, SAG- oder andere Genomsequenz mit den Datenbanken verglichen, um festzustellen, ob bereits nahe Verwandte beschrieben wurden. Ein häufig verwendetes Kriterium ist, dass die neue Sequenz eine durchschnittliche Nukleotididentität aufweisen muss, oder ANI von Pfad 2 gilt für Namen, die bereits veröffentlicht sind, wie z. B. Candidatus-Namen. Candidatus-Namen sind vorläufige Namen, die im Rahmen des ICNP festgelegt wurden und normalerweise auf Genomsequenzen und anderen Daten basieren. Sie wurden jedoch nicht validiert, da eine Kultur nicht in zwei Kultursammlungen hinterlegt wurde. Wenn die Genomsequenzen jedoch den Datenstandards entsprechen, können sie nach Prüfung durch die SeqCode-Kuratoren im SeqCode validiert werden.

Wie der SeqCode entwickelt wurde

Der SeqCode wurde am 1. Januar 2022 vom SeqCode-Organisationskomitee gestartet und eine Betaversion des Online-SeqCode-Registers ist derzeit in Betrieb. Der SeqCode entstand Nach einer Reihe von Online-Meetings und persönlichen Workshops in den Jahren 2018 und 2019, die zur Veröffentlichung von a führten Konsenserklärungdie von 120 prominenten Mikrobiologen aus der ganzen Welt unterstützt wurde.

Die Stellungnahme enthielt zwei Vorschläge. Die erste bestand darin, DNA-Sequenzen als Nomenklaturtypen im ICNP zuzulassen. Dieser Vorschlag wurde jedoch vom International Committee on Systematics of Prokaryotes (ICSP), dem Leitungsgremium des ICNP, abgelehnt. Der alternative Vorschlag bestand darin, den SeqCode vorzubereiten, der die Erstellung stabiler Namen ermöglichen würde, die mit dem ICNP kompatibel sind, sodass die beiden Codes in Zukunft zusammengeführt werden könnten. Der erste Entwurf des SeqCode wurde im Sommer 2020 fertiggestellt und auf einer Reihe internationaler Online-Workshops diskutiert, die im Februar 2021 unter dem Banner der International Society for Microbial Ecology (ISME) stattfanden. An diesen Workshops nahmen 848 Registranten aus 42 Ländern teil. Als Ergebnis dieses Prozesses wurde im Sommer 2022 die erste Ausgabe des SeqCode veröffentlicht.

Treten Sie der SeqCode-Community bei

Der Erfolg des SeqCode hängt von der Beteiligung der Gemeinschaft ab, und Interessenten an der mikrobiellen Nomenklatur sind herzlich willkommen Treten Sie der SeqCode-Community bei. Die Mitgliedschaft ermöglicht die Abstimmung über Änderungen des SeqCode und seiner Satzung, die Wahl von Amtsträgern und die Teilnahme an systematischen Diskussionen. Die Statuten für die Verwaltung des SeqCode-Leitungsgremiums, des SeqCode-Komitees, sind ebenfalls verfügbar. Ziel ist es, nicht nur einen wertvollen Service zu bieten, sondern auch die Benennung zu vereinfachen und die Stabilität von Namen zu verbessern. Um diese Ziele zu erreichen, ist eine gemeinschaftliche Beratung unerlässlich. SeqCode berücksichtigt außerdem die FAIR-Prinzipien der Auffindbarkeit, Zugänglichkeit, Interoperabilität und Wiederverwendbarkeit, um die Durchdringung des Registers in andere Datenbanken zu fördern.

Mehr Informationen:
Aharon Oren et al., Internationaler Code der Nomenklatur der Prokaryoten. Prokaryotischer Code (Revision 2022), Internationale Zeitschrift für systematische und evolutionäre Mikrobiologie (2023). DOI: 10.1099/ijsem.0.005585

Zur Verfügung gestellt von der American Society for Microbiology

ph-tech