Eine Analyse von Millionen von SARS-CoV-2-Genomen ergab, dass eine Rekombination des Virus ungewöhnlich ist, aber wenn sie auftritt, findet sie am häufigsten in der Spike-Proteinregion statt, dem Bereich, der es dem Virus ermöglicht, sich an Wirtszellen anzuheften und diese zu infizieren.
Die von Wissenschaftlern der UC Santa Cruz geleitete Studie wurde am 11. August in der Zeitschrift veröffentlicht Natur. Es beschreibt eine neue Software, die von den Forschern entwickelt wurde, um den phylogenetischen Stammbaum von COVID-19, ein Diagramm der Evolutionsgeschichte des Virus, nach Fällen von Rekombination zu durchsuchen. Diese Software ist Open Source, sodass Beamte des öffentlichen Gesundheitswesens sie verwenden können, um Fälle von Rekombination in ihren Gemeinden zu verfolgen.
Rekombination tritt auf, wenn zwei genetisch unterschiedliche Formen des Virus hybridisieren. Diese Studie konzentrierte sich auf die nachweisbare Rekombination, wenn die Hybridisierung zu einer Sequenz führt, die genetisch neu ist, und nicht auf Fälle, in denen zwei Sequenzen kombiniert werden, um eine Sequenz zu bilden, die mit einer bereits existierenden identisch ist.
„Es ist wirklich wichtig, um die Evolutionsgeschichte des Virus zu rekonstruieren“, sagte Russell Corbett-Detig, leitender Autor der Studie und außerordentlicher Professor für Biomolekulartechnik an der Baskin School of Engineering. „Wenn es eine Rekombination gibt, ist es nicht ein Baum, es sind viele Bäume, und die Möglichkeit, dies genau zu verfolgen, ist wirklich entscheidend für das Verständnis der Evolution des Virus.“
Erkenntnisse zur Rekombination
Die Forscher analysierten 1,6 Millionen Proben von COVID-19 und fanden 589 Rekombinationsereignisse, was darauf hinweist, dass nur etwa 2,7 % der sequenzierten Genome aus einer Rekombination resultieren. Diese Sequenzen stammen aus dem SARS-CoV-2-Browser der UC Santa Cruz, einem Repository für COVID-19-Genomdaten, das mit derzeit fast 12 Millionen Sequenzen die größte Sammlung genomischer Sequenzen einer einzelnen Art ist, die jemals zusammengestellt wurde.
Während die Ergebnisse zeigen, dass die Rekombination häufiger in der Spike-Proteinregion auftritt, ist noch nicht bekannt, warum dies so ist. Dies könnte möglicherweise das Ergebnis einer mechanistischen Verzerrung sein, die darauf hinweist, dass es die natürliche Tendenz aller Coronaviren ist, sich in Richtung der Drei-Prime-Region des viralen Genoms zu rekombinieren, die das Spike-Protein enthält, oder dass eine positive natürliche Selektion für COVID-19 begünstigt wird Rekombinanten, die in dieser Region vorkommen.
Obwohl eine Rekombination auftritt, gibt es keine Hinweise darauf, dass die resultierenden Stämme eher epidemiologisch bedeutsam sind. Tatsächlich sterben die meisten rekombinanten Varianten aus, ebenso wie die meisten der Tausenden von mutierten Varianten von COVID-19.
Eine neue Software, die hauptsächlich von Yatish Turakhia, Assistenzprofessor der UC San Diego, während seiner Postdoktorandenausbildung im Labor von Corbett-Detig geschrieben wurde, ermöglichte die Rechenleistung, die für die Analyse von Millionen von Genomen erforderlich ist. Die Software namens Recombination Inference using Phylogenetic PLacementS (RIPPLES) kann einen riesigen phylogenetischen Baum von COVID-19-Genomen effizient durchsuchen, um Fälle zu finden, in denen eine neue Sequenz eine Kombination aus zwei verschiedenen Abschnitten des Baums zu sein scheint. Der Stammbaum von COVID-19, genannt UShER, wurde von UCSC-Forschern entwickelt und ist das wichtigste Instrument, das von Gesundheitsbehörden weltweit verwendet wird, um die Verbreitung von Varianten in ihrer Gemeinde zu verfolgen.
Die Forscher fanden heraus, dass die Rekombination am phylogenetischen Baum von COVID-19 am häufigsten in Form von „langen Ästen“ auftaucht, was den Anschein erweckt, dass mehrere Mutationen nacheinander aufgetreten sind, was ziemlich selten ist.
„In einem Baum mit Millionen von Sequenzen finden Sie diese langen Verzweigungen, die die möglichen Fälle einer nachweisbaren Rekombination auf nur etwa 10.000 Verzweigungen reduzieren“, sagte Turakhia. „Durch diese langen Äste ist die Rekombination am Baum viel einfacher zu erkennen, was die effiziente Leistung der neuen Software ermöglicht.“
Turakhia und sein Team wollen die Geschwindigkeit und Leistung von RIPPLES weiter verbessern und visuelle Tools entwickeln, um es einem breiteren Publikum zugänglicher zu machen.
Verwendung für die öffentliche Gesundheit
Zu wissen, wann eine Rekombination auftritt, ist entscheidend für das Verständnis der evolutionären Abstammung einer Sequenz des Virus. Die Rekombination kann den Prozess der Rückverfolgung des phylogenetischen Baums einer bestimmten Sequenz erschweren, da ihr genetisches Material das Ergebnis zweier Verbindungsbereiche des gesamten COVID-19-Stammbaums ist.
Dies kann Beamten helfen zu verstehen, wann eine scheinbar neue Linie von COVID-19 wirklich eine zum ersten Mal eingeführte unabhängige Mutation ist oder eher nur eine Kombination aus zwei Linien, die bereits in der Gemeinschaft existierten. Das Verständnis, wann eine Rekombination auftritt, ist auch aus Sicht der öffentlichen Gesundheit wichtig, da es das Virus potenziell besser darin machen kann, der Immunität zu entgehen.
Darüber hinaus hat die Verfügbarkeit und Benutzerfreundlichkeit der RIPPLES-Software positive Auswirkungen auf Genomexperten und Beamte des öffentlichen Gesundheitswesens gleichermaßen, die einen Satz von COVID-19-Genomproben in nur wenigen Minuten effizient nach Rekombination durchsuchen können.
Dies spiegelt ein größeres Thema der Arbeit der skalierbaren Übersetzung von Pathogengenomikdaten im Labor von Corbett-Detig und dem UCSC Genomics Institute wider. Die Forscher konzentrieren sich auf die Entwicklung von Tools, die es Gesundheitsbehörden ermöglichen, die Fragen, die sie stellen möchten, zu automatisieren und zu übersetzen und Antworten zu erhalten, die einfach zu handhaben und zuverlässig sind.
„Ein großer Teil des Erfolgs unserer Arbeit war, dass die Software im Großen und Ganzen extrem zugänglich und rechengünstig ist“, sagte Corbett-Detig. „Jeder könnte seine hundert neuen SARS-CoV-2-Genomsequenzen nehmen und in nur wenigen Minuten auf einem einfachen Laptop herausfinden, ob es möglicherweise rekombinante Proben gibt. Die globale öffentliche Gesundheit muss demokratisiert werden, bis zu dem Punkt, an dem jeder es tun kann, selbst wenn Sie sind kein superreiches Labor mit riesigen Servern.“
Phylogenomik im Pandemie-Maßstab enthüllt die SARS-CoV-2-Rekombinationslandschaft, Natur (2022). DOI: 10.1038/s41586-022-05189-9