Une analyse de millions de génomes du SRAS-CoV-2 révèle que la recombinaison du virus est rare, mais lorsqu’elle se produit, c’est le plus souvent dans la région de la protéine de pointe, la zone qui permet au virus de se fixer et d’infecter les cellules hôtes.
L’étude, dirigée par des scientifiques de l’UC Santa Cruz, a été publiée le 11 août dans la revue La nature. Il détaille un nouveau logiciel créé par les chercheurs pour rechercher dans l’arbre phylogénétique COVID-19, un diagramme de l’histoire évolutive du virus, des cas de recombinaison. Ce logiciel est open source, ce qui permet aux responsables de la santé publique de l’utiliser pour suivre les cas de recombinaison au sein de leurs communautés.
La recombinaison se produit lorsque deux formes génétiquement distinctes du virus s’hybrident. Cette étude s’est concentrée sur la recombinaison détectable, lorsque l’hybridation aboutit à une séquence génétiquement nouvelle, et non sur les cas où deux séquences se combinent pour former une séquence identique à une déjà existante.
« C’est vraiment important pour reconstruire l’histoire évolutive du virus », a déclaré Russell Corbett-Detig, auteur principal de l’étude et professeur agrégé d’ingénierie biomoléculaire à la Baskin School of Engineering. « Quand il y a recombinaison, ce n’est pas un arbre, c’est beaucoup d’arbres, et être capable de tracer cela avec précision est vraiment crucial pour comprendre l’évolution du virus. »
Découvertes sur la recombinaison
Les chercheurs ont analysé 1,6 million d’échantillons de COVID-19 et ont trouvé 589 événements de recombinaison, ce qui indique que seulement 2,7 % environ des génomes séquencés résultent de la recombinaison. Ces séquences provenaient du navigateur UC Santa Cruz SARS-CoV-2, un référentiel de données génomiques COVID-19, qui est maintenant la plus grande collection de séquences génomiques d’une seule espèce jamais assemblée, actuellement à près de 12 millions de séquences.
Bien que les résultats montrent que la recombinaison se produit plus fréquemment dans la région de la protéine de pointe, on ne sait pas encore pourquoi. Cela pourrait potentiellement être le résultat d’un biais mécaniste, indiquant que c’est la tendance naturelle de tous les coronavirus à se recombiner vers la région des trois premiers du génome viral, qui contient la protéine de pointe, ou que la sélection naturelle positive pour COVID-19 favorise recombinants présents dans cette région.
Bien que la recombinaison se produise, rien ne prouve que les souches résultantes soient plus susceptibles d’être épidémiologiquement importantes. En fait, la plupart des variantes recombinantes disparaissent, tout comme la plupart des milliers de variantes mutées de COVID-19.
Un nouveau logiciel, écrit principalement par le professeur adjoint Yatish Turakhia de l’UC San Diego lors de sa formation postdoctorale dans le laboratoire de Corbett-Detig, a permis l’exploit de calcul requis pour l’analyse de millions de génomes. Le logiciel, appelé Recombination Inference using Phylogenetic PLacEmentS (RIPPLES), peut rechercher efficacement un arbre phylogénétique massif de génomes COVID-19 pour trouver des cas où une nouvelle séquence semble être une combinaison de deux sections distinctes de l’arbre. L’arbre phylogénétique COVID-19, appelé USHER, a été créé par des chercheurs de l’UCSC et est le principal outil utilisé par les responsables de la santé du monde entier pour suivre la propagation des variantes dans leur communauté.
Les chercheurs ont découvert que la recombinaison apparaît le plus souvent sur l’arbre phylogénétique du COVID-19 sous la forme de « longues branches », ce qui donne l’impression que plusieurs mutations se sont produites séquentiellement, ce qui est assez rare.
« Dans un arbre de millions de séquences, vous trouvez ces longues branches, qui réduisent les cas possibles de recombinaison détectable à seulement environ 10 de milliers de branches », a déclaré Turakhia. « Ces longues branches rendent la recombinaison beaucoup plus facile à repérer sur l’arbre, ce qui permet une performance efficace du nouveau logiciel. »
Turakhia et son équipe visent à continuer à améliorer la vitesse et les performances de RIPPLES et à créer des outils visuels pour le rendre plus accessible à un public plus large.
Utilisation pour la santé publique
Savoir quand la recombinaison se produit est crucial pour comprendre la lignée évolutive d’une séquence du virus. La recombinaison peut compliquer le processus de traçage de l’arbre phylogénétique d’une séquence particulière car son matériel génétique est le résultat de deux zones de jonction de l’arbre généalogique global du COVID-19.
Cela peut aider les fonctionnaires à comprendre quand une lignée de COVID-19 qui semble être nouvelle est vraiment une mutation indépendante introduite pour la première fois, ou plutôt juste une combinaison de deux lignées qui existaient déjà dans la communauté. Comprendre quand la recombinaison se produit est également important du point de vue de la santé publique, car cela peut potentiellement rendre le virus plus apte à échapper à l’immunité.
De plus, la disponibilité et la facilité d’utilisation du logiciel RIPPLES ont des implications positives pour les experts en génomique et les responsables de la santé publique, qui peuvent rechercher efficacement un ensemble d’échantillons génomiques COVID-19 pour la recombinaison en quelques minutes seulement.
Cela reflète un thème plus large du travail de traduction évolutive des données génomiques des agents pathogènes au laboratoire de Corbett-Detig et à l’UCSC Genomics Institute. Les chercheurs se concentrent sur la création d’outils qui permettent aux responsables de la santé publique d’automatiser et de traduire les questions qu’ils veulent poser, et de recevoir des réponses faciles à suivre et fiables.
« Une grande partie du succès de notre travail a été que le logiciel est extrêmement accessible et bon marché en termes de calcul dans le grand schéma des choses », a déclaré Corbett-Detig. « N’importe qui pourrait prendre ses cent nouvelles séquences du génome du SRAS-CoV-2 et déterminer s’il y avait des échantillons potentiellement recombinants en quelques minutes sur un ordinateur portable de base. La santé publique mondiale doit être démocratisée, au point que n’importe qui peut le faire, même si ce n’est pas un laboratoire super riche avec des serveurs géants. »
La phylogénomique à l’échelle pandémique révèle le paysage de la recombinaison du SRAS-CoV-2, La nature (2022). DOI : 10.1038/s41586-022-05189-9