L’un des principaux défis de la science du microbiome a été de distinguer ce qui est un contaminant environnemental potentiel d’un véritable signal de microbiome authentique. Les défis associés au séquençage métagénomique dans des environnements à faible biomasse incluent la distinction entre un vrai signal et une contamination, un ADN résiduel d’un kit d’échantillonnage ou d’extraction ou l’environnement.
Alors que les chercheurs incluent normalement des contrôles négatifs de l’équipement ou de l’environnement et utilisent des outils algorithmiques pour identifier les taxons présents dans l’environnement, tous les ensembles de données ne sont pas accompagnés de contrôles négatifs. Des chercheurs du Baylor College of Medicine et de la Rice University ont développé un outil de détection de contamination de novo pour établir la reproductibilité dans l’identification et l’analyse des microbes. Leurs conclusions ont été récemment publiées dans Communication Nature.
« Nous nous sommes associés à nos collaborateurs de l’Université Rice pour développer et tester un outil informatique que nous avons appelé Squeegee », a déclaré le Dr Kjersti Aagaard, professeur d’obstétrique et de gynécologie au Baylor and Texas Children’s Hospital.
« La prémisse de Squeegee est que nous pouvons utiliser un pipeline d’analyse informatique pour nous aider à détecter des » chapelure « de contaminants qui seraient communs entre le microbiome trouvé chez tous les hôtes humains (ou autres mammifères) et l’environnement d’échantillonnage ou de laboratoire. »
Le laboratoire Aagaard de Baylor a mené des recherches au cours de la dernière décennie, ce qui a conduit à un certain nombre d’ensembles de données riches provenant d’un grand nombre de participants qui ont une biomasse particulièrement faible et ont de nombreux témoins négatifs. Ils se sont associés à des chercheurs du Rice’s Treangen Lab pour tester Squeegee, un algorithme utilisé sur des ensembles de données de vie provenant d’études humaines qui avaient des contrôles de contamination de différents environnements et des kits d’extraction d’ADN.
Ils ont examiné le taux de faux positifs, le rappel et la précision avec laquelle Squeegee pouvait prédire et signaler ces ensembles de contamination environnementale en l’absence de contrôle négatif.
« Nous avons pu montrer que Squeegee était capable d’avoir un rappel pondéré élevé et un taux de faux positifs très faible dans ces ensembles de données de vérité terrain », a déclaré le Dr Michael Jochum, associé de recherche postdoctoral au Département d’obstétrique et de gynécologie Baylor.
Selon Jochum, Squeegee améliore la fiabilité globale des résultats d’analyse de séquençage métagénomique dans les études à faible biomasse – études qui contiennent peu d’ADN microbien comme le lait maternel, le placenta ou le liquide amniotique. L’outil d’identification de la contamination de novo est capable d’identifier les effets sur les lots, en les signalant comme des contaminants potentiels. Compte tenu de la concentration et de l’expertise du laboratoire Aagaard dans l’étude de ces environnements microbiens clairsemés, il s’agit d’un outil qu’ils ont ajouté à leur boîte à outils pour les études en cours et futures.
« Il s’agit d’un outil unique en son genre pour la communauté scientifique du microbiome, et il est disponible gratuitement », a déclaré Aagaard.
Plus d’information:
Yunxi Liu et al, Identification de novo des contaminants microbiens dans les microbiomes à faible biomasse microbienne avec Squeegee, Communication Nature (2022). DOI : 10.1038/s41467-022-34409-z