ID de programme open source séquences de gènes synthétiques et naturels

Tous tels nach Plastik Mit zunehmendem Abfall augmente auch das

Il est certain que certaines bactéries et certains virus peuvent causer des maladies, mais les véritables coupables sont les séquences préoccupantes qui se trouvent dans les génomes de ces microbes.

Les appeler est sur le point de devenir plus facile.

Des années de travail des informaticiens de l’Université Rice et de leurs collègues ont conduit à une plate-forme améliorée pour le dépistage de l’ADN et la caractérisation des séquences pathogènes, qu’elles soient naturelles ou synthétiques, avant qu’elles n’aient la possibilité d’avoir un impact sur la santé publique.

L’informaticien Todd Treangen de la George R. Brown School of Engineering de Rice et la spécialiste de la génomique Krista Ternus de Signature Science LLC ont dirigé l’étude qui a produit SeqScreen, un programme permettant de caractériser avec précision de courtes séquences d’ADN, souvent appelées oligonucléotides.

Treangen a déclaré que SeqScreen est destiné à améliorer la détection et le suivi d’un large éventail de séquences pathogènes.

« SeqScreen est la première boîte à outils logicielle open source disponible pour le criblage d’ADN synthétique », a déclaré Treangen. « Notre programme améliore l’état de l’art antérieur pour les entreprises, les particuliers et les agences gouvernementales pour leurs pratiques de dépistage ADN. »

L’étude, qui a commencé comme un projet de recherche à haut risque et à haut rendement, apparaît dans la revue Biologie du génome.

SeqScreen profite du travail de partenaires de la société Signature Science, basée à Austin, au Texas, pour organiser une base de données de milliers de séquences de gènes représentant 32 types de fonctions de virulence. « Cette base de données organisée a nécessité des années de biocuration et d’examen pour se développer, et est au cœur des données de formation de l’algorithme d’apprentissage automatique de SeqScreen », a déclaré Treangen.

La société a collaboré avec Treangen l’année dernière pour trouver des mutations du SRAS-CoV-2 qui auraient pu rendre la variante Omicron plus résistante aux anticorps, y compris ceux des vaccinations. « SeqScreen est venu en premier, et certaines de ses idées ont été transférées au projet COVID », a-t-il déclaré. « Mais SeqScreen a une portée beaucoup plus large. »

« Nous nous concentrons sur l’identification des fonctions des séquences préoccupantes, que nous appelons FunSoC, alors que les approches de dépistage précédentes visaient davantage à déterminer » êtes-vous cette bactérie ? » ou ‘êtes-vous ce virus?’ « , A déclaré Treangen. « SeqScreen ne se concentre pas sur les noms des bactéries ou des virus qui se trouvent dans votre échantillon. Nous voulons plutôt savoir s’il y a des séquences dans cet échantillon qui pourraient être nocives, comme des toxines qui peuvent détruire les cellules humaines. »

Il est important de se concentrer sur les fonctions préoccupantes, a-t-il déclaré, car les bactéries échangent facilement de l’ADN par transfert horizontal de gènes.

« Nous avons mis en évidence des exemples dans la publication de bactéries dont les génomes sont essentiellement identiques, sauf que l’un a une séquence préoccupante, telle qu’une toxine, que l’autre n’a pas », a déclaré Treangen. « SeqScreen se concentre vraiment sur la présence ou l’absence de fonctions qui représentent des facteurs de virulence. »

Il a déclaré que SeqScreen contribuera également à la détection de nouveaux agents pathogènes ou émergents dans l’environnement.

Plus d’information:
Advait Balaji et al, SeqScreen : dépistage fonctionnel précis et sensible des séquences pathogènes via l’apprentissage d’ensemble, Biologie du génome (2022). DOI : 10.1186/s13059-022-02695-x

Fourni par l’Université Rice

ph-tech