Plateforme en ligne conçue pour améliorer la reproductibilité, les collaborations scientifiques

Tous tels nach Plastik Mit zunehmendem Abfall augmente auch das

Pendant des siècles, les scientifiques se sont appuyés sur un stylo ou un crayon et un carnet de laboratoire fiable pour s’assurer que leurs expériences pouvaient être comprises et reproduites par leurs collègues. Maintenant, comme les expériences peuvent impliquer des dizaines d’étapes et des centaines de matériaux, produire des gigaoctets de données qui nécessitent des superordinateurs pour être traitées et sont partagées avec des collaborateurs du monde entier, le cahier de laboratoire peut ne plus suffire.

Dans une étude récente, les chercheurs rapportent le développement d’une plate-forme en ligne qui peut aider les chercheurs en génomique à suivre les expériences de la conception à la publication, en conservant des enregistrements précis à des fins de contrôle de la qualité et en facilitant les efforts potentiels de reproductibilité.

Le système, nommé Plate-forme de recherche épigénomique, ou PEGR, est conçu comme un outil pour aider les laboratoires expérimentaux des sciences de la vie – ou laboratoires humides – à suivre les opérations très complexes et à transformer les données brutes en connaissances scientifiques. Par exemple, plutôt que de s’appuyer sur des notes manuscrites minutieuses, le PEGR intègre des codes-barres bidimensionnels – appelés réponse rapide ou codes QR – pour collecter et suivre électroniquement des informations détaillées sur les échantillons au fur et à mesure de leur progression dans le processus expérimental.

L’efficacité du PEGR peut améliorer la reproductibilité, une des principales raisons du développement de l’outil, selon William Lai, professeur de recherche adjoint à l’Université Cornell et ancien professeur de recherche adjoint en biochimie et biologie moléculaire à Penn State. La reproductibilité, une étape critique du processus scientifique, oblige les scientifiques à vérifier leur travail pour s’assurer qu’il est précis, sûr et fonctionnel dans les applications du monde réel.

« Il est déjà bien reconnu que la reproductibilité est un problème non seulement dans les sciences de la vie, mais dans tous les domaines STEM (science, technologie, ingénierie et médecine) », a déclaré Lai. « Il y a eu histoire après histoire d’équipes de recherche qui ont prétendu découvrir quelque chose et puis, quelques années plus tard, nous constatons que personne n’a reproduit ces résultats en dehors du laboratoire qui a généré les découvertes. PEGR est une approche pour maîtriser suivi des processus expérimentaux – ce qu’un utilisateur utilise et quand l’utilise-t-il – afin que nous puissions améliorer la reproductibilité. »

Parce qu’il s’agit d’une plate-forme en ligne, le PEGR peut connecter les scientifiques du monde entier pour faciliter les efforts de reproductibilité. Selon Danying Shao, ingénieur en recherche et développement à l’Institute for Computational and Data Science (ICDS) Research Innovations with Scientists and Engineers, ou RISE, équipe.

« Il ne fait aucun doute qu’une explosion de données se produit dans la bioinformatique », a déclaré Shao, qui a aidé à concevoir la plate-forme. « Les ensembles de données volumineuses sont générés à un rythme sans précédent. Par exemple, un seul échantillon peut générer des gigaoctets de données. Et, lorsque nous séquençons des centaines d’échantillons, vous pouvez voir que nous pouvons atteindre le niveau où nous créons des téraoctets de Les données. »

Selon les chercheurs, qui ont publié des détails sur le système dans Biologie du génomePEGR est intégré avec la plateforme Galaxy, un système de flux de travail scientifique open source. PEGR est conçu pour suivre l’échantillon et l’expérience de séquençage, gérer le traitement des données, puis produire des rapports et des visualisations des résultats expérimentaux.

Lors des premières exécutions avec la plate-forme, les chercheurs constatent déjà les premiers avantages.

« Juste à titre d’exemple, récemment, un technicien a connu une série d’expériences ratées, nous sommes donc allés dans le PEGR et en examinant les métadonnées expérimentales, nous avons réalisé qu’ils utilisaient un mauvais lot d’un certain produit chimique », a déclaré Lai. « Maintenant, historiquement, le processus pour trouver la cause des expériences ratées aurait pu traîner pendant des mois, sinon un an ou deux, au lieu de trouver la source tout de suite. »

Recherche propulsée par RISE

Selon Chuck Pavloski, chef d’équipe RISE, le projet PEGR n’est qu’un exemple de la façon dont les membres de RISE aident les chercheurs de Penn State, ainsi que la communauté de recherche dans son ensemble. Pavloski compare l’équipe à un lien entre des chercheurs dotés d’outils informatiques et d’une expertise qui peuvent étendre le pouvoir de la science pour relever d’importants défis scientifiques et sociétaux.

« Les ingénieurs de RISE sont effectivement le lien entre la science et les besoins informatiques d’aujourd’hui », a déclaré Pavloski. « En d’autres termes, ils permettent aux scientifiques d’être ce qu’ils sont bons. Nous agissons à peu près de la même manière qu’un scientifique travaillant dans un laboratoire national, ouvrant la voie à nos scientifiques pour qu’ils puissent explorer leurs domaines et poursuivre leurs idées de recherche. . »

Ce partenariat propulsé par RISE peut aider les scientifiques à résoudre les questions de recherche informatique traditionnelles, telles que fournir des conseils sur les meilleures pratiques d’utilisation du supercalculateur Roar de Penn State pour offrir des moyens d’optimiser et d’améliorer le code, mais l’équipe peut également appliquer sa propre compréhension approfondie de la recherche universitaire à collaborer avec des scientifiques sur des projets interdisciplinaires de pointe.

« L’équipe RISE est composée de scientifiques de niveau maîtrise et doctorat qui ont une compréhension approfondie du fonctionnement de la science, mais qui travaillent tout le temps en dehors de leur domaine », a déclaré Pavloski. « Par exemple, nous pourrions avoir un météorologue qualifié qui travaille également sur des projets de biochimie ou de génomique, ou nous avons des ingénieurs dans notre équipe qui peuvent aider des scientifiques en astronomie ou en biochimie. »

Cette interdisciplinarité offre un autre avantage. Les membres de l’équipe RISE peuvent tirer parti des meilleures pratiques en sciences informatiques dans un domaine pour mener des enquêtes dans d’autres domaines ou disciplines.

« Nous fournissons également un lien fort avec les nouvelles technologies, telles que l’utilisation de techniques d’intelligence artificielle ou l’exploration de l’utilisation d’une unité de traitement graphique – ou GPU – dans un projet de recherche », a déclaré Pavloski.

Les ingénieurs de RISE travaillent également avec des spécialistes de la visualisation de données pour aider les scientifiques à créer des visualisations convaincantes pour leur travail, ainsi qu’à tirer parti des nouvelles technologies immersives, telles que la réalité virtuelle et la réalité augmentée, pour explorer les données de manière profondément engageante.

Utilisations futures

Les chercheurs espèrent que le PEGR, qui est open source, pourrait produire des avantages dans toute l’entreprise scientifique, économiser du temps, de l’argent et des maux de tête, et conduire à tout, d’une compréhension plus riche du génome à de meilleurs traitements médicaux atteignant les patients plus rapidement.

À l’avenir, les chercheurs pourraient explorer si la plate-forme en ligne peut être étendue en dehors de l’utilisation dans les laboratoires humides et pour une utilisation dans la science translationnelle, ce qui aiderait les scientifiques à apporter des traitements et des solutions au monde réel.

« Cette plate-forme a été conçue à l’origine autour de la recherche fondamentale, mais nous travaillons activement à la faire évoluer dans le domaine biomédical translationnel à l’avenir », a déclaré Lai.

Plus d’information:
Danying Shao et al, PEGR : une plateforme de gestion flexible pour une recherche épigénomique et génomique reproductible, Biologie du génome (2022). DOI : 10.1186/s13059-022-02671-5

Fourni par l’Université d’État de Pennsylvanie

ph-tech