Les outils d’analyse de données basés sur l’IA ont le potentiel d’améliorer considérablement la qualité des publications scientifiques. Une nouvelle étude du professeur Mathias Christmann, professeur de chimie à la Freie Universität Berlin, a révélé des lacunes dans les publications chimiques.
À l’aide d’un script Python développé à l’aide de modèles de langage d’IA modernes, Christmann a analysé plus de 3 000 articles scientifiques publiés dans Lettres organiques au cours des deux dernières années. L’analyse a révélé que seulement 40 % des documents de recherche chimique contenaient des mesures de masse sans erreur. L’outil d’analyse de données basé sur l’IA utilisé à cette fin pourrait être créé sans aucune connaissance préalable en programmation.
« Les résultats démontrent à quel point les outils basés sur l’IA peuvent être puissants dans la recherche quotidienne. Ils rendent non seulement accessibles des analyses complexes, mais améliorent également la fiabilité des données scientifiques », explique Christmann.
Les grands modèles de langage avancés tels que ChatGPT (OpenAI), Gemini (Google) et Claude (Anthropic) permettent désormais de traduire le langage naturel directement en langages informatiques comme Python. Cela permet aux chercheurs sans expérience en codage de créer des applications qui, par exemple, recherchent dans de grands ensembles de données des composants de texte ou des valeurs de mesure spécifiques. Les données ainsi obtenues peuvent ensuite être traitées automatiquement et vérifiées pour leur plausibilité.
L’étude de Christmann, « Ce que j’ai appris en analysant des données de masse précises de 3 000 fichiers d’informations à l’appui », publié dans Lettres organiquesa utilisé un outil d’analyse de données basé sur l’IA pour découvrir des erreurs systématiques jusqu’alors inconnues. Il a également identifié des cas où des valeurs mal calculées semblaient être validées par des mesures.
« Ces observations soulèvent la question de savoir si certaines mesures ont pu être fabriquées », souligne le chercheur.
Cette étude démontre comment les outils d’IA peuvent améliorer l’intégrité scientifique grâce à un contrôle qualité automatisé et à une détection systématique des erreurs.
Dans le cadre d’une initiative « IA dans l’éducation », le département de biologie, de chimie et de pharmacie de la Freie Universität Berlin prévoit d’intégrer ces outils et des outils similaires dans son programme d’études. « Ils aideront les étudiants à développer de solides compétences en analyse de données et des capacités de pensée critique », explique Christmann. « Les outils d’IA seront précieux pour préparer les étudiants à leur carrière de chercheur. »
Plus d’informations :
Mathias Christmann, Ce que j’ai appris en analysant des données de masse précises de 3 000 fichiers d’informations à l’appui, Lettres organiques (2024). DOI : 10.1021/acs.orglett.4c03458