L’expérience Large Hadron Collider Beauty (LHCb) au CERN est la plus grande expérience au monde en physique des saveurs des quarks avec un vaste programme de physique des particules. Ses données des Runs 1 et 2 du Large Hadron Collider (LHC) ont jusqu’à présent été utilisées pour plus de 600 publications scientifiques, y compris un certain nombre de découvertes importantes.
Alors que tous les résultats scientifiques de la collaboration LHCb sont déjà accessibles au public par le biais d’articles en libre accès, les données utilisées par les chercheurs pour produire ces résultats sont désormais accessibles à tous dans le monde via le portail de données ouvertes du CERN. La publication des données s’inscrit dans le cadre de la politique scientifique ouverte du CERN, reflétant les valeurs de transparence et de collaboration internationale inscrites dans la Convention du CERN depuis plus de 60 ans.
« Les données collectées à LHCb sont un héritage unique pour l’humanité, d’autant plus qu’aucune autre expérience ne couvre la région que LHCb examine », déclare Sebastian Neubert, responsable du projet de données ouvertes LHCb. « Il a été obtenu grâce à un énorme effort de collaboration internationale, qui a été financé par le public. Par conséquent, les données appartiennent à la société. »
L’échantillon de données mis à disposition représente 20 % de l’ensemble total de données collectées par l’expérience LHCb en 2011 et 2012 lors de l’exploitation 1 du LHC. Il comprend 200 téraoctets contenant des informations obtenues à partir d’événements de collision proton-proton filtrés et enregistrés avec le détecteur.
La collaboration LHCb a prétraité les données en reconstruisant des signatures expérimentales, telles que les trajectoires de particules chargées, à partir des informations brutes fournies par son système de détection complexe. Les données sont filtrées, classées selon environ 300 processus et désintégrations, et mises à disposition dans le même format que celui utilisé par les physiciens de LHCb.
L’analyse des données du LHC est un exercice complexe et chronophage. Par conséquent, pour faciliter l’analyse, les échantillons sont accompagnés d’une documentation et de métadonnées détaillées, ainsi que d’un glossaire expliquant plusieurs centaines de termes spéciaux utilisés dans le prétraitement. Les données peuvent être analysées à l’aide d’algorithmes LHCb dédiés, disponibles sous forme de logiciel open source.
Les données conviennent à différents types d’études de physique et peuvent être téléchargées directement par n’importe qui. « Il est destiné à être utilisé par des scientifiques professionnels et son interprétation nécessite des connaissances en physique des particules, mais tout le monde est invité à l’essayer », poursuit Neubert. « Ce serait formidable si les données inspirent de nouvelles directions de recherche et sont utilisées par des chercheurs dans d’autres domaines, tels que la science des données et l’intelligence artificielle. Nous sommes impatients d’entendre les utilisateurs des données ce qu’ils trouvent. »
D’autres publications de données de la collaboration LHCb sont prévues à l’avenir.
Plus d’information:
Portail de données ouvertes du CERN