Large Hadron Collider Beauty veröffentlicht ersten Datensatz für die Öffentlichkeit

Die Kolosseen von Elden Ring oeffnen morgen endlich im kostenlosen

Das Large Hadron Collider Beauty (LHCb)-Experiment am CERN ist das weltweit führende Experiment in der Quark-Flavor-Physik mit einem breiten Teilchenphysikprogramm. Seine Daten aus den Läufen 1 und 2 des Large Hadron Collider (LHC) wurden bisher für über 600 wissenschaftliche Veröffentlichungen verwendet, darunter eine Reihe bedeutender Entdeckungen.

Während alle wissenschaftlichen Ergebnisse der LHCb-Zusammenarbeit bereits durch Open-Access-Papiere öffentlich zugänglich sind, sind die Daten, die von den Forschern zur Erstellung dieser Ergebnisse verwendet wurden, jetzt für jeden auf der Welt über das CERN-Portal für offene Daten zugänglich. Die Datenfreigabe erfolgt im Kontext der Open Science Policy von CERN, die die Werte der Transparenz und internationalen Zusammenarbeit widerspiegelt, die seit mehr als 60 Jahren in der CERN-Konvention verankert sind.

„Die am LHCb gesammelten Daten sind ein einzigartiges Vermächtnis für die Menschheit, zumal kein anderes Experiment die Region abdeckt, die der LHCb betrachtet“, sagt Sebastian Neubert, Leiter des LHCb-Open-Data-Projekts. „Sie wurden durch eine riesige internationale Gemeinschaftsleistung gewonnen, die von der Öffentlichkeit finanziert wurde. Daher gehören die Daten der Gesellschaft.“

Die zur Verfügung gestellte Datenprobe macht 20 % des gesamten Datensatzes aus, der vom LHCb-Experiment 2011 und 2012 während LHC Run 1 gesammelt wurde. Es umfasst 200 Terabyte mit Informationen aus Proton-Proton-Kollisionsereignissen, die mit dem Detektor gefiltert und aufgezeichnet wurden.

Die LHCb-Kollaboration hat die Daten vorverarbeitet, indem sie experimentelle Signaturen wie die Bahnen geladener Teilchen aus den Rohinformationen rekonstruiert hat, die von ihrem komplexen Detektorsystem geliefert wurden. Die Daten werden gefiltert, nach etwa 300 Prozessen und Zerfällen klassifiziert und im gleichen Format bereitgestellt, wie es die LHCb-Physiker verwenden.

Die Analyse von LHC-Daten ist ein komplexes und zeitaufwändiges Unterfangen. Um die Analyse zu erleichtern, werden die Proben daher von einer umfangreichen Dokumentation und Metadaten sowie einem Glossar begleitet, das mehrere hundert Fachbegriffe erklärt, die in der Vorverarbeitung verwendet wurden. Die Daten können mit speziellen LHCb-Algorithmen analysiert werden, die als Open-Source-Software verfügbar sind.

Die Daten eignen sich für verschiedene Arten von Physikstudien und können von jedem direkt heruntergeladen werden. „Es soll von professionellen Wissenschaftlern verwendet werden und seine Interpretation erfordert einige Kenntnisse der Teilchenphysik, aber jeder ist eingeladen, es auszuprobieren“, fährt Neubert fort. „Es wäre großartig, wenn die Daten neue Forschungsrichtungen anregen und von Forschern in anderen Bereichen wie Data Science und künstlicher Intelligenz genutzt werden. Wir sind gespannt darauf, von den Nutzern der Daten zu hören, was sie finden.“

Weitere Datenveröffentlichungen aus der LHCb-Kollaboration sind für die Zukunft geplant.

Mehr Informationen:
Offenes Datenportal des CERN

ph-tech