L’ère numérique a été une formidable aubaine pour les domaines des statistiques et de l’astronomie. Cependant, selon le Dr Max Bonamente, professeur de physique et d’astronomie à l’Université de l’Alabama à Huntsville (UAH), la plupart des astronomes ne sont pas suffisamment formés pour réaliser les avantages substantiels à gagner en réunissant ces disciplines. Lui et ses collègues s’efforcent de changer tout cela grâce à des recherches pionnières dans le domaine en plein essor de l’astrostatistique.
Le Dr Bonamente a publié un article dans le Avis mensuels de la Royal Astronomical Society présentant une nouvelle tournure innovante dans les distributions de probabilité qui promet de révolutionner la façon dont les données cosmologiques peuvent être interprétées.
« Traditionnellement, les astronomes ont été de piètres statisticiens. Nous aimons « inventer les statistiques au fur et à mesure » », explique le chercheur. « Mon dernier article est une nouvelle méthode pour tenir compte des erreurs systématiques. Il décrit une nouvelle méthode de distribution de probabilité que j’ai développée et à laquelle je n’avais pas pensé auparavant. C’est un truc ringard, mais cela a des implications réelles en termes de conclusions à partir d’observations. De nombreux astronomes n’ont pas la formation en mathématiques nécessaire pour faire des statistiques avec soin. C’est difficile, car les statistiques sont des mathématiques difficiles à la base. Peu de gens veulent prendre le temps supplémentaire pour le faire. Bien sûr, tout le monde ne ressent pas cela. »
En témoigne le succès d’un atelier appelé iid2022 : Statistical Methods for Event Data et sous-titré Illuminating the Dynamic Universe, récemment organisé par l’UAH, une partie du système de l’Université de l’Alabama. Le Dr Bonamente et son collègue, le Dr Lingling Zhao, professeur adjoint de sciences spatiales, ont organisé l’atelier.
Le rassemblement a été conçu pour former de jeunes scientifiques aux méthodes statistiques appropriées pour l’analyse et l’interprétation des données et comprenait une analyse collaborative pratique d’échantillons de problèmes à l’aide de logiciels avancés. Le rassemblement a également fourni un forum aux astronomes et chercheurs dans des domaines connexes pour échanger sur les avancées récentes dans l’analyse des données d’événements.
Les « données d’événement » sont la collection d’événements individuels – en astronomie, généralement des photons légers, mais aussi des neutrinos ou d’autres particules. Ces événements peuvent être étudiés par des applications statistiques en fonction de la localisation (images), du temps (comme les courbes de lumière) ou de l’énergie ou de la longueur d’onde (spectres). Les événements peuvent également être définis comme des ensembles de quantités, tels que des événements d’ondes gravitationnelles ou des amas de galaxies détectés par des mesures du fond diffus cosmologique, qui est le reste refroidi de la première lumière qui pourrait voyager librement dans l’univers.
Originaire d’Italie, le Dr Bonamente a déménagé aux États-Unis en 1997 et est un ancien élève de l’UAH, obtenant à la fois une maîtrise et un doctorat. en physique à l’UAH, où il a développé l’utilisation d’une méthode statistique appelée chaîne de Markov Monte Carlo (MCMC) pour l’analyse des événements cosmologiques. Les MCMC comprennent une classe d’algorithmes spéciaux utilisés dans les distributions de probabilité, une fonction mathématique qui donne les probabilités d’occurrence de différents résultats possibles pour une expérience.
« Ces méthodes ont permis d’analyser les données plus rapidement et avec plus de précision », note le chercheur. « De nos jours, l’apprentissage automatique est partout en astronomie. Nous avons utilisé des MCMC pour mesurer la constante de Hubble, par exemple, ce qui était très important à l’époque. » La constante de Hubble est l’un des nombres les plus importants de la cosmologie, car elle nous indique à quelle vitesse l’univers s’étend.
L’astrostatistique représente l’avenir de la gestion et de l’analyse des mégadonnées en astronomie, car les dernières technologies produisent des quantités stupéfiantes de données d’une complexité époustouflante. Le défi d’analyser ces données ne fait que croître de façon exponentielle à mesure que de nouveaux mécanismes de collecte de données évoluent dans les instruments radio, micro-ondes, infrarouge, rayons X, rayons gamma, interféromètre et optiques qui nécessiteront de nouveaux algorithmes et techniques statistiques pour donner un sens à tout cela.
« La plupart des astronomes ou des physiciens ne connaissent pas grand-chose à la théorie des probabilités, encore moins aux statistiques », souligne le Dr Bonamente. « Le travail d’un scientifique devrait être celui d’être prudent, et de ne pas céder au désir de trouver un grand nouveau résultat quand il n’y en a pas. Donc, marier les mathématiques et l’astronomie est la direction naturelle pour moi. »
Plus d’information:
Massimiliano Bonamente, Erreurs systématiques dans la régression du maximum de vraisemblance des données de comptage de Poisson : introduction de la distribution χ2 surdispersée, Avis mensuels de la Royal Astronomical Society (2023). DOI : 10.1093/mnras/stad463