Le télescope Vera Rubin générera une quantité ahurissante de données, disent les astronomes

Lorsque l’observatoire Vera C. Rubin sera mis en service en 2025, il deviendra l’un des outils les plus puissants dont disposent les astronomes, capturant d’énormes portions du ciel chaque nuit grâce à son miroir de 8,4 mètres et sa caméra de 3,2 gigapixels. Chaque image sera analysée dans un délai de 60 secondes, alertant les astronomes d’événements transitoires comme les supernovae. Un nombre incroyable de 5 pétaoctets (5 000 téraoctets) de nouvelles images brutes seront enregistrés chaque année et mis à la disposition des astronomes pour étude.

Sans surprise, les astronomes ont hâte de mettre la main sur les données à haute résolution. Un nouveau document décrit comment les énormes quantités de données seront traitées, organisées et diffusées. L’ensemble du processus nécessitera plusieurs installations sur trois continents au cours de l’enquête prévue sur 10 ans.

L’Observatoire Rubin est un télescope au sol situé dans les Andes chiliennes. Le télescope Simonyi Survey de 8,4 mètres de l’observatoire utilisera l’appareil photo numérique à la plus haute résolution au monde, qui comprend également le plus grand objectif fish-eye au monde. L’appareil photo a à peu près la taille d’une petite voiture et pèse près de 2 800 kg (6 200 lb). Ce télescope d’enquête se déplace rapidement et sera capable de balayer l’intégralité du ciel visible de l’hémisphère sud toutes les quatre nuits.

« La détection et la classification automatisées des objets célestes seront effectuées par des algorithmes sophistiqués sur des images haute résolution pour produire progressivement un catalogue astronomique composé à terme de 20 milliards de galaxies et 17 milliards d’étoiles et de leurs propriétés physiques associées », écrivent Fabio Hernandez, George Beckett, Peter. Clark et plusieurs autres astronomes dans leur papier préimprimé posté sur arXiv.

Le projet principal de l’Observatoire Rubin est le Legacy Survey of Space and Time (LSST) et les chercheurs prévoient que ce projet rassemblera des données sur plus de 5 millions d’objets de la ceinture d’astéroïdes, 300 000 chevaux de Troie Jupiter, 100 000 objets géocroiseurs et plus de 40 000 ceintures de Kuiper. objets. Puisque Rubin sera capable de cartographier le ciel nocturne visible tous les quelques jours, bon nombre de ces objets seront observés des centaines de fois.

Grâce aux observations répétées du télescope, l’énorme quantité de données permettra de calculer les positions et les orbites de tous ces objets.

Les images et les données circuleront immédiatement du télescope vers l’installation de base et le centre d’accès aux données chilien à La Serena, au Chili, puis seront acheminées vers les trois installations de données Rubin sur des réseaux dédiés à haut débit reliant les sites : l’installation de données française CC-IN2P3 à Lyon, France, le UK Data Facility, le réseau IRIS, au Royaume-Uni et le Data Facility et le Data Access Center des États-Unis au SLAC National Accelerator Laboratory en Californie, aux États-Unis. Il existe également un siège social au sein de l’Association des universités pour la recherche en astronomie ( AURA) à Tucson, Arizona, États-Unis

Une fois les images prises, elles seront traitées selon trois échelles de temps différentes : rapide, quotidienne et annuelle. L’article de Hernandez et al. décrit comment les images brutes collectées chaque nuit d’observation seront traitées rapidement (dans un délai de 60 secondes), et les objets qui ont changé de luminosité ou de position généreront et émettront des alertes pour une « détection transitoire ».

Pour ce processus appelé Prompt Processing, il n’y aura pas de période de propriété associée aux alertes, et elles seront immédiatement accessibles au public, puisque l’objectif est de transmettre rapidement presque tout sur un événement donné, pour permettre une classification et une prise de décision rapides. Les scientifiques estiment que Prompt Processing pourrait générer des millions d’alertes par nuit.

Les produits quotidiens, diffusés dans les 24 heures suivant l’observation, incluront les images de cette nuit. Les campagnes annuelles retraiteront l’ensemble des données d’images collectées depuis le début de l’enquête.

Pour chaque publication de données, il y aura des images brutes et d’étalonnage en plus des images prêtes pour la science qui ont été traitées avec des algorithmes scientifiques mis à jour. Il y aura également des catalogues avec les propriétés de tous les objets astrophysiques détectés.

« Le volume des produits de données publiés générés par le traitement annuel de l’ensemble accumulé d’images brutes est en moyenne 2,3 fois supérieur à la taille de l’ensemble de données d’entrée pour cette année-là et devrait atteindre plus de cent pétaoctets à la fin de l’enquête,  » ont écrit les astronomes. Ils ont également déclaré qu’au cours de l’enquête qui s’étendra sur 10 ans, le volume de données publiées à des fins d’analyse scientifique devrait augmenter d’un ordre de grandeur.

L’Observatoire Rubin utilisera plusieurs types de produits et services de données pour l’archivage et la diffusion des données aux diverses collaborations scientifiques. Le document indique que les « pipelines scientifiques » Rubin LSST sont composés d’environ 80 types de tâches différentes, qui sont toutes mises en œuvre sur une base de code algorithmique commune et un logiciel spécialisé. Il existe une fonctionnalité appelée Data Butler, qui est le système logiciel qui résume les détails d’accès aux données (y compris l’emplacement des données, le format des données et les protocoles d’accès).

Chaque année, une publication de données sera produite et mise à la disposition des collaborations scientifiques pour être utilisée dans des études portant sur quatre piliers scientifiques principaux : l’étude de la matière noire et de l’énergie noire, l’inventaire des objets du système solaire, l’exploration du ciel optique transitoire et la cartographie de la Voie lactée.

Cette version annuelle permettra à toutes les images d’enquête prises à ce jour d’être retraitées, combinées et mesurées automatiquement pour produire une image de plus en plus profonde de l’ensemble du ciel du Sud, ainsi qu’un catalogue croissant d’objets astronomiques qui capturent l’évolution de chacun d’entre eux au fil du temps. Ce traitement annuel des données sera effectué dans les trois installations de données, l’ensemble de données final étant assemblé au SLAC et mis à la disposition des astronomes et des physiciens via la plateforme scientifique Rubin.

À l’heure actuelle, on s’attend à ce que les données de l’Observatoire Rubin deviennent entièrement publiques après deux ans. La question de savoir comment accéder aux données publiques et comment cet accès pourrait être financé est toujours en suspens.

Plus d’information:
Fabio Hernandez et al, Aperçu de l’infrastructure de traitement d’images distribuée pour produire le Legacy Survey of Space and Time, arXiv (2023). DOI : 10.48550/arxiv.2311.13981

Informations sur la revue :
arXiv

Fourni par Universe Today

ph-tech