Des astronomes appliquent des techniques d’apprentissage automatique pour trouver des quasars de l’univers primitif dans un océan de données

Les quasars sont des noyaux galactiques extrêmement lumineux dans lesquels le gaz et la poussière qui tombent dans un trou noir supermassif central émettent d’énormes quantités de lumière. En raison de leur luminosité exceptionnelle, ces objets peuvent être observés à des décalages vers le rouge élevés, c’est-à-dire à de grandes distances.

Un décalage vers le rouge plus élevé indique non seulement qu’un quasar se trouve à une plus grande distance, mais aussi plus loin dans le temps. Les astronomes s’intéressent à l’étude de ces objets anciens car ils détiennent des indices sur l’évolution de notre univers au début de son adolescence.

Les candidats quasars à fort décalage vers le rouge sont d’abord identifiés par leur couleur (ils sont très rouges) et doivent ensuite être confirmés en examinant des observations séparées de leurs spectres. Cependant, certains candidats à fort décalage vers le rouge peuvent être éliminés par erreur des études ultérieures en raison de distorsions dans leur apparence causées par des lentilles gravitationnelles.

Il s’agit d’un phénomène qui se produit lorsqu’un objet massif, comme une galaxie, se trouve entre nous et un objet lointain. La masse de la galaxie courbe l’espace et agit un peu comme une loupe, ce qui provoque une courbure du chemin emprunté par la lumière de l’objet lointain et produit une image déformée de l’objet.

Bien que cet alignement puisse être bénéfique (la lentille gravitationnelle agrandit l’image du quasar, le rendant plus brillant et plus facile à détecter), il peut également modifier de manière trompeuse l’apparence du quasar.

La lumière interférente provenant des étoiles de la galaxie intermédiaire peut donner au quasar une apparence plus bleue, tandis que la courbure de l’espace-temps peut le faire apparaître étalé ou multiplié. Ces deux effets font qu’il est probable qu’il soit éliminé comme candidat au statut de quasar.

Ainsi, une équipe d’astronomes dirigée par Xander Byrne, astronome à l’Université de Cambridge et auteur principal de l’étude papier présenter ces résultats dans le Avis mensuels de la Royal Astronomical Societya pour objectif de récupérer les quasars à lentilles qui ont été négligés lors des études précédentes.

Byrne est parti à la recherche de ces trésors disparus dans les vastes archives de données du Dark Energy Survey (DES). Le DES a été réalisé avec la Dark Energy Camera fabriquée par le Département de l’énergie, montée sur le télescope de 4 mètres Víctor M. Blanco à l’observatoire interaméricain Cerro Tololo de la National Science Foundation des États-Unis, un programme du NSF NOIRLab.

Le défi était alors de trouver un moyen de découvrir ces joyaux cosmiques au sein de cet immense océan de données.

L’ensemble complet des données DES comprend plus de 700 millions d’objets. Byrne a réduit ces archives en comparant les données avec des images d’autres études pour éliminer les candidats improbables, notamment les objets qui étaient probablement des naines brunes, qui, bien qu’étant totalement différentes des quasars à presque tous les égards, peuvent leur ressembler étonnamment sur les images. Ce processus a donné lieu à un ensemble de données beaucoup plus gérable contenant 7 438 objets.

Byrne devait maximiser son efficacité dans ses recherches sur ces 7 438 objets, mais il savait que les techniques traditionnelles risquaient de ne pas détecter les quasars à lentilles à fort décalage vers le rouge qu’il recherchait. « Pour éviter d’éliminer prématurément les quasars à lentilles, nous avons appliqué un algorithme d’apprentissage par contraste et cela a fonctionné à merveille. »

L’apprentissage par contraste est un type d’algorithme d’intelligence artificielle (IA) dans lequel des décisions séquentielles placent chaque point de données dans un groupe en fonction de ce qu’il est ou de ce qu’il n’est pas. « Cela peut sembler magique », a déclaré Byrne, « mais l’algorithme n’utilise pas plus d’informations que celles qui sont déjà présentes dans les données. L’apprentissage automatique consiste à trouver les éléments de données utiles. »

La décision de Byrne de ne pas s’appuyer sur l’interprétation visuelle humaine l’a conduit à envisager un processus d’IA non supervisé, ce qui signifie que l’algorithme lui-même pilote le processus d’apprentissage plutôt qu’un humain.

Les algorithmes d’apprentissage automatique supervisé sont basés sur une vérité dite de base, définie par un programmeur humain. Par exemple, le processus peut commencer par une description d’un chat et passer par des décisions telles que « Ceci est/n’est pas une image d’un chat. Ceci est/n’est pas une image d’un chat noir. »

En revanche, les algorithmes non supervisés ne s’appuient pas sur cette définition initiale spécifiée par l’homme pour prendre leurs décisions. Au lieu de cela, l’algorithme trie chaque point de données en fonction des similitudes avec les autres points de données de l’ensemble. Ici, l’algorithme trouverait des similitudes entre les images de plusieurs animaux et les regrouperait comme chat, chien, girafe, pingouin, etc.

À partir des 7 438 objets de Byrne, l’algorithme non supervisé a trié les objets en groupes. En adoptant une analogie géographique, l’équipe a qualifié ces regroupements de données d’archipel. (Le terme n’implique aucune proximité spatiale entre les objets. Ce sont leurs caractéristiques qui les regroupent « proches », et non leurs positions dans le ciel.)

Au sein de cet archipel, un petit sous-ensemble d’objets, appelés « îles », a été regroupé comme de possibles candidats quasars. Parmi ces candidats, quatre se sont distingués comme des pierres précieuses dans un tas de galets.

En utilisant des données d’archives du télescope Gemini Sud, une partie de l’Observatoire international Gemini, exploité par le NSF NOIRLab, Byrne a confirmé que 3 des 4 candidats de « l’île aux quasars » sont en effet des quasars à fort décalage vers le rouge. Et l’un d’entre eux est très probablement la richesse cosmique que Byrne espérait trouver : un quasar à fort décalage vers le rouge à lentille gravitationnelle. L’équipe prévoit maintenant de réaliser des images de suivi pour confirmer la nature lenticulaire du quasar.

« Si elle était confirmée, la découverte d’un quasar à lentille dans un échantillon de quatre cibles représenterait un taux de réussite remarquablement élevé ! Et si cette recherche avait été menée en utilisant des méthodes de recherche standard, il est probable que ce joyau serait resté caché. »

Le travail de Byrne est un exemple astucieux de la manière dont l’IA peut aider les astronomes à fouiller dans des coffres à données de plus en plus volumineux. Des afflux massifs de données astronomiques sont attendus dans les années à venir avec l’étude quinquennale en cours de l’instrument spectroscopique d’énergie sombre, ainsi que les prochaines études Legacy Survey et Space and Time, qui seront menées par l’observatoire Vera C. Rubin à partir de 2025.

Plus d’information:
Xander Byrne et al, Quasar Island – trois nouveaux quasars z ∼ 6, dont un candidat à lentille, identifiés grâce à l’apprentissage contrastif, Avis mensuels de la Royal Astronomical Society (2024). DOI: 10.1093/mnras/stae902

Fourni par le NOIRLab de la NSF

ph-tech