Les lecteurs qui ont essayé l’imagerie astronomique seront familiers avec la technique consistant à prendre plusieurs images, puis à les empiler ensemble pour améliorer la force du signal, produisant ainsi de meilleures images. En poussant cette technique plus loin, de nombreux projets de recherche nécessitent des données sur le même objet sur des périodes plus longues qu’une observation nocturne. Ces données sont généralement capturées à partir de différents endroits et dans différentes conditions. Le problème a été de faire correspondre les observations dans toutes ces enquêtes. Les chercheurs ont partagé une nouvelle approche pour calculer si des images distinctes du même objet produiront des signaux supplémentaires ou généreront simplement du bruit inutile.
Habituellement, les images combinées dans les images astronomiques sont prises avec le même télescope, de sorte que les instruments qui capturent les données et les conditions sont identiques. À ce jour, utiliser plusieurs télescopes situés à différents endroits pour capturer les données afin de former une seule image est une approche inhabituelle, voire peu pratique.
Une équipe de chercheurs de l’Institut John Hopkins a abordé le problème principal de l’évaluation des images provenant d’études du ciel prises sur de nombreuses années à partir de différents télescopes situés à différents endroits et dans différentes conditions. Le défi a été de faire correspondre les observations des mêmes objets et lorsque les enquêtes sont très proches, cela peut être plus difficile. Des outils existants sont disponibles pour croiser les données de divers catalogues tels que TopCat, CDS Match et Aspects, mais à ce jour, ils sont rares et ont eu des taux d’échec plus élevés que souhaité.
L’équipe a développé une nouvelle approche de science des données connue sous le nom de « programmation à contraintes quadratiques entières mixtes » ou MIQCP en abrégé, qui se concentre sur l’attribution d’un score à chaque paire d’observations provenant de différentes séries d’observations provenant de différentes enquêtes. Le score attribué mesure la probabilité que les observations concernent le même objet et le score augmente à mesure que les observations sont plus proches et diminue si elles sont plus éloignées.
Grâce à leur nouvelle technique, ils sont capables de prendre des observations à partir de différentes enquêtes et de faire correspondre des objets pour supprimer la tâche de trier toutes les paires possibles. Non seulement cela accélère le processus de mise en correspondance, mais cela permet également de gérer de grands ensembles de données. Lors des tests, les résultats étaient très prometteurs. Les approches précédentes étaient encore rapides mais ne permettaient pas toutes les correspondances possibles, limitant ainsi les chances de succès, ce qui a été considérablement amélioré avec cette nouvelle technique.
L’équipe souligne que les enquêtes sont essentielles à la compréhension des nombreux mécanismes à travers l’univers, non seulement à l’échelle macro mais également au niveau des particules. Leur nouvelle technique ouvre de nouvelles opportunités pour le traitement des données d’image et l’équipe va encore améliorer la méthode pour gérer des ensembles de données plus volumineux. L’équipe peut déjà gérer jusqu’à 100 catalogues, une amélioration par rapport aux 10 à 20 actuels utilisant les méthodes existantes.