Depuis plus de 60 ans, les scientifiques recherchent dans le cosmos d’éventuels signes de transmission radio qui indiqueraient l’existence d’une intelligence extraterrestre (ETI). Au cours de cette période, la technologie et les méthodes ont considérablement mûri, mais les plus grands défis demeurent. En plus de n’avoir jamais détecté de signal radio d’origine extraterrestre, il existe un large éventail de formes possibles qu’une telle diffusion pourrait prendre.
En bref, les chercheurs de SETI doivent supposer à quoi ressemblerait un signal, mais sans le bénéfice d’exemples connus. Récemment, une équipe internationale dirigée par l’Université de Californie à Berkeley et le SETI Institute a développé un nouvel outil d’apprentissage automatique qui simule à quoi pourrait ressembler un message d’une intelligence extraterrestre (ETI). Elle est connue sous le nom de Setigen, une bibliothèque open source qui pourrait changer la donne pour les futures recherches SETI.
L’équipe de recherche était dirigée par Bryan Brzycki, étudiant diplômé en astronomie à l’UC Berkeley. Il a été rejoint par Andrew Siemion, directeur du Berkeley SETI Research Center, et des chercheurs du SETI Institute, Breakthrough Listen, du Dunlap Institute for Astronomy & Astrophysics, de l’Institut des sciences spatiales et de l’astronomie, du Centre international de recherche en radioastronomie (ICRAR ), et le Goergen Institute for Data Science.
Depuis les années 1960, la méthode la plus courante de SETI consiste à rechercher dans le cosmos des signaux radio d’origine artificielle. La première expérience de ce type était le projet Ozma (d’avril à juillet 1960), dirigé par le célèbre astrophysicien de Cornell Frank Drake (créateur de l’équation de Drake). Cette enquête s’est appuyée sur la parabole de 25 mètres de l’Observatoire national de radioastronomie de Green Bank, en Virginie-Occidentale, pour surveiller Epsilon Eridani et Tau Ceti à des fréquences d’environ 400 kHz autour de 1,42 GHz.
Ces recherches se sont depuis étendues pour couvrir de plus grandes zones du ciel nocturne, des gammes de fréquences plus larges et une plus grande diversité de signaux. Comme Brzycki l’a expliqué à Universe Today par e-mail :
« Dans les années 1960, l’idée était de se concentrer sur une région autour d’une fréquence bien connue où l’hydrogène neutre émet un rayonnement dans l’espace interstellaire, 1,42 GHz. Puisque cette émission naturelle est répandue dans toute la galaxie, l’idée est que toute civilisation intelligente saurait à ce sujet, et potentiellement cibler cette fréquence pour la transmission afin de maximiser les chances de détection.Depuis lors, d’autant plus que la technologie a rapidement progressé, la radio SETI s’est étendue sur tous les axes de mesure.
« Nous pouvons désormais prendre des mesures sur une bande passante de plusieurs GHz instantanément. À mesure que le stockage s’est amélioré, nous pouvons collecter d’énormes quantités de données, permettant des observations à plus haute résolution dans les directions temporelle et fréquentielle. De la même manière, nous avons effectué des enquêtes à proximité étoiles et d’autres directions dans la galaxie, afin de maximiser l’exposition aux directions potentiellement intéressantes du ciel. »
Un autre changement majeur a été l’incorporation d’algorithmes basés sur l’apprentissage automatique conçus pour trouver des transmissions au milieu du bruit de fond radio du cosmos et corriger les interférences de radiofréquence (RFI). Les algorithmes utilisés dans les enquêtes SETI sont tombés dans l’une des deux catégories suivantes : ceux qui mesurent les données de séries chronologiques de tension et ceux qui mesurent les données de spectrogramme temps-fréquence.
« Les données brutes collectées par une antenne radio sont des mesures de tension ; une onde radio induit un courant dans l’antenne, qui est lu et enregistré sous forme de tension », a déclaré Brzycki. « Un radiotélescope n’est en réalité qu’une antenne augmentée d’une parabole pour focaliser une plus grande zone de lumière, augmentant la résolution et la luminosité. Il s’avère que l’intensité est proportionnelle à la tension au carré. De plus, nous nous soucions de l’intensité en fonction de la fréquence. et l’heure (le moment et l’endroit d’un signal potentiel). »
Pour obtenir cela, dit Brzycki, les astronomes commencent par utiliser des algorithmes qui calculent la puissance de chaque fréquence observée par rapport aux données d’entrée de la série chronologique. En d’autres termes, l’algorithme transforme les données du signal radio d’une fonction de l’espace et/ou du temps en une fonction dépendant de la fréquence spatiale ou de la fréquence temporelle, c’est-à-dire. une transformée de Fourier (FT). En mettant cela au carré, les astronomes peuvent mesurer l’intensité de chaque fréquence sur la période de collecte de données.
« Pour obtenir un spectrogramme complet, un tableau d’intensité en fonction du temps et de la fréquence, nous prenons une section de la série tension-temps, obtenons le FT, puis répétons ce processus sur toute l’observation afin que nous puissions empiler efficacement une série de tableaux de données FT les uns sur les autres dans le sens du temps », a ajouté Brzycki. « [O]Une fois que vous avez décidé d’une résolution temporelle, nous déterminons le nombre d’échantillons temporels nécessaires et calculons le FT pour voir la quantité de puissance contenue dans chaque tranche de fréquence. »
L’algorithme de recherche principal utilisé par les chercheurs de SETI est connu sous le nom d’algorithme « doppler incoherent tree », qui décale le spectre des ondes radio pour corriger la dérive de fréquence et maximise le rapport signal sur bruit d’un signal. Le programme de recherche SETI le plus complet jamais monté, Breakthrough Listen, utilise une version open-source de cet algorithme connue sous le nom de TurboSETI, qui a servi de colonne vertébrale à de nombreuses recherches de « technosignatures » (c’est-à-dire des signes d’activité technologique). Comme l’a expliqué Brzycki, cette méthode présente certains inconvénients : « L’algorithme suppose qu’un signal SETI potentiel est continu avec un rapport cyclique élevé (ce qui signifie qu’il est presque toujours « activé »). La recherche d’un signal sinusoïdal continu est un bonne première étape car il est relativement facile et peu coûteux en énergie pour les humains de produire et de transmettre de tels signaux.
« Étant donné que TurboSETI est ciblé pour les signaux en ligne droite qui sont toujours » allumés « , il peut avoir du mal à capter des morphologies alternatives, comme les signaux à large bande et pulsés. Des algorithmes supplémentaires sont en cours de développement pour essayer de détecter ces autres types de signaux, mais comme toujours , nos algorithmes ne sont aussi efficaces que les hypothèses que nous faisons sur les signaux qu’ils ciblent. »
Pour les chercheurs de SETI, l’apprentissage automatique est un moyen d’identifier les transmissions dans les données radiofréquences brutes et de classer plusieurs types de signaux. Le principal problème, dit Brzycki, est que la communauté astronomique ne dispose pas d’un ensemble de données de signaux ET, ce qui rend la formation supervisée difficile au sens traditionnel. À cette fin, Brzycki et ses collègues ont développé une bibliothèque open source basée sur Python appelée Setigen qui facilite la production d’observations radio synthétiques.
« Ce que fait Setigen, c’est faciliter la production de signaux SETI synthétiques, qui peuvent être utilisés dans des données entièrement synthétiques, ou ajoutés à des données d’observation réelles pour fournir un fond de bruit et de RFI plus réaliste », a déclaré Brzycki. « De cette façon, nous pouvons produire de grands ensembles de données de signaux synthétiques pour analyser la sensibilité des algorithmes existants ou pour servir de base à la formation à l’apprentissage automatique. »
Cette bibliothèque standardise les méthodes de synthèse pour l’analyse des algorithmes de recherche, en particulier pour les produits de données d’observation radio existants comme ceux utilisés par Breakthrough Listen. « Ceux-ci sont disponibles à la fois dans des formats de spectrogramme et de tension complexe (séries temporelles), donc avoir une méthode de production de données fictives peut être vraiment utile pour tester le code de production et développer de nouvelles procédures », a ajouté Brzycki.
À l’heure actuelle, des algorithmes pour les observations multifaisceaux sont en cours de développement à l’aide de Setigen pour produire des signaux fictifs. La bibliothèque est également constamment mise à jour et améliorée au fur et à mesure que la recherche SETI progresse. Brzycki et ses collègues espèrent également ajouter la prise en charge de la synthèse de signaux à large bande pour faciliter les algorithmes de recherche qui ciblent les signaux à bande non étroite. Des levés SETI plus robustes seront possibles dans un avenir proche à mesure que les radiotélescopes de nouvelle génération deviendront opérationnels.
Cela inclut Breakthrough Listen, qui intégrera les données du réseau MeerKAT en Afrique du Sud. Il y a aussi le Square Kilometre Array (SKA), un énorme projet de radiotélescope qui combinera les données des observatoires d’Afrique du Sud et d’Australie. Il s’agit notamment du MeerKAT et de l’Hydrogen Epoch of Reionization Array (HERA) en Afrique du Sud et du SKA Pathfinder australien (ASKAP) et du Murchison Widefield Array (MWA) en Australie.
Hélas, il reste le facteur le plus limitant concernant SETI, qui est notre cadre de référence extrêmement limité. En fin de compte, les astronomes n’ont aucune idée de ce à quoi ressemblerait un signal extraterrestre parce que nous n’en avons jamais vu auparavant. Cela, paradoxalement, rend plus difficile la détection de preuves de technosignatures dans le bruit de fond du cosmos. En tant que tels, les astronomes sont obligés d’adopter l’approche « des fruits à portée de main », ce qui signifie rechercher l’activité technologique telle que nous la connaissons.
Cependant, en établissant des paramètres basés sur ce qui est théoriquement possible, les scientifiques peuvent affiner la recherche et augmenter les chances qu’ils trouvent quelque chose un jour. Comme Brzycki l’a résumé :
« La seule solution potentielle à cela est une sorte d’enquête d’apprentissage automatique non supervisée qui minimise nos hypothèses ; des travaux sont en cours sur ce front. Setigen s’appuie certainement sur cette hypothèse – les signaux synthétiques que l’on peut produire sont de nature heuristique, en ce que l’utilisateur décide à quoi ils doivent ressembler.
« En fin de compte, la bibliothèque fournit un moyen d’évaluer nos algorithmes existants et de créer des ensembles de données de signaux potentiels pour développer de nouvelles méthodes de recherche, mais les questions fondamentales de savoir où et quand resteront toujours – le mieux que nous puissions faire est de garder en regardant. »
Dans des moments comme celui-ci, il est bon de se rappeler que le paradoxe de Fermi n’a besoin d’être résolu qu’une seule fois. Dès que nous détecterons une transmission radio dans le cosmos, nous saurons avec certitude que nous ne sommes pas seuls dans l’Univers, que la vie intelligente peut exister et existe au-delà de la Terre, et qu’elle communique à l’aide de technologies que nous pouvons détecter.
Bryan Brzycki et al, Setigen : simulation de technosignatures radio pour SETI. arXiv:2203.09668v1 [astro-ph.IM], doi.org/10.48550/arXiv.2203.09668