Comment l’apprentissage automatique peut prendre en charge l’assimilation de données pour les modèles du système terrestre

Assimilation de données est la combinaison des dernières observations avec une prévision à court terme pour obtenir la meilleure estimation possible de l’état actuel du système Terre. Le machine learning peut y contribuer en optimisant l’utilisation des observations satellitaires.

L’obtention de la meilleure estimation possible de l’état actuel du système Terre, connue sous le nom d’analyse, est extrêmement importante pour les prévisions météorologiques. C’est parce que l’analyse sert de conditions initiales aux prévisions.

Pour utiliser les dernières observations, nous nous appuyons sur un vaste système d’instruments qui mesurent régulièrement certains aspects de l’atmosphère et d’autres composants du système Terre. Au cours des dernières décennies, les observations par satellite sont devenues de plus en plus importantes.

Ils effectuent de fréquentes observations de l’atmosphère et de la surface du globe. Mais leur utilisation sur la glace terrestre et marine a été limitée jusqu’à présent en raison des difficultés rencontrées pour interpréter correctement ces observations.

« L’apprentissage automatique permet de parvenir à une bonne interprétation, par exemple, des observations satellitaires sur la glace de mer », explique Alan Geer, scientifique du CEPMMT.

Trois avantages

Utiliser pleinement les informations contenues dans les observations satellitaires, indépendamment de la nébulosité et sur différentes surfaces, est appelé « assimilation de tout le ciel et de toutes les surfaces ».

L’assimilation sur toutes les surfaces peut apporter trois avantages :

  • nous obtenons plus d’informations sur l’état atmosphérique dans des zones où les observations satellitaires étaient auparavant ignorées, comme la glace de mer, la neige et les surfaces terrestres
  • nous obtenons de nouvelles informations sur des variables mal connues, telles que la concentration de glace de mer, la couverture neigeuse ou l’humidité du sol
  • nous pouvons utiliser les observations pour aider à contraindre, améliorer et développer de meilleurs modèles physiques et empiriques du système Terre.
  • Nous allons ici examiner de plus près l’exemple de la glace de mer : comment pouvons-nous interpréter les observations satellitaires sur la glace de mer pour nous aider à dresser un tableau aussi complet que possible de l’état du système Terre à un instant donné ?

    L’état actuel des lieux

    Les observations de radiance micro-ondes provenant de satellites sont déjà utilisées dans l’analyse des glaces de mer du CEPMMT. Cependant, ils sont introduits dans l’analyse atmosphérique par une voie lente, détournée et sous-optimale.

    Les récupérations de concentrations de glace de mer sont d’abord déduites par des fournisseurs de données externes. Ils sont ensuite intégrés dans une analyse quotidienne au UK Met Office. Par la suite, l’analyse quotidienne est assimilée au système de réanalyse/analyse OCEAN5 du CEPMMT pour l’océan et la glace marine. Les changements observés dans la glace de mer parviennent finalement à l’assimilation des données atmosphériques avec un retard global d’environ 48 à 72 heures.

    « Le retard peut être éliminé si nous pouvons utiliser nos outils internes d’assimilation de données pour déduire la concentration de glace de mer directement à partir des radiances satellites observées », explique Alan.

    Comment l’apprentissage automatique entre en jeu

    Une approche typique d’apprentissage automatique tenterait d’apprendre la présence de glace de mer à partir d’entrées et de sorties connues.

    Pour le problème de l’observation des glaces de mer, nous connaissons les résultats : ce sont les observations de radiance par satellite. Cependant, les données, y compris les détails microstructuraux de la glace et de la neige qui affectent les observations, sont fondamentalement inconnues.

    « Pour résoudre ce problème, une année d’observations du rayonnement micro-ondes a été associée aux profils atmosphériques issus des prévisions à court terme du CEPMMT », explique Alan. « Des outils d’apprentissage automatique ont été utilisés pour connaître l’état de la glace de mer en même temps qu’un modèle empirique pour représenter le transfert radiatif de surface. Pouvoir les apprendre ensemble était la clé de ce projet et nécessitait une nouvelle approche pour réaliser l’apprentissage automatique. »

    De meilleures analyses

    L’illustration montre l’analyse de la concentration de glace de mer résultante, comparée à la concentration de glace de mer OCEAN5, pour le 7 novembre 2020 :

    L’analyse de la glace de mer OCEAN5 est valable pour la même période, mais représente la partie sibérienne de l’océan Arctique comme une eau libre, en raison des retards dans les changements observés dans la glace de mer qui arrivent à l’analyse. En revanche, la nouvelle approche montre que ces zones sont déjà en grande partie gelées.

    Un exemple de la qualité de la nouvelle analyse de la concentration de glace de mer est également fourni dans la figure ci-dessous.

    La nouvelle analyse de la glace de mer montre un signal pour l’iceberg géant A-68A près de l’île de Géorgie du Sud dans l’océan Austral, alors que l’iceberg est absent dans l’analyse OCEAN5.

    De meilleures prévisions atmosphériques

    L’ajout d’observations micro-ondes dans les zones de glace de mer améliore les prévisions de température dans l’océan Austral jusqu’au quatrième jour environ, depuis la surface jusqu’à la moyenne troposphère.

    Il y a peu d’impact sur les prévisions pour l’Arctique, probablement parce que la disponibilité tout au long de l’année de mesures in situ permet de combler les éventuelles lacunes des données satellitaires.

    L’assimilation de la glace de mer décrite ici devrait devenir opérationnelle avec le cycle 49r1 du système de prévision intégré (IFS) du CEPMMT en 2024.

    Fourni par le Centre européen pour les prévisions météorologiques à moyen terme (ECMWF)

    ph-tech