Chaque hiver, printemps et été, les prévisionnistes et les chercheurs en conditions météorologiques extrêmes se réunissent pour tester les outils et les innovations les plus récents et les plus prometteurs en matière de prévision des phénomènes météorologiques violents afin de voir comment ils fonctionnent dans des conditions réelles.
Ces expériences au banc d’essai, orchestrées par la National Oceanic and Atmospheric Administration (NOAA), prévoient respectivement les tempêtes hivernales, les orages violents et les inondations soudaines.
Le banc d’essai d’hydrométéorologie a récemment organisé la 12e expérience annuelle sur la météo hivernale (WWE). Une expérience immersive, collaborative, « de la recherche aux opérations », qui a réuni des membres des communautés de prévision, de recherche et universitaires pour évaluer et discuter des défis liés aux prévisions météorologiques hivernales.
« Nous générons des prévisions opérationnelles à l’aide de nouvelles entrées ou de nouveaux modèles testant leur bon fonctionnement », a déclaré Keith Brewster, chercheur principal et directeur des opérations du Center for Analysis and Prediction of Storms (CAPS) de l’Université de l’Oklahoma. « Si nous promettons une prévision là où des orages se produisent, pouvons-nous nous attendre à ce qu’un prévisionniste l’utilise ? »
En arrière-plan de l’expérience, les superordinateurs du Texas Advanced Computing Center (TACC) – parmi les plus rapides disponibles pour les chercheurs universitaires dans le monde – bourdonnent.
L’équipe CAPS a commencé à utiliser les systèmes TACC pour l’expérience de printemps du banc d’essai sur les conditions météorologiques dangereuses en 2011 afin de mieux prévoir les orages violents. Ils calculaient à l’époque sur le supercalculateur original Stampede du TACC, le 6e plus rapide au monde à son apogée. De 2017 à 2021, ils ont utilisé Stampede2 (12e plus rapide) via l’Extreme Science and Engineering Discovery Environment (XSEDE). Depuis 2021, ils utilisent Frontera, le supercalculateur universitaire le plus rapide au monde et actuellement le 13e plus rapide au classement général.
« Ce que TACC et XSEDE nous offrent, c’est la possibilité de faire ces expériences en temps réel ou en temps quasi réel », a déclaré Brewster.
L’équipe CAPS soumet ses simulations de prévision avant 22h00, après l’arrivée des observations météorologiques et d’autres données d’entrée pour le cycle 00 UTC. Les simulations s’exécutent pendant la nuit et sont prêtes à 8h00 le lendemain matin, prédisant les événements météorologiques sur trois jours et demi.
« Sur Stampede, nous avons travaillé avec TACC pour mettre en place une file d’attente spéciale où nous avons un nombre dédié de cœurs qui nous sont alloués », a déclaré Brewster. Ce type de « calcul urgent » est devenu une caractéristique du TACC, permettant au centre de prévoir les ondes de tempête d’ouragan, de surveiller les déchets spatiaux en orbite terrestre basse et d’alimenter les modèles COVID-19. « Plus récemment, sur Frontera, la capacité est telle que nous pouvons fonctionner dans la file d’attente régulière, en utilisant une priorité VIP, ce qui rend notre utilisation plus efficace et moins perturbatrice pour les autres utilisateurs de la recherche. »
L’expérience sur la météo hivernale de cette année avait trois objectifs scientifiques clés : évaluer subjectivement l’utilité des prévisions du modèle permettant la convection (CAM) pour améliorer les prévisions de chutes de neige sur deux à trois jours ; noter objectivement les prévisions de chutes de neige à l’aide de systèmes de vérification standard communautaires ; et déterminer la combinaison optimale de physique à utiliser dans les modèles de prochaine génération.
L’équipe était principalement intéressée à prédire la quantité d’accumulation de neige, mais elle a également testé sa capacité à déterminer les différences entre la neige, le grésil et la pluie verglaçante dans les prévisions, et à prédire d’autres facettes de la météo hivernale, comme la vitesse du vent.
« Donner aux prévisionnistes la possibilité d’utiliser ces modèles expérimentaux dans des situations réelles permet aux prévisionnistes et aux chercheurs de déterminer les forces, les défis opérationnels et la facilité d’utilisation des prévisionnistes dès le début de la phase de développement », a déclaré James Correia Jr., coordinateur du banc d’essai d’hydrométéorologie. « Cela nous permet, ensemble, dans les bancs d’essai de la NOAA, d’apporter des améliorations à notre processus de prévision, à nos modèles et à la façon dont nous abordons et résolvons les défis de recherche et opérationnels. »
Les récents programmes de banc d’essai ont également inclus la tâche importante d’évaluer le modèle météorologique de nouvelle génération de la NOAA, le modèle FV3. Ce modèle a fait ses preuves dans les prévisions à l’échelle mondiale, et l’agence prévoit de l’utiliser également de manière opérationnelle pour une modélisation régionale à résolution beaucoup plus élevée, comme représenté dans les bancs d’essai à fort impact. Le nouveau système de prévision à plusieurs échelles est connu sous le nom de système de prévision unifié (UFS).
« En plus des tests en temps réel, CAPS a utilisé des superordinateurs TACC pour réexécuter des cas afin d’identifier la cause première des problèmes qui ont été identifiés lors des bancs d’essai précédents », a déclaré Brewster. « Cela conduit à un réglage et à d’autres améliorations des codes d’origine. »
L’expérience sur la météo hivernale s’est déroulée pendant 27 jours de cas sur Frontera en temps quasi réel au cours de l’hiver, y compris la vérification objective et la formation à l’apprentissage automatique, un aspect prospectif de la recherche. Brewster a présenté les résultats lors d’un webinaire organisé par la NOAA en mars 2022.
Après l’expérience, les chercheurs effectuent généralement des études plus détaillées sur des facettes spécifiques des prévisions, avec un financement du bureau du programme météorologique de la NOAA dans le cadre du concours Testbed en collaboration avec le centre de prévision météorologique et le centre de prévision des tempêtes de la NOAA, deux divisions du service météorologique national.
Test des méthodes de consensus d’ensemble
La plupart des observateurs météorologiques connaissent l’idée des modèles d’ensemble – les essaims de pistes qui représentent les résultats de diverses simulations, qui sont moyennés et interprétés par les météorologues.
À l’aide de Frontera, l’équipe de Brewster génère des prévisions d’ensemble en temps réel.
« Dans la théorie de la décision, il a été démontré que lorsque vous obtenez un consensus d’experts, vous obtenez de meilleurs conseils que d’une seule personne », a déclaré Brewster. « Grâce à TACC, nous pouvons générer 13 modèles, 13 « experts » prédisant le temps qu’il va faire. À partir de là, nous travaillons sur la manière de développer des produits de consensus d’ensemble qui aident le mieux à améliorer les prévisions. »
Parfois, la facilité d’utilisation par un opérateur humain l’emporte sur les compétences de prédiction pures. Communiquer la décision consensuelle à partir d’un ensemble de prévisions en est un exemple.
« Nous, les chercheurs, sommes là-bas, observant et participant, pendant une semaine, comme si nous étions au bureau météorologique, créant des prévisions, afin que des gens comme moi puissent voir les problèmes », a expliqué Brewster. « Nous essayons d’être réalistes : quelqu’un peut-il vraiment regarder dix à quinze modèles ? Ou cela crée-t-il plus d’incertitude ? »
Une approche que l’équipe CAPS a explorée pour les méthodes de consensus d’ensemble est la méthode de la moyenne de correspondance de probabilité locale (LPM). La méthode LPM divise une zone en patchs, calcule la dynamique atmosphérique sur ce patch et distribue les résultats localement. (Nathan Snook et l’équipe CAPS ont décrit la méthode et comparé différentes façons de calculer cette moyenne, dans un article de 2020 dans Lettres de recherche géophysique.)
Une évaluation de la précision par la NOAA a montré que la moyenne de correspondance de probabilité locale (LPM) était légèrement inférieure à la moyenne de correspondance de probabilité (PM) dans la notation objective des précipitations.
« Mais c’est là que les activités du banc d’essai entrent en jeu », a déclaré Brewster. « Lorsqu’un humain regarde une prévision, il ne regarde pas les chiffres bruts d’un site. Il regarde la forme – la réflectivité consensuelle – et à cet égard, le LPM a été jugé meilleur. C’était une victoire pour notre équipe. »
Le LPM a depuis été mis en œuvre dans le système opérationnel de prévision d’ensemble à haute résolution de la NOAA. C’est l’objectif du programme NOAA Testbed : prendre des idées de recherche et les faire passer par des tests et des évaluations dans des contextes quasi opérationnels jusqu’au déploiement opérationnel réel.
« C’est ce que nous appelons le transfert de technologie », a déclaré Brewster. « Il existe un fossé technologique où des chercheurs comme notre équipe travaillent sur des modèles, produisent des articles, et il peut être difficile d’introduire de nouveaux modèles ou concepts dans les opérations. Le transfert de technologie s’est produit parce qu’il a été prouvé, pas seulement en cours d’exécution sur TACC et à d’autres chercheurs, mais à d’autres prévisionnistes. Cela nous permet de franchir le fossé entre les articles de revues et les prévisions ayant un impact sur le monde réel.
Nathan Snook et al, Comparaison et vérification des algorithmes moyens de probabilité localisés ponctuels et ponctuels pour les prévisions de précipitations par consensus d’ensemble, Lettres de recherche géophysique (2020). DOI : 10.1029/2020GL087839