Les expériences sur le plasma de fusion à haute température menées dans le grand dispositif hélicoïdal (LHD) de l’Institut national des sciences de la fusion (NIFS) ont renouvelé le record mondial d’une quantité de données acquises, 0,92 téraoctets (To) par expérience, en février 2022, en février 2022. en utilisant une gamme complète d’appareils de diagnostic plasma de pointe.
Le Réacteur Thermonucléaire Expérimental International (ITER), actuellement en construction en France grâce à la collaboration internationale de sept parties, devrait générer environ 1 To de données par expérience dans 10 ans, et LHD est actuellement la seule expérience au monde qui produit des données étroitement alignées sur ITER.
La promotion de la « science ouverte », dans laquelle les données de recherche à grande échelle sont utilisées et partagées dans la société, a été adoptée dans le cadre d’une déclaration commune lors de la réunion du G7 tenue à Sendai, au Japon, en 2023. Le NIFS a lancé des efforts à part entière en faveur de la science ouverte. en établissant la « Politique d’Open Access » en février 2022 et la « Politique des données de recherche » en octobre 2022.
Depuis 2023, toutes les données obtenues lors des expériences LHD sont accessibles au public immédiatement après la fin de l’acquisition et de l’analyse. Tous les codes sources des programmes informatiques destinés à l’analyse des données sont également librement disponibles.
Dans la science ouverte, le principe FAIR est considéré comme un indicateur important. Le NIFS considère que le respect des exigences FAIR en matière de données diagnostiques brutes et analysées, c’est-à-dire les actifs numériques précieux du projet LHD, est une proposition importante de la plateforme de recherche universitaire LHD et poursuit ses efforts.
Bien que les données de l’expérience LHD soient devenues l’une des plus grandes ressources de données au monde et soient largement utilisées par les chercheurs nationaux et internationaux sur les plasmas de fusion, elles ont rarement été utilisées à d’autres fins, par exemple dans différents domaines de recherche ou dans l’industrie. Cela peut être dû 1) à la difficulté de trouver les données intéressantes à partir d’une grande variété de données expérimentales, et 2) au nombre énorme et à la taille énorme des données individuelles, qui rendent difficile le démarrage facile et rapide de l’analyse des données.
Afin de résoudre ces problèmes, on s’attend à ce que 1) une vue d’ensemble complète d’énormes quantités de données expérimentales soit permise, et 2) l’environnement d’analyse de données puisse être facilement préparé pour démarrer les analyses instantanément, et les ressources de calcul des données peut être augmenté ou diminué selon les besoins.
Réalisations de la recherche
Les données de l’expérience LHD constituent un actif numérique à grande échelle. Pour promouvoir son utilisation par les chercheurs de différents domaines, l’industrie et le grand public, il est nécessaire de disposer d’un environnement informatique facilement utilisable par tous. Une possibilité importante existe dans la technologie des « services cloud ».
Les services cloud fournissent un environnement dans lequel les analyses de données peuvent être lancées immédiatement, permettant aux chercheurs, à l’industrie et même aux citoyens d’utiliser les données de manière très efficace. Désormais, NIFS a été adopté pour le « Programme de parrainage de données ouvertes d’Amazon Web Services (AWS) » et a achevé le transfert de données d’environ 2 pétaoctets de données d’expérience LHD sur le stockage cloud d’AWS, Service de stockage simple Amazon (Amazon S3), pour les rendre librement accessibles à tous sur Internet.
Un environnement informatique capable d’exécuter une suite de programmes d’analyse de données est également indispensable pour l’utilisation de vastes données ouvertes. Les données LHD entièrement répliquées sur le stockage cloud d’AWS sont désormais accessibles directement à partir des ordinateurs cloud AWS pour des analyses de données massives et hautes performances à tout moment.
Le fait qu’Amazon S3 nous permette de fournir un service de données fiable et continu, indépendant des capacités du système et du réseau NIFS constitue également un avantage majeur pour la promotion de la science ouverte.
Contrairement à d’autres domaines de recherche, tels que les observations environnementales, météorologiques et astronomiques mondiales, où le partage international de données de recherche a déjà lieu depuis plus de quelques décennies, il y a eu peu de collaboration ou de partage international de données dans la recherche et le développement sur l’énergie de fusion, en particulier dans le domaine expérimental.
En effet, les résultats expérimentaux diffèrent souvent d’un appareil à l’autre, ce qui rend difficile leur simple comparaison et leur évaluation. Les données ouvertes du LHD représentent la première étape majeure au monde vers l’interdisciplinarité et l’universalisation de la recherche sur l’énergie de fusion.
Les résultats seront présentés à la 14e AIEA Réunion technique sur les systèmes de contrôle, l’acquisition de données, la gestion des données et la participation à distance à la recherche sur la fusion qui se tiendra à São Paulo, au Brésil, du 15 au 19 juillet 2024.
Importance des réalisations et développements futurs
La base de données brutes et analysées de diagnostic LHD, qui constitue la plus grande accumulation de données de recherche sur l’énergie de fusion au monde, est un atout de recherche numérique très précieux. En transformant tout cela en données ouvertes sur le cloud AWS, on s’attend à ce que la base de données soit non seulement utilisée à des fins de recherche au sein et en dehors de la recherche sur la fusion, mais qu’elle attire également la participation du grand public et de nouveaux entrants d’autres pays et industries. qui souhaitent lancer de nouvelles recherches et développements sur l’énergie de fusion.
Les barrières à la première entrée devraient être considérablement réduites. En outre, il devrait devenir une plate-forme numérique majeure pour l’échange de connaissances en matière de recherche, d’échanges humains et de développement, non seulement au Japon mais aussi ailleurs dans le monde. À cette fin, NIFS promeut intensivement ce grand référentiel de données sous le nom de « Plasma and Fusion Cloud », en utilisant le NII RDC, la plateforme cloud de données de recherche de l’Institut national d’informatique.
À l’avenir, pour faire progresser les principes de la science ouverte, nous venons de commencer à attribuer un identifiant persistant mondial, DOI (Digital Object Identifier), à environ 40 millions de données LHD afin de faciliter leur recherche et leur accessibilité. L’enregistrement peut prendre de trois à quatre ans, en raison du nombre extrêmement important d’entités de données.
Cependant, lorsque toutes les données seront enregistrées, il devrait s’agir du plus grand nombre de DOI de données de recherche accessibles au public dans le monde, dépassant les leaders mondiaux actuels tels que Geoscience Australia (environ 7 millions de DOI), le CERN (environ 6,7 millions). , et l’Interddisciplinaire Earth Data Alliance (IEDA) aux États-Unis (environ 5 millions).
Ushio Usami, responsable national du secteur public mondial AWS au Japon, a déclaré : « Nous sommes très heureux de pouvoir contribuer à l’utilisation de l’énergie de fusion en collaboration avec l’Institut national pour la science de la fusion. J’espère que ces données ouvertes seront utilisé non seulement dans le domaine de la recherche universitaire au Japon, mais également par les industries du monde entier pour promouvoir l’innovation technologique dans divers domaines scientifiques.
Dr Keiichi Nakano, chercheur en chef pour l’infrastructure cyber-scientifique du Centre de recherche pour la science ouverte et la plateforme de données, Institut national d’informatique (NII), et également directeur du programme « Développement d’un écosystème de données de recherche pour la promotion de la science basée sur les données « , a déclaré : » Dans cette réalisation, l’infrastructure de données de recherche (NII Research Data Cloud : NII RDC) que nous avons construite a été utilisée comme fonction pour utiliser d’énormes quantités de données.
« Nous sommes ravis que le NII RDC ait pu contribuer à la mise en œuvre pratique de la science ouverte, qui aura un impact mondial. Nous espérons continuer à approfondir notre collaboration avec le NIFS et contribuer au développement de la science ouverte mondiale grâce à ces données de recherche. « .