Un ensemble mondial de données open source d’images haute résolution de la Terre – le plus complet et le plus détaillé du genre – a été développé par des experts dirigés par l’UCL avec des données de l’Agence spatiale européenne (ESA).
L’ensemble de données gratuit, WorldStrat, sera présenté lors de la conférence NeurIPS 2022 à la Nouvelle-Orléans. Il comprend près de 10 000 km² d’images satellites gratuites, montrant tous les types de lieux, de zones urbaines et d’utilisation des terres, de l’agriculture, des prairies et des forêts aux villes de toutes tailles et aux calottes polaires.
L’ensemble de données comprend des emplacements dans les pays du Sud et ceux qui ont besoin d’aide humanitaire, qui sont souvent sous-représentés dans l’imagerie satellite car ils sont généralement collectés à des fins commerciales, mettant donc en vedette de manière disproportionnée les régions les plus riches.
Les scientifiques affirment que la collection permet une analyse mondiale du terrain pour relever des défis mondiaux tels que la réponse aux catastrophes naturelles et causées par l’homme, la gestion des ressources naturelles et la planification urbaine.
Les travaux sur WorldStrat ont commencé en 2021 et depuis son lancement en juin 2022, il a été téléchargé plus de 3 000 fois.
Le chef de projet, le Dr Julien Cornebise (UCL Computer Science) a déclaré : « La combinaison de l’imagerie commerciale à haute résolution et de l’apprentissage automatique a un énorme potentiel pour permettre des analyses à l’échelle planétaire, ce qui pourrait aider à relever toutes sortes de défis mondiaux – le problème est que les données sont souvent bloquées derrière un paywall. »
« Le programme TPM de l’ESA a rendu notre projet possible en fournissant un accès gratuit à des données qui seraient normalement très coûteuses. »
L’équipe a utilisé les données des satellites Airbus SPOT 6 et SPOT 7, commandés par l’ESA et lancés respectivement en 2012 et 2014. Les satellites peuvent fournir des images à des résolutions aussi élevées que 1,5 m par pixel, ce qui signifie que chaque pixel représente une zone de 1,5 m sur 1,5 m au sol.
Les scientifiques ont utilisé environ 4 000 images très détaillées des satellites SPOT. Même si ces images sont à haute résolution (spatiale), elles ont une faible résolution temporelle, ce qui signifie dans ce contexte que chaque satellite ne revisite pas et ne recapture pas chaque site régulièrement. En effet, les images prises par les satellites étaient à l’origine destinées à être utilisées pour des applications commerciales spécifiques plutôt que pour des analyses à plus long terme.
Pour lutter contre cela, l’équipe a également utilisé des images de résolution inférieure disponibles gratuitement du satellite Copernicus Sentinel-2. Celles-ci sont à une résolution temporelle plus élevée, ce qui signifie qu’elles ont été capturées à des moments plus réguliers tous les cinq jours. Ils ont associé chaque image SPOT à 16 images de Copernicus Sentinel-2, en utilisant environ 64 000 au total.
Les chercheurs ont développé l’ensemble de données pour soutenir également le développement d’applications d’apprentissage automatique afin de l’étendre et de l’améliorer, par exemple pour améliorer encore la résolution de l’image. Pour permettre le développement d’applications supplémentaires, les scientifiques ont développé une boîte à outils d’intelligence artificielle ainsi que le code source complet, permettant aux développeurs de reproduire, d’étendre et de transformer le travail.
Le Dr Cornebise a poursuivi : « Des milliers d’utilisateurs de données du monde entier ont déjà téléchargé WorldStrat, et nous sommes impatients de voir comment ils l’étendent et l’améliorent, en utilisant des techniques d’apprentissage automatique. »
Une version pré-imprimée de la recherche est disponible sur arXiv.
Plus d’information:
Julien Cornebise et al, Open High-Resolution Satellite Imagery: The WorldStrat Dataset—With Application to Super-Resolution, arXiv (2022). DOI : 10.48550/arxiv.2207.06418
Ensemble de données GitHub : worldstrat.github.io/