Une nouvelle méthode d’apprentissage automatique produit des cartes détaillées des tendances de la population pour 550 espèces d’oiseaux

Des chercheurs utilisent un ordinateur quantique pour identifier un candidat

Les scientifiques du Cornell Lab of Ornithology ont développé une nouvelle façon de modéliser si les populations de plus de 500 espèces d’oiseaux augmentent ou diminuent. La méthode résout un problème statistique lancinant en tenant compte des changements d’une année à l’autre dans le comportement des personnes qui collectent les données. Le résultat est des cartes de tendances détaillées pour chaque espèce jusqu’à un rayon de huit milles, un coup de pouce majeur pour les efforts de conservation locaux. Les scientifiques ont utilisé une approche appelée Double Machine Learning. Les détails sont publiés dans la revue Méthodes en écologie et évolution.

« Le changement de comportement humain pose un problème pour l’analyse statistique des données collectées par des volontaires », a expliqué l’auteur principal Daniel Fink du Cornell Lab. « Par exemple, une espèce particulière est-elle vraiment en déclin dans une région ou y a-t-il simplement moins de personnes qui font des observations dans l’habitat préféré de l’oiseau par rapport aux années précédentes ? »

Le comportement d’observation des oiseaux peut changer lorsque les gens adoptent de nouveaux outils, s’améliorent dans l’identification des oiseaux ou vont observer les oiseaux dans de nouvelles zones. Les changements dans le comportement humain deviennent ce qu’on appelle un facteur « confondant ». Un facteur de confusion a un impact sur la question principale étudiée et peut déformer la réalité. Dans ce cas, les changements dans les abondances enregistrées d’oiseaux peuvent être réels, ou ils peuvent être des artefacts qui apparaissent en raison de changements dans le processus d’observation au fil du temps.

Le Double Machine Learning est appliqué aux données d’observation des oiseaux collectées par le programme mondial eBird du Cornell Lab, puis visualisées avec des cartes détaillées. Avec le Double Machine Learning, deux types de patterns sont « appris » puis identifiés dans les données. L’une des tendances est la variation des dénombrements d’oiseaux signalés. Le deuxième modèle reflète la variation du comportement des ornithologues. L’effet du modèle de comportement est ensuite supprimé, ne laissant que des variations dans les abondances réelles enregistrées d’oiseaux.

« Maintenant, nous avons un moyen d’analyser ces données qui produisent des estimations solides de l’évolution de la population, même pour les espèces et/ou les régions sans programmes de surveillance rigoureux », a déclaré Fink. « La capacité d’estimer les tendances tout en tenant compte des facteurs de confusion inhérents aux données de la science citoyenne a le potentiel de combler d’importantes lacunes en matière d’information. »

Plus d’information:
Daniel Fink et al, Un modèle de tendance d’apprentissage automatique double pour les données scientifiques citoyennes, Méthodes en écologie et évolution (2023). DOI : 10.1111/2041-210X.14186

Fourni par l’Université Cornell

ph-tech