Dans le domaine dynamique de l’IA agricole, la détection des fruits basée sur l’apprentissage profond a pris de l’importance, en particulier dans les vergers intelligents. Ces techniques dépendent toutefois fortement de grands ensembles de données étiquetés manuellement, un processus à la fois long et laborieux.
Les travaux précédents ont introduit une méthode de réseau contradictoire génératif (GAN), EasyDAM, pour atténuer les coûts d’étiquetage en générant des images de fruits simulées. Néanmoins, cette approche se heurte à des défis : premièrement, elle manque d’adaptabilité à diverses espèces fruitières, ce qui entraîne des fluctuations de performances dans différents environnements de verger.
Deuxièmement, même si cela réduit le travail dans le domaine cible, cela nécessite toujours un étiquetage manuel dans le domaine source, sans pour autant éliminer complètement les processus manuels. Il est essentiel de développer des méthodes permettant de sélectionner des ensembles de données de domaine source optimaux et de parvenir à un étiquetage véritablement automatisé, en répondant à ces limitations actuelles et en progressant vers une génération automatisée d’étiquettes à coût nul.
En juillet 2023, Phénomique des plantes a publié un article de recherche intitulé « EasyDAM_V3 : Étiquetage automatique des fruits basé sur la sélection optimale du domaine source et la synthèse des données via un graphe de connaissances« .
Dans le but de faire progresser l’étiquetage automatique des fruits avec une efficacité élevée et un coût nul, cette étude présente EasyDAM_V3, une nouvelle approche qui combine la sélection optimale du domaine source avec la génération d’ensembles de données synthétiques. EasyDAM_V3 vise à relever deux défis principaux : sélectionner les ensembles de données de fruits du domaine source les plus appropriés pour la traduction d’images et minimiser le coût d’annotation manuelle dans le domaine cible.
Le premier aspect d’EasyDAM_V3 implique une sélection systématique d’ensembles de données de domaine source et cible pour les modèles de traduction d’images. Ce processus utilise un modèle de caractéristiques spatiales multidimensionnelles, permettant l’identification de l’ensemble de données de domaine source le plus approprié pouvant correspondre à plusieurs fruits de domaine cible. La sélection est basée sur l’analyse de caractéristiques phénotypiques telles que la forme, la couleur et la texture sur divers ensembles de données sur les fruits.
Par exemple, dans l’étude, les poires ont été identifiées comme le domaine source optimal pour traduire des images vers des domaines cibles tels que les agrumes, les pommes et les tomates. Cette détermination a été effectuée grâce à un algorithme de clustering et à une analyse multidimensionnelle de l’espace des fonctionnalités, garantissant une plus grande fidélité dans la généralisation de la traduction. Le deuxième aspect se concentre sur la construction d’un graphe de connaissances pour générer des ensembles de données synthétiques avec des informations d’étiquette précises.
EasyDAM_V3 utilise une traduction d’image de fruit en arrière-plan transparent et un détecteur sans ancre pour l’auto-apprentissage des pseudo-étiquettes. Cette approche innovante peut traiter des fruits de différentes tailles et formes, améliorant ainsi la précision de la génération finale de l’étiquette.
La validation expérimentale d’EasyDAM_V3 impliquait les agrumes, la pomme et la tomate comme domaines cibles. Le processus comprenait trois parties principales : utiliser la quantification de caractéristiques multidimensionnelles et la reconstruction spatiale pour sélectionner le fruit du domaine source optimal, saisir ces fruits sources dans le modèle CycleGAN pour la génération d’images du domaine cible et utiliser ces images pour construire des ensembles de données synthétiques.
Ces ensembles de données ont ensuite été utilisés pour former un modèle de détection de fruits basé sur un détecteur sans ancre. Les résultats de ces expériences ont montré qu’EasyDAM_V3 pouvait traduire et générer avec succès des étiquettes pour les domaines cibles en utilisant des poires comme domaine source, avec des taux de précision moyens élevés d’environ 90 %. Cela démontre l’efficacité d’EasyDAM_V3 pour relever à la fois les défis de la sélection optimale du domaine source et la réduction des coûts d’annotation manuelle.
En résumé, l’approche décrite par EasyDAM_V3 améliore non seulement l’applicabilité et l’adaptabilité au domaine des algorithmes d’étiquetage automatique, mais représente également une étape importante vers la réalisation de solutions efficaces et rentables en matière d’IA agricole et de gestion intelligente des vergers.
Plus d’information:
Wenli Zhang et al, EasyDAM_V3 : Étiquetage automatique des fruits basé sur la sélection optimale du domaine source et la synthèse des données via un graphique de connaissances, Phénomique des plantes (2023). DOI : 10.34133/plantphenomics.0067