Im dynamischen Bereich der landwirtschaftlichen KI hat die auf Deep Learning basierende Obsterkennung an Bedeutung gewonnen, insbesondere in intelligenten Obstgärten. Diese Techniken hängen jedoch stark von großen, manuell beschrifteten Datensätzen ab, ein Prozess, der sowohl zeitaufwändig als auch arbeitsintensiv ist.
In der vorherigen Arbeit wurde EasyDAM, eine generative kontradiktorische Netzwerkmethode (Generative Adversarial Network, GAN), eingeführt, um die Etikettierungskosten durch die Generierung simulierter Fruchtbilder zu senken. Dennoch steht dieser Ansatz vor Herausforderungen: Erstens mangelt es ihm an Anpassungsfähigkeit an verschiedene Obstarten, was zu Leistungsschwankungen in unterschiedlichen Obstgartenumgebungen führt.
Zweitens reduziert es zwar den Arbeitsaufwand in der Zieldomäne, erfordert jedoch immer noch eine manuelle Kennzeichnung in der Quelldomäne, wodurch manuelle Prozesse nicht vollständig eliminiert werden. Es ist von entscheidender Bedeutung, Methoden zur Auswahl optimaler Quelldomänendatensätze und zur Erzielung einer wirklich automatisierten Kennzeichnung zu entwickeln, diese aktuellen Einschränkungen zu beseitigen und auf eine kostengünstige automatisierte Kennzeichnungsgenerierung hinzuarbeiten.
Im Juli 2023, Pflanzenphänomik veröffentlichte einen Forschungsartikel mit dem Titel „EasyDAM_V3: Automatische Fruchtkennzeichnung basierend auf optimaler Quelldomänenauswahl und Datensynthese über einen Wissensgraphen.“
In dem Bestreben, die automatische Etikettierung von Früchten mit hoher Effizienz und ohne Kosten voranzutreiben, stellt diese Studie EasyDAM_V3 vor, einen neuartigen Ansatz, der die optimale Auswahl der Quelldomäne mit der Generierung synthetischer Datensätze kombiniert. EasyDAM_V3 zielt darauf ab, zwei Hauptherausforderungen zu bewältigen: die Auswahl der am besten geeigneten Quelldomänen-Fruchtdatensätze für die Bildübersetzung und die Minimierung der manuellen Annotationskosten in der Zieldomäne.
Der erste Aspekt von EasyDAM_V3 umfasst eine systematische Auswahl von Quell- und Zieldomänendatensätzen für Bildübersetzungsmodelle. Dieser Prozess nutzt ein mehrdimensionales räumliches Merkmalsmodell und ermöglicht die Identifizierung des am besten geeigneten Quelldomänendatensatzes, der mehreren Zieldomänenfrüchten entsprechen kann. Die Auswahl basiert auf der Analyse phänotypischer Merkmale wie Form, Farbe und Textur in verschiedenen Fruchtdatensätzen.
In der Studie wurden beispielsweise Birnen als optimale Quelldomäne für die Übersetzung von Bildern in Zieldomänen wie Zitrusfrüchte, Äpfel und Tomaten identifiziert. Diese Bestimmung wurde mithilfe eines Clustering-Algorithmus und einer mehrdimensionalen Merkmalsraumanalyse durchgeführt, wodurch eine höhere Genauigkeit bei der Übersetzungsgeneralisierung gewährleistet wurde. Der zweite Aspekt konzentriert sich auf die Erstellung eines Wissensgraphen, um synthetische Datensätze mit genauen Etiketteninformationen zu generieren.
EasyDAM_V3 verwendet eine transparente Hintergrundübersetzung von Fruchtbildern und einen ankerfreien Detektor für das Pseudo-Label-Selbstlernen. Dieser innovative Ansatz kann Früchte unterschiedlicher Größe und Form verarbeiten und verbessert so die Genauigkeit der endgültigen Etikettenerstellung.
Die experimentelle Validierung von EasyDAM_V3 umfasste Zitrusfrüchte, Äpfel und Tomaten als Zieldomänen. Der Prozess umfasste drei Hauptteile: die Verwendung mehrdimensionaler Merkmalsquantisierung und räumlicher Rekonstruktion zur Auswahl der optimalen Quelldomänenfrucht, die Eingabe dieser Quellfrüchte in das CycleGAN-Modell zur Generierung von Zieldomänenbildern und die Verwendung dieser Bilder zur Erstellung synthetischer Datensätze.
Diese Datensätze wurden dann verwendet, um ein ankerfreies, detektorbasiertes Fruchterkennungsmodell zu trainieren. Die Ergebnisse dieser Experimente zeigten, dass EasyDAM_V3 mit Birnen als Quelldomäne erfolgreich Beschriftungen für die Zieldomänen übersetzen und generieren konnte, mit hohen durchschnittlichen Präzisionsraten von etwa 90 %. Dies zeigt die Wirksamkeit von EasyDAM_V3 bei der Bewältigung der beiden Herausforderungen der optimalen Auswahl der Quelldomäne und der Reduzierung der manuellen Annotationskosten.
Zusammenfassend lässt sich sagen, dass der von EasyDAM_V3 beschriebene Ansatz nicht nur die Anwendbarkeit und Domänenanpassungsfähigkeit automatischer Etikettierungsalgorithmen verbessert, sondern auch einen bedeutenden Schritt hin zu effizienten, kostengünstigen Lösungen in der landwirtschaftlichen KI und der intelligenten Obstgartenbewirtschaftung darstellt.
Mehr Informationen:
Wenli Zhang et al, EasyDAM_V3: Automatische Fruchtkennzeichnung basierend auf optimaler Quelldomänenauswahl und Datensynthese über einen Wissensgraphen, Pflanzenphänomik (2023). DOI: 10.34133/plantphenomics.0067