Das Ausdünnen der Beeren ist für den Anbau hochwertiger Tafeltrauben von entscheidender Bedeutung und wird traditionell von qualifizierten Arbeitskräften durchgeführt, die aufgrund der alternden Bevölkerung immer knapper werden. Um den arbeitsintensiven und zeitaufwändigen Prozess zu bewältigen, konzentrieren sich die Forscher auf die Entwicklung eines intelligenten Bildverarbeitungssystems für die automatisierte Beerenausdünnung.
Aktuelle Studien nutzen Deep Learning (DL) und Bildverarbeitung, um Beeren zu zählen und zu lokalisieren. Die Methoden reichen von der Analyse von Bildern ganzer Weinreben bis hin zur Fokussierung auf Bilder einzelner Weintrauben, um die Genauigkeit und Effizienz zu verbessern. Aufgrund ihrer Größe, Farbähnlichkeit mit Blättern und dichter Packung bleibt es jedoch weiterhin schwierig, kleine Beeren während der Ausdünnungssaison genau zu erkennen. Dies erfordert weitere Forschung, um die Erkennungsfähigkeiten zu verbessern und die Techniken zu verallgemeinern.
In diesem Studieverwendeten die Forscher ein maschinelles Bildverarbeitungssystem, insbesondere ein Instanzsegmentierungsmodell namens AS-SwinT, um den Prozess der Weinbeerenzählung zu verbessern. Das Experiment wurde mit einem robusten Hardware-Setup durchgeführt, einschließlich einer 24 GB NVIDIA RTX3090 und einer i7-CPU. Es wurden Softwaretools wie Python und PyTorch verwendet, die MMDetection für die Modellkonstruktion verwendeten.
Die Bilder wurden durch Flipping-Techniken verbessert und die Modelle wurden mithilfe der AdamW-Optimierung trainiert, wobei der Schwerpunkt auf Transferlernen und Backbone-Gewichten aus dem Imagenet-Datensatz lag. Die Leistung von AS-SwinT und anderen Modellen wurde mithilfe durchschnittlicher Präzisionsmetriken im COCO-Stil unter Berücksichtigung verschiedener Objektgrößen und unter Verwendung von Präzisions- und Rückrufberechnungen bewertet.
Ablationsstudien zeigten deutliche Verbesserungen der Erkennungsgenauigkeit, insbesondere durch die Integration von Anchor-Optimierung, Soft-NMS und ASFF-Komponenten. AS-SwinT zeigte eine überlegene Leistung bei der Erkennung kleiner Beeren und kombinierte die Vorteile dieser Module, um Fehlerkennungen zu vermeiden.
Vergleiche mit verschiedenen Backbone-Netzwerken zeigten, dass tiefere Schichten nicht immer mit einer höheren Genauigkeit einhergehen, was die effektive Fähigkeit des Swin Transformer zur Merkmalsextraktion unterstreicht. Beim Vergleich mit klassischen Modellen sowohl in künstlichen als auch in natürlichen Umgebungen übertraf AS-SwinT andere und zeigte bemerkenswerte Robustheit und Genauigkeit, insbesondere unter schwierigen Bedingungen, bei denen sich Beeren überlappen oder im Schatten liegen.
Die Studie untersuchte auch die Schätzung der Anzahl der Beeren in einer einzelnen Traube mithilfe eines linearen Regressionsmodells und bewertete die Beziehung zwischen Vorhersage und Grundwahrheit. AS-SwinT erzielte unter den getesteten Modellen die höchsten Anpassungseigenschaften, was auf seinen potenziellen Nutzen für Weinbauern hinweist.
Trotz des Erfolgs weisen Herausforderungen wie die Nichterkennung von stark schattierten oder winzigen Beeren auf Bereiche für zukünftige Forschung hin, einschließlich der Erforschung verschiedener Rebsorten und der Auswirkungen von Umweltbedingungen auf die Erkennungsgenauigkeit. Ziel der Studie ist es, die Kennzeichnungskosten zu senken und das Modell weiter zu verbessern.
Es legt nahe, dass halbüberwachtes Lernen und andere Methoden von Vorteil sein könnten. Insgesamt stellt die Forschung einen bedeutenden Fortschritt in der automatischen Traubenzählung dar, bietet eine robuste Lösung zur Unterstützung des Beerenausdünnungsprozesses und könnte möglicherweise den Tafeltraubenanbau revolutionieren.
Mehr Informationen:
Wensheng Du et al, Instanzsegmentierung und Beerenzählung von Tafeltrauben vor dem Ausdünnen basierend auf AS-SwinT, Pflanzenphänomik (2023). DOI: 10.34133/plantphenomics.0085