Vorab trainierte Modelle übertreffen herkömmliche Methoden

Die Diagnose von Pflanzenkrankheiten ist von entscheidender Bedeutung, um den wachsenden Nahrungsmittelbedarf der Welt zu decken, der bei einer Bevölkerung von 9,1 Milliarden Menschen bis 2050 voraussichtlich steigen wird. Krankheiten können die Ernteerträge um 20–40 % verringern, daher ist eine frühzeitige Erkennung von entscheidender Bedeutung. Zu den traditionellen Methoden zur Krankheitsidentifizierung gehören Expertenanalysen und auf maschinellem Lernen basierende Bildverarbeitung. Der manuelle Ansatz ist jedoch ineffizient und fehleranfällig, während maschinelles Lernen, insbesondere Deep-Learning-Methoden wie Convolutional Neural Networks (CNNs), die Krankheitserkennung durch die Extraktion detaillierter Bildmerkmale revolutioniert hat.

Diese Modelle werden häufig anhand nicht-botanischer Datensätze wie ImageNet vorab trainiert und verfügen nicht über spezifische Kenntnisse im Bereich Pflanzenkrankheiten, was zu einer begrenzten Genauigkeit führt. Diese Lücke verdeutlicht die Notwendigkeit, vorab trainierte Modelle mit Spezialwissen über Pflanzenphänotypen und -krankheiten zu entwickeln, um die Genauigkeit der Diagnose von Pflanzenkrankheiten zu verbessern.

Im Mai 2023, Pflanzenphänomik veröffentlichte einen Forschungsartikel mit dem Titel „PDDD-PreTrain: Eine Reihe häufig verwendeter vorab trainierter Modelle unterstützen die bildbasierte Diagnose von Pflanzenkrankheiten.“

In dieser Studie entwickelten die Autoren eine Reihe vorab trainierter Modelle für die Diagnose von Pflanzenkrankheiten unter Verwendung eines umfassenden Datensatzes namens PDDD (Plant Disease Diagnostic Dataset), der über 400.000 Bilder von 40 Pflanzenarten in 120 Krankheitsklassen enthält. Verschiedene Modellstrukturen und Parameter wurden untersucht, um für unterschiedliche Diagnoseszenarien und Geräte geeignet zu sein. Zur Bewertung verwendeten die Forscher Methoden wie Klassifizierungserkennungsgenauigkeit und mittlere durchschnittliche Präzision (mAP) und verwendeten Datensätze wie den Kaggle-Pflanzenkrankheitsdatensatz und PlantDoc für Tests.

Die Ergebnisse zeigten, dass die vorab trainierten Modelle, die auf den PDDD- und PlantVillage-Datensätzen basierten, die auf ImageNet allein trainierten Modelle deutlich übertrafen. Dies zeigte sich bei Aufgaben wie der Klassifizierung von Pflanzenkrankheiten, bei denen das Hybridmodell, das die PlantVillage- und ImageNet-Datensätze kombinierte, herausragte. Bei der Erkennung von Pflanzenkrankheiten zeigte das Faster R-CNN-Modell, das mit Gewichten von PDDD und ImageNet initialisiert wurde, eine verbesserte Erkennungsgenauigkeit und Generalisierungskapazität.

In ähnlicher Weise erzielten DeeplabV3-Modelle, die auf PDDD und ImageNet vorab trainiert wurden, bei der Segmentierung von Pflanzenkrankheiten eine höhere Genauigkeit, was den Vorteil der Einbeziehung domänenspezifischen Wissens in die Modelle hervorhebt.

Zusammenfassend unterstreichen diese Ergebnisse die Bedeutung der Verwendung umfangreicher, domänenspezifischer Datensätze für das Vortraining zur Diagnose von Pflanzenkrankheiten. Durch die Bereitstellung dieser Modelle als Open Source möchten die Autoren die weitere Forschung auf diesem Gebiet unterstützen und eine Grundlage für fortschrittliche und effiziente Methoden zur Diagnose von Pflanzenkrankheiten schaffen. Der Erfolg dieser Modelle stellt einen bedeutenden Schritt beim Einsatz von Deep Learning für die Diagnose von Pflanzenkrankheiten dar und deutet auf mögliche Anwendungen in der Präzisionslandwirtschaft und anderen verwandten Bereichen hin.

Mehr Informationen:
Xinyu Dong et al, PDDD-PreTrain: Eine Reihe häufig verwendeter vorab trainierter Modelle unterstützen die bildbasierte Diagnose von Pflanzenkrankheiten, Pflanzenphänomik (2023). DOI: 10.34133/plantphenomics.0054

Bereitgestellt von der NanJing Agricultural University

ph-tech