Die Digitalisierung von Bildern und Informationen aus Herbarbelegen erweitert deren Verwendung und stellt eine wichtige Ressource für phänotypische und phänologische Studien bereit. Ab Frühjahr 2020 ein Schlüsselrepositorium, iDigBio, hat über 19 Millionen digitalisierte Exemplare. Annotierte Bilder in hoher Qualität können verwendet werden, um maschinelle Lernalgorithmen zu trainieren, um bestimmte auf digitalen Bildern basierende Aufgaben zu automatisieren und so später Zeit zu sparen. Die anfängliche Annotation erfordert jedoch einen hohen Aufwand an Personenstunden und wird häufig von Freiwilligen durchgeführt. Aus diesem Grund ist es wichtig, die einfachsten und effizientesten Wege zu finden, damit die Freiwilligen ihre Aufgaben erfüllen können.

In einem neuen Artikel, erschienen in Anwendungen in den PflanzenwissenschaftenIn der Sonderausgabe Machine Learning in Plant Biology verwendeten die Hauptautorin Laura Brenskelle und Kollegen einen hochwertigen, vorannotierten Datensatz mit jeweils 3000 Arten Prunus or Acer Exemplare zu Testen Sie die Annotationsgenauigkeit der Freiwilligen von phänologischen Merkmalen unter zwei verschiedenen Bedingungen.

In der ersten erschienen die Torschützen persönlich und erhielten eine 15-minütige Trainingseinheit sowie ein Handbuch mit Illustrationen und Beispielen. Im zweiten nutzten Torschützen die Online-Plattform Notizen aus der Natur und erhielten das Anweisungshandbuch ohne zusätzliche Schulung. In der zweiten Einstellung erforderte ein Muster drei Anmerkungen und wurde der Anmerkung zugeteilt, die von zwei Wertungsprüfern vereinbart wurde. Die Autoren untersuchten dann den Einfluss von Faktoren wie den bewerteten Merkmalen und Taxa sowie dem botanischen Fachwissen, dem akademischen Karriereniveau und der Geschwindigkeit der einzelnen Bewerter.

Beispiele Prunus (links) und Acer (rechts) Proben, die in die Studien eingeschlossen wurden. Quelle Brenskelle et al. 2020.

Überraschenderweise zeigten die Ergebnisse, dass botanisches Fachwissen, Karriereniveau und Geschwindigkeit keine wichtigen Faktoren für die Genauigkeit der Scorer waren. Stattdessen wurde die Genauigkeit von den zu bewertenden Merkmalen und Taxa bestimmt, unabhängig davon, ob die Person persönlich oder online bewertete, und von der Person selbst … einige Leute waren einfach genauer, unabhängig von anderen Faktoren. Insgesamt waren diejenigen, die persönlich erschienen, signifikant genauer, obwohl beide Gruppen recht gut abschnitten. „Wir glauben, dass es zwei Hauptfaktoren gibt, die zu der leichten Verzögerung bei der Genauigkeit der Online-Anmerkungen beigetragen haben könnten – Schulung und Bildqualität“, erklärt Brenskelle, der die umfassenden Schulungsbroschüren und die Möglichkeit betont, die Details eines Bildes zu vergrößern. Sie stellt auch fest, dass die dreifache Bewertung die Online-Genauigkeit um drei Prozent verbesserte. „Dies ist eine weitere Möglichkeit, die Genauigkeit von Online-Anmerkungen zu verbessern, obwohl dafür dreimal so viele fertige Anmerkungen erforderlich sind.“

Obwohl die in dieser Studie bewerteten Merkmale einfach waren, ist Brenskelle zuversichtlich, dass Freiwillige effektiv für komplexere Annotationsaufgaben geschult werden können. „Die Merkmale in dieser Studie waren relativ einfache Anwesenheits-/Abwesenheitsanmerkungen. Es gibt unzählige komplexere Annotationsaufgaben, an denen sich Forscher interessieren könnten, insbesondere für die Pflanzenphänologie. Ich denke, mit der richtigen Ausbildung der Freiwilligen würde unser allgemeiner Ansatz für komplexere Merkmale funktionieren“, sagt sie. „Ich denke, die größte Herausforderung, auf die Sie bei komplexeren Merkmalen stoßen würden, wäre, Bilder zu haben, die einen angemessenen Detaillierungsgrad für die Dinge zeigen, die Sie von den Freiwilligen verlangen. Abgesehen von dieser Herausforderung denke ich, dass die Entwicklung von Trainingshandbüchern mit visuellen Beispielen es Freiwilligen ermöglichen würde, komplexere Merkmale zu bewerten.“