Es gibt viele fossile Pflanzenreste, die dazu beitragen könnten, neue Evolutionsgeschichten botanischer Familien zu schreiben. Unter den Überresten sind häufig Blätter, die eine hervorragende Möglichkeit bieten könnten, Pflanzen zu identifizieren. Aber Ressourcen für die Blattidentifizierung können schwer zugänglich sein. Peter Wilf und Kollegen haben diese Wissenslücke durch adressiert Zusammenstellung einer Open-Access-Datenbank mit 30,252 Bildern von geprüften Blattproben auf Familienebene. Die Datenbank bietet nicht nur eine hervorragende Bildungsressource für menschliche Studenten, sondern könnte auch maschinelle Lernprojekte mit Material zur Verbesserung ihrer Systeme versorgen.

„Die Komplexität von Blättern ist unermesslich, und die Terminologie, mit der wir sie beschreiben müssen, ist nur der kleinste Anfang dessen, was benötigt wird“, sagte Peter Wilf sagte in einer Pressemitteilung. „Forscher brauchen viel besser zugängliche visuelle Referenzen, um die Unterschiede zwischen den vielen Pflanzengruppen zu untersuchen, damit wir mehr davon in Worte fassen können. Es gibt viele Pflanzenfamilien, die oberflächlich ähnlich aussehen, und diese Sammlung bietet die Möglichkeit, neue Muster zu sehen.“
Es ist nicht nur die Komplexität, die das Problem ist. In ihrem Artikel heben Wilf und Kollegen auch die Aufzeichnung der Blattarchitektur hervor, oder besser gesagt, das Fehlen davon. „Um ihr Wissen über die Blattarchitektur aufzubauen, verlassen sich Forscher immer noch hauptsächlich auf die „mündliche Überlieferung“ von einer schwindenden Zahl sachkundiger Kollegen und einer Handvoll Übersichtspapiere und Feldführer, die angeblich diagnostische Blattmerkmale hervorheben … Es gibt bedeutende Literatur über die Blattarchitektur und Blatt-Fossilien-Aufzeichnungen verschiedener Taxa… Viele der vielfältigsten und ökologisch bedeutendsten Gruppen von Angiospermen haben jedoch praktisch keine Dokumentation diagnostischer Blattspreitenmerkmale (z. B. Asteraceae, Rubiaceae), und daher bleiben ihre Blattfossilien weitgehend unerkannt, obwohl dies wahrscheinlich ist vor aller Augen in Museumssammlungen versteckt…“
Der Zugriff auf diese Sammlungen kann eine Herausforderung darstellen. Physisch können sie auf der ganzen Welt sein, was zu hohen Reisekosten führt. Einige Herbarien digitalisieren ihre Sammlungen, aber es sind die größeren und finanziell besser ausgestatteten Herbarien, die sich das leisten können. In dem Artikel fügen Wilf und Kollegen auch hinzu, dass es für ein Forschungsprojekt oft nicht ausreicht, nur online verfügbar zu sein. „Bei den meisten Online-Bildsätzen sind Massendownloads nicht einfach durchzuführen, Bilder werden auf eine niedrige Auflösung heruntergerechnet und die Dateinamen sind nicht standardisiert, was einen erheblichen manuellen Aufwand erfordert, um sie für ein bestimmtes Projekt neu zu organisieren und zusammenzustellen. Taxonomische Daten sind oft teilweise obsolet geworden, was die Modularität der Daten noch komplizierter macht.“
„Was wir hier getan haben, ist, diese riesige Bildungsressource für alle zugänglich zu machen, indem wir all diese Bilder aus verschiedenen Altquellen überprüft und standardisiert haben“, sagte Wilf. „Wir alle haben 15 Jahre gebraucht, um das zu tun und alle Dateinamen zu konvertieren, aber jetzt können Sie das ganze Paket mit einem einzigen Browser-Klick auf Ihrem Desktop haben. Jeder Dateiname enthält die Schlüsselinformationen in derselben Reihenfolge für eine schnelle Alpha-Sortierung: Familie, Gattung, Art und Exemplarnummer. Die Dateinamen können in Sekundenschnelle nach dem gewünschten Artikel durchsucht und die Bilder mit Standardwerkzeugen wie der Windows-Suchleiste angezeigt werden. Alle Bilder sind in Originalauflösung; nichts wird heruntergesampelt.“
Nicht nur das menschliche Auge kann von der Datenbank profitieren. Die Autoren sprechen auch über maschinelles Lernen. Sie beschreiben einige Apps als „spektakuläre Durchbrüche“ bei der Identifizierung von Pflanzen. Sie weisen aber auch auf einige Probleme hin. Erstens sind die Algorithmen undurchsichtig – es ist unklar, was die Computer als diagnostische Merkmale bei der Identifizierung von Pflanzen erkannt haben.
Ein weiteres Problem ist, dass nicht viele Algorithmen über die Speziesebene hinaus identifizieren. Die Öffentlichkeit kennt gerne die Art einer Pflanze, aber es kann hilfreich sein zu wissen, was eine Pflanzenfamilie verbindet. Bei Blattfossilien gibt es möglicherweise keine vorhandene Art oder Gattung, die mit einem Bild verbunden werden könnte, daher wäre es äußerst nützlich, eine Familie durch maschinelles Lernen identifizieren zu können.
„Diese Datenbank stellt die Informationen in diesen Sammlungen Menschen auf der ganzen Welt in einer Form zur Verfügung, die einfacher zu durchsuchen ist als das Original und besser zugänglich für digitale Analysen“, sagte Scott Wing, ein Co-Autor des Artikels. „Wir glauben, dass die Datenbank neue Forschungen anregen und auch die Museumssammlungen für Menschen öffnen wird.“
LESEN SIE DEN ARTIKEL
Wilf, P., Wing, SL, Meyer, HW, Rose, JA, Saha, R., Serre, T., Cúneo, NR, Donovan, MP, Erwin, DM, Gandolfo, MA, González-Akre, E., Herrera, F., Hu, S., Iglesias, A., Johnson, KR, Karim, TS und Zou, X. (2021) „Ein Bilddatensatz von gereinigten, geröntgten und fossilen Blättern, die auf Pflanzenfamilie für den Menschen überprüft wurden und maschinelles Lernen“, PhytoKeys, https://doi.org/10.3897/phytokeys.187.72350
AUF DIE DATENBANK ZUGREIFEN
Wilf, P., Wing, SL, Meyer, HW, Rose, JA, Saha, R., Serre, T., Rubén Cúneo, N., Donovan, M., Erwin, DM, Gandolfo, MA, Gonzalez-Akre, EB, Herrera, F., Hu, S., Iglesias, A., Johnson, KR, Karim, TS und Zou, X. (2021) „Bildsammlung und unterstützende Daten für: An image dataset of cleared, x-rayed, und fossile Blätter, die auf Pflanzenfamilie für menschliches und maschinelles Lernen überprüft wurden.“ Figshare+, https://doi.org/10.25452/figshare.plus.14980698
