Eine bahnbrechende Studie mit künstlicher Intelligenz (KI) hat einen neuartigen Ansatz zur Untersuchung des Zusammenhangs zwischen Blattgröße und Klima bei verschiedenen Pflanzenarten aufgezeigt. Die von Wilde und Kollegen durchgeführte und im veröffentlichten Studie Amerikanische Zeitschrift der Botanik, Verwendet maschinelles Lernen zur Analyse großer Datenmengen aus digitalisierten Herbarium-Sammlungen. Diese innovative Methode könnte beispiellose Erkenntnisse darüber liefern, wie sich Pflanzen an ihre Umgebung anpassen.

Herbariumsammlungen sind Bibliotheken konservierter Pflanzenexemplare, die oft Jahrhunderte zurückreichen. Sie sind eine Fundgrube an biologischen Informationen, aber ihre Größe und Komplexität machen ihre Analyse traditionell schwierig. Maschinelles Lernen, ein Zweig der KI, könnte den Messprozess automatisieren und so die für die Untersuchung verfügbaren Daten drastisch erhöhen.

Das Forschungsteam nutzte eine Art von KI namens Convolutional Neural Networks (CNNs), die sich besonders gut für die Analyse von Bildern eignet. Sie trainierten diese CNNs, um Blätter in Bildern von Pflanzenexemplaren aus zwei Gattungen zu identifizieren und zu messen: Syzygium, eine Gruppe blühender Pflanzen aus der Familie der Myrten, und Gummibaum, besser bekannt als Feigen.

Hellgrüne Syzygium-Blätter, die Ihrer archetypischen ovalen Blattform ähneln.
Syzygium Blätter. Bild: canva

„In dieser Studie wollten wir die Pixel in Blättern finden und zählen, als Maß für Fläche, Breite und Länge. Wir haben als Proof-of-Concept mit einfachen Blättern mit glatten Rändern begonnen, würden dies aber gerne auf komplexere Blattformen ausweiten“, sagten die Autoren in einer E-Mail.

Das Team trainierte zwei Versionen des CNN-Modells, eine mit einer zufälligen Auswahl von Bildern und eine andere mit vom Benutzer ausgewählten Bildern. Die Leistung dieser Modelle wurde dann anhand einer Reihe von Validierungsbildern getestet. Anschließend wurden die validierten Modelle auf über 3,800 digitalisierte Exemplare aus dem National Herbarium of New South Wales, Australien, angewendet.

„Diese Exemplare wurden alle kürzlich im Rahmen einer großen Digitalisierungsinitiative fotografiert. Das bedeutete, dass die Bilder unter einheitlichen Bedingungen, mit ähnlicher Ausrüstung und gleichbleibender Konfiguration aufgenommen wurden, sodass sie schön standardisiert waren. Ähnliche Digitalisierungsinitiativen laufen bei Herbaria auf der ganzen Welt, so dass es bald möglich sein wird, ähnliche Methoden auf eine große Anzahl von Bildern anzuwenden (mit Anpassungen der Auflösung usw.)“, so die Autoren

Die Ergebnisse waren vielversprechend. Der vom Benutzer ausgewählte Trainingsansatz war effektiver und fand mehr Blätter und einen größeren Bereich an Blattgrößen als das zufällig trainierte Modell. Dies deutet darauf hin, dass ein gewisses Maß an fachkundiger menschlicher Einbindung die Effizienz der KI bei solch komplexen Aufgaben verbessern kann.

„Das Human-in-the-Loop-Modell war hier besonders nützlich, da wir die Menge an Trainingsdaten minimieren wollten, die zur Generierung eines robusten Modells erforderlich sind. Wenn wir in Zukunft weiterhin auf Trainingsdaten beschränkt bleiben, könnten diese Ansätze noch lange eine Rolle spielen. Wenn andererseits die weltweiten Bemühungen zum Trainieren von Modellen zu großen Bibliotheken von Trainingsdaten führen, wird möglicherweise das Volumen die Vorteile der menschlichen Selektivität ersetzen“, so die Autoren

In Bezug auf den Zusammenhang zwischen Blattgröße und Klima bestätigten die CNN-Modelle, dass bei verschiedenen Arten größere Blätter mit wärmerem, feuchterem Klima verbunden sind, was mit früheren Studien übereinstimmt. Allerdings war der Zusammenhang innerhalb einzelner Arten nicht so eindeutig, was darauf hindeutet, dass andere Faktoren wie genetische Variation und Populationsgeschichte die Blattgröße beeinflussen könnten.

„Wir sehen, dass, wenn wir von einem Punkt im Südosten Australiens zu einem Punkt im wärmeren Nordostaustralien ziehen, im Durchschnitt die Größe eines.“ Syzygium Blatt wird größer. Dies scheint vor allem daran zu liegen, dass es im Norden Arten mit größeren Blättern gibt. Wenn wir die Blätter einer einzelnen, weit verbreiteten Art an denselben beiden Standorten betrachten, stellen wir im Durchschnitt fest, dass die Blätter etwa gleich groß sind“, schreiben die Autoren in ihrer E-Mail.

„Die Erklärung hängt wahrscheinlich mit der Evolutionsgeschichte oder den Evolutionsprozessen innerhalb der Arten zusammen. Beispielsweise sind innerhalb einer Art wahrscheinlich weit voneinander entfernte Populationen immer noch durch Genfluss verbunden. Dies kann beispielsweise indirekt über relativ kurze Pollenbewegungen zwischen benachbarten Populationen über Generationen hinweg erfolgen. Das bedeutet, dass genetische Allele, die die Blattgröße beeinflussen, wahrscheinlich zwischen den Populationen geteilt werden, wodurch die Blattgrößen zwischen den Populationen homogenisiert werden.

„Wenn die Selektion größere Blätter im Norden bevorzugen würde, müsste der damit verbundene Nutzen größerer Blätter ziemlich groß sein, um den Effekt des Genflusses zu überwinden. Es ist auch möglich, dass einige weit verbreitete Arten kürzlich eine Populationserweiterung erfahren haben, was auch dazu führen würde, dass Populationen über große geografische Gebiete hinweg ähnliche Merkmalswerte aufweisen. Daher könnten sowohl evolutionäre Prozesse (z. B. Pollenfluss) als auch Geschichten (z. B. Populationsausweitung) zu unterschiedlichen beobachteten Merkmals-Klima-Zusammenhängen innerhalb der Arten führen.“

Wenn Sie die Nachrichten zum Thema KI verfolgen, könnten die Ergebnisse interessant sein, aber die Methode könnte undurchsichtig sein. Es ist nicht nur wichtig, dass man Dinge weiß, sondern auch, dass man es weiß wie weißt du Dinge. Dies ist ein Problem, das Wilde und Kollegen in ihrem Artikel ansprechen.

„Komplexe Modelle des maschinellen Lernens (neuronale Netze usw.) sind weniger leicht zu verstehen als die statistischen Modelle, die bisher in den Pflanzen- und Biowissenschaften weit verbreitet waren. Wir sind jedoch an einem Punkt angelangt, an dem es eine solide Grundlage gibt, um sie auf zuverlässige und robuste Weise zu nutzen und von ihrer enormen Schlussfolgerungskraft zu profitieren“, sagten die Autoren in ihrer E-Mail.

„Diese Grundlage für den sinnvollen Einsatz von ML basiert auf den Prozessen der Modellvalidierung und -prüfung. Dazu gehört die Aufnahme von Daten (Bildern), die nicht zum Trainieren eines Modells verwendet werden, und das Hinzufügen von Beschriftungen zu den Daten der Features, die ein gut trainiertes Modell finden sollte. Wir können dann quantitativ fragen, wie gut ein Modell abschneidet, wenn die Daten angezeigt werden. Findet es alle Blätter, die dort zu finden waren? Schafft es es zu vermeiden, Dinge Blätter zu nennen, die keine Blätter waren? Wenn ein Blatt korrekt gefunden wird, gelangt es dann zu einer genauen Schätzung seiner Größe in Pixeln? Wenn ein maschinelles Lernmodell in Bezug auf diese Fragen für einen ausreichend großen und repräsentativen Satz an Trainingsdaten gute Leistungen erbringen kann, gewinnen wir Vertrauen in das Modell.“

Sobald Sie über eine robuste Messmethode verfügen, können Sie die von Ihnen gemessenen Daten auch erweitern. „Wir haben auch Modelle des maschinellen Lernens verwendet, um eine Reihe anderer Strukturen in Herbariumproben zu finden, darunter Knospen, Früchte und Blüten – es gibt also definitiv viel Spielraum für die Ausweitung auf andere Strukturen“, sagen die Autoren in ihrer E-Mail. Es besteht auch die Hoffnung, die Art der Messungen erweitern zu können, sagen sie. „Wir haben darüber nachgedacht, maschinelles Lernen zu nutzen, um Feldmessungen anderer Blattmerkmale durchzuführen, die in konservierten Exemplaren nur unzureichend dargestellt werden, aber das ist eine Arbeit, die sich noch in der Entwicklung befindet!“

LESEN SIE DEN ARTIKEL

Wilde, BC, Bragg, JG und Cornwell, W. (2023) „Analyse von Merkmals-Klima-Beziehungen innerhalb und zwischen Taxa mithilfe von maschinellem Lernen und Herbariumproben" Amerikanische Zeitschrift der Botanik, P. e16167. Verfügbar um: https://doi.org/10.1002/ajb2.16167.