Maschinelle Übersetzung, sofern nicht anders angegeben.

Die Integration von maschinellem Lernen und Pflanzenmodellierung kann Vorhersagen über Pflanzenwachstum und -ertrag optimieren.


Die Seite kann als Audiodatei angehört werden.

Angesichts des sich verschärfenden Klimawandels arbeiten Wissenschaftler daran, die leistungsstärksten Methoden, Algorithmen oder Modelle zu finden, um die Auswirkungen hoher Temperaturen und/oder begrenzter Wasserverfügbarkeit auf das Wachstum, die Entwicklung und die Produktivität von Pflanzen zu simulieren. Die Komplexität der Wechselwirkungen zwischen Pflanze und Umwelt erschwert dies, aber neue Forschungsergebnisse haben gezeigt, dass die Integration von maschinellem Lernen und Pflanzenmodellierung die erforderlichen Antworten liefern kann.

Dr. Ioannis Droutsas, Research Fellow an der University of Leeds, und Koautoren eingebettete Algorithmen für maschinelles Lernen (ML) in ein prozessbasiertes Pflanzenmodell, um ein neues Pflanzenmodellierungs-/ML-Framework mit hoher Leistung bei der Darstellung der Pflanzenreaktion auf eine Vielzahl von Umgebungen, einschließlich Stressbedingungen, zu schaffen.

Die Autoren modifizierten das bestehende prozessbasierte Erntemodell GLAM-Parti  durch Einbetten von Algorithmen für maschinelles Lernen, um Variablen zu schätzen, die sich regelmäßig der Vorhersagekapazität des Erntemodells entziehen. . ML wurde für tägliche Vorhersagen der Strahlungsnutzungseffizienz, der Änderungsrate des Ernteindex und des phänologischen Stadiums verwendet.

Für die Bewertung des neuen GLAM-Parti-ML-Frameworks verwendeten die Autoren eine bestehenden Datensatz für eine Weizensorte, die unter einer breiten Palette von Temperaturen, Sonneneinstrahlung und Luftfeuchtigkeitsbedingungen angebaut wurde, einschließlich Hitzestress. Die Hälfte der Daten wurde verwendet, um die maschinellen Lernalgorithmen zu trainieren, und die andere Hälfte, um das Modell zu testen.

Das Modell wurde mit den Wettereingängen Temperatur, Sonneneinstrahlung und Dampfdruckdefizit betrieben, den wichtigsten Wetterdeterminanten des Weizenwachstums unter bewässerten, gut gedüngten Bedingungen. Die Ergebnisse von Biomasse und Getreideertrag sowie die Tage bis zur Blüte und Reife wurden mit den Feldmessungen am Ende der Saison verglichen.

Ein Flussdiagramm, das die Methodik für die Integration von ML in GLAM-Parti zeigt. Der Datensatz ist in Trainings- und Testbehandlungen aufgeteilt. Erntedaten aus den Trainingsbehandlungen werden für passende Zeitreihen von Biomasse und Ertrag verwendet, die dann die Zielvariablen RUE und dHI/dt für das Training von Random Forests (RF) und XGBoost ableiten. Die Testbehandlungen werden bei der Bewertung von GLAM-Parti mit RF bzw. XGBoost verwendet.
Methodik zur Integration von ML in GLAM-Parti.

Das Team wendete Random Forests und Extreme Gradient Boosting an. Beide ML-Modelle zeigten eine hohe Effizienz beim Erlernen der Muster zwischen Eingaben und Pflanzenleistung (in Bezug auf die Strahlungsnutzungseffizienz) im Laufe der Vegetationsperiode. Dies führte zu einer guten Modellfähigkeit für Pflanzenbiomasse; GLAM-Parti-ML reproduzierte 98 % der beobachteten Varianz sowohl bei der Biomasse als auch beim Getreideertrag, und der Modellfehler betrug weniger als 20 %. Darüber hinaus reproduzierte das Modell mindestens 98 % der beobachteten Varianz in den Tagen bis zur Blüte und Reife mit weniger als 11 % Fehler. Dennoch wurde das Einsetzen beider phänologischer Stadien unterschätzt, wodurch Anthese und Reife früher als beobachtet vorhergesagt wurden.

Es werden vier Figuren gezeigt. Die gepaarten Balkendiagramme vergleichen die beobachtete und vorhergesagte Biomasse, den Kornertrag, den Auflauf bis zur Anthese und den Auflauf bis zur Reife. Alle haben 12 Sorten auf der x-Achse und eine rote vertikale Linie in der Mitte, die anzeigt, dass 6 der Sorten zum Training von Random Forests verwendet werden und die anderen 6 Behandlungen sind, die für Modelltests verwendet werden. Die y-Achse für Abbildung A ist die Biomasse in Tonnen pro Hektar von 0-20. Die Biomasse für drei der Trainingssorten und eine Testsorte liegt bei etwa 5 Tonnen pro Hektar, während der Wert für andere Sorten bei etwa 10 Tonnen pro Hektar liegt. Die Trainingsvorhersagewerte werden gleichmäßig über- und unterschätzt, während die Testwerte zu unterschätzende Vorhersagen anzeigen. Die y-Achse für Abbildung B ist der Getreideertrag in Tonnen pro Hektar von 0-8. Die Biomasse für zwei der Trainingssorten und eine Testsorte liegt bei etwa 1 Tonne pro Hektar, während der Wert für andere Sorten bei etwa 5 Tonnen pro Hektar liegt. Die Trainingsvorhersagewerte werden gleichmäßig über- und unterschätzt, während die Testwerte zu unterschätzende Vorhersagen anzeigen. Die y-Achse für Figur C ist das Auflaufen bis zur Anthese von 0–100 Tagen. Das Anthesedatum variiert sowohl für die Trainings- als auch für die Testsorten und liegt zwischen 50 und 100 Tagen. Die Trainingsvorhersagewerte sind gleich den beobachteten Werten, während die Testwerte zu unterschätzende Vorhersagen zeigen. Die y-Achse für Abbildung D ist das Auflaufen bis zur Fälligkeit von 0–150 Tagen. Das Reifedatum variiert sowohl für die Trainings- als auch für die Testsorten und liegt zwischen 75 und 150 Tagen. Die Trainingsvorhersagewerte sind gleich den beobachteten Werten, während die Testwerte Vorhersagen zeigen, die meistens unterschätzt werden.
Vergleich zwischen beobachteten und GLAM-Parti-simulierten Werten für eine Weizensorte, die unter einem weiten Temperatur-, Sonneneinstrahlungs- und Luftfeuchtigkeitsbereich angebaut wurde, einschließlich Hitzestress. Vertikale rote Linien trennen die Behandlungen für das Training von Random Forests (links von der roten Linie) und die Behandlungen für Modelltests (rechts von der roten Linie).

Als nächstes wurde GLAM-Parti mit seinem Vorgänger GLAM verglichen, einem prozessbasierten Erntemodell ohne Integration von maschinellem Lernen. GLAM wurde mit 100 % der Daten kalibriert und GLAM-Parti mit nur 50 %. Dennoch hatte GLAM-Parti-ML niedrigere Fehlerwerte für Biomasse, Ertrag und die Tage bis zur Reife und Anthese, was darauf hinweist, dass die Parametrisierungen des maschinellen Lernens das Modell verbesserten, obwohl es nur mit der Hälfte der Daten trainiert wurde.

Um GLAM-Parti-ML weiter zu evaluieren, verwendeten die Autoren a zweiter Datensatz von drei Weizensorten, die in vielen Feldversuchen in sechs Ländern angebaut wurden. Auch hier wurde die Hälfte der Daten zum Trainieren der maschinellen Lernalgorithmen und die andere Hälfte zum Testen des Modells verwendet.

Es werden vier Figuren gezeigt. Die Streudiagramme vergleichen beobachtete und prognostizierte Biomasse, Kornertrag, Auflauf bis Blüte und Auflauf bis Reifedaten für Weizen, der in 4 Ländern angebaut wurde. Die Achsen für Abbildung A sind Biomasse in Tonnen pro Hektar von 0-15. Der R-Quadrat-Wert beträgt 0.73. Die y-Achsen für Abbildung B sind Getreideerträge in Tonnen pro Hektar von 0–7.5. Der R-Quadrat-Wert beträgt 0.76. Die Achsen für Abbildung C sind das Auflaufen bis zur Anthese von 0–100 Tagen. Der R-Quadrat-Wert beträgt 0.66. Die Achsen für die Abbildung sind das Auflaufen bis zur Reife von 0-120 Tagen. Der R-Quadrat-Wert beträgt 0.79.
Vergleich zwischen beobachteten und GLAM-Parti-simulierten Werten für drei Weizensorten, die in vielen Feldversuchen in sechs Ländern angebaut wurden.

Wieder einmal zeigte das Modell eine hervorragende Leistung. Es reproduzierte 73 % der Variation der Biomasse zwischen Standorten und Sorten mit 15 % Fehler und 76 % der Körnerertragsvariation mit 16 % Fehler. Die Pflanzenphänologie war für die Tage bis zur Reife genauer (9.9 % Fehler) als für die Anthese (13.2 % Fehler). Es gab wiederum einen negativen Bias in der Vorhersage beider phänologischen Stadien. 

Droutsas schlussfolgert: „Die Verwendung eines größeren Trainingsdatensatzes würde die Modellsimulationen erheblich verbessern. Es gibt jedoch nur wenige Datensätze mit den erforderlichen Messungen.“

DER ARTIKEL::

Ioannis Droutsas, Andrew J Challinor, Chetan R Deva, Enli Wang, Integration von maschinellem Lernen in prozessbasierte Modellierung zur Verbesserung der Simulation komplexer Pflanzenreaktionen, in silico Plants, 2022, diac017, https://doi.org/10.1093/insilicoplants/diac017

Starten Sie die Eingabe und drücken Sie die Eingabetaste, um zu suchen

Entdecken Sie mehr von Botany One

Abonnieren Sie jetzt, um weiterzulesen und Zugriff auf das vollständige Archiv zu erhalten.

Weiterlesen