Fortschritte in der Datenverarbeitung und der Hochdurchsatz-Phänotypisierung haben zu einer massiven Steigerung der Datenverfügbarkeit geführt. Wissenschaftler nutzen diese Daten, um neue Ergebnisse vorherzusagen, z. B. die Reaktion einer Kulturpflanze, wenn sie an einem anderen Ort oder am selben Ort mit einem anderen Klima gepflanzt wird.
Laut einem neuen Forschungsartikel von Dr. Carlos Messina von Corteva Agriscience und Kollegen, neue Modellierungsansätze sollten untersucht werden, um diesen Datenschatz zu nutzen. Dieser Artikel stellt mehrere hybride Modellierungsansätze vor, um genaue und interpretierbare Vorhersagen zu erzielen.
Die Autoren verwendeten ein bestehendes Systemmodell, CROPGRO, um phänologische Stadien in neuen Umgebungen vorherzusagen, indem sie einen großen interkontinentalen Datensatz verwendeten, der den zeitlichen Ablauf der Entwicklungsstadien von Sojabohnen aufzeichnet. Sie fanden heraus, dass sich das vorhandene Modell nicht gut über alle Umgebungen und Laufzeiten verallgemeinern ließ, weil es einfach eine Zeitreihe von Tagestemperaturen und Photoperioden (z. B. Gradtage) verwendete, um den Kalendertag eines Entwicklungsereignisses zu bestimmen. „Während Systemmodelle unter bestimmten Bedingungen gut funktionieren, sind sie nicht ausreichend verallgemeinerbar, um agronomische und züchterische Entscheidungen über eine Vielzahl von Umweltbedingungen und kontinuierliche relative Reife hinweg zu unterstützen“, erklärt Dr. Ryan McCormick, Hauptautor der Studie.

Die Autoren unternahmen mehrere Ansätze zur Verbesserung von CROPGRO.
Zunächst verwendeten sie eine hochparallelisierte Multi-Modell-Optimierungsstrategie, um CROPGRO neu anzupassen. Unter Verwendung eines evolutionären Algorithmus wurden 36 Parameter untersucht, um Äquifinalität und Familien von Parametern mit ähnlichem Verhalten zu identifizieren. Der am Ende jeder Evolutionsrunde gefundene Parametervektor mit der optimalen Anpassung wurde beibehalten und als Satz optimierter Parameter für nachfolgende Analysen mit CROPGRO verwendet. Das umgerüstete Modell („CROPGRO optimiert“) schnitt nach dem Umrüstprozess im Vergleich zur Vorgängerversion besser ab.
Als nächstes entwickelten die Autoren maschinell erlernte Modelle unter Verwendung neuronaler Netze. Trainiert mit Eingaben von minimaler Tagestemperatur, maximaler Tagestemperatur, Sonneneinstrahlung, Photoperiode und relativer Reife, sagten diese Modelle die täglichen Entwicklungsstadien genau voraus. Die Einbeziehung von „CROPGRO-optimierten“ Vorhersagen als Merkmale in das Netzwerkmodell verbesserte die Genauigkeit ihrer Vorhersagen, was darauf hindeutet, dass maschinelles Lernen verbessert werden kann, indem von Experten entwickelte Merkmale wissensbasierter Modelle einbezogen werden.
Die Sammlung von 20 wissensbasierten und datengesteuerten Modellen wurde dann kombiniert, um die Vorhersage weiter zu verbessern. Die Autoren kombinierten die Modelle, wobei die Vorhersage jedes einzelnen Modells in der endgültigen Gesamtvorhersage gleich gewichtet wurde. Sie verwendeten auch Super Learning, das die Modelle nach ihrer Leistung gewichtete. Der Super Learner übertraf das einfache Ensemble von Modellen, war aber ähnlich wie „CROPGRO optimiert“ (siehe Abbildung).
Messina und McCormick sind sich einig, dass „diese Arbeit zeigt, dass Maschinenmodelle kein Ersatz für Modelle sind, die auf der Grundlage wissenschaftlicher Erkenntnisse entwickelt wurden, sondern dass die Verschmelzung beider Ansätze, wissenschaftsbasierte Modelle, das Problem der Modellunterbestimmung von Maschinenmodellen zumindest teilweise lösen können zu besseren Vorhersagen führen und neues Wissen aufdecken.
Die DSSAT-Community (Decision Support System for Agrotechnology Transfer) engagiert sich für die Förderung der Entwicklung aller DSSAT-Modelle und Softwaretools als Open-Source-Projekte. Der Code des DSSAT Cropping System Model (CSM), einschließlich CROPGRO, ist vollständig offen und zugänglich unter https://github.com/DSSAT/dssat-csm-os
