Ein neues Projekt versucht, die Wildnis der Pflanzenmodelle zu zähmen, indem es eine spezielle Modellierungsplattform schafft, die kollaboratives und verteiltes Modelldesign, Reproduzierbarkeit und Verbreitung unterstützt.
In den letzten Jahrzehnten, getrennte Teams haben Modelle entwickelt, die verschiedene Programmiersprachen mit unterschiedlichem Grad an Modularität und Interoperabilität verwenden. Während sich Pflanzenwissenschaftler angesichts des Klimawandels beeilen, die wachsenden Ertragsanforderungen zu erfüllen, bieten fortschrittliche Technologien in Molekularbiologie, Biochemie und Hochleistungsrechnen eine beispiellose Gelegenheit, Modelle zu erstellen, die schnelle Fortschritte in der Pflanzenzüchtung leiten. Fortschritte werden auch Forschung erfordern, um über die Modellierung auf Einzelskalen hinauszugehen integrative Multiskalenmodellierung, um eine integrative Multiskalenmodellierung zu erreichen, die unser Verständnis der molekularen Mechanismen und die Fülle an genomweiten Daten, die in den letzten drei Jahrzehnten generiert wurden, voll ausschöpft. Die Möglichkeit, integrative Mehrskalenmodelle zu erstellen, wird jedoch derzeit durch die Schwierigkeit behindert, Modelle und Simulationswerkzeuge zwischen Teams (oder sogar innerhalb eines Teams) auszutauschen, wiederzuverwenden und zu kombinieren, obwohl für diesen Zweck dedizierte Modellierungsplattformen existieren.
Seit 25 Jahren gibt es dedizierte Modellierungsplattformen, die es Benutzern ermöglichen, Modelle zu erstellen, auszuführen und mit ihnen zu interagieren und ihre Ergebnisse zu visualisieren (z. B. V-Laby, GroIMP, L-Py, AmapSim, AMAPmod, Capsis). Neuere Plattformen erleichtern auch die Integration und Interoperabilität von heterogenen Modellen und Datenstrukturen (z. B. OpenAlea und Yggdrasil).
In einem neuen Artikel, der von Dr. Frédéric Boudon, Forscher für Pflanzenmodellierung und Informatik am UMR AGAP Institut an der Universität Montpellier, und anwesenden Kollegen veröffentlicht wurde eine neue benutzerfreundliche virtuelle Modellierungsumgebung mit Jupyter-Notebooks. Ihr einzigartiger Ansatz geht mehrere Probleme an, denen Anlagenmodellierer häufig begegnen, darunter Reproduzierbarkeit, Wiederverwendung, Modularität, Zusammenarbeit und Wartung.
Laut Boudon „macht die Verwendung von Jupyter Notebook unsere Plattform einzigartig, weil ihre Fähigkeit, Modellierungsnarrative zu erstellen, es ermöglicht, Benutzern auf klare, dokumentierte und gemeinsam nutzbare Weise Zugang zu den verschiedenen Schritten der Modellierungspipeline zu geben. Wir verwenden auch eine Standarddarstellung mehrdimensionaler Arrays zur Darstellung von Pflanzeneigenschaften, was die Effizienz der Modellierung und des Codierungsprozesses verbessert, da keine benutzerdefinierten Codes zum Extrahieren, Transformieren und Visualisieren von Daten erforderlich sind. Diese Funktionen werden vom wissenschaftlichen Python-Stack standardmäßig bereitgestellt, wodurch der Wartungsaufwand minimiert wird.“
Die Jupyter-basierte Modellierungsumgebung ermöglicht einen reproduzierbaren, wiederverwendbaren, kollaborativen und verteilten Modellentwurf. Das Notebook-Format unterstützt die klare Spezifikation von Prozessen und Dokumentationen, um die Simulationserzählung eines Modellierungsszenarios zu erstellen. Dieses Format ermöglicht es, Hypothesen des Modells und tatsächliche Parameterwerte klar zu spezifizieren, wodurch die Informationen zukünftigen Benutzern zugänglich gemacht werden. Auf diese Weise können Mitarbeiter und Benutzer ein Modell testen und ändern. Die Einbindung des Conda-Paketverwaltungssystems ermöglicht es, Software-Abhängigkeiten eindeutig zu spezifizieren. Darüber hinaus ermöglicht die Umgebung die Entwicklung von Modellen aus der Ferne, sodass Benutzer nicht über umfangreiche Rechenressourcen verfügen müssen. Dies erleichtert weiter den kollaborativen und verteilten Modellentwurf und die Implementierung.
Eine Erhöhung der Modellmodularität ist durch die Einbeziehung von xarray-simlab möglich, einer Python-Bibliothek zum Organisieren und Ausführen von Simulationen. Die Bibliothek stellt einen Rahmen bereit, um komplexe Berechnungsmodelle aus Sätzen wiederverwendbarer Untermodelle oder Module zusammenzustellen. Eine Sammlung von Teilmodellen kann kombiniert werden, um ein Modell zu bilden, und ihre rechnerische Ordnung wird vollständig von Prozessabhängigkeiten abgeleitet. Diese Modularität ermöglicht es Benutzern, Simulationen nur für eine Teilmenge von Prozessen auszuführen oder sogar alternative Prozesse zu definieren, um vordefinierte zu ersetzen.
Um die Verwendung der neuen Modellierungsumgebung zu veranschaulichen, haben die Autoren das Design neu gestaltet V-Mango, ein bestehendes Modell der Mangobaumentwicklung und Fruchtproduktion, und reorganisierte seinen Code.

„Wir haben uns für V-Mango entschieden, weil es ein komplexes Modell war, das von einer Neugestaltung und Reorganisation des Codes profitieren könnte. Das Modell bestand aus Prozessen, die als einfache Funktionen oder L-System-Regeln implementiert wurden, ohne dass sie voneinander unterschieden werden konnten. Außerdem wurde die Interaktion zwischen Teilmodellen durch die Verwendung unterschiedlicher Sprachtechnologien eingeschränkt“, erklärt Boudon.
Die Funktionalität von xarray-simlab in der Jupyter-Umgebung ermöglichte es den Autoren, V-mango einfach neu zu gestalten und seinen Code neu zu organisieren. Diese bestand darin, Prozesse und deren Inputs/Outputs zu definieren und entsprechende Modelllogiken zuzuweisen (siehe alter vs. neuer Workflow).

Wartungsprobleme werden mit der Jupyter-Plattform reduziert, da Funktionen vom wissenschaftlichen Python-Stack sofort einsatzbereit sind. Dies reduziert den Bedarf an schwer zu pflegenden benutzerdefinierten Codes, um Daten zu extrahieren, umzuwandeln und zu visualisieren.
Die Autoren ermutigen andere dazu die Open-Source-Plattform selbst ausprobieren.
DER ARTIKEL::
Jan Vaillant, Isabelle Grechi, Frédéric Normand, Frédéric Boudon, Hin zu virtuellen Modellierungsumgebungen für funktionale strukturelle Pflanzenmodelle basierend auf Jupyter-Notebooks: Anwendung auf die Modellierung von Wachstum und Entwicklung von Mangobäumen, in silico Plants, 2021;, diab040, https://doi.org/10.1093/insilicoplants/diab040
Dieses Manuskript ist Teil von in silico Plant's Funktionelles strukturelles Anlagenmodell Sonderausgabe.
pgljupyter ist verfügbar unter https://github.com/fredboudon/plantgl-jupyter/ und vmango-lab at https://github.com/fredboudon/vmango-lab mit Anweisungen für den Installationsprozess. Alle Beispiele in Abschnitt 3 sind als Notebooks in einem Demo-Repository unter verfügbar https://github.com/fredboudon/plantgl-jupyter/blob/isp2022/examples und kann mit nbviewer inspiziert und entweder lokal oder auf einer Binderinstanz reproduziert werden. Die in Abschnitt 4 beschriebenen Notebooks sind unter erhältlich https://github.com/fredboudon/vmango-lab-demo/tree/isp2022.
