Es gibt ein Instrument, das die Pflanzenzüchtung anleiten kann, um die Erträge zu steigern, um den Anforderungen einer wachsenden Bevölkerung in einem sich ändernden Klima gerecht zu werden: ökophysiologische Pflanzenmodelle. Diese Modelle simulieren die Anlagenentwicklung auf der Grundlage verschiedener Umwelt- und Managementeingaben. Die Merkmale, die diese Modelle simulieren, basieren auf mathematischen Algorithmen, die zugrunde liegende physiologische Prozesse darstellen, die das Wachstum und die Entwicklung von Nutzpflanzen von der Pflanzung bis zur Reife steuern.

Ökophysiologische Pflanzenmodelle liefern wertvolle Informationen, einige Merkmale können jedoch nicht gut simuliert werden, da sie Parameterwerte erfordern, die schwer zu messen sind, unbekannt sind oder je nach Sorte variieren. Diese Werte sind wichtig: die Leistung von Nutzpflanzenmodellen hängt weitgehend davon ab vom Detaillierungsgrad der für die Modellparametrisierung verfügbaren Eingabeinformationen.

Glücklicherweise können ökophysiologische Nutzpflanzenmodelle in genomische Vorhersagealgorithmen integriert und durch diese beeinflusst werden, die Gene mit den Parametern verknüpfen können, die die physiologischen Prozesse steuern. Die beste Klasse von Parametern, auf die Algorithmen zur Genomvorhersage abzielen, werden als „Genotyp-spezifische Parameter (GSPs)“ bezeichnet. Diese Genotyp-zu-Phänotyp-Integration würde es Züchtern ermöglichen, Gene auszuwählen, die Merkmale steuern, die phänotypisch schwer auszuwählen sind.

Obwohl die Integration von ökophysiologischen Nutzpflanzenmodellen und genomischen Vorhersagen vielversprechend ist, wurde hierzu relativ wenig Arbeit geleistet. Pratishtha Poudel, ehemalige Postdoktorandin an der Kansas State University, jetzt Assistenzprofessorin an der Purdue University, und Kollegen vermuten, dass dies auf begrenzte Überschneidungen zwischen den Gemeinschaften der ökophysiologischen Nutzpflanzenmodellierung und der genomischen Vorhersage zurückzuführen sein könnte.

Den Autoren zufolge gibt es viele verschiedene Algorithmen und kein einziger Algorithmus zur genomischen Vorhersage passt am besten zu verschiedenen Arten und Merkmalen. Daher kann die Auswahl des geeigneten Algorithmus zur genomischen Vorhersage entmutigend sein. Ihr Übersichtsartikel, veröffentlicht in in silico Plants beabsichtigt, diese Lücke zu schließen, indem es ökophysiologische Pflanzenmodellierer mit genomischen Vorhersagealgorithmen vertraut macht.

Sie betrachteten die folgenden genomischen Vorhersagealgorithmen:

  • Bayes A und B
  • bester linearer unverzerrter Prädiktor (BLUP)
  • LASSO
  • Markergestützte Auswahl (MAS)
  • Reproduktion des Kernel-Hilbert-Raums (RKHS)

Das Papier unterstützt die Leser bei der Auswahl des am besten geeigneten genomischen Vorhersagealgorithmus für verschiedene genotypspezifische Parameter auf der Grundlage der folgenden Kriterien:

1) Wählen Sie den genomischen Vorhersagealgorithmus basierend auf der Komplexität der genetischen Architektur des interessierenden Merkmals (in diesem Fall jedes GSP).

Abbildung 1. Methoden der markergestützten Selektion (MAS) gehören zu den „einfacheren“ Algorithmen, die sich zur Vorhersage von Merkmalen eignen, die stark von einigen wenigen Genen kontrolliert werden. Andererseits sind nichtparametrische Vorhersagealgorithmen wie RKHS flexibel und können besser zur Vorhersage von Merkmalen geeignet sein, wenn viele Gene Merkmale nur schwach kontrollieren und starke Gen-Umwelt-Interaktionen auftreten.

Der Benutzer muss fragen, wie viele Gene das Merkmal steuern und wie stark. Außerdem müssen sie berücksichtigen, inwieweit die Genexpression durch die Umwelt gesteuert wird. Informationen zu Anzahl und Größe von QTLs aus QTL-Studien werden verwendet, um auf die genetische Architektur eines Merkmals zu schließen.

2) Bestimmen Sie, wie die genotypspezifischen Parameter geschätzt werden.

Sobald ein genomischer Vorhersagealgorithmus (oder einige Kandidaten) ausgewählt wurde, können die genotypspezifischen Parameter mithilfe eines von zwei Ansätzen geschätzt werden, die sich in ihrer rechnerischen Komplexität und Effizienz des Schätzprozesses unterscheiden.

Zielfunktionen werden verwendet, um die Unterschiede zwischen den beobachteten und den vorhergesagten Parameterwerten zu messen – jede Iteration sollte sie näher an die Konvergenz bringen.

Einstufiger Ansatz
Abbildung 2: Einstufiger Ansatz zur Vorhersage genotypspezifischer Parameter. Blaue Formen = Eingabedaten, Orange = Teil des Genomvorhersagealgorithmus, Lila = Teil des ökophysiologischen Modells.

Einstufiger Ansatz: Genotypspezifische Parameter und der Genomvorhersagealgorithmus, der sie vorhersagen soll, werden gleichzeitig angepasst. Jede Iteration des genomischen Vorhersagealgorithmus erfordert eine Neubewertung des vom ökophysiologischen Pflanzenmodell vorhergesagten Phänotyps für jeden Genotyp und jede Umgebung über objektive Funktionen.

  • Vorteile: Kombinierte genetische und phänotypische Daten zwischen Genotypen führen zu besseren Schätzungen genotypspezifischer Parameter
  • Nachteile: Geringere Recheneffizienz
Zweistufiger Ansatz
Abbildung 3: Zweistufiger Ansatz zur Vorhersage genotypspezifischer Parameter. Blaue Formen = Eingabedaten, Orange = Teil des Genomvorhersagealgorithmus, Lila = Teil des ökophysiologischen Modells.

Zweistufiger Ansatz: Die geschätzten genotypspezifischen Parameter werden zuerst für das ökophysiologische Pflanzenmodell geschätzt, dann wird der genomische Vorhersagealgorithmus angepasst.

  • Vorteile: Höhere Recheneffizienz
  • Nachteile: Kann voreingenommene genotypspezifische Parameterschätzungen erstellen, auf denen die zweite Schätzungsstufe basieren würde, wenn die Daten eine hohe Varianz aufweisen (z. B. aufgrund unvollständiger Daten, wenn nicht alle Genotypen in Versuchen in verschiedenen Umgebungen gezüchtet werden).

3) Untersuchen Sie die Fähigkeit, vorherige genetische Informationen zu integrieren.

Abbildung 4. Die Auswahl der Algorithmen sollte auf dem Umfang des Vorwissens über die genetische Architektur eines Merkmals basieren.

Wenn zusätzliche Informationen über die genetische Architektur eines Merkmals bekannt sind, sollten Benutzer einen Algorithmus wählen, der diese Informationen integrieren kann. Zu diesen Informationen können Marker oder Gene gehören, deren Auswirkungen aus häufig gemessenen Merkmalen und großen Datenmengen bekannt sind. Wenn nur wenige Informationen verfügbar sind, wären einfache Vorhersagealgorithmen am besten geeignet, da sich aus den Daten wahrscheinlich nur hervorstechende große genetische Effekte ermitteln lassen. Wenn viel bekannt ist, beispielsweise aus der Hochdurchsatz-Phänotypisierung, kann eine komplexere Methode verwendet werden.

Poudel kommt zu dem Schluss: „Die Schätzung von GSPs in ökophysiologischen Nutzpflanzenmodellen mit genomischen Vorhersagemodellen wird dazu beitragen, genotypische und phänotypische Informationen zu einem umfassenden Genotyp-zu-Phänotyp-Bild zu kombinieren.“ In diesem Artikel machen wir einen wichtigen Schritt hin zur Zusammenführung der Gemeinschaften für genomische Vorhersage und ökophysiologische Modellierung und erkunden Möglichkeiten zur Entwicklung solcher kombinierter Vorhersagealgorithmen.“

DER ARTIKEL::

Pratishtha Poudel, Bryan Naidenov, Charles Chen, Phillip D. Alderman und Stephen M. Welch. Integration genomischer Vorhersage und genotypspezifischer Parameterschätzung in ökophysiologischen Modellen: Überblick und Perspektiven. in silico Pflanzen, 2023; diad007, https://doi.org/10.1093/insilicoplants/diad007