Spezialisierte Metaboliten sind entscheidend für die Wechselwirkungen zwischen Pflanze und Umwelt, z. B. um Bestäuber anzulocken oder Pflanzenfresser abzuwehren. Sie sind auch für den Einsatz als unerlässlich Pharmazeutika, Kosmetika, Ernährung und zur Herstellung von Arzneimitteln, Farbstoffen, Duftstoffen, Aromen und Nahrungsergänzungsmitteln.
Die Identifizierung der Gene, die für Enzyme codieren, die spezialisierte Metaboliten produzieren, ist der Schlüssel zur Entwicklung ihrer Stoffwechselwege. Dieser Engineering-Ansatz kann verwendet werden die Struktur der spezialisierten Metaboliten zu modifizieren oder völlig neue Moleküle mit neuen oder verbesserten biologischen Eigenschaften herzustellen.

Im Gegensatz zu allgemeinen Metaboliten, die direkt am Wachstum und der Entwicklung einer Pflanze beteiligt sind und im Allgemeinen unter Pflanzenarten konserviert werden, sind spezialisierte Metaboliten abstammungsspezifisch und sehr vielfältig. Viele Gene, die der Produktion des spezialisierten Stoffwechsels zugrunde liegen, gehören zu denselben Genfamilien wie diejenigen, die am allgemeinen Stoffwechsel beteiligt sind, was die Unterscheidung erschwert.
Eine maschinelle Lernstrategie, Transfer Learning, wurde verwendet, um spezialisierte Stoffwechselgene in a zu identifizieren neue Studie veröffentlicht in in silico Asphaltmischanlagen geleitet von Prof Shin Han Shiu der Michigan State University. Mit diesem Ansatz konnten die Autoren Erkenntnisse aus gut Annotierten nutzen Arabidopsis thaliana um Genfunktionen in Kulturtomate vorherzusagen, die weniger experimentell annotierte Gene hat.
„Dieser Ansatz verwendet die am besten kommentierten Pflanzenarten, Arabidopsis thaliana, um in einigen Fällen möglicherweise falsch annotierte Gene in Tomaten herauszufiltern. Durch das Trainieren eines neuen Modells, das nur auf den verbleibenden Genen basiert, wird das Modell erheblich verbessert. Ohne diesen Filterschritt führen falsch annotierte Gene zu suboptimalen Modellen, weshalb wir in früheren Modellen, die nur auf Tomatendaten basieren, schlechtere Vorhersagen sehen.“ erklärt Erstautorin Dr. Bethany Moore, derzeit Postdoktorandin an der University of Wisconsin-Madison.
Die Autoren warnen davor, dass der Ansatz des Transferlernens zwar gut für allgemeine Stoffwechselgene funktionierte, aber keinen so großen Einfluss auf die Vorhersage spezialisierter Stoffwechselgene hatte, wahrscheinlich weil spezialisierte Stoffwechselwege per Definition spezialisiert sind – was Sie in einer Art lernen, ist es nicht zwangsläufig auf einen anderen anwenden. Darüber hinaus müssen die potenziell falsch annotierten Gene experimentell weiter verifiziert werden.
Laut Shiu „zeichnet sich der Ansatz des maschinellen Lernens durch die Erkennung von Mustern in Datensätzen aus vielen verschiedenen Quellen aus. Ein gutes Modell, das auf den identifizierten Mustern basiert, kann dann verwendet werden, um Vorhersagen zu treffen, die weiter getestet werden können. Da immer mehr Daten verfügbar werden, erwarten wir breitere Anwendungen des maschinellen Lernens bei der Lösung pflanzenwissenschaftlicher Probleme.“
Software, die für dieses und andere Projekte entwickelt wurde, ist unter verfügbar https://github.com/ShiuLab.
