Erik Amézquita, Doktorand in der Abteilung für Computational Mathematics, Science and Engineering an der Michigan State University, ist der Hauptautor eines Artikels, der in veröffentlicht wurde in silico Pflanzen, die präsentieren eine neue Technik zur Analyse von Formen in Pflanzen.
Die topologische Datenanalyse (TDA) ist eine aufstrebende mathematische Disziplin, die auf der Annahme basiert, dass alle Daten Formen sind und alle Formen Daten. Mit TDA lässt sich die Form verschiedenster Objekte mithilfe abstrakter mathematischer Darstellungen auf Grundlage der algebraischen Topologie charakterisieren. Der TDA-Ansatz ist weder von der Existenz homologer Landmarken – ähnlicher Merkmale aufgrund gemeinsamer Abstammung von einem Vorfahren – abhängig, noch ist er auf Objekte einer bestimmten Orientierung oder Dimension beschränkt. TDA bietet somit einen robusten, umfassenden, vergleichbaren und quantifizierbaren Rahmen zur Formmessung für eine Vielzahl von Eingabedaten. Eines der vielen verfügbaren TDA-Werkzeuge ist die Euler-Charakteristik-Transformation (ECT), die misst, wie sich die intrinsische Topologie – insbesondere die Euler-Charakteristik – eines Objekts verändert, wenn es entlang aller möglichen Schwellenwerte und in alle Richtungen geschnitten wird.
Die Entscheidung für die Verwendung des ECT ergibt sich aus zwei wichtigen Gründen. Der erste ist, dass die ECT-Berechnung für einen kleinen Seed nur wenige Sekunden dauert, was wichtig ist, wenn man mit einer großen Datenmenge umgeht. Der zweite Grund ist das Schneiden eines Samens alles möglich Directions garantiert mathematisch alles, was es über Formen zu wissen gibt, genug, um sogar die ursprüngliche Form von Grund auf zu rekonstruieren.
„Der Vorbehalt ist, dass es tatsächlich unendlich viele Richtungen zu berechnen gibt. Trotzdem scheinen wir, selbst wenn wir etwa 150 Richtungen nehmen, genug morphologische Informationen zu kodieren, um dann aufregende Ergebnisse zu erzielen“, erklärt Erik Amézquita, ein ausgebildeter Mathematiker, der sich zum Pflanzenbiologen entwickelt hat.
Die Autoren verglichen die Wirksamkeit der Verwendung traditioneller Formdeskriptoren, topologischer Formdeskriptoren oder einer Kombination aus beiden, um Samen verschiedener Gerstenakzessionen zu charakterisieren und zu identifizieren.

Zunächst sammelten sie Rispen von 28 Akzessionen mit unterschiedlichen Ährenmorphologien und geografischen Ursprüngen. Dann scannten sie diese Rispen (Samenbüschel) in Gruppen von jeweils drei oder vier Rispen mit Hilfe der Röntgen-Computertomographie (CT) (Abb. 1). Diese Scans wurden später digital verarbeitet, um über dreitausend einzelne Gerstensamen aus den Rispen zu isolieren. Schließlich wurde jeder Samen nach seinen drei Hauptkomponenten ausgerichtet und orientiert.
Die Autoren fuhren dann fort, die Form der Gerstenkörner zu quantifizieren. Sie maßen zunächst 11 verschiedene traditionelle Formdeskriptoren wie Länge, Breite, Höhe, Oberfläche und Volumen für jeden Samen (Abb. 2).

Als nächstes wurden die topologischen Formdeskriptoren mit dem ECT gemessen. Um die ECT zu berechnen, wurden die Samen zunächst quer zu einer festgelegten Richtung in 16 gleich dicke Scheiben geschnitten. Als nächstes wurden die Samen rekonstruiert, indem jeweils eine Schicht hinzugefügt wurde, und Änderungen in der Euler-Charakteristik wurden aufgezeichnet (Abb. 3). Dieses Zerhacken, die scheibenweise Rekonstruktion und die Euler-Charakteristik-Verfolgung wurden für insgesamt 158 verschiedene Richtungen durchgeführt. Das ECT-Verfahren erzeugte mehr als 2500 verschiedene Schnitte, die mehr als 2500 topologischen Formdeskriptoren für jeden Samen entsprechen. Um Verzerrungen durch das Arbeiten mit Daten in hohen Dimensionen – bekannt als Fluch der Dimensionalität – zu vermeiden, war eine Dimensionalitätsreduktion notwendig.

Um die Eignung aller Formdeskriptoren zu untersuchen, wurde ein Computer damit beauftragt, die 28 Gerstensamenakzessionen ausschließlich unter Verwendung von Kornmorphologieinformationen zu charakterisieren und vorherzusagen. Der Computer, eine Support-Vektor-Maschine, verwendete drei Arten von Training. Erstens verwendete die Maschine ausschließlich traditionelle Formdeskriptoren. Als nächstes wurde die Maschine ausschließlich mit topologischen Formdeskriptoren trainiert. Schließlich nutzte die Maschine beide Informationsquellen.
Die Autoren fanden heraus, dass bei den meisten Akzessionen topologische Merkmale dem Computer helfen, bessere Vorhersageraten zu erzielen als herkömmliche Formmerkmale. Diese Klassifizierungsergebnisse wurden weiter verbessert, als sowohl traditionelle als auch topologische Informationen kombiniert wurden, was zeigt, dass die Topologie Merkmale misst, die von der traditionellen Umgebung übersehen wurden. Während traditionelle Formdeskriptoren in der Lage sind, die Samen basierend auf ihrem Beitritt zu gruppieren, waren topologische Formdeskriptoren in der Lage, sie basierend auf ihrer Rispe weiter zu gruppieren.
Um genau zu bestimmen, was das „Etwas“ ist, das von den traditionellen Merkmalen übersehen wird, wurden mehrere Auswertungen von Varianzanalysen durchgeführt. Eine Untersuchung der Richtungen und Scheiben, die zur Berechnung der ECT verwendet wurden, zeigt, dass die Form der Falte und der Unterseite der Samen die Akzessionen am stärksten diskriminieren (Abb. 4).

Amézquita sagt: „Die Euler-Charakteristik ist eine einfache, aber leistungsstarke Methode, um Merkmale sichtbar zu machen, die mit bloßem Auge nicht ohne weiteres erkennbar sind. Es gibt versteckte morphologische Informationen, die traditionellen und geometrisch-morphometrischen Methoden fehlen. Die Euler-Charakteristik und TDA im Allgemeinen können leicht aus beliebigen Bilddaten berechnet werden. TDA schlägt einen neuen aufregenden Weg vor, der allein von morphologischen Informationen angetrieben wird, um die Phänotyp-Genotyp-Beziehung weiter zu erforschen.“
DER ARTIKEL::
Erik J. Amézquita, Michelle Y. Quigley, Tim Ophelders, Jacob B. Landis, Daniel Koenig, Elizabeth Munch, Daniel H. Chitwood, Messung des verborgenen Phänotyps: Quantifizierung der Form von Gerstensamen mit der charakteristischen Euler-Transformation, in silico Plants, 2021;, diab033, https://doi.org/10.1093/insilicoplants/diab033
Dieses Manuskript ist Teil von in silico Plant's Funktionelles strukturelles Anlagenmodell Sonderausgabe.
Alle in diesem Artikel verwendeten Daten und Codes sind frei und offen verfügbar unter https://doi.org/10.5061/dryad.rxwdbrv93 und https://github.com/amezqui3/demeter/.
