Das Aufkommen und die Breite der Bioinformatik-Ressourcen haben die Arbeit von Wissenschaftlern erleichtert. Bevor sie sich ins Nasslabor stürzen, sind sie in der Lage, Zielgene zu parsen und bessere Hypothesen zu konstruieren. Mehrere Gruppen und Forschungsinstitute haben die Initiative ergriffen, Datensätze, Tools, Algorithmen, Open-Source-Code und Visualisierungsplattformen bereitzustellen.

Eine umfassende Untersuchung eines Gens oder Proteins erfordert die Nutzung mehrerer Online-Tools, Datenbanken und Visualisierungsplattformen. Zum Beispiel, Araport or TAIR zum Abrufen von Informationen zu Annotation und Sequenz, BioGRID für Protein-Protein-Interaktionsdaten, SUBA4 zur Verfolgung der subzellulären Lokalisierung, BeiPAN2.0 zum Nachweis von Bindungsstellen für Transkriptionsfaktoren (TF), Phyre2 für die 3D-Modellierung von Proteinen und die Reaktom für Signal-, Stoffwechsel- und Genregulationswege. Darüber hinaus gibt es zahlreiche Werkzeuge zur Analyse posttranslationaler Modifikationen (Phosphorylierung, Acetylierung, Myristoylierung, usw.), subzelluläre Targeting-Sequenzen, funktionelle Domänen und Wechselwirkungen zwischen kleinen Molekülen und Proteinen.

Die Veröffentlichung von ePlant war der Titelartikel von August's The Plant Cell.
Die Veröffentlichung von ePlant war der Titelartikel von August's The Plant Cell.

Diese Tools und Ressourcen konzentrieren sich in den meisten Fällen auch auf eine bestimmte Pflanze. Um die Funktionalität eines bestimmten Proteins oder einer bestimmten Domäne aus interspeziesischer Sicht zu überprüfen, sind daher mehrere Datenbanken erforderlich. Zu diesem Zweck erfordert das Abrufen von Daten aus einem Tool und das Ausführen auf einer anderen Plattform eine erneute Verarbeitung oder präzise Formatierung für das nächste Tool. Die Integration mehrerer Tools in eine einzige Plattform ist eine elegante Lösung, um Arbeit und Ärger zu vermeiden. Integration ist eine Möglichkeit für diese Tools, Hypothesen, die sie ursprünglich erleichtern sollten, einfacher zu generieren und zu testen.


Einführung der integrierten Plattform ePlant

ePlant bringt mehrere Datenvisualisierungsplattformen basierend auf einer hierarchischen Skala in eine Schnittstelle. Es integriert mehrere Datenbanken und hat eine zoombare Benutzeroberfläche. ePlant hat einen Viewer für Geninformationen, einen Viewer für Veröffentlichungen, einen Heatmap-Viewer, den World eFP (Electronic Fluorescent Pictograph) Viewer, einen Pflanzen-eFP, einen Gewebe- und Experiment-eFP-Viewer, einen Zell-eFP, einen Chromosomen-Viewer, einen Interaktions-Viewer, einen Molekül-Viewer, einen Sequenz-Viewer und vieles mehr integriert hat Link-Out-Optionen zu anderen Tools wie Araport, TAIR, SUBA3, MASCP, Biomarkt etc. Anstatt als reine Visualisierungswerkzeuge zu dienen, helfen sie bei der Beantwortung wissenschaftlicher Fragestellungen.

Die grafische Benutzeroberfläche, die Sie auf der Homepage von ePlant begrüßt.
Die grafische Benutzeroberfläche, die Sie auf der Startseite von ePlant begrüßt.

Für ein bestimmtes Gen ABA UNEMPFINDLICH 3 (ABI3) zeigt der World eFP Viewer die Varianz der Genexpression in verschiedenen Ökotypen. Der Gewebe- und Experiment-eFP-Viewer zeigt die wurzelspezifische Expression, der Zell-eFP-Viewer zeigt die kernspezifische reichliche Lokalisierung, der Chromosomen-Viewer enthält die physische Kartenposition des Locus, der Interaktions-Viewer zeigt sowohl vorhergesagte als auch bestätigte Protein-Protein- und Protein-DNA-Wechselwirkungen an , lokalisiert der molekulare Betrachter die DNA-Bindungssequenz von ABI3 aus der partiellen 3D-Struktur.

ePlant weiterbringen Arabidopsis

ePlant basiert auf Arabidopsis thaliana Daten. Es enthält Informationen für mehr als 35 Millionen Genexpressionsmessungen und experimentell dokumentierte subzelluläre Lokalisationen für 10,910 Proteine. Darüber hinaus kuratiert es ungefähr 100,000 Protein-Protein- und 2.7 Millionen Protein-DNA-Interaktionsdaten. Es bietet auch von Phyre2 vorhergesagte Strukturen von 23,091 Genprodukten und 6.19 Millionen nicht-synonymen SNPs basierend auf der 1001 Proteomes-Website.

Ein Beispiel für RNA-Expressionsdaten für ARR10 von ePlant.
Ein Beispiel für RNA-Expressionsdaten für ARR10 von ePlant. CC BY 4.0

Obwohl ePlant gewidmet ist Arabidopsis thaliana, Der gesamte Quellcode des Projekts ist verfügbar in GitHub. Ähnliche Plattformen lassen sich durch die Einbindung entsprechender Datensätze auch für beliebige andere Anlagen aufbauen. Gleichzeitig sind eFP-Browser für andere zweikeimblättrige (Poplar, Medicago, Sojabohnenöl, Kartoffel, Tomate, E. salugineum, C. sativa, Arachis, Traube), Monokotylen (Mais, Reis, Gerste, Triticale, Brachypodium) und Nicht-Pflanzen (Maus, Human) in BAR (The Bio-Analytic Resource for Plant Biology)-Plattform zusammen mit ePlant. Betrachtet man die Genexpression in Arabidopsis kann zu Erkenntnissen darüber führen, wie es in anderen Anlagen funktioniert. Auf diese Weise trägt es dazu bei, die Anwendung eines erforschten Gens oder genregulatorischen Netzwerks auf mehrere Pflanzenarten auszudehnen. Die Integration einer breiten Palette von Arten für den eFP-Viewer ermöglicht es Forschern, interessante Muster in verschiedenen experimentellen Systemen zu untersuchen.