El advenimiento y la amplitud de los recursos bioinformáticos han facilitado el trabajo de los científicos. Antes de saltar al trabajo de laboratorio húmedo, pueden analizar objetivos genéticos y construir mejores hipótesis. Varios grupos e institutos de investigación han tomado la iniciativa de proporcionar conjuntos de datos, herramientas, algoritmos, código fuente abierto y plataformas de visualización.

Un estudio exhaustivo de un gen o una proteína requiere el uso de múltiples herramientas, bases de datos y plataformas de visualización en línea. Por instancias, Araport or TAIRO para recuperar información sobre anotaciones y secuencias, BioGRID para datos de interacción proteína-proteína, SUBA4 para rastrear la localización subcelular, En PAN2.0 para detectar sitios de unión del factor de transcripción (TF), Phyre2 para el modelado 3D de proteínas, y la reactoma para vías de señalización, metabólicas y reguladoras de genes. Además, existen numerosas herramientas para analizar la modificación postraduccional (fosforilación, acetilación, miristoilación, etc.), secuencias de direccionamiento subcelular, dominios funcionales e interacciones proteína-molécula pequeña.

La publicación de ePlant fue el artículo de portada de The Plant Cell de agosto.
La publicación de ePlant fue el artículo de portada de The Plant Cell de agosto.

Estas herramientas y recursos también se enfocan en una planta específica en la mayoría de los casos. Como resultado, para verificar la funcionalidad de una proteína o dominio en particular desde una perspectiva entre especies, se requieren varias bases de datos. Para este propósito, extraer datos de una herramienta y ejecutarlos en una plataforma diferente requiere volver a procesarlos o formatearlos con precisión para la siguiente herramienta. La integración de múltiples herramientas en una sola plataforma es una solución elegante para evitar trabajo y molestias. La integración es una forma de que estas herramientas generen y prueben con mayor facilidad las hipótesis que debían facilitar en primer lugar.


Presentamos la plataforma integrada ePlant

ePlanta trae múltiples plataformas de visualización de datos en una interfaz basada en una escala jerárquica. Integra varias bases de datos y tiene una interfaz de usuario ampliable. ePlant ha integrado un visor de información genética, un visor de publicaciones, un visor de mapas de calor, el visor de eFP (pictograma fluorescente electrónico) mundial, eFP de plantas, visor de eFP de tejidos y experimentos, eFP de células, visor de cromosomas, visor de interacciones, visor de moléculas, visor de secuencias y tiene opciones de enlace a otras herramientas como Araport, TAIRO, SUBA3, mascp, biomercado etc.. En lugar de servir únicamente como herramientas de visualización, ayudan a responder preguntas científicas.

La interfaz gráfica de usuario que le da la bienvenida en la página de inicio de ePlant.
La interfaz gráfica de usuario que le da la bienvenida en la página de inicio de ePlant.

Para un gen en particular, ABA INSENSITIVO 3 (ABI3), el visor mundial de eFP muestra la variación de la expresión génica en diferentes ecotipos. El visor de eFP de tejidos y experimentos revela la expresión específica de la raíz, el visor de eFP de células muestra la localización abundante específica del núcleo, el visor de cromosomas contiene la ubicación del mapa físico del locus, el visor de interacciones muestra las interacciones proteína-proteína y proteína-ADN predichas y confirmadas , el visor molecular identifica la secuencia de unión al ADN de ABI3 a partir de la estructura 3D parcial.

Llevando ePlant más allá Arabidopsis

ePlant se basa en Arabidopsis thaliana datos. Contiene información de más de 35 millones de mediciones de expresión génica y localizaciones subcelulares documentadas experimentalmente para 10,910 100,000 proteínas. Además, selecciona aproximadamente 2.7 2 datos de interacción proteína-proteína y 23,091 ​​millones de proteína-ADN. También proporciona estructuras predichas por Phyre6.19 de 1001 productos genéticos y XNUMX millones de SNP no sinónimos basados ​​en el sitio web XNUMX Proteomes.

Un ejemplo de datos de expresión de ARN para ARR10 de ePlant.
Ejemplo de datos de expresión de ARN para ARR10 de ePlant. CC BY 4.0

Aunque ePlant se dedica a arabidopsis thaliana, el código fuente completo del proyecto está disponible en GitHub. Es posible construir plataformas similares para cualquier otra planta mediante la incorporación de conjuntos de datos apropiados. Al mismo tiempo, los navegadores eFP están disponibles para otras dicotiledóneas (Poplar, medicago, haba de soja, Patata, Tomate, E. salsuginum, C. sativa, Arachis, De uva), monocotiledóneas (Maíz, Arroz, Cebada, Triticale, braquipodio) y no vegetales (Ratón, Personas) en BARES (The Bio-Analytic Resource for Plant Biology) junto con ePlant. Mirando la expresión génica en Arabidopsis puede conducir a conocimientos sobre cómo funciona en otras plantas. De esta manera, ayuda a ampliar la aplicación de un gen investigado o una red reguladora de genes en múltiples especies de plantas. La integración de una amplia gama de especies para el visor eFP permite a los investigadores explorar patrones interesantes en diferentes sistemas experimentales.