Los metabolitos especializados son críticos para las interacciones planta-ambiente, como atraer polinizadores o defenderse de los herbívoros. También son esenciales para su uso como productos farmacéuticos, cosméticos, nutrición y para la fabricación de medicamentos, colorantes, fragancias, sabores y suplementos dietéticos.
La identificación de los genes que codifican enzimas que producen metabolitos especializados es clave para diseñar sus vías. Este enfoque de ingeniería se puede utilizar para modificar la estructura de los metabolitos especializados, o para hacer moléculas completamente nuevas, con propiedades biológicas nuevas o mejoradas.

A diferencia de los metabolitos generales, que están directamente involucrados en el crecimiento y desarrollo de una planta y generalmente se conservan entre las especies de plantas, los metabolitos especializados son específicos del linaje y muy diversos. Muchos genes que subyacen a la producción del metabolismo especializado pertenecen a las mismas familias de genes que los implicados en el metabolismo general., lo que los hace difíciles de distinguir.
Se utilizó una estrategia de aprendizaje automático, aprendizaje por transferencia, para identificar genes metabólicos especializados en un nuevo estudio publicado en in silico Plantas dirigido por el profesor Shin Han Shiu de la Universidad Estatal de Michigan. Con este enfoque, los autores pudieron utilizar el conocimiento de los bien anotados Arabidopsis thaliana para predecir las funciones de los genes en el tomate cultivado, que tiene menos genes anotados experimentalmente.
“Este enfoque utiliza las mejores especies de plantas anotadas, Arabidopsis thaliana, para filtrar, en algunos casos, genes potencialmente mal anotados en tomate. Al entrenar un nuevo modelo basado solo en los genes restantes, el modelo mejora sustancialmente. Sin este paso de filtrado, los genes mal anotados conducen a modelos subóptimos, por lo que vemos peores predicciones en modelos anteriores basados solo en datos de tomate”. explica la primera autora, la Dra. Bethany Moore, actualmente investigadora postdoctoral en la Universidad de Wisconsin-Madison.
Los autores advierten que, si bien el enfoque de aprendizaje por transferencia funcionó bien para los genes del metabolismo general, no tuvo tanto impacto en la predicción de los genes del metabolismo especializado, probablemente porque las vías del metabolismo especializado son, por definición, especializadas: lo que se aprende en una especie no aplica necesariamente a otro. Además, los posibles genes mal anotados deben verificarse experimentalmente.
Según Shiu, “el enfoque de aprendizaje automático sobresale en la identificación de patrones en conjuntos de datos de muchas fuentes diferentes. Luego, se puede usar un buen modelo basado en los patrones identificados para hacer predicciones que se pueden probar más a fondo. Con más y más datos disponibles, esperamos ver aplicaciones más amplias del aprendizaje automático para resolver problemas de ciencia de las plantas”.
El software desarrollado para este y otros proyectos está disponible en https://github.com/ShiuLab.
