Un nuevo proyecto intenta domar el desierto del modelo de planta mediante la creación de una plataforma de modelado dedicada que admita el diseño, la reproducibilidad y la difusión de modelos colaborativos y distribuidos.
Durante las últimas décadas, equipos en silos han desarrollado modelos utilizando diferentes lenguajes de programación, con diferentes grados de modularidad e interoperabilidad. A medida que los científicos de plantas se apresuran a satisfacer las crecientes demandas de rendimiento frente al cambio climático, las tecnologías avanzadas en biología molecular, bioquímica y computación de alto rendimiento brindan una oportunidad sin precedentes para crear modelos que guíen los rápidos avances en el mejoramiento de plantas. El progreso también requerirá que la investigación vaya más allá del modelado a escala única para modelado multiescala integrador para lograr un modelado multiescala integrador que aproveche al máximo nuestra comprensión de los mecanismos moleculares y la gran cantidad de datos del genoma que se ha generado en las últimas tres décadas. Sin embargo, la capacidad de construir modelos multiescala integradores actualmente se ve obstaculizada por la dificultad de intercambiar, reutilizar y combinar modelos y herramientas de simulación entre equipos (o incluso dentro de un equipo) a pesar de la existencia de plataformas de modelado dedicadas creadas para este propósito.
Las plataformas de modelado dedicadas han existido durante los últimos 25 años, lo que permite a los usuarios crear, ejecutar e interactuar con modelos y visualizar su salida (por ejemplo, V-Laby, GroIMP, L-Py, AmapSim, AMAPmod, Capsis). Las plataformas más nuevas también facilitan la integración y la interoperabilidad de estructuras de datos y modelos heterogéneos (por ejemplo, OpenAlea e Yggdrasil).
En un nuevo artículo publicado por el Dr. Frédéric Boudon, Investigador en Modelado de Plantas y Ciencias de la Computación en el Instituto UMR AGAP de la Universidad de Montpellier y colegas presentes un nuevo entorno de modelado virtual fácil de usar que utiliza cuadernos Jupyter. Su enfoque único aborda varios problemas que comúnmente encuentran los modeladores de plantas, incluida la reproducibilidad, la reutilización, la modularidad, la colaboración y el mantenimiento.
Según Boudon, “el uso de Jupyter Notebook hace que nuestra plataforma sea única porque su capacidad para crear narrativas de modelado hace posible que los usuarios accedan a los diferentes pasos de la tubería de modelado de una manera clara, documentada y compartible. También utilizamos una representación estándar de matrices multidimensionales para representar las propiedades de la planta, lo que mejora la eficiencia del modelado y el proceso de codificación porque no requiere códigos personalizados para extraer, transformar y visualizar datos. La pila científica de Python proporciona esas funciones listas para usar, lo que minimiza la carga de mantenimiento”.
El entorno de modelado basado en Jupyter hace posible el diseño de modelos reproducibles, reutilizables, colaborativos y distribuidos. El formato de cuaderno admite una especificación clara de los procesos y la documentación para crear la narrativa de simulación de un escenario de modelado. Este formato permite especificar claramente las hipótesis del modelo y los valores reales de los parámetros, haciendo accesible la información a futuros usuarios. Esto permite a los colaboradores y usuarios probar y modificar un modelo. La inclusión del sistema de gestión de paquetes conda permite especificar claramente las dependencias del software. Además, el entorno permite el desarrollo de modelos de forma remota por lo que no requiere que los usuarios tengan grandes recursos computacionales. Esto facilita aún más el diseño y la implementación de modelos colaborativos y distribuidos.
Es posible aumentar la modularidad del modelo gracias a la inclusión de xarray-simlab, una biblioteca de Python para organizar y ejecutar simulaciones. La biblioteca proporciona un marco para componer modelos computacionales complejos a partir de conjuntos de sub/modelos o módulos reutilizables. Se puede combinar una colección de sub/modelos para formar un modelo, y su ordenamiento computacional se deduce completamente de las dependencias del proceso. Esta modularidad permite a los usuarios ejecutar simulaciones solo para un subconjunto de procesos o incluso definir procesos alternativos para reemplazar los predefinidos.
Para ilustrar el uso del nuevo entorno de modelado, los autores rediseñaron V-Mango, un modelo existente de desarrollo de árboles de mango y producción de frutos, y reorganizó su código.

“Elegimos V-Mango porque era un modelo complejo que podía beneficiarse del rediseño y la reorganización del código. El modelo estaba compuesto por procesos implementados como funciones simples o reglas del sistema L sin forma de distinguirlos entre sí. Además, la interacción entre los submodelos estaba restringida por el uso de diferentes tecnologías de lenguaje”, explica Boudon.
La funcionalidad de xarray-simlab en el entorno Jupyter permitió a los autores rediseñar fácilmente V-mango y reorganizar su código. Esto consistió en definir procesos y sus entradas/salidas y asignar la lógica del modelo correspondiente (ver flujo de trabajo antiguo vs. nuevo).

Los problemas de mantenimiento se reducen con la plataforma Jupyter porque la pila científica de Python proporciona funciones listas para usar. Esto reduce la necesidad de códigos personalizados difíciles de mantener para extraer, transformar y visualizar datos.
Los autores alientan a otros a probar la plataforma de código abierto ellos mismos.
LEE EL ARTÍCULO:
Jan Vaillant, Isabelle Grechi, Frédéric Normand, Frédéric Boudon, Hacia entornos de modelado virtual para modelos de plantas estructurales funcionales basados en cuadernos Jupyter: aplicación al modelado del crecimiento y desarrollo de árboles de mango, in silico Plants, 2021;, diab040, https://doi.org/10.1093/insilicoplants/diab040
Este manuscrito es parte de in silico Plant's Edición especial del Modelo Estructural Funcional de la Planta.
pgljupyter está disponible en https://github.com/fredboudon/plantgl-jupyter/ y vmango-lab en https://github.com/fredboudon/vmango-lab con instrucciones para el proceso de instalación. Todos los ejemplos de la sección 3 están disponibles como cuadernos en un repositorio de demostración en https://github.com/fredboudon/plantgl-jupyter/blob/isp2022/examples y puede inspeccionarse con nbviewer y reproducirse localmente o en una instancia de carpeta. Los cuadernos descritos en el apartado 4 están disponibles en https://github.com/fredboudon/vmango-lab-demo/tree/isp2022.
