Los avances en computación y fenotipado de alto rendimiento han impulsado aumentos masivos en la disponibilidad de datos. Los científicos están aprovechando estos datos para predecir nuevos resultados, como la respuesta de un cultivo a ser plantado en un lugar diferente o en el mismo lugar con un clima diferente.
Según un nuevo artículo de investigación del Dr. Carlos Messina de Corteva Agriscience y sus colegas, se deben explorar nuevos enfoques de modelado para explotar este tesoro de datos. Este artículo presenta varios enfoques de modelado híbrido para lograr predicciones precisas e interpretables.
Los autores utilizaron un modelo de sistemas existente, CROPGRO, para predecir las etapas fenológicas en nuevos entornos utilizando un gran conjunto de datos intercontinentales que registran el momento de las etapas de desarrollo de la soja. Descubrieron que el modelo existente no se generalizaba bien en todos los ambientes y madurez porque simplemente usaba una serie de tiempo de temperaturas diarias y fotoperíodos (por ejemplo, grados día) para determinar el día calendario de un evento de desarrollo. “Si bien los modelos de sistemas funcionan bien en condiciones específicas, no son lo suficientemente generalizables para respaldar las decisiones agronómicas y de mejoramiento en una variedad de condiciones ambientales y madurez relativa continua”, explica el Dr. Ryan McCormick, autor principal del estudio.

Los autores emprendieron varios enfoques para mejorar CROPGRO.
En primer lugar, utilizaron una estrategia de optimización de modelos múltiples altamente paralelizados para reajustar CROPGRO. Utilizando un algoritmo evolutivo, se exploraron 36 parámetros para identificar la equifinalidad y familias de parámetros de comportamiento similar. El vector de parámetros con el ajuste óptimo encontrado al final de cualquier ronda de evolución se retuvo y se usó como el conjunto de parámetros optimizados para análisis posteriores usando CROPGRO. El modelo reacondicionado ("optimizado para CROPGRO") se desempeñó mejor después del proceso de reacondicionamiento en comparación con la versión anterior.
A continuación, los autores desarrollaron modelos de aprendizaje automático utilizando redes neuronales. Entrenados con entradas de temperatura diaria mínima, temperatura diaria máxima, radiación solar, fotoperíodo y madurez relativa, estos modelos predijeron con precisión las etapas diarias de desarrollo. La inclusión de predicciones "optimizadas por CROPGRO" como características en el modelo de red mejoró la precisión de sus predicciones, lo que indica que el aprendizaje automático se puede mejorar al incluir características diseñadas por expertos de modelos basados en el conocimiento.
A continuación, se combinó la colección de 20 modelos basados en el conocimiento y en los datos para mejorar aún más la predicción. Los autores combinaron los modelos con la predicción de cada modelo individual igualmente ponderada en la predicción del conjunto final. También utilizaron el superaprendizaje, que ponderaba los modelos según su desempeño. El súper alumno superó el conjunto simple de modelos, pero fue similar al "CROPGRO optimizado" (ver figura).
Messina y McCormick están de acuerdo en que “este trabajo demuestra que los modelos de máquina no sustituyen a los modelos desarrollados con base en el conocimiento científico, pero la fusión de ambos enfoques, los modelos basados en la ciencia pueden resolver, al menos en parte, el problema de la subdeterminación del modelo de los modelos de máquina, pueden conducir a mejores predicciones y descubrir nuevos conocimientos.
La comunidad del Sistema de Apoyo a la Decisión para la Transferencia de Agrotecnología (DSSAT) se compromete a promover el desarrollo de todos los modelos y herramientas de software DSSAT como proyectos de código abierto. El código DSSAT Crop System Model (CSM), incluido CROPGRO, está completamente abierto y accesible en https://github.com/DSSAT/dssat-csm-os
