Un estudio pionero que utiliza inteligencia artificial (IA) ha demostrado un enfoque novedoso para investigar la relación entre el tamaño de la hoja y el clima en diferentes especies de plantas. La investigación, realizada por Wilde y colegas y publicada en la American Journal of Botany, usos aprendizaje automático para analizar grandes cantidades de datos de colecciones de herbario digitalizadas. Este método innovador podría ofrecer información sin precedentes sobre cómo las plantas se adaptan a sus entornos.
Las colecciones de herbario son bibliotecas de especímenes de plantas conservadas, que a menudo datan de siglos atrás. Son un tesoro de información biológica, pero su escala y complejidad tradicionalmente han hecho que su análisis sea un desafío. El aprendizaje automático, una rama de la IA, podría automatizar el proceso de medición, aumentando drásticamente los datos disponibles para el estudio.
El equipo de investigación utilizó un tipo de IA conocido como redes neuronales convolucionales (CNN), que son particularmente hábiles para analizar imágenes. Entrenaron a estas CNN para identificar y medir hojas en imágenes de especímenes de plantas de dos géneros: sicigio, un grupo de plantas con flores de la familia de los mirtos, y Ficus, más comúnmente conocidos como higos.

“En este estudio, queríamos encontrar y contar los píxeles en las hojas, como medida de área, ancho y largo. Comenzamos con hojas simples, con márgenes suaves, como prueba de concepto, pero nos gustaría mucho extender esto a formas de hojas más complejas”, dijeron los autores en un correo electrónico.
El equipo entrenó dos versiones del modelo CNN, una con una selección aleatoria de imágenes y otra con imágenes seleccionadas por el usuario. A continuación, se probó el rendimiento de estos modelos utilizando un conjunto de imágenes de validación. Posteriormente, los modelos validados se aplicaron a más de 3,800 especímenes digitalizados del Herbario Nacional de Nueva Gales del Sur, Australia.
“Todos estos especímenes fueron fotografiados recientemente en una gran iniciativa de digitalización. Esto significó que las imágenes se tomaron en condiciones uniformes, con equipos similares, configurados de manera constante, por lo que estaban bien estandarizados. Se están llevando a cabo iniciativas de digitalización similares en Herbaria de todo el mundo, por lo que pronto será posible aplicar métodos similares a una gran cantidad de imágenes (con ajustes de resolución, etc.)”, dijeron los autores.
Los resultados fueron prometedores. El enfoque de entrenamiento seleccionado por el usuario fue más efectivo, ya que encontró más hojas y una gama más amplia de tamaños de hojas que el modelo de entrenamiento aleatorio. Esto indica que un grado de participación humana experta puede mejorar la eficiencia de la IA en tareas tan complejas.
“El modelo humano en el circuito fue particularmente útil aquí donde queríamos minimizar la cantidad de datos de entrenamiento necesarios para generar un modelo sólido. Si en el futuro seguimos limitados por los datos de entrenamiento, estos enfoques podrían tener un papel durante mucho tiempo. Si, por otro lado, los esfuerzos globales para entrenar modelos dan como resultado grandes bibliotecas de datos de entrenamiento, quizás el volumen sustituya los beneficios de la selectividad humana”, dijeron los autores.
En lo que respecta al vínculo entre el tamaño de la hoja y el clima, los modelos de CNN confirmaron que, en diferentes especies, las hojas más grandes se asociaron con climas más cálidos y húmedos, de acuerdo con estudios previos. Sin embargo, la relación no fue tan clara dentro de las especies individuales, lo que sugiere que otros factores, como la variación genética y la historia de la población, podrían influir en el tamaño de la hoja.
“Vemos que si nos movemos de un punto en el sureste de Australia a un punto en el noreste de Australia más cálido, en promedio, el tamaño de un sicigio la hoja se hace más grande. Esto parece deberse principalmente a que hay especies con hojas más grandes en el norte. Si observamos las hojas de una sola especie, ampliamente distribuida, en los mismos dos lugares, en promedio, encontramos que las hojas tienen aproximadamente el mismo tamaño”, dijeron los autores en su correo electrónico.
“La explicación probablemente esté relacionada con la historia o los procesos evolutivos, dentro de las especies. Por ejemplo, dentro de una especie, es probable que las poblaciones que están muy separadas estén conectadas por el flujo de genes. Esto puede ser indirecto, por ejemplo, a través de movimientos relativamente cortos de polen entre poblaciones cercanas, durante generaciones. Esto significa que es probable que las poblaciones compartan alelos genéticos que influyen en el tamaño de las hojas, lo que homogeneiza el tamaño de las hojas entre las poblaciones.
“Si la selección favoreciera las hojas más grandes en el norte, el beneficio asociado de las hojas más grandes tendría que ser bastante fuerte para superar el efecto del flujo de genes. También es posible que algunas especies ampliamente distribuidas hayan experimentado una expansión poblacional reciente, lo que también conduciría a poblaciones con valores de características similares en grandes áreas geográficas. Por lo tanto, tanto los procesos evolutivos (p. ej., el flujo de polen) como las historias (p. ej., la expansión de la población) podrían conducir a diferentes vínculos observados entre características y clima dentro de las especies”.
Si está siguiendo las noticias sobre IA, entonces los resultados pueden ser interesantes, pero el método puede ser opaco. Es fundamental no sólo que sepas cosas, sino también que sepas Comó sabes cosas. Este es un problema que Wilde y sus colegas abordan en su artículo.
“Los modelos complejos de aprendizaje automático (redes neuronales, etc.) son menos fáciles de entender que los modelos estadísticos que han sido omnipresentes en las ciencias biológicas y de plantas hasta ahora. Sin embargo, estamos llegando a un punto en el que existe una base sólida para usarlos y beneficiarse de su enorme poder de inferencia, de manera confiable y sólida”, dijeron los autores en su correo electrónico.
“Esta base para el buen uso de ML se basa en los procesos de validación y prueba del modelo. Esto implica tomar datos (imágenes) que no se usan para entrenar un modelo y agregar etiquetas a esos datos de las características que debería encontrar un modelo bien entrenado. Entonces podemos preguntar, cuantitativamente, qué tan bien funciona un modelo cuando se muestran los datos. ¿Encuentra todas las hojas que estaban allí para ser encontradas? ¿Consigue evitar llamar hojas a las cosas que no eran hojas? Cuando encuentra correctamente una hoja, ¿alcanza una estimación precisa de su tamaño, en términos de píxeles? Si un modelo de aprendizaje automático puede funcionar bien en relación con estas preguntas, para un conjunto de datos de entrenamiento suficientemente grande y representativo, confiamos en el modelo”.
Una vez que tenga un método sólido para medir, también puede expandir lo que mide. “También hemos utilizado modelos de aprendizaje automático para encontrar una variedad de otras estructuras en especímenes de herbario, incluidos capullos, frutas y flores, por lo que definitivamente hay mucho margen para extenderse a otras estructuras”, dicen los autores en su correo electrónico. También existe la esperanza de poder ampliar el tipo de mediciones que puede hacer, dicen. “Hemos pensado en utilizar el aprendizaje automático para realizar mediciones de campo de otros rasgos de las hojas que están mal representados por los especímenes preservados, ¡pero este es un trabajo aún en desarrollo!”
LEA EL ARTÍCULO:
Wilde, BC, Bragg, JG y Cornwell, W. (2023) “Análisis de relaciones entre rasgos y clima dentro y entre taxones utilizando el aprendizaje automático y especímenes de herbario, " American Journal of Botany, pag. e16167. Disponible en: https://doi.org/10.1002/ajb2.16167.
