Erik Amézquita, estudiante de doctorado en el departamento de Matemática Computacional, Ciencia e Ingeniería de la Universidad Estatal de Michigan, es el autor principal de un artículo publicado en in silico Plantas que presenta una nueva técnica para analizar formas en plantas.

El Análisis Topológico de Datos (TDA) es una disciplina matemática emergente que surge de la idea de que todos los datos son forma, y ​​toda forma es datos. Con el TDA, la forma de diversos objetos puede caracterizarse mediante representaciones matemáticas abstractas basadas en la topología algebraica. El enfoque del TDA no depende de la existencia de puntos de referencia homólogos (características similares debidas a la ascendencia compartida de un ancestro común), ni se limita a objetos con una orientación o dimensión particular. Por lo tanto, el TDA ofrece un marco robusto, completo, comparable y cuantificable para medir la forma de una diversidad de entradas. Una de las muchas herramientas de TDA disponibles es la Transformada Característica de Euler (ECT), que mide cómo cambia la topología intrínseca (específicamente, la característica de Euler) de un objeto al ser segmentado en todos los umbrales y direcciones posibles.

La elección de utilizar la TEC surge por dos razones importantes. La primera es que el cálculo de ECT para una semilla pequeña toma solo un par de segundos, lo cual es importante cuando se trata de un gran volumen de datos. La segunda razón es que cortar una semilla a lo largo todo posible direcciones matemáticamente garantiza codificar todo lo que hay que saber sobre la forma, lo suficiente como para incluso reconstruir la forma original desde cero.

“La advertencia es que en realidad hay un número infinito de direcciones para calcular. Sin embargo, incluso tomando alrededor de 150 direcciones, parece que codificamos suficiente información morfológica para luego producir resultados emocionantes”, explica Erik Amézquita, un matemático de formación ahora convertido en biólogo de plantas.

Los autores compararon la efectividad del uso de descriptores de forma tradicionales, descriptores de forma topológicos o una combinación de ambos para caracterizar e identificar semillas de diferentes accesiones de cebada.

Figura 1: Panícula 3D después de normalizar la densidad, eliminar el aire y otros desechos y podar las aristas.

Primero, recolectaron panículas de 28 accesiones con diversas morfologías de espigas y orígenes geográficos. Luego escanearon estas panículas (grupos de semillas), en lotes de tres o cuatro panículas cada uno, utilizando tomografía computarizada (TC) de rayos X (Fig. 1). Estos escaneos luego se procesaron digitalmente para aislar más de tres mil semillas de cebada individuales de las panículas. Finalmente, cada semilla fue alineada y orientada de acuerdo a sus tres principales componentes principales.

Los autores procedieron entonces a cuantificar la forma de los granos de cebada. Primero midieron 11 descriptores de formas tradicionales diferentes, como largo, ancho, altura, área de superficie y volumen para cada semilla (Fig. 2).

Figura 2. Las semillas se alinearon según sus componentes principales y se midieron los descriptores de forma tradicionales.

A continuación, los descriptores de forma topológica se midieron con el ECT. Para calcular la ECT, primero se cortaron las semillas en una dirección fija en 16 rebanadas de igual grosor. A continuación, las semillas se reconstruyeron agregando un corte a la vez y se registraron los cambios en la Característica de Euler (Fig. 3). Este corte, reconstrucción corte por corte y el seguimiento característico de Euler se realizaron para 158 direcciones diferentes en total. El procedimiento ECT produjo más de 2500 cortes diferentes, correspondientes a más de 2500 descriptores de forma topológica para cada semilla. Para evitar las distorsiones causadas por trabajar con datos en dimensiones altas, conocida como la maldición de la dimensionalidad, era necesaria una reducción de la dimensionalidad.

Figura 3. Cada semilla fue “cortada” en 32 rebanadas de arriba a abajo. A medida que se agregan segmentos, se calcula un número asociado a la topología.

Para estudiar la idoneidad de todos los descriptores de forma, se encargó a una computadora que caracterizara y predijera las 28 accesiones de semillas de cebada utilizando únicamente la información de la morfología del grano. La computadora, una máquina de vectores de soporte, utilizó tres tipos de entrenamiento. En primer lugar, la máquina utilizaba exclusivamente descriptores de formas tradicionales. A continuación, la máquina se entrenó únicamente con descriptores de forma topológica. Finalmente, la máquina utilizó ambas fuentes de información.

Los autores encontraron que para la mayoría de las accesiones, las características topológicas ayudan a la computadora a producir mejores índices de predicción que las características de forma tradicionales. Estos resultados de clasificación se vieron reforzados aún más cuando se combinó la información tradicional y la topológica, lo que demuestra que la topología mide las características que la configuración tradicional no detecta. Además, mientras que los descriptores de forma tradicionales pueden agrupar las semillas en función de su accesión, los descriptores de forma topológica pudieron agruparlas aún más en función de su panícula.

Para determinar exactamente qué es ese “algo” perdido por las características tradicionales, se llevaron a cabo varias evaluaciones de análisis de varianza. Una exploración de las direcciones y cortes utilizados para calcular el ECT revela que la forma del pliegue y la parte inferior de las semillas discriminan más las accesiones (Fig. 4)

Figura 4. Los cortes más significativos corresponden a la morfología del pliegue y del fondo de la semilla.

Dice Amézquita, “La característica de Euler es una forma simple pero poderosa de revelar características que no son fácilmente visibles a simple vista. Hay información morfológica oculta que faltan los métodos tradicionales y morfométricos geométricos. La característica de Euler, y el TDA en general, se pueden calcular fácilmente a partir de cualquier dato de imagen. TDA sugiere un nuevo camino emocionante, impulsado solo por información morfológica, para explorar más a fondo la relación fenotipo-genotipo”.

LEE EL ARTÍCULO:

Erik J Amézquita, Michelle Y Quigley, Tim Ophelders, Jacob B Landis, Daniel Koenig, Elizabeth Munch, Daniel H Chitwood, Midiendo el fenotipo oculto: Cuantificando la forma de las semillas de cebada usando la Transformada característica de Euler, in silico Plants, 2021;, diab033, https://doi.org/10.1093/insilicoplants/diab033


Este manuscrito es parte de in silico Plant's Edición especial del Modelo Estructural Funcional de la Planta.

Todos los datos y el código utilizados en este artículo están disponibles de forma libre y abierta en https://doi.org/10.5061/dryad.rxwdbrv93 y https://github.com/amezqui3/demeter/.