La digitalización de imágenes e información de especímenes de herbario está ampliando su uso y proporcionando un importante recurso para estudios fenotípicos y fenológicos. A partir de la primavera de 2020, un repositorio de claves, iDigBio, tiene más de 19 millones de especímenes digitalizados. Las imágenes anotadas de alta calidad se pueden usar para entrenar algoritmos de aprendizaje automático para automatizar ciertas tareas basadas en imágenes digitales, ahorrando tiempo en el futuro. Sin embargo, la anotación inicial requiere una gran inversión de horas-persona y, a menudo, la realizan voluntarios. Por esta razón, es importante encontrar las formas más fáciles y eficientes de permitir que los voluntarios completen sus tareas.

En un nuevo artículo publicado en Aplicaciones en Ciencias VegetalesEn el número especial de Machine Learning in Plant Biology, la autora principal, Laura Brenskelle, y sus colegas utilizaron un conjunto de datos preanotados de alta calidad que contenía 3000 especies cada uno de ellos Prunus or Acer especímenes a probar la precisión de las anotaciones de los voluntarios de caracteres fenológicos bajo dos condiciones diferentes.

En la primera, los goleadores comparecieron personalmente y se les entregó un entrenamiento de 15 minutos además de un manual con ilustraciones y ejemplos. En la segunda, los goleadores utilizaron la plataforma online Notas de la Naturaleza y recibieron el manual de instrucciones sin capacitación adicional. En la segunda configuración, un espécimen requería tres anotaciones y se le asignaba la anotación acordada por dos anotadores. Luego, los autores investigaron la influencia de factores tales como los rasgos y los taxones que se calificaron, así como la experiencia botánica, el nivel de carrera académica y la velocidad de los calificadores individuales.

Ejemplos de Prunus (izquierda) y Acer (derecha) especímenes incluidos en los estudios. Fuente Brenskelle et al. 2020.

Sorprendentemente, los resultados mostraron que la experiencia botánica, el nivel profesional y la velocidad no fueron factores importantes en la precisión de los anotadores. En cambio, la precisión se rige por los rasgos y los taxones que se califican, ya sea que la persona califique en persona o en línea, y el individuo mismo... algunas personas fueron más precisas independientemente de otros factores. En general, los que aparecieron en persona fueron significativamente más precisos, aunque a ambos grupos les fue razonablemente bien. “Creemos que hay dos factores principales que pueden haber contribuido al ligero retraso en la precisión de las anotaciones en línea: la capacitación y la calidad de la imagen”, explica Brenskelle, quien enfatiza los folletos de capacitación integrales y la capacidad de ampliar los detalles de una imagen. También señala que la puntuación por triplicado mejoró la precisión en línea en un tres por ciento. "Esta es otra forma de mejorar la precisión de las anotaciones en línea, aunque requiere tres veces la cantidad de anotaciones completadas".

Aunque los rasgos que se calificaron en este estudio fueron sencillos, Brenskelle confía en que los voluntarios pueden capacitarse de manera efectiva para tareas de anotación más complejas. “[L]os rasgos en este estudio fueron anotaciones de presencia/ausencia relativamente simples. Hay innumerables tareas de anotación más complejas que puedo imaginar en las que los investigadores estarían interesados, especialmente para la fenología de las plantas. Creo que, con la capacitación adecuada de los voluntarios, nuestro enfoque general funcionaría para rasgos más complejos”, dice. “Creo que el mayor desafío al que te enfrentarías con características más complejas sería tener imágenes que muestren un nivel de detalle apropiado para las cosas que pides a los voluntarios que califiquen. Aparte de ese desafío, creo que si desarrollara manuales de capacitación con ejemplos visuales, eso permitiría a los voluntarios calificar rasgos más complejos”.