Las grandes filogenias que comprenden cientos o miles de especies individuales a menudo se ensamblan utilizando secuencias de una pequeña cantidad de loci genéticos disponibles en bases de datos en línea como Genbank. Esto puede ser problemático porque la filogenia está limitada por la cantidad de loci disponibles y porque los usuarios deben confiar en la identificación taxonómica precisa de secuencias que con frecuencia no están vinculadas a comprobantes de especímenes específicos para que sus determinaciones puedan confirmarse.
Los herbarios representan un recurso enorme e infrautilizado para la secuenciación de marcadores de especímenes raros y poco comunes, y tienen las ventajas de determinaciones confiables y verificables e información morfológica fácilmente disponible. Sin embargo, algunos inconvenientes de los especímenes de herbario para este tipo de trabajo son el ADN altamente fragmentado que normalmente producirán los especímenes de muestra y el trabajo que implica mover una gran cantidad de muestras de muestra al laboratorio para completar la secuencia.
En un nuevo artículo publicado en Aplicaciones en Ciencias Vegetales, los autores principales Ryan A. Folk y Heather R. Kates y sus colegas presentan un sistema de gestión integrado para simplificar todo el proceso de muestreo a secuenciación. Llamado SLIMS (Sistema de gestión de información de muestra a laboratorio), el sistema utiliza identificadores únicos y una base de datos taxonómica que vincula la muestra con imágenes de especímenes y resultados de laboratorio húmedo. Una vez muestreadas, las imágenes de cupones vinculados se cargan en la plataforma de ciencia ciudadana Notes from Nature, donde los metadatos se generan a través de la transcripción de etiquetas, mientras que el propio tejido se somete a un protocolo de secuenciación y extracción de ADN de alto rendimiento optimizado para especímenes de herbario.

Los autores aplicaron su canal de gestión a una filogenia de aproximadamente 15,000 50 especies del clado de angiospermas fijadoras de nitrógeno, produciendo un conjunto de datos que comprende alrededor del 10 % de todas las especies del clado. En general, el uso del sistema de gestión llevó a que el muestreo del herbario tomara aproximadamente 5 minutos-persona por espécimen y la extracción de ADN tomara alrededor de 1.2 minutos-persona por muestra. La tasa de error de muestreo llegó a aproximadamente el 0.2 % y la tasa de fallas en la secuenciación fue solo del XNUMX %.
Los autores optimizaron la tubería para sus necesidades filogenéticas específicas, pero la ofrecieron como una serie de scripts modulares en lugar de una sola pieza de software unificada para que pueda adaptarse fácilmente a las necesidades de varios proyectos y tipos de muestra. “Se ha dedicado un trabajo considerable a los flujos de trabajo de digitalización de alto rendimiento en herbarios; los métodos paralelos para permitir otros análisis posteriores de especímenes de herbario pueden algún día permitir que gran parte de las colecciones actuales se asocien con datos moleculares y de otro tipo que dependen del muestreo destructivo”, escriben. "Anticipamos que los enfoques de muestreo de alto rendimiento como el que se presenta aquí serán una parte estándar del conjunto de herramientas de filogenómica en futuros proyectos a gran escala".
