Aunque los estudios de asociación del genoma completo (GWAS) permiten la identificación de variantes de polimorfismo de nucleótido único (SNP) asociadas con rasgos de interés, muchas de las variantes identificadas se encuentran en regiones no codificantes y, presumiblemente, solo influyen en la regulación de la expresión génica. Por lo tanto, identificar los genes causales que subyacen a un fenotipo dado usando solo variantes es un gran desafío. La integración de GWAS y redes de coexpresión de genes puede ayudar a priorizar genes candidatos de alta confianza, ya que los perfiles de expresión de genes asociados a rasgos pueden usarse para extraer nuevos candidatos. Un nuevo artículo publicado en in silico Plantas presenta un marco estadístico que automatiza la integración de redes de coexpresión de genes y SNP derivados de GWAS para priorizar genes candidatos asociados con rasgos de interés.
El Investigador Graduado Fabricio Almeida-Silva y el Profesor Asociado Dr. Thiago Venancio de la Universidad Estatal del Norte de Río de Janeiro presentan minero de jaulas (candidate gene miner), un paquete R/Bioconductor para priorizar genes candidatos a través de la integración de GWAS y redes de coexpresión.
minero de jaulas utiliza un enfoque basado en genes guía para descubrir nuevos candidatos que se coexpresan con genes asociados a rasgos conocidos y que se inducen o reprimen significativamente en condiciones de interés.
Mientras que un enfoque computacional existente, Camoco, existe que puede integrar loci identificados por GWAS con información funcional derivada de redes de coexpresión de genes, minero de jaulas es capaz de descubrir genes candidatos dentro de una ventana deslizante más grande, lo que le permite detectar más genes candidatos.
Datos de entrada requeridos por minero de jaulas son posiciones de SNP, genes guía y una red de coexpresión de genes.
Los genes se consideran candidatos de alta confianza si pasan los tres criterios de filtrado implementados en minero de jaulas:
- proximidad física a los SNP,
- coexpresión con genes asociados a rasgos conocidos, y
- cambios significativos en los niveles de expresión en condiciones de interés.
Los candidatos priorizados también se pueden calificar y clasificar para seleccionar objetivos para la validación experimental.

Los autores aplicaron minero de jaulas a un conjunto de datos reales de Capsicum annuum respuesta a la infección por Phytophthora para identificar candidatos priorizados que codifican proteínas relacionadas con procesos conocidos relacionados con la inmunidad vegetal. La documentación fácil de seguir de la sesión, incluido el código, las explicaciones y las figuras, se incluye en un archivo complementario del artículo.
Venancio concluye, “desarrollamos minero de jaulas para priorizar los genes candidatos, lo que lleva a una reducción significativa en el tamaño de las listas de genes candidatos. Anticipamos que este paquete contribuirá al avance de la genómica de poblaciones y a la identificación de genes para aplicaciones biotecnológicas”.
LEE EL ARTÍCULO:
Fabricio Almeida-Silva, Thiago M Venancio, Cageminer: un paquete R/Bioconductor para priorizar genes candidatos mediante la integración de GWAS y redes de coexpresión de genes, in silico Plants, 2022; diac018, https://doi.org/10.1093/insilicoplants/diac018
Todos los datos y el código utilizados en este manuscrito están disponibles gratuitamente en un repositorio de GitHub (https://github.com/almeidasilvaf/cageminer_benchmark) para garantizar la total reproducibilidad
