El sesgo de uso de codones (también conocido como sesgo de codones) es el uso selectivo de tripletes de nucleótidos (codones) para codificar secuencias de aminoácidos específicas en los genes que codifican proteínas de una especie. Cada aminoácido en una secuencia puede codificarse desde uno (en el caso de la metionina y el triptófano) hasta seis codones diferentes. Las frecuencias con las que se utilizan codones sinónimos para codificar un aminoácido varían entre organismos y, a veces, incluso dentro del mismo organismo.

Variación del contenido de GC
Variación del contenido de GC en M. acuminata, M. balbisiana, Pho. dactylifera, S. polyrhiza y Phy. heterocycla

Los patrones de uso de codones reflejan el linaje y la composición del genoma de una especie. Mazumdar et al. investigó las diferencias entre monocotiledóneas herbáceas y no herbáceas.

Primero, se revisaron los estudios de uso de codones en monocotiledóneas. La información actual se amplió luego con respecto al uso de codones, así como al sesgo del contexto de pares de codones, utilizando cuatro genomas de monocotiledóneas que no son pastos completamente secuenciados (Musa acuminada, musa balbisiana, Phoenix dactylifera y Spirodela poliriza) para los que se dispone de conjuntos de datos transcriptómicos comparables. Se tomaron medidas con respecto al uso relativo de codones sinónimos, número efectivo de codones, codones óptimos derivados y contenido de GC y luego se investigaron las relaciones para inferir las fuerzas evolutivas subyacentes.

Mazumdar et al. identificó codones óptimos, codones raros y contexto de par de codones preferido en las especies de monocotiledóneas que no son pastos estudiadas. En contraste con la distribución bimodal de GC3 (contenido de GC en la posición del tercer codón) en las gramíneas, las monocotiledóneas que no son gramíneas mostraron una distribución unimodal. El uso desproporcionado de G y C (y de A y T) en aminoácidos de dos y cuatro codones detectados en el análisis descarta la hipótesis del sesgo mutacional como explicación de la variación genómica en el contenido de GC.

Los codones óptimos en estas monocotiledóneas que no son hierba muestran una preferencia por G/C en la posición del tercer codón. Estos resultados respaldan el concepto de que el uso de codones y la composición de nucleótidos en monocotiledóneas que no son pastos están impulsados ​​principalmente por la conversión de genes sesgada por GC.