Codon-Usage-Bias (auch bekannt als Codon-Bias) ist die selektive Verwendung von Nukleotid-Tripletts (Codons), um spezifische Aminosäuresequenzen in den proteinkodierenden Genen einer Spezies zu kodieren. Jede Aminosäure in einer Sequenz kann von einem (im Falle von Methionin und Tryptophan) bis zu sechs verschiedenen Codons kodiert werden. Die Häufigkeit, mit der synonyme Codons verwendet werden, um eine Aminosäure zu codieren, variiert zwischen Organismen und manchmal sogar innerhalb desselben Organismus.

Variation des GC-Gehalts
Variation des GC-Gehalts in M. acuminata, M. balbisiana, Pho. dactylifera, S. polyrhiza und Phy. heterocycla

Codon-Nutzungsmuster spiegeln die Abstammung und die Genomzusammensetzung einer Art wider. Mazumdar et al. untersuchten die Unterschiede zwischen Gras- und Nicht-Gras-Einkeimblättrigen.

Zunächst wurden Studien zur Codon-Nutzung bei Monokotylen überprüft. Die aktuellen Informationen wurden dann hinsichtlich der Codon-Verwendung sowie der Codon-Paar-Kontextverzerrung erweitert, indem vier vollständig sequenzierte Nicht-Gras-Monocot-Genome verwendet wurden (Musa acuminata, balbisanische Muse, Phoenix dactylifera und Spirodela polyrhiza), für die vergleichbare Transkriptom-Datensätze verfügbar sind. Es wurden Messungen bezüglich der relativen Verwendung von synonymen Codons, der effektiven Anzahl von Codons, des abgeleiteten optimalen Codon- und GC-Gehalts durchgeführt und dann die Beziehungen untersucht, um die zugrunde liegenden evolutionären Kräfte abzuleiten.

Mazumdar et al. identifizierten optimale Codons, seltene Codons und den bevorzugten Codonpaar-Kontext in den untersuchten einkeimblättrigen Nicht-Gras-Spezies. Im Gegensatz zur bimodalen Verteilung von GC3 (GC-Gehalt in dritter Codon-Position) in Gräsern zeigten Nicht-Gras-Einkeimblättrige eine unimodale Verteilung. Die unverhältnismäßige Verwendung von G und C (und von A und T) in Zwei- und Vier-Codon-Aminosäuren, die in der Analyse nachgewiesen wurde, schließt die Mutationsbias-Hypothese als Erklärung für die genomische Variation im GC-Gehalt aus.

Optimale Codons in diesen Nicht-Gras-Monokotylen zeigen eine Präferenz für G/C in der dritten Codonposition. Diese Ergebnisse stützen das Konzept, dass die Codonverwendung und die Nukleotidzusammensetzung in Nicht-Gras-Monokotylen hauptsächlich durch GC-voreingenommene Genumwandlung angetrieben werden.