全 文 :Vol. 30 , No. 12
pp. 1220 - 1224 Dec. , 2004
作 物 学 报
ACTA AGRONOMICA SINICA
第 30 卷 第 12 期
2004 年 12 月 1220~1224 页
粳稻叶绿体基因组的密码子用法
刘庆坡1 薛庆中1 ,2 , 3 Ξ
(1 浙江大学农业与生物技术学院农学系 ,浙江杭州 310029 ;2 浙江大学沃森基因组科学研究院 ,浙江杭州 310029)
摘 要 基因组密码子使用受多种因素的影响 ,本试验通过对应分析探讨了若干重要因子对粳稻品种“日本晴”叶绿体
全基因组序列密码子用法的效应。结果指出 ,在影响最大的第一条向量轴上 ,基因的位置坐标与该基因的表达水平
(CAI)和 GC3s 极显著相关 ( r = 01785 3 3 和 - 01804 3 3 ) ,而 CAI与 GC3s 高度负相关 ( r = - 01917 3 3 ) ;说明基因表达水平
的高低是影响密码子使用的主要因素 ,并且高表达的基因强烈偏好使用以 T或 A 结尾的密码子。基因编码区碱基组成
的影响力远不及基因的表达水平 , G + C 含量与 ENC、CAI 以及第一条向量轴上基因位置坐标的相关系数分别为
01344 3 3 、- 01422 3 3 和 - 01421 3 3 ;相关性测验和方差分析均表明基因长度对密码子的使用影响不大 ,估计与那些编码未
知功能的 ORFs 的存在有关 ;复制转录对密码子的使用没有明显的选择。将高表达优越密码子分析法和高频密码子分析
法相结合 ,确定了 TGT和 GAA 等 12 个密码子为叶绿体基因组的主要偏爱密码子。
关键词 水稻 ;叶绿体基因组 ;密码子使用 ;对应分析 ;基因表达水平 ; G+ C含量
中图分类号 :S511
Codon Usage in the Chloroplast Genome of Rice ( Oryza sativa L1 ssp1 japonica)
LIU Qing2Po1 ,2 , XUE Qing2Zhong1 ,2 , 3
(1 Department of Agronomy , College of Agriculture and Biotechnology , Zhejiang University , Hangzhou 310029 , Zhejiang ; 2 College of Watson’s Genomics ,
Zhejiang University , Hangzhou 310029 , Zhejiang , China)
Abstract The codon usage in the genome is usually influenced by many factors1 A correspondence analysis was performed
for exploring the effects of several important factors on codon usage in the complete chloroplast genome sequences of Nip2
ponbare1 The results showed that there were significant correlations ( r = 01785 3 3 and - 01804 3 3 ) between the gene po2
sition on first axis and gene expression level , with both the assessments (Codon Adaptation Index ,CAI and GC3s values) ,
whereas a strongly negative correlation ( r = - 01917 3 3 ) between CAI and GC3s values , indicating that the natural se2
lection on gene expression level was the major factor affecting the codon usage of Nipponbare , and that highly expressed
genes had a stronger preference for codons with Tor A at the third nucleotide position1 From a lower positive correlation be2
tween GC content and ENC ( r = 01344 3 3 ) , and lower negative correlations between GC content and CAI , axis 1 coordi2
nates ( r = - 01422 3 3 and - 01421 3 3 , respectively) , we could conclude that the GC content in coding region gave a
less contribution to codon usage bias than that to gene expression level1 The results of correlation analysis and variance
analysis showed that gene lengths did not significantly affected genomic codon usage bias , which was probably related to
those ORFs with unidentified function1 The replication2transcription selection had a far less influence on the codon usage of
a gene1 Through an analysis of both the high2expression codon and high2frequency codon , we defined 12 codons from 12
amino acids as the major preference codons in cv1 Nipponbare1
Key words Rice ; Chloroplast genome ; Codon usage ; Correspondence analysis ; Gene expression level ; GC content
生物体中除通用遗传密码子外 ,已发现一些非
通用的密码子 ,主要存在于线粒体中。一般而言 ,各
种生物通用标准密码 ,仅在少数情况下出现密码子
的变异。不同的物种具有明显的密码子偏性。导致
密码子偏性的最主要因素是基因组的碱基偏好和对
偏爱密码子的选择[1 ] 。例如蓝藻的选择作用较为强Ξ基金项目 :国家自然科学基金 (39870421)和浙江省重点科研项目 (2003C22007)资助。
作者简介 :刘庆坡 (1976 - ) , 男 , 在读博士生 , 研究方向 : 基因组学。3 通讯作者 :薛庆中 ,教授 , 博士生导师。E2mail : qzhxue @hotmail .
com ,Tel : 057128999650
Received(收稿日期) :2003209215 ,Accepted (接受日期) : 2004203228.
烈 ;硅藻中等 ,而红藻和眼虫藻则较弱[2 ] 。然而 ,有
关叶绿体基因密码子使用的基本特征迄今仅有很少
报道。有人曾推测在翻译机制及其基因密码子使用
偏性上叶绿体基因类似于大肠杆菌[3 ] ;在密码子使
用中 ,黑松叶绿体以碱基偏好为主 ,选择作用非
常弱[2 ] 。
生物细胞中有 3 个相对独立的基因组和遗传体
系[4 ] ,即核、线粒体和叶绿体基因组。后者具有与原
核生物类似的编码蛋白基因的翻译组件 (如 70S 核
糖体、tRNAs 和起始因子等) [5 ] 。粳稻叶绿体全基因
组序列的发表[6 ,7 ] ,为深入研究其密码子的使用提供
了便利。本文利用多变量统计分析 (对应分析)结合
相关性测验的方法 ,对粳稻叶绿体基因组的密码子
使用与基因的表达水平、基因编码区的碱基组成、基
因长度以及复制转录间的关系作了系统分析 ,并确
定了它的主要偏爱密码子。这对于研究与叶绿体基
因组相关特性的遗传及其变异 ,阐明叶绿体基因组
和核及线粒体基因组的基因转移 ,探讨生物分子进
化等问题均有重要意义。
1 材料与方法
111 序列数据
日本晴叶绿体全基因组 DNA 序列 (序列号 NC—
001320)从 GenBank 数据库 (Release 135) 下载。叶绿
体 DNA 为双链环状 ,序列全长 134 525 bp ,基因组平
均 G+ C含量约为 39 %。根据基因组序列的注释信
息 ,共获得 108 个蛋白编码基因。为了减少长度较
短的基因变异所带来的样本误差 ,依照国际通用办
法 ,去除 48 个长度小于 350 bp 的基因[2 ,3 ] 。编写
Perl 程序提取剩余 60 个蛋白编码基因的 CDS (Cod2
ing Sequence)序列。
112 统计分析
用软件 GCUA112 (由 James 等编写并提供 ,详见
http :ΠΠbioinf1may1ieΠgcuaΠ) [8 ]统计基因的 G + C、GC3s
含量和有效密码子数 ( Effective Number of Codons ,
ENC)等指标并进行对应分析 (Correspondence Analys2
is) 。编写 Perl 程序计算基因的密码子适应指数
(Codon Adaptation Index ,CAI) 和基因组的 AT 偏移。
利用 SPSS 1010 多元分析软件进行相关显著性测验。
11211 同义密码子偏性的衡量指标 (1) GC3s
值是第 3 位密码子的 G+ C 含量在基因碱基总量中
所占的比率 (蛋氨酸、色氨酸和终止密码子除外) 。
(2)有效密码子数[9 ] 用于测量某个基因的密码子使
用偏移的情况。该值为 20~61 ,越靠近 20 表示基因
的偏性越大。(3) 密码子适应指数[10 ] 常用于基因表
达水平的测量。此值为 0~1 ,越接近 1 表示基因的
表达水平越高。本文中以 17 个核糖体蛋白基因的
相对密码子使用度 RSCU 和密码子相对适应值 w
(Relative Adaptiveness of Codon)作为计算 CAI值的参
考数据。(4) AT 偏移 (AT2skew) 定义为整个基因组
DNA 序列的 (A - T)Π(A + T) 的比值。通过计算 AT
偏移可分析整个基因组中 A、T 的变化趋势。本研
究中计算的步长为 1 000 bp。
11212 对应分析 对应分析中[11 ] ,样本中所有基
因被分布在一个 59 维 (59 个正义密码子) 的向量空
间中 ,应用这些结果能够探究基因间 RSCU 值的变
异情况 ,从中判别影响基因密码子使用的主要因素。
11213 主要偏爱密码子 (Major Preference Codons) 的
确定 高表达优越密码子 ( High2expression Codon ,
HE)和高频密码子 ( High2frequency Codon) 的确定分
别参见文献 [12 ]和 [13 ]。本研究中 ,将同时确定为
高表达优越密码子和高频密码子的同义密码子定义
为粳稻叶绿体基因组的主要偏爱密码子。
2 结果与分析
211 基因的表达水平对密码子使用的影响
对应分析表明 ,第 1 条向量轴能解释基因间总
变异的 1117 % ,其余 3 条向量轴分别解释 9106 %、
8108 %和 7109 %。从图 1 看出 ,高表达基因 (如核糖
体蛋白基因)主要位于第一条向量轴右侧 ,而未知功
能的 ORFs 多数位于左侧。第 1 条向量轴上基因的
位置与该基因的表达水平 (CAI) 呈极显著正相关
( r = 01785 3 3 ) , 而与 GC3s 高度负相关 ( r =
- 01804 3 3 ) 。此外 ,CAI与 GC3s 的相关系数为负值
并达极显著 ( r = - 01917 3 3 ) ,表明基因表达水平的
高低是影响密码子使用的主要因素 ,并且高表达的
基因强烈偏爱使用以 T或 A 结尾的密码子。
212 基因编码区的碱基组成对密码子使用的影响
ENC与 CAI 为负相关 ( r = - 01608 3 3 ) 。编码
序列的 G + C 含量与 ENC 表现较弱正相关 ( r =
01344 3 3 ) ,而和 CAI负相关 ( r = - 01422 3 3 ) 。表明
高表达基因的同义密码子有一定程度偏性 ,基因
1221 12 期 刘庆坡等 :粳稻叶绿体基因组的密码子用法
图 1 粳稻叶绿体 60 个蛋白编码基因位置
和 RSCU值前两个向量轴的对应分析
Fig11 Correspondence analysis of relative synonymous
codon usage ( RSCU) values for 60 japonica chloroplast
genes and the position of genes on the first two axes
空心圆形和三角形分别代表核糖体蛋白基因和未知功能的ORF。
Open circles and triangles indicate ribosomal protein genes and the ORFs
of unidentified function used as the high and low data set respectively1
A + T含量较低则表达较高。虽然编码区的碱基组
成对密码子使用的相关性均达到了极显著的水平 ,
但与基因表达水平的影响相比 ,其程度明显不及后
者。
213 基因长度与基因表达水平、同义密码子偏性的
关系
基因长度与 CAI、ENC 和 GC3s 的相关系数分别
为 01070、- 01080 和 - 01092 ,均未达到显著水平。
进一步将供试基因分成 4 组 (基因长度 ≤499 bp ,
500~999 bp ,1 000~1 499 bp , ≥1 500 bp) ,对每组的
CAI、ENC 和 GC3s 值进行方差分析 (见表 1) 。从表 1
可以看出 ,4 个组中 ,CAI、ENC 和 GC3s 值的差异均
不显著。说明日本晴叶绿体基因组中 ,基因长度与
基因的表达水平以及密码子偏性无明显相关。
表 1 不同长度基因 CAI、ENC、GC3s 的方差分析
Table 1 Variance analysis of CAI, ENC and GC3s in groups of gene
with different lengths
基因长度
Gene
length (bp)
样本数
No1 of
sampling
平均值±标准差 Means ±SD
CAI ENC GC3s
≤499 16 01699 ±01064a 501889 ±51457a 01309 ±01093a
500 - 999 15 01694 ±01053a 491097 ±31953a 01292 ±01068a
1 000 - 1 499 14 01716 ±01031a 471830 ±51778a 01289 ±01063a
≥1 500 15 01707 ±01024a 491509 ±31248a 01277 ±01029a
注 :同一列中相同字母表示统计上差异不显著 ( P < 0105) 。
Note : The same superscript letter within the same column means no statisti2
cally significant difference between groups ( P < 0105) 1
214 复制转录对密码子使用的影响
从图 2 看出 ,在 134 000 bp 范围内 ,AT 偏移值
起伏跌宕 ,无明显规律可循。在 DNA 双链上 AT 富
集 ,前导链和后随链分别为 6116 %和 6113 % ;蛋白
编码基因数目分别为 53 和 55 个 ,表示复制转录选
择对密码子使用影响很小。
图 2 粳稻叶绿体基因组的 AT偏移分布
Fig12 AT skew in rice chloroplast genome
( Oryza sativa L1 ssp1 japonica)
215 密码子的使用模式及主要偏爱密码子的确定
日本晴叶绿体基因组的 108 个蛋白编码基因
中 ,绝大多数翻译起始密码子是ATG,只有基因 rp12
及 rps 19 分别是 ACG和 GTG。但在基因内部密码
子 ACG和 GTG仍然分别编码苏氨酸和缬氨酸。其
余密码子的使用与核基因一致。
本研究中将 17 个核糖体蛋白基因作为高表达
样本组 ,8 个未知功能的 ORFs 为低表达样本组 ,分
别计算其平均的相对密码子使用度 RSCU ,根据
△RSCU 值最终确定包括 TAA 在内的 27 个密码子
为高表达优越密码子 (表 2) 。从表 2 还可以看出 ,
GCT、TGT等 18 个密码子被确定为高频密码子。若
将两者综合评定 ,TGT、GAT、GAA 和 TTT 等 12 个密
码子被认为是主要偏爱密码子。
3 讨论
按照中性进化理论的观点 ,核苷酸序列中密码
子第 3 位碱基的变化受到突变和自然选择的影响是
中性或近中性的[14 ] 。Sharp 等 (1986) [15 ] 认为在高效
表达基因中 ,密码子的使用偏性由翻译的选择压主
宰 ;而在低表达基因或群体比较小的物种中 ,主要通
过突变或漂移产生 ,选择作用相对较弱。他提出的
“选择2突变2漂移”模型指出在对偏好密码子的选择
和通过突变2漂移对非偏好密码子的保留之间 ,同义
密码子的使用偏性存在一种平衡。单细胞生物[14 ]
中的酿酒酵母、大肠杆菌和多细胞生物中的线
虫[16 ] 、果蝇[17 ]等都适用于此模型。在叶绿体基因组
2221 作 物 学 报 30 卷
的研究方面 ,Morton (1999) [18 ] 认为 DNA 链的不对称
突变是造成 Euglena gracilis 使用偏性的主要原因。
同样 ,上下文依赖性突变 ( Context2dependent Muta2
tions)在禾谷类作物叶绿体 DNA 密码子使用偏性中
发挥作用 ,低表达基因的密码子使用还受到弱的选
择作用[19 ] 。本研究中 ,粳稻叶绿体基因组的密码子
使用受到了表达水平上的自然选择以及基因碱基组
成的显著影响 ,其中选择的作用比较突出 ,但复制转
录的影响不明显。
表 2 粳稻叶绿体基因组的密码子使用
Table 2 Codon usage of the chloroplast genome in japonica rice
氨基酸
AA
密码子
Codon
HE
High Low △RSCU
RFSC
( %)
氨基酸
AA
密码子
Codon
HE
High Low △RSCU
RFSC
( %)
氨基酸
AA
密码子
Codon
HE
High Low △RSCU
RFSC
( %)
Ala GCA 1139 1132 0107 2915 Lys AAG 0149 0165 - 0116 2614 Ser AGT 1148 0153 0195 3 3 3 1917
GCC 0185 0146 0139 3 3 3 1416 Leu CTA 0159 0194 - 0135 1411 TCA 1105 0196 0109 3 1712
GCG 0150 0161 - 0111 1219 CTC 0148 0194 - 0146 717 TCC 1129 1191 - 0162 2112
GCT 1126 1162 - 0136 4310 + CTG 0128 0130 - 0102 516 TCG 0151 0164 - 0113 818
Cys TGC 0142 0164 - 0122 2612 CTT 1109 2101 - 0192 2215 TCT 1144 1154 - 0110 2612 +
TGT 1158 1136 0122 3 3 7318 + TTA 2150 1101 1149 3 3 3 3310 + Thr ACA 1134 0197 0137 3 3 2617
Asp GAC 0160 0175 - 0115 2216 TTG 1107 0180 0127 3 3 1712 ACC 0183 1133 - 0150 2013
GAT 1140 1125 0115 3 7714 + Asn AAC 0163 1112 - 0149 2816 ACG 0138 0126 0112 3 1018
Glu GAA 1162 1105 0157 3 3 3 7214 + AAT 1137 0188 0149 3 3 3 7114 + ACT 1145 1144 0101 4212 +
GAG 0138 0195 - 0157 2716 Pro CCA 0193 0193 0100 2614 Val GTA 1162 1109 0153 3 3 3 3611
Phe TTC 0183 1106 - 0123 3619 CCC 1120 0199 0121 3 3 2219 GTC 0139 0155 - 0116 1112
TTT 1117 0194 0123 3 3 6311 + CCG 0147 0149 - 0102 1114 GTG 0152 018 - 0128 1413
Gly GGA 1149 1121 0128 3 3 3715 + CCT 1140 1159 - 0119 3913 + GTT 1147 1156 - 0109 3814 +
GGC 0134 0166 - 0132 1017 Gln CAA 1168 1135 0133 3 3 3 7616 + Tyr TAC 0139 0174 - 0135 2315
GGG 0172 1159 - 0187 2014 CAG 0132 0165 - 0133 2314 TAT 1161 1126 0135 3 3 3 7615 +
GGT 1145 0155 0190 3 3 3 3113 Arg AGA 1199 1153 0146 3 3 3 2815 + Met ATG 2165 3100 - 0135 9617 +
His CAC 0135 0145 - 011 2518 AGG 0152 1105 - 0153 1017 ACG 0135 0100 0135 3 3 3 313
CAT 1165 1155 0110 3 7412 + CGA 1111 0163 0148 3 3 3 2012 GTG 0100 0100 0100 010
Ile ATA 1104 0186 0118 3 3011 CGC 0135 1105 - 0170 919 Trp TGG 1100 1100 0100 10010
ATC 0155 1114 - 0159 2112 CGG 0143 0184 - 0141 814 Ter TAA 2147 0138 2109 3 3 3 4813
ATT 1141 1100 0141 3 3 3 4817 CGT 1160 0191 0169 3 3 3 2214 TAG 0100 0175 - 0175 2117
Lys AAA 1151 1135 0116 3 7316 + Ser AGC 0123 0142 - 0119 618 TGA 0153 1188 - 1135 3010
注 :高表达优越密码子分别被标记为 3 3 3 ( △RSCU ≥0130) 、3 3 ( △RSCU ≥0120)和 3 ( △RSCU ≥0108) 。高频密码子标记为 + 。RFSC为同义密码
子的使用频率。斜体加粗的为主要偏爱密码子。
Note : High2expression codons , defined by a higher RSCU value in highly expressed genes , are expressed as 3 3 3 ( △RSCU ≥0130) , 3 3 ( △RSCU ≥0120) and 3
( △RSCU ≥0108) 1 High2frequency codons are expressed as + 1 Relative frequency of synonymous codon is abbreviated to RFSC1 Codons marked with italic and
bold are major preference codons1
通常认为 ,基因的碱基组成会影响密码子的使
用。基于粳稻日本晴叶绿体基因组的对应分析 ,虽
然第一条向量轴上各基因的位置坐标与 G + C 含量
呈极显著负相关 ( r = - 01421 3 3 ) ,但 r 值相对较
小 ,从另一个角度反映编码区 G + C 含量对同义密
码子的使用影响不大。这也许与整个基因组 G + C
含量低 (约 39 %) 、变异幅度也小 (0132~0150) 有关。
因此 ,就整体而言 ,叶绿体基因间的异质性不太高 ,
碱基从 G或 C突变为 A 或 T的强度不大。
基因密码子使用偏性的高低被认为与基因的长
度有关。它们在拟南芥[12 ] 和籼稻[20 ] 等物种中呈显
著负相关 ,表明较长的基因具有较低的密码子使用
3221 12 期 刘庆坡等 :粳稻叶绿体基因组的密码子用法
偏性和较高的密码子替代率 ,受选择影响较小。与
上述物种不同 ,本研究中 ,粳稻叶绿体基因组基因长
度与基因的密码子使用偏性并无明显相关。究其原
因可能与供试基因中一些编码未知蛋白的 ORFs 的
G+ C (0134~0150) 、GC3s (0128~0149) 含量以及
ENC 值 (4811~5412)较高有关。
在烟草叶绿体基因组中绝大多数基因以 ATG,
只有 3 个基因 ( rps19、psbC 和 ycf15) 以 GTG,2 个基
因 ( psbL 和 ndhD)以 ACG为翻译起始密码子[21 ] 。本
研究在粳稻叶绿体基因组中 ,也得到基本相似的结
果。这是巧合还是有普遍趋势存在 ? 此外 ,为什么
个别叶绿体基因以 ACG和 GTG作翻译起始密码子 ,
但它们在基因内部却仍然翻译成苏氨酸和缬氨酸 ?
这些问题仍值得研究。
关于主要偏爱密码子确定的方法 ,不同学者的
见解不甚一致。Duret 等 (1999) [12 ] 将那些出现频率
随基因表达水平升高而增加的密码子定义为高表达
优越密码子。这样有时会与 RSCU 值的表现不太一
致。比如 ,编码丙氨酸的 4 个密码子中 , GCC 的
RSCU 值低于 1100 ,在高Π低表达样本组中 ,被定为高
表达优越密码子 ;相反 ,RSCU 值均大于 1100 的 GCA
和 GCT ,未能定为高表达优越密码子 ,仅仅是因为它
们在高表达组的使用频率不优于低表达组 (表 2) 。
但从纵向看 ,在样本内 , GCA 和 GCT 的使用频率还
是明显高于 GCC。林涛等 (2002) [13 ]的高频密码子分
析法未将高表达与低表达蛋白基因分开 ,当某些密
码子的高表达优越性在总体上表现不突出时 ,这种
优越性就会被湮没。为此 ,作者尝试将两种密码子
分析方法加以整合 ,使 RSCU 值小于 1100 的密码子
不能成为最优密码子 ;最终将 12 个密码子确定为粳
稻叶绿体基因组的主要偏爱密码子 ,这对于在分子
水平上研究物种进化具有重要的指导意义。
References
[1 ] Akashi H , Eyre2Walker A1 Translational selection and molecular evolu2
tion1 Curr Opin Genet Dev , 1998 , 8 : 688 - 693
[2 ] Morton B R1 Selection on the codon bias of chloroplast and cyanelle
genes in different plant and algal lineages1 J Mol Evol , 1998 , 46 :
449 - 459
[3 ] Morton B R , So B G1 Codon usage in plastid genes is correlated with
context , position within the gene , and amino acid content1 J Mol Evol ,
2000 , 50 : 184 - 193
[4 ] Hirose T , Ideue T , Wakasugi T , Sugiura M1 The chloroplast infA gene
with a functional UUG initiation codon1 FEBS Letters , 1999 , 445 : 169
- 172
[5 ] Sugiura M1 The chloroplast genome1 Plant Mol Biol , 1992 , 19 (1) :
149 - 168
[6 ] Hiratsuka J , Shimada H , Whittier R , Ishibashi T , Sakamoto M , Mori
M , Kondo C , Honji Y, Sun C R , Meng B Y, Li YQ , Kanno A , Nish2
izawa Y, Hirai A , Shinozaki K, Sugiura M1 The complete sequence of
the rice ( Oryza sativa) chloroplast genome : intermolecular recombina2
tion between distinct tRNA genes accounts for a major plastid DNA inver2
sion during the evolution of the cereals1 Mol Gen Genet , 1989 , 217 :
185 - 194
[7 ] Shimada H , Sugiura M1 Fine structural features of the chloroplast ge2
nome : comparison of the sequenced chloroplast genomes1 Nucleic Acids
Research , 1991 , 19 (5) : 983 - 995
[8 ] McInerney J O1 GCUA : general codon usage analysis1 Bioinformatics ,
1998 , 14 (4) : 372 - 373
[9 ] Wright F1 The“effective number of codons”used in a gene1 Gene ,
1990 , 87 : 23 - 29
[10 ] Sharp P M , Li W H1 The codon adaptation index2a measure of direc2
tional synonymous codon usage bias , and its potential applications1 Nu2
cleic Acids Res , 1987 , 15 (3) : 1 281 - 1 295
[ 11 ] Greebacre M J1 Theory and applications of correspondence analysis1
London :Academic Press ,1984
[12 ] Duret L , Mouchiroud D1 Expression pattern and , surprisingly , gene
length shape codon usage in Caenorhabditis , Drosophila , and Arabi2
dopsis1 Proc Natl Acad Sci USA , 1999 , 96 : 4 482 - 4 487
[13 ] Lin T(林涛) , Ni Z2H(倪志华) , Shen M2S(沈明山) , Chen L (陈
亮) 1 High2frequency codon analysis and its application in codon analy2
sis of tobacco1 Journal of Xiamen University (Natural Science) (厦门
大学学报·自然科学版) , 2002 , 5 : 551 - 554
[14 ] Sharp P M , Stenico M , Peden J F , Lloyd A T1 Codon usage : muta2
tional bias , translational selection , or both ? Biochem Soc Trans , 1993 ,
21 : 835 - 841
[ 15 ] Sharp P M , Li W H1 An evolutionary perspective on synonymous codon
usage in unicellular organisms1 J Mol Evol , 1986 , 24 : 28 - 38
[16 ] Stenico M , Lloyd A T , Sharp P M1 Codon usage in Caenorhabditis ele2
gans : delineation of translational selection and mutational biases1 Nu2
cleic Acids Res , 1994 , 22 : 2 437 - 2 446
[ 17 ] Miyasaka H1 Translation initiation AUG context varies with codon usage
bias and gene length in Drosophila melanogaster1 J Mol Evol , 2002 ,
55( 1) : 52 - 64
[18 ] Morton B R1 Strand asymmetry and codon usage bias in the chloroplast
genome of Euglena gracilis1 Proc Natl Acad Sci USA , 1999 , 96 :
5 123 - 5 128
[ 19 ] Morton B R1 The role of context2dependent mutations in generating
compositional and codon usage bias in grass chloroplast DNA1 J Mol
Evol , 2003 , 56 : 616 - 629
[20 ] Liu Q2P(刘庆坡) , Tan J (谭军) , Xue Q2Z(薛庆中) 1 Synonymous
codon usage bias in the rice cultivar 93211 ( Oryza sativa L1 ssp1 indi2
ca) 1 Acta Genetica Sinica (遗传学报) , 2003 , 30 (4) : 335 - 340
[21 ] Sugiura M , Hirose T , Sugita M1 Evolution and mechanism of translation
in chloroplast1 Annu Rev Genet , 1998 , 32 : 437 - 459
4221 作 物 学 报 30 卷