免费文献传递   相关文献

CHARACTERIZATION OF CODON USAGE OF waxy GENES IN SEVERAL PLANTS

几种植物waxy基因的密码子用法特征分析



全 文 :核 农 学 报 2010,24(3):476 ~ 481
Journal of Nuclear Agricultural Sciences
文章编号:1000-8551(2010)03-0476-06
几种植物 waxy基因的密码子用法特性分析
刘汉梅1,2 赵 耀2 顾 勇2 张怀渝1 黄玉碧2
(1.四川农业大学生命科学与理学院,四川 雅安 625014;2,四川农业大学玉米所,四川 雅安 625014)
摘 要:密码子简并性特征造成了不同物种或同一物种的不同基因在密码子使用上存在不同的偏爱性。
本研究运用 Codon W 软件对水稻、玉米、高粱、小麦、大麦、拟南芥、豌豆的 waxy 基因的密码子用法进行
了分析。结果表明:单子叶植物与双子叶植物 waxy 基因的密码子用法差异较大,前者偏向于使用以 G
或 C 碱基结尾的密码子,后者则偏向于使用以 A 或 T 碱基结尾的密码子。不同物种的 waxy 基因在密
码子用法差异上表现为,进化上亲缘关系越近的物种其基因密码子用法越相似。因此,基于基因密码子
用法的研究,可作为目前各种系统发育分析方法的重要补充,用于物种进化关系和分子进化机制研究。
关键词:waxy 基因;密码子偏爱性;GC 含量
CHARACTERIZATION OF CODON USAGE OF waxy GENES IN SEVERAL PLANTS
LIU Han-mei1,2 ZHAO Yao2 GU Yong2 ZHANG Huai-yu1 HUANG Yu-bi2
(1 . College of Life Sciense,Sichuan Agriculture University,Ya’an,Sichuan 625014;
2 . Maize Research Institute,Sichuan Agriculture University,Ya’an,Sichuan 625014)
Abstract:Because of degeneracy of genetic codons,synonymous codons usage patterns can significantly vary among
genomes,even often among genes within a single genome. In this study,codon usage of waxy genes in rice,maize,
sorghum,wheat,barley,Arabidopsis thaliana and pea were analyzed by software Codon W. The results showed that
codon bias of waxy in monocots were different from that of dicots. In monocots,waxy genes prefer to the codons with C
or G at the synonymous position. But they prefer to the codons ending with A or T in dicots. And it was found that the
relationships of species were more closely,and the codon usage patterns of waxy were more similar. So the analysis of
codon usage was an important and supplementary method to phylogenetic research,and was used to the investigation of
the evolutionary relation and molecular mechanism.
Key words:waxy genes;codon bias;GC content
收稿日期:2009-12-31 接受日期:2010-03-10
基金项目:四川省教育厅重点项目资助(2006A018)
作者简介:刘汉梅(1978-),女,重庆铜梁人,讲师,主要从事作物分子生物学和生物信息学研究。E-mail:hanmeil@ 163. com
通讯作者:黄玉碧(1963-),男,四川西充人,教授,博导,主要从事作物遗传育种与分子生物学研究。E-mail:yubihuang@ sina. com
编码同一种氨基酸的密码子称为同义密码子
(synonymous codon)。每种氨基酸可由 1 至多个密码
子(最多 6 个)编码,此即密码子的简并性。不同物种
或同一物种的不同基因对同义密码子的使用并不是完
全均衡的,经过长期进化,这些基因都会形成对特定的
同义密码子的使用偏爱,称为密码子偏性(codon
bias)。进一步的研究发现,不同的密码子使用模式与
基因的碱基组成[1]、基因表达水平[2]、tRNA 的丰富
度[3]、基因长度[4]、编码蛋白质的结构和功能[5]、以及
密码子 - 反密码子间结合能的大小[6]等有关。因此
开展同义密码子使用偏爱性研究将对新基因的预测、
基因功能和表达调控机制及分子进化研究等具有重要
指导意义。
植物淀粉颗粒紧密结合型淀粉合成酶(Granule-
Bound Starch SynthaseⅠ,GBSSⅠ)由 waxy 基因编码,
主要在贮藏器官中表达,控制种子胚乳等部位直链淀
674
3 期 几种植物 waxy 基因的密码子用法特性分析
粉的合成[7]。如果 waxy 基因发生缺失、突变或 GBSS
Ⅰ酶活性降低,将导致胚乳直链淀粉合成受阻,含量降
低。如水稻、小麦、玉米等禾谷类作物的 waxy 突变体
和 GBSSⅠ反义的转基因植株,其籽粒淀粉中直链和支
链淀粉比例,以及支链淀粉结构等均发生不同程度的
改变,进而改变了淀粉的糊化和膨胀等特性,从而决定
其在食品、制药、工业等领域有着不同的用途[8]。
笔者所在课题组对糯玉米的起源、进化和糯质表
现型的分子机制等进行了大量研究[8 ~ 10],在此过程中
发现玉米 waxy 基因编码区的 GC 含量较高,导致引物
设计、PCR 扩增和测序等比较困难,推测可能存在较
强的密码子使用偏爱性。因此本文将对来源于水稻、
玉米、高粱、小麦、大麦 5 种单子叶植物和拟南芥、豌豆
2 种双子叶植物的 waxy 基因的密码子使用特性进行
分析,并用聚类分析的方法比较各物种 waxy 基因密码
子用法的差异,为未来深入开展禾谷类作物 waxy 基因
的表达、结构和功能研究提供基础数据。
1 材料和方法
1 . 1 序列数据
本研究采用的 waxy 基因序列来源于 GenBank
(Release 164),不同植物的 waxy 基因在 NCBI 数据库
(http:/ /www. ncbi. nlm. nih. gov)的登录号见表 1。
表 1 waxy 基因序列登录号
Table 1 The accession number of waxy genes
序列登录号
accession number
物种
species
AF031162 水稻 rice
X03935 玉米 maize
U23945 高粱 sorghum
AB019622 小麦 wheat-7A
AB019623 小麦 wheat-4A(易位自 7B 染色体)
AB019624 小麦 wheat-7D
AB088761 大麦 barley
X88789 豌豆 pea
AY094405 拟南芥 Arabidopsis thaliana
1 . 2 方法
1. 2. 1 同义密码子使用偏爱性分析 下载各基因的
全长编码区序列(coding DNA sequence,简称 CDS),包
括起始密码子和终止密码子,运用软件 Codon W
(version 1. 4, http:/ / bioweb. pasteur. fr / seqanal /
interfaces / codonw. html)计算以下衡量同义密码子使用
偏性的参数:(1)有效密码子数(ENC,effective number
of codons),该值被认为是在评价基因整体密码子偏爱
性用法中最具参考价值的参数之一,目前被广泛用于
评价基因密码子偏爱性,其取值范围为 20(每个氨基
酸只使用一个密码子的极端情况)到 61(各个密码子
均被平均使用)[11]。(2)全长基因 GC 含量和密码子
各位置的 GC 含量(GC1、GC2 和 GC3),GCn 指在密码
子第一、二和三位上的 GC 含量分布。其中 GC1 和
GC2 按定义,用 C 语言编写程序计算。(3)同义密码
子相 对 使 用 度 (RSCU,relative synonymous codon
usage),该值的计算方法为某一密码子所使用的频率
与其在无偏使用时预期频率之间的比值,若某一密码
子的 RSCU 值等于 1,则表明该密码子的使用没有偏
爱;RSCU 值大于 l,表明该密码子的使用频率相对较
高,小于 1 则表明使用频率低。它去除了氨基酸组成
对密码子使用的影响,且直观地反映了密码子使用的
偏爱性[12]。
1. 2. 2 基于密码子使用偏性的聚类 利用 SPSS 16. 0
对 9 条 waxy 基因进行基于密码子使用偏性的聚类。
在对基因密码子使用概率分析时,将每一条基因作为一
个对象,相对密码子使用度作为变量。采用 59 个同义
密码子[去除编码蛋氨酸(M)的密码子 AUG 和编码色
氨酸(W)的密码子 UGG 以及 3 个终止密码子]的 RSCU
值对其密码子使用偏性进行分析。基因间的距离规定
为同义密码子相对使用度的欧拉平方距离[13]。对于基
因 a 与基因 b,其密码子使用距离的计算公式为:
Dab = Σ
59
j = 1
(RSCUaj - RSCUbj)槡
2
把两两序列的距离计算出来后,构建距离系数矩
阵,并进行基于该系数的聚类分析。
2 结果与分析
2 . 1 有效密码子数与密码子的碱基组成
各物种 waxy 基因的 ENC 值、总的 GC 含量和密码
子各位置的 GC 含量计算结果见表 2。结果显示,水
稻、玉米、高粱、小麦、大麦单子叶植物 waxy 基因的
ENC 值均小于 40,表明它们具有较强的密码子使用偏
爱性;而双子叶植物拟南芥、豌豆的 ENC 值较高,均大
于 50,表明其密码子使用的偏爱性较弱。进一步分析
来源于不同物种 waxy 基因 GC 含量发现,单子叶植物
全长 waxy 基因的 GC 含量较高,都在 0. 6 以上,而双
子叶植物豌豆和拟南芥 GC 含量较低,分别为 0. 432
和 0. 452。从密码子 3 个位置的 GC 含量来看,单子叶
植物密码子 3 个位置的 GC 含量均高于双子叶植物。
在单子叶植物中,waxy 基因的 GC 含量均呈 GC3 >
GC1 > GC2 这一规律,且密码子第 3 位的 GC 含量远高
774
核 农 学 报 24 卷
于第 1、2 位。而在双子叶植物中,GC1 最高,GC2 和
GC3 均较低。由此可见,禾本科作物与双子叶植物
waxy 的密码子用法明显不同,禾本科作物 waxy 基因
中绝大部分密码子第 3 位分布的是 G 或 C 碱基,双子
叶植物分布的是 A 或 T 碱基。
表 2 waxy 基因的有效密码子数和 GC 含量
Table 2 The ENC values and content of GC for waxy genes in seven species
物种
species
有效密码子数
ENC
全长 CDS 的 GC 含量
GC
密码子第一位 GC 含量
GC1
密码子第二位 GC 含量
GC2
密码子第三位 GC 含量
GC3
水稻 rice 38. 89 0. 617 0. 582 0. 438 0. 824
玉米 maize 33. 25 0. 663 0. 617 0. 442 0. 925
高粱 sorghum 37. 45 0. 639 0. 606 0. 438 0. 867
小麦 wheat_7A 35. 1 0. 642 0. 608 0. 41 0. 903
小麦 wheat_4A 33. 46 0. 654 0. 609 0. 422 0. 927
小麦 wheat_7D 33. 75 0. 649 0. 608 0. 417 0. 919
大麦 barley 34. 82 0. 641 0. 598 0. 415 0. 905
豌豆 pea 52. 33 0. 432 0. 517 0. 394 0. 366
拟南芥 Arabidopsis thaliana 51. 39 0. 452 0. 534 0. 394 0. 403
2 . 2 同义密码子的使用频率
为了解这几个物种 waxy 基因密码子使用的具体
情况,用 Codon W 计算各基因的 RSCU 值,结果见表
3。水稻有 27 个 RSCU 值大于 l 的密码子(其中 2 个
以 T 碱基结尾,且其 RSCU 值略大于 1),玉米有 26
个,高粱有 25 个,大麦有 26 个,小麦的 3 个 waxy 基因
7A、4A、7D 分别有 26、27 和 27 个,且这些密码子均以
C 或 G 碱基结尾。双子叶植物拟南芥和豌豆分别有
25 和 26 个密码子的 RSCU 值大于 1,它们中绝大部分
以 A 或 T 碱基结尾,仅少数几个同义密码子以 G 或 C
碱基结尾,且其对应的 RSCU 值均小于 2。RSCU 值大
于 1 的密码子为基因的偏爱性密码子,其余的为非偏
爱性密码子。由此可见,单子叶植物 waxy 基因偏爱 G
或 C 结尾的密码子,双子叶植物偏爱 A 或 T 结尾的密
码子。
2 . 3 几个物种 waxy 基因密码子使用频率的差异
为了解几个物种 waxy 基因密码子使用差异的大
小,根据表 3 中各密码子的相对使用度(RSCU),利用
SPSS 计算各物种之间的 waxy 密码子使用偏性的欧氏
距离系数(表 4),并进行基于该系数的聚类分析,聚类
结果如图 1 所示。各物种间的距离系数越大,则表示
它们在密码子使用上的差异越大。由表 4 可知,禾本
科作物与拟南芥、豌豆的 waxy 基因间距离系数较大,
而禾本科作物相互之间及拟南芥与豌豆间的距离系数
较小,表明禾本科植物与双子叶植物间 waxy 基因的密
码子使用差异较大,而单、双子叶植物内部物种间密码
子使用差异较小。基于距离系数的聚类(图 1),5 个
单子叶植物和 2 个双子叶植物各为一类,单子叶植物
中,麦类作物 waxy 基因之间密码子用法差异相对较
小,成为一亚类;高粱和玉米成为一亚类;最后再与密
码子用法差异稍大的水稻成为一类。这一聚类结果与
基于 waxy 基因所编码蛋白序列构建的系统发育树
(图 2,首先用 ClustalX 进行多序列比对,然后导入
Mega 4. 0,用 UPGMA 法构建而成)分支结果大体一
致,将单、双子叶植物,以及禾本科植物中的黍亚科、稻
亚科和早熟禾亚科分离。表明 waxy 基因密码子偏爱
性差异大小与物种的亲缘关系远近有关,亲缘关系越
远,waxy 基因密码子偏爱性差异越大,亲缘关系越近,
密码子偏爱性差异越小。
图 1 基于 waxy 相对密码子使用度的聚类图
Fig. 1 Cluster analysis dendrogram of RSCU for waxy genes
874
3 期 几种植物 waxy 基因的密码子用法特性分析
表 3 各物种 waxy 基因同义密码子的相对使用度
Table 3 The relative synonymous codon usage of waxy genes
氨基酸
amino acid
密码子
codon
水稻
rice
玉米
maize
高粱
sorghum
小麦
wheat-7A
小麦
wheat-4A
小麦
wheat-7D
大麦
barley
拟南芥
Arabidopsis thaliana
豌豆
pea
A(Ala) GCA 0. 39 0. 24 0. 55 0. 24 0. 28 0. 3 0. 36 0. 88 1. 24
A GCC 1 . 64 1 . 94 1 . 85 2 . 2 2 . 32 2 . 07 2 . 14 0. 48 1 . 05
A GCG 1 . 25 1 . 58 1 . 29 1 . 25 1 . 19 1 . 26 1 0. 4 0 . 29
A GCT 0. 72 0. 24 0. 31 0. 31 0. 21 0. 37 0. 5 2. 24 1. 43
C(Cys) TGC 1 . 6 1 . 83 1 . 85 2 2 2 2 0. 67 0. 6
C TGT 0. 4 0. 17 0. 15 0 0 0 0 1. 33 1. 4
D(Asp) GAC 1 . 64 1 . 87 1 . 7 1 . 89 1 . 83 1 . 78 1 . 83 0. 88 0. 57
D GAT 0. 36 0. 13 0. 3 0. 11 0. 17 0. 22 0. 17 1. 12 1. 43
E(Glu) GAA 0. 23 0. 26 0. 26 0. 22 0. 16 0. 17 0. 16 1. 11 1. 29
E GAG 1 . 77 1 . 74 1 . 74 1 . 78 1 . 84 1 . 83 1 . 84 0. 89 0. 71
F(Phe) TTC 1 . 91 2 1 . 91 1 . 67 1 . 83 1 . 91 1 . 6 1 . 31 1 . 23
F TTT 0. 09 0 0. 09 0. 33 0. 17 0. 09 0. 4 0. 69 0. 77
G(Gly) GGA 0. 79 0. 5 0. 69 0. 38 0. 22 0. 15 0. 44 1 . 8 1 . 63
G GGC 2 . 21 2 . 57 2 . 48 2 . 42 2 . 3 2 . 4 2 . 25 0. 39 0. 59
G GGG 0. 43 0. 86 0. 76 1. 06 1. 26 1. 31 1. 02 0. 55 0. 74
G GGT 0. 57 0. 07 0. 07 0. 15 0. 22 0. 15 0. 29 1 . 25 1 . 04
H(His) CAC 1 . 25 2 1 . 78 1 . 8 1 . 78 1 . 78 1. 78 1 1
H CAT 0. 75 0 0. 22 0. 2 0. 22 0. 22 0. 22 1 1
I(Ile) ATA 0 0 0. 1 0. 12 0 0. 11 0 0. 43 1
I ATC 3 3 2 . 79 2 . 88 2 . 88 2 . 67 2 . 78 1 . 03 0. 77
I ATT 0 0 0. 1 0 0. 12 0. 22 0. 22 1 . 54 1 . 23
K(Lys) AAA 0. 15 0 0. 06 0. 05 0. 05 0. 11 0. 05 1 . 02 1 . 12
K AAG 1 . 85 2 1 . 94 1 . 95 1 . 95 1 . 89 1 . 95 0. 98 0. 88
L(Leu) CTA 0. 13 0. 13 0. 49 0. 12 0. 12 0. 12 0. 12 0. 67 0. 35
L CTC 3 . 19 3 . 19 2 . 45 2 . 88 3 . 24 2 . 94 2 . 88 0. 93 0. 58
L CTG 1 . 91 2 . 43 2 . 45 2 . 4 2 . 04 2 . 33 2 . 04 0. 67 0. 81
L CTT 0. 64 0. 13 0. 37 0. 48 0. 36 0. 49 0. 72 2 1 . 85
L TTA 0 0 0 0 0 0 0 0. 4 0. 69
L TTG 0. 13 0. 13 0. 24 0. 12 0. 24 0. 12 0. 24 1 . 33 1 . 73
N(Asn) AAC 1 . 67 2 1 . 71 1 . 91 2 1 . 71 1 . 91 1 . 3 0. 9
N AAT 0. 33 0 0. 29 0. 09 0 0. 29 0. 09 0. 7 1. 1
P(Pro) CCA 0. 47 0. 77 0. 36 0. 39 0. 65 0. 4 0. 26 2 1 . 73
P CCC 1 . 18 1 . 16 1 . 21 1 . 55 1 . 68 1 . 73 1 . 81 0. 31 0. 53
P CCG 1 . 29 1 . 68 1 . 82 1 . 81 1 . 68 1 . 87 1 . 81 0. 62 0. 4
P CCT 1 . 06 0. 39 0. 61 0. 26 0 0 0. 13 1 . 08 1 . 33
Q(Gln) CAA 0 0 0 0. 11 0. 22 0. 11 0. 11 0. 9 1 . 18
Q CAG 2 2 2 1 . 89 1 . 78 1 . 89 1 . 89 1. 1 0. 82
R(Arg) AGA 0. 18 0. 16 0. 19 0. 17 0 0 0 2 . 4 3
R AGG 3 . 09 2 . 11 1 . 88 2 . 06 2 2 . 06 2 . 36 1 . 2 0. 75
R CGA 0 0. 16 0. 19 0. 17 0 0 0 0. 48 0. 75
R CGC 0. 91 2 . 81 2 . 25 2 . 06 2 . 23 2 . 06 2 0. 24 0
R CGG 0. 73 0. 97 0. 75 1. 37 1. 54 1. 71 1. 45 0. 72 0
R CGT 1 . 09 0. 16 0. 75 0. 17 0. 17 0. 17 0. 18 0. 96 1. 5
S(Ser) AGC 2 . 74 2 . 81 2 . 62 3 3 2 . 9 2 . 48 0. 6 1. 11
S AGT 0 0 0 0 0. 2 0. 21 0. 21 0. 75 0. 95
S TCA 0. 34 0 0. 56 0 0 0 0 0. 75 1 . 74
S TCC 1 . 37 1 . 88 1 . 5 1 . 93 2 . 2 2 . 07 2 . 28 1 . 5 0. 63
S TCG 1. 2 1. 12 0. 94 0. 64 0. 6 0. 41 0. 62 0 0. 32
S TCT 0. 34 0. 19 0. 38 0. 43 0 0. 41 0. 41 2 . 4 1 . 26
T(Thr) ACA 0 0. 16 0. 16 0. 14 0 0 0 1 . 24 0. 65
T ACC 2 . 07 2 . 24 2 . 08 2 . 29 2 . 43 2 . 71 2 . 29 0. 55 0. 65
T ACG 1 . 24 1 . 6 1 . 44 0. 86 1 . 43 1 . 14 1 . 57 0. 14 0. 65
T ACT 0. 69 0 0. 32 0. 71 0. 14 0. 14 0. 14 2 . 07 2 . 06
V(Val) GTA 0 0 0 0 0. 07 0 0 0. 38 0. 83
V GTC 1 . 6 2 . 18 2 . 24 1 . 77 1 . 86 1 . 76 1 . 78 0. 69 0. 17
V GTG 1 . 84 1 . 6 1 . 52 2 . 03 2 2 . 03 2 . 22 1 . 31 1 . 25
V GTT 0. 56 0. 22 0. 24 0. 2 0. 07 0. 2 0 1 . 62 1 . 75
Y(Tyr) TAC 1 . 81 2 1 . 9 1 . 67 1 . 79 2 1 . 89 1 . 05 0. 9
Y TAT 0. 19 0 0. 1 0. 33 0. 21 0 0. 11 0. 95 1 . 1
注:大于 l 的 RSCU 值用黑体字表示。
Note:Bold data means the RSCU value is more than 1.
974
核 农 学 报 24 卷
表 4 各物种 waxy 基因间相对密码子使用度的欧氏距离系数
Table 4 Coefficient of Squared Euclidean distance of codon usage bias between samples of waxy genes
水稻
rice
玉米
maize
高粱
sorghum
小麦
wheat-7A
小麦
wheat-4A
小麦
wheat-7D
大麦
barley
拟南芥
Arabidopsis thaliana
豌豆
pea
水稻 rice —
玉米 maize 3. 333 —
高粱 sorghum 2. 721 1. 776 —
小麦 wheat-7A 2. 999 1. 981 2. 003 —
小麦 wheat-4A 3. 399 1. 831 2. 402 1. 369 —
小麦 wheat-7D 3. 374 2. 141 2. 328 1. 302 1. 132 —
大麦 barley 3. 081 2. 221 2. 292 1. 479 1. 289 1. 304 —
拟南芥 Arabidopsis thaliana 8. 318 9. 781 8. 841 9. 159 9. 648 9. 455 9. 180 —
豌豆 pea 8. 749 10. 288 9. 199 9. 696 10. 138 10. 008 9. 793 3. 062 —
图 2 基于 waxy 基因编码蛋白质序列分析所得的进化分支图
Fig. 2 A dendrogram of protein sequences encoding by waxy genes
3 讨论
影响密码子使用的因素很多,如基因碱基组成、表
达水平等[1,2]。本文对控制植物贮藏器官直链淀粉合
成的关键基因 waxy 密码子的用法分析发现,禾本科单
子叶植物 waxy 基因的 GC 含量高,按 Wang 等[14,15]的
分类,属于高 GC 含量基因。而双子叶植物 waxy 基因
GC 含量低,拟南芥 waxy 基因接近于其基因组 GC 含
量平均值(44. 5%)。进一步分析发现,该基因无论在
单子叶还是双子叶植物中,每个氨基酸在同义密码子
的使用上都存在明显的偏爱性,单子叶植物主要偏爱
于使用以 C 或 G 结尾的密码子,少量或避免使用以 A
或 T 结尾的密码子,而双子叶植物则相反。该基因在
单、双子叶植物中所呈现的密码子用法差异与前人报
道的单、双子叶植物基因组密码子偏爱特性趋势一
致[16,17]。因此推测,单、双子叶植物 waxy 基因密码子
用法偏性可能主要受物种自身基因组环境如基因组的
碱基组成等的影响,具有种族特异性。
密码子使用偏性产生的生物学基础目前还不很清
楚,近几年研究者通过对模式生物的密码子用法研究,
表明同义密码子使用偏性主要由突变偏性、翻译选择
或两者共同作用产生[18]。从以上分析可知,单、双子
叶植物分化后,waxy 基因的碱基组成发生了较大变
化。Kawabe 等[19]分析了 3 种双子叶植物和 4 种单子
叶植物基因组的密码子用法,发现单子叶植物基因组
GC 含量高于双子叶植物。可能正是单子叶植物基因
组内,很多基因都像 waxy 基因一样,在单、双子叶植物
分化后发生了碱基组成变化,而导致全基因组的整体
GC 含量增加。用突变偏性、翻译选择都不能很好地解
释 waxy 等基因的碱基组成变化和密码子使用偏性的
产生,因为笔者发现除 waxy 基因外,控制植物淀粉合
成的其他基因如编码可溶性淀粉合成酶、淀粉分支酶
和去分支酶等基因在单、双子叶植物中的密码子用法
并没有明显差异。那么引起 waxy 基因这一变化的驱
动力是什么,如何演变的等问题还需进一步研究。
基因完整编码序列中的密码子用法在分子进化中
是一种重要的进化现象,从原核生物到真核生物都广
泛存在。密码子是蛋白质编码基因中的基本结构单
位,可以从各个角度对曾经发生的进化事件进行一定
084
Journal of Nuclear Agricultural Sciences
2010,24(3):476 ~ 481
推测,揭示暗藏于基因组内部或基因组间的演化关系。
不同物种或同一物种的不同基因对密码子的用法特征
有所不同,这种密码子使用偏爱性差异大小与物种的
亲缘关系远近有关,亲缘关系越远,密码子偏爱性差异
越大,越近则差异越小[20 ~ 22]。本研究对 5 个禾本科作
物和 2 个双子叶植物的 waxy 基因密码子用法进行比
较分析,发现单子叶植物间亲缘关系近,密码子用法特
征相似,双子叶植物相互之间也相似。但单子叶植物
与双子叶植物相比,密码子用法差异大。以上结果也
表明物种间亲缘关系越近,其 waxy 基因的密码子使用
差异越小。基于密码子用法差异进行的聚类分析与通
过蛋白质序列构建的系统发育树显示的各物种间的进
化距离远近关系大体一致,也表明在基因类型和功能
一定的情况下,进化上亲缘关系较近的物种间,同义密
码子的用法越相似。因此在目前基于分子序列的系统
发育分析中,基于编码区密码子使用信息的聚类分析
可为系统发育分析提供可靠信息,可作为目前各种系
统发育分析方法的重要补充,用于物种进化关系和分
子进化机制研究。
基于基因密码子用法的聚类分析与基于蛋白质序
列的进化分析结果可能存在一定差异。本文中,从图
1 和图 2 可以看出,小麦的 3 个 waxy 基因和大麦基因
在 2 个图上的位置不同,同时水稻位置也有差异。分
析导致该现象的可能原因是样本数量太少。本研究仅
选取了 1 个基因,而不是多个基因作为分析样本,存在
一定的系统误差。单基因在进化上有可能存在较大的
突变,导致其密码子使用偏爱性发生较大变化,而表现
出与真实的分类地位存在差异。如果选取多个基因进
行分析,则可消除这种系统误差,得出更为合理的系统
树。
参考文献:
[1 ] Carlini D B,Chen Y,Stephan W. The relationship between third-
codon position nucleotide content,codon bias,mRNA secondary
structure and gene expression in the drosophild alcohol
dehydrogenase genes Adh and Adhr[J]. Genetics,2001,159(2):
623 - 633
[2 ] Karlin S,Campbell A M,Mrazek J. Comparative DNA analysis across
diverse genomes[J]. Annu Rev Genetics,1998,32:185 - 225
[3 ] Moriyama E N,Powell J R. Codon usage bias and tRNA abundance
in Drosophila[J]. J Mot Evol,1997,45(5):514 - 523
[4 ] Moriyama E N,Powell J R. Gene length and codon usage bias in
Drosophila melanogaster,Saccharomyces cerevisiae and Escherichia
coli[J]. Nucleic Acids Res,1998,26(13):3188 - 3193
[5 ] Gupta S K,Bhattacharya T K,Bhattacharya T K. Studies on the
relationships between the synonymous codon usage and protein
secondary structural units [J]. Biochemical and Biophysical
Research Communications 2000,269:692 - 696
[6 ] 刘次全,谢 君,柳树群,梁宠荣,黄京飞,石秀凡 .人类基因中同
义密码子的偏好与密码子 -反密码子间的结合强度密切相关吗
[J].科学通报,2000,45(23):2520 - 2525
[7 ] 杨荣光,戴忠民,王洪明,于 静,李培和,李振清,吴泽金 . 植物淀
粉生物合成的研究进展[J]. 安徽农业科学,2007,35(28):
8791 - 8793.
[8 ] 田孟良,黄玉碧,谭功燮,刘永建,荣廷昭 . 西南糯玉米地方品种
waxy 基因序列多态性分析[J]. 作物学报,2008,34(5):729 -
736
[9 ] Tian Menglaing,Tan Gongxie,Liu Yongjian,Rong Tinzhao,Huang
Yubi. Origin and evolution of Chinese waxy maize:evidence from
the Globulin-1 gene [J]. Genet Resour Crop Evol,2009,56(2):
247 - 255
[10] Liu Yongjian,Huang Yubi,Rong Tingzhao,Tian Mengliang,Yang
Junpin. Comparative analysis of genetic diversity in landraces of waxy
maize from yunnan and Guizhou using SSR markers [J ].
Agricultural Sciences in China,2005,4(9):648 - 653
[11] Wright Frank. The“effective number of codons” used in a gene
[J]. Gene,1990,87(1):23 - 29
[12] Sharp P M,Li W H. An evolutionary perspective on synonymous
codon usage in unicellular organisms[J]. J Mol Evol,1986,24:28
- 38
[13] Das S,Paul S,Dutta C. Synonymous codon usage in adenoviruses:
influence of mutation,selection and protein hydropathy [J]. Virus
Res,2006,117(2):227 - 236
[14] Wang H C,Hickey D A. Rapid divergence of codon usage patterns
within the rice genome[J]. BMC Evol Biol,2007,7 Suppl 1:S6
[15] Liu H,He R,Zhang H,Huang Y,Tian M,Zhang J. Analysis of
synonymous codon usage in Zea mays[J]. Mol Biol Rep,2010,37
(2):677 - 684
[16] Wang L, Roossinck MJ. Comparative analysis of expressed
sequences reveals a conserved pattern of optimal codon usage in
plants[J]. Plant Mol Biol. 2006,61(4 - 5):699 - 710
[17] 刘汉梅,何 瑞,赵 耀,张怀渝,黄玉碧,玉米密码子用法分析
[J]. 核农学报,2008,22(2):141 - 147
[18] Liu Q,Feng Y,Zhao X,Dong H,Xue Q. Synonymous codon usage
bias in Oryza sativa. [J]. Plant Science,2004,167:101 - 105
[19] Kawabe A,Miyashita N T. Patterns of codon usage bias in three
dicot and four monocot plant species [J]. Genes Genet Syst.,
2003,78(5):343 - 352.
[20] 刘庆坡,冯 英,董 辉,20 个物种同义密码子偏性的比较分析
[J].西北农林科技大学学报(自然科学版),2004,32(7):67 -
71
[21] 张晓峰,薛庆中 . 水稻和拟南芥 NBS-LRR 基因家族同义密码子
使用偏好的比较[J].作物学报,2005,31(5):596 - 620
[22] 吴宪明,吴松锋,任大明 .密码子偏性的分析方法及相关研究进
展[J].遗传,2007,29 (4):420 - 426
(责任编辑 王媛媛)
184