免费文献传递   相关文献

毛果杨HMA基因家族的生物信息学分析



全 文 :植物生理学报 Plant Physiology Journal 2014, 50 (7): 891~900  doi: 10.13592/j.cnki.ppj.2014.0037 891
收稿 2014-02-12  修定 2014-04-15
资助 北京市自然科学基金项目(5122019)。
* 通讯作者(E-mail: jcxu282@sina.com; Tel: 010-62336628)。
毛果杨HMA基因家族的生物信息学分析
王晓桐, 李昊阳, 徐吉臣∗
北京林业大学林木育种国家工程实验室, 北京100083
摘要: 重金属转运ATP酶(heavy metal transporting ATPase, HMA)是一种通过水解ATP跨膜运送重金属阳离子的转运蛋白, 属
于P-ATPase家族中一个亚类。不同HMA蛋白对重金属离子的转运具有选择性, 在植物修复重金属污染土壤方面起着重要
作用。依据毛果杨全基因组测序的结果, 以及HMA基因蛋白的序列和功能特征, 从毛果杨基因组中鉴定了13个HMA基因
家族成员, 分属于Zn亚类(Zn2+/Co2+/Cd2+/Pb2+P1B-ATPase)和Cu亚类(Cu
+/Ag+P1B-ATPase)两个亚家族, 主要分布于1、3号染色
体上。生物信息学分析表明, 毛果杨HMA基因的氨基酸序列一致性介于21.3%~89.3%, 且具有保守的基序CPC、HP、DK-
TGT、TGEx、GDG、PxD和CxxC等。蛋白理化特征分析显示, 多数毛果杨HMA蛋白稍偏酸性, 结构稳定性较好, 蛋白脂
溶指数高, 稍具疏水性。密码子偏好性分析显示, 毛果杨HMA蛋白14个氨基酸中存在16个高频密码子, 另有1个终止密码
子为高频密码子, 显示出毛果杨的种属特征。研究结果展示了毛果杨HMA基因家族的基本信息和特点, 为深入研究毛果杨
HMA基因的功能搭建了基础平台。
关键词: 杨树; 重金属转运ATP酶; 植物修复; 基因家族; 生物信息学
Bioinformatics Analysis of the Heavy Metal Transporting ATPase Gene Family
in Poplar Genome
WANG Xiao-Tong, LI Hao-Yang, XU Ji-Chen*
National Engineering Laboratory for Tree Breeding, Beijing Forestry University, Beijing 100083, China
Abstract: Heavy metal transporting ATPases (HMA) is a kind of protein transporting the heavy metal ions
across membranes through ATP hydrolysis, which belong to the large P-type ATPase family. Each HMA protein
transports the heavy metal ions selectively. They might play an important role in phytoremediation for contami-
nated soil. Based on the sequence and function characteristics of HMA, 13 HMA genes members were identi-
fied from the sequence database of Populus trichocarpa, those were classified into Zn (Zn2+/Co2+/Cd2+/Pb2+) and
Cu (Cu+/Ag+) subfamily, respectively. Most of the genes were anchored on the chromosome 1 and 3. Sequence
alignment showed that the identity of amino acid among HMA genes is between 21.3% and 89.3%, also with
several conserved motifs such as CPC, HP, DKTGT, TGEx, GDG, PxD and CxxC. Most of HMA proteins have
a little acidic and hydrophobic, stable space structure and higher aliphatic index. The codon usage of HMA
genes in Populus trichocarpa also displayed the feature in space, which having 16 codons for 14 amino acids
and 1 codon for termination as the high-frequency codons. The results here revealed the basic information of
poplar HMA family that would be a well platform for the further gene function study in future.
Key words: poplus; heavy metal transporting ATPases (HMA); phytoremediation; gene family; bioinformatics
P1B-ATPase的作用机制类似于Ca
2+-ATP酶
(SRCa2+-ATPase)运输Ca2+的过程, 即通过水解ATP
跨膜运送阳离子 , 属于P - AT P a s e中一个亚类
(Palmgren和Harper 1999; Axelsen和Palmgren 2001)。
P1B-ATPase蛋白可以选择性吸收和运输植物生长
发育必需的金属离子(Cu+、Cu2+、Zn2+和Co2+)以
及一些非必需的重金属离子(Cd2+和Pb2+), 因此又
称为重金属转运ATP酶(heavy metal transporting
ATPase, HMA) (Argüello等2007), 在重金属的抗
性、吸收、转运过程中起着重要的作用, 是植物
修复重金属污染土壤不可或缺的组成部分。Morel
等(2009)研究发现, 过量表达AtHMA3可以提高拟
南芥植株对Cd、Zn 和Pb的耐受性, Cd的吸收量较
野生型增加了2~3倍。Papoyan和Kochian (2004)将
研究报告 Original Papers
植物生理学报892
遏蓝菜TcHMA4基因转至酵母中, 基因表达菌株对
重金属Cd和Pb离子的输出能力分别提高了70%和
50%。Adams等(2011)在毛果杨中研究了PtHMA4基
因的功能, 在低浓度Zn胁迫下, 过表达株系的生根
比例明显高于对照。其他一些分析研究的低等和
高等植物品种包括绿藻(Chlamydomonas rein-hardtii)
(CrHMA1~3) (Williams和Mills 2005)、水稻(Oryza
sativa) (OsHMA1~9) (Lee等2007)、拟南芥(Arabi-
dopsis thaliala) (AtHMA1~8) (Hussain等2004; Puig等
2007)、鼠耳芥(Arabidopsis haller) (AhHMA3、4)
(Cobbett等2003; Courbot等2007)和遏蓝菜(Thlaspi
caerulescens) (TcHMA4) (Bernard等2004)等。
杨树是木本植物的模式物种, 是常用的绿化
及用材树种, 易于杂交和无性繁殖, 具有生长迅
速、生物量大等特点。大量研究表明(Gu等2007;
Zacchini等2009), 杨树可富集大量重金属尤其是Cd
和Zn, 其根、叶中Cd的富集浓度可达到9 962和
514.08 mg·kg-1。比较而言, 一些绿化草本植物如
麦冬(Ophiopogon japonicus)、红花酢浆草(Oxalis
rubra)、黑麦草(Lolium perenne)、草地早熟禾(Poa
pratensis)等对Cd的吸收量介于4~45 mg·kg-1(李艳
和卜现亭2011)。因此, 杨树在重金属污染土壤的
修复领域备受关注。张春燕等(2013)研究了Cd、
Zn、Pb复合污染对不同杨树品系生物量、重金属
吸收量、富集系数(bioconcen-tration factors, BCF)
和转运系数(transfer factors, TF)的影响, 发现不同
品系、不同组织器官对不同重金属的反应均存在
显著的差异, 品系61-1叶片中Cd和Zn的含量分别
达到29.23和1 410 mg·kg-1。
杨树基因组于2006年完成了测序工作(Tuskan
等2006)。大量遗传信息的获得, 为系统解析杨树
修复重金属污染土壤的机制, 促进杨树在植物修复
领域更为广泛的应用奠定了基础。本研究拟根据
已公开的毛果杨(Populus trichocarpa)全基因组测
序结果, 鉴定毛果杨HMA基因家族成员, 剖析毛果
杨HMA基因的分布、序列特征、密码子偏好性等
生物学信息, 以期全面了解毛果杨HMA基因的特
点, 为后续基因功能的研究及应用搭建基础平台。
材料与方法
1 材料
毛果杨(Populus trichocarpa Torr. & Gray)、拟
南芥(Arabidopsis thaliala L.)、水稻(Oryza sativa
L.) HMA家族成员基因序列信息下载于Phytozome
(Goodstein等2012) (http://www.phytozome.net)。相
关网站还包括美国国立生物技术信息中心数据库
(NCBI) (http://www.ncbi.nlm.nih.gov/)。
2 方法
2.1 毛果杨中HMA基因的确认与分类
根据已报道的拟南芥基因组中已确定的HMA
基因家族成员的序列进行结构域分析, 确定HMA
基因家族的基本特征, 以此为基础从毛果杨序列
库中筛选HMA家族成员。
2.2 HMA家族基因的染色体物理定位
利用Phytozome数据库中毛果杨HMA基因染
色体物理定位的信息, 使用Map Draw软件(刘仁虎
和孟金陵2003)在毛果杨染色体上绘制HMA基因
分布图。
2.3 HMA蛋白序列分析
采用生物信息学软件DNAMAN v7.0对毛果
杨HMA家族成员进行相似性比对及进化树构建;
使用密码子分析软件CodonW v1.4.4 (Peden 2000)
及EMBOSS在线版中的CHIPS程序对毛果杨HMA
密码子偏好性(codon usage bias)进行统计分析; 通
过在线软件WebLogo 3 (Crooks等2004)以及Prot-
Param (Walker 2005)对毛果杨HMA的氨基酸保守
性、蛋白理化性质等进行分析。
实验结果
1 毛果杨HMA基因的鉴定及染色体分布
对拟南芥8个HMA家族成员进行序列比较和
功能分析, 发现可以分为两大类群, 即转运Cu+/Ag+
的Cu亚类(AtHMA5~AtHMA8)和转运Zn2+/Co2+/
Cd2+/Pb2+的Zn亚类(AtHMA1~AtHMA4)。Cu亚类
成员中具有E1-E2 ATPase (PF00122)、heavy-
metal-associated domain (PF00403)、haloacid
dehalogenase-like hydrolase (PF00702) 3种结构域,
Zn亚类中具有E1-E2 ATPase和haloacid dehalogenase-
like hydrolase 2种结构域(AtHMA1、2、4), 或只具
有1种E1-E2 ATPase结构域(AtHMA3)。根据这一
规律在数据库Phytozome中搜索毛果杨的HMA基
因, 获得Cu亚类的9个以及Zn亚类的18个HMA基因
候选序列。进一步利用报道的HMA家族所特有的
CPx/SPx (Cys/Ser-Pro-x, Cys/His/Ser)和HP (His-
王晓桐等: 毛果杨HMA基因家族的生物信息学分析 893
Pro)基序(Solioz和Vulpe 1996)进行比对验证, 发现
吻合的HMA家族Zn亚类成员4个, 分别命名为PtH-
MA1~4, Cu亚类的成员9个, 分别命名为PtHMA5~
13 (图1)。
对毛果杨HMA基因序列统计分析显示, HMA
基因大小跨度较大, 在基因组中的长度介于3 070~
30 833 bp, 外显子的长度介于1 350~3 687 bp (表1),
包含的内含子数量5~16个。
表1 毛果杨HMA基因家族成员信息
Table 1 The information of HMA genes in P. trichocarpa
基因分类 数据库编号 基因名称
基因大小(内含子
基因大小(外显子)/bp 内含子数量
+外显子)/bp
Zn亚类 Potri.007G049000 PtHMA1 9 095 2 502 12
Potri.006G220200 PtHMA2 5 975 1 350 10
Potri.003G204800 PtHMA3 3 070 1 881 7
Potri.006G076900 PtHMA4 8 456 3 687 10
Cu亚类 Potri.001G019100 PtHMA5 5 750 2 925 7
Potri.001G105800 PtHMA6 4 746 2 958 5
Potri.001G158900 PtHMA7 10 613 3 033 8
Potri.001G205400 PtHMA8 26 961 2 424 15
Potri.003G024000 PtHMA9 30 833 2 427 15
Potri.003G075700 PtHMA10 9 091 3 027 8
Potri.003G125600 PtHMA11 4 433 2 964 5
Potri.003G125700 PtHMA12 5 181 2 952 5
Potri.018G047800 PtHMA13 9 133 2 670 16
图1 毛果杨HMA基因结构域分布
Fig.1 Distribution of the structural domain from HMA genes in P. trichocarpa
绿色: heavy-metal-associated domain结构域; 蓝色: E1-E2 ATPase结构域; 黄色: haloacid dehalogenase-like hydrolase结构域。
植物生理学报894
利用Phytozome数据库中毛果杨HMA基因染
色体物理定位的信息, 确认毛果杨13个HMA基因
成员分别位于杨树19条染色体中的第1、3、6、
7、18号染色体上, 其中第1、3号染色体上的HMA
基因分布较多, 分别含有4个和5个, 显示HMA基因
在毛果杨染色体上的分布并不是随机的(图2)。
2 毛果杨HMA基因序列相似性比较
对13个毛果杨HMA基因序列比较发现(表2),
表2 毛果杨HMA家族成员一致性比较
Table 2 Homologous rate among HMA genes in P. trichocarpa
%
HMA家族成员 PtHMA1 PtHMA2 PtHMA3 PtHMA4 PtHMA5 PtHMA6 PtHMA7 PtHMA8 PtHMA9 PtHMA10 PtHMA11 PtHMA12 PtHMA13
PtHMA1 - 27.50 24.80 21.30 38.70 39.60 38.50 39.50 39.50 38.70 39.00 39.60 37.30
PtHMA2 39.70 - 47.50 27.40 47.60 47.80 45.80 50.00 50.50 46.40 47.30 46.30 90.90
PtHMA3 38.90 41.60 - 26.90 79.70 61.70 56.70 44.90 44.30 57.30 62.10 60.60 46.20
PtHMA4 31.80 31.90 33.10 - 32.10 33.20 33.10 32.60 31.80 33.80 33.50 33.40 31.30
PtHMA5 23.20 40.20 76.40 23.30 - 59.50 53.30 42.90 43.00 53.40 59.40 57.80 42.10
PtHMA6 22.30 40.20 60.90 23.50 54.50 - 53.90 43.40 44.10 54.00 92.80 81.60 41.90
PtHMA7 22.10 41.60 52.00 25.70 46.30 48.70 - 44.40 44.40 92.30 53.70 53.30 41.80
PtHMA8 22.70 48.60 35.00 25.30 32.10 32.70 32.40 - 91.30 44.90 44.00 43.10 51.40
PtHMA9 22.20 49.10 35.00 25.30 32.50 33.20 32.30 89.70 - 44.80 44.20 43.60 51.20
PtHMA10 22.00 41.60 52.30 26.40 46.20 48.80 91.50 32.80 32.90 - 53.90 53.50 41.70
PtHMA11 22.00 40.00 61.20 23.90 54.60 92.90 48.80 33.40 33.40 48.60 - 80.90 42.00
PtHMA12 21.90 38.60 59.60 23.90 52.70 79.80 46.90 33.10 33.10 47.10 79.80 - 40.70
PtHMA13 22.40 89.30 36.50 24.10 30.20 29.10 30.80 45.20 46.10 31.20 29.00 28.10 -
  右上部分为核苷酸序列, 左下部分为氨基酸序列。
图2 毛果杨HMA基因在染色体上的分布
Fig.2 Distribution of the HMA genes on poplar chromosomes
I、III、VI、VII、XVIII分别代表染色体对应序号, 染色体右侧为HMA成员名称, 左侧则为基因间的物理图距/Mb。
王晓桐等: 毛果杨HMA基因家族的生物信息学分析 895
毛果杨HMA家族成员间相似性跨度较大, 核苷酸
序列一致性介于31.8%~92.8%, 氨基酸序列一致性
范围介于21.3%~89.3%。其中Zn亚类家族成员
PtHMA1~4间核苷酸序列的一致性在31.8%以上,
氨基酸序列的一致性高于21.3%; Cu亚类家族成员
PtHMA5~13间核苷酸序列的一致性在40.7%以上,
氨基酸序列的一致性高于28.1%。毛果杨HMA家
族成员在序列相似性上没有明显的亚家族特征。
以毛果杨、水稻以及拟南芥HMA基因的氨基
酸序列构建进化树显示, 毛果杨的13个基因可归
类于3大类群(图3)。与Argüello (2003)和De Her-
togh等(2004)报道的P1B-ATPase分类体系比较吻合,
其中PtHMA5~13、PtHMA2~3分属其中的P1B-1
(Cu+/Ag+)亚类, PtHMA4属于P1B-2 (Zn
2+/Cd2+/Pb2+)
亚类, PtHMA1属于P1B-4 (Co
2+)亚类。
对序列一致率较高的几个毛果杨HMA基因进
一步分析, 发现它们在内含子、外显子组成方面也
有一定的相关性, 包括内含子的数量、内含子及外
显子的大小等, 如PtHMA8与PtHMA9均含有15个内
含子, 其中第6、7、9内含子的碱基数目几近相同
(碱基数目相差少于5 bp), 第1~9、14、15外显子的
碱基数目则完全相同, 显示2个基因间存在较高的
亲缘关系。类似的情况也发生在基因PtHMA7/
PtHMA10以及PtHMA6/PtHMA11/PtHMA12等。
3 毛果杨HMA基因碱基保守性分析
对基因进行碱基保守性分析可以看出(图4),
毛果杨HMA基因中散在分布着几个保守性的氨基
酸残基, 如Cys156、Gly690、Pro528、Glu525、
Asp687、Thr689和His742等, 部分保守性氨基酸残
基甚至组合成HMA家族特有的保守性基序, 如
CPC、HP、DKTGT、TGEx、GDG、PxD和CxxC
等(图3)。根据已有的研究可知(Williams和Mills
2005; Argüello等2007), P1B-ATPase包含3个重要的
功能区: A功能区(actuator domain)涉及能量转导,
包含一个磷酸酶域(TGEx); P功能区(phosphory-
lation domain)涉及酶的磷酸化, 包含一个组氨酸激
酶域(DKTGT)和一个离子转换基序(HP); N功能区
(nucleotide-binding domain)涉及ATP的结合以及水
解, 包含一个ATP结合域(GDG)。除外, 蛋白N-末
端的重金属相关调节功能域(heavy metal associated
regulatory domain, HMA-RD)存在2个保守基序
CxxC。
4 毛果杨HMA密码子偏好性分析
遗传信息在由mRNA到蛋白质的传递过程中
是以三联体密码子的形式进行的, 每种氨基酸至
少对应着一个密码子, 色氨酸、精氨酸甚至对应6
种同义密码子, 基因同义密码子的使用频率具有
物种特异性。对13个毛果杨HMA基因家族成员的
11 600个密码子的使用统计发现, 氨基酸密码子相
对使用频率(relative frequency of synonymous codon,
RFSC)具有明显的偏好性, 除Met、Gln、Lys、
Cys、Trp、Ser氨基酸外, 其他氨基酸均有高频密
码子(相对同义密码子使用频率单值超过60%或超
过该组同义密码子平均占有频率的1.5倍的密码
子) (林涛等2002), 脯氨酸和精氨酸甚至具有2个高
频密码子。在所有高频密码子中, 以U结尾的占
图3 三个物种基因组中HMA家族成员的系统进化树
Fig.3 Phylogenetic tree of the HMA genes in three species
植物生理学报896
65% (11/17), 以A结尾的占29% (5/11), 以G结尾的
占6% (1/17), 以C结尾的为0。如UUU是编码苯丙
氨酸(Phe)的高频密码子, 相对使用频率为61.26%,
而另一密码子UUC的使用频率只有38.74% (表
3)。在3个终止密码子中, UGA具有更高的使用偏
性, 相对使用频率达到53.85%, 亦为高频密码子。
5 毛果杨HMA基因蛋白理化特征分析
对毛果杨HMA蛋白大小预测显示, 毛果杨
HMA家族成员蛋白质分子量介于47.31~131.67
kDa (表4); 毛果杨HMA家族成员蛋白质的理论等
电点分布介于4.74~8.76, 多数毛果杨HMA蛋白表
现偏酸性, 平均值达到6.47。对蛋白的其他理化特
性分析显示, 除PtHMA4外, 其他毛果杨HMA蛋白
表现相似, 如一定的疏水性但都属于亲疏性相当
的两性蛋白(介于–0.5~+0.5) (付海辉等2010)
(GRAVY为正值表示疏水性, 负值表示亲水性)、
较好的蛋白结构稳定性(>40为不稳定)、以及较高
的脂溶指数(较高的蛋白脂溶指数保证其在不同环
境中具有良好的稳定性)等。
讨  论
HMA基因家族是植物吸收、转运重金属的重
要组成部分。研究结果显示, 不同HMA基因对重
金属具有一定的选择性。Axelsen和Palmgren
(2001)依据转运重金属的特异性, 将HMA基因家族
蛋白分为两类: 一是Zn亚类, 转运重金属离子Zn2+/
Co2+/Cd2+/Pb2+等; 二是Cu亚类, 转运重金属离子如
C u +/ A g +等。拟南芥的A t H M A 1 ~ 4、水稻的
OsHMA1~3、毛果杨的PtHMA1~4属于Zn亚类, 而
拟南芥的AtHMA5~8、水稻的OsHMA4~9、毛果
杨的PtHMA5~13属于Cu亚类。本研究依据蛋白结
构域的预测, 同样将HMA分为Cu亚类和Zn亚类,
两者既有保守的结构区段如E1-E2 ATPase结构域,
以及HMA特有的基序CPC、HP、DKTGT、
GDG、TGEx等, 也存在各自特色的结构区段, 如
Cu亚类较Zn亚类多了1~3个Heavy-metal-asso-ciat-
ed domain结构域, Cu亚类蛋白N-端存在1或2个特
殊的保守基序GMxCxxC, 与金属离子的结合调节
有关, 该基序在Zn亚类为GICCxxx (Eren和Argüello
2004; Verret等2005; Wong等2009; Miyadate等2011;
Takahashi和Bashir 2012)。
Argüello (2003)进一步依据HMA家族蛋白跨
膜域数目及跨膜金属结合位点上的氨基酸的不同,
将所有HMA基因蛋白分为5类, 目前在植物中发现
图4 毛果杨13个HMA家族成员氨基酸序列保守性分析
Fig.4 Conservation analysis of amino acids of 13 HMA genes in P. trichocarpa genome
序列中每个位点堆叠的氨基酸高度体现了该位点的保守程度, 堆叠中单个氨基酸的高度显示了此种氨基酸在这一位置中的相对频率。
王晓桐等: 毛果杨HMA基因家族的生物信息学分析 897
表4 毛果杨HMA蛋白的分子量及理化性质
Table 4 The molecular weight and physicochemical properties of HMA in P. trichocarpa genome
蛋白 分子量/kDa 理论等电点(PI) 脂溶指数(AI) 总平均疏水性(GRAVY) 蛋白不稳定指数(II)
PtHMA1 89.88 7.04 99.88 0.10 34.08
PtHMA2 47.31 4.74 110.16 0.31 31.04
PtHMA3 67.41 8.21 107.20 0.30 29.98
PtHMA4 131.67 7.66 83.33 –0.16 44.78
PtHMA5 105.22 5.56 101.07 0.17 33.95
PtHMA6 106.57 6.04 101.98 0.15 33.86
PtHMA7 108.59 5.30 105.87 0.32 30.48
PtHMA8 85.69 8.76 103.15 0.22 30.41
PtHMA9 86.15 8.14 102.88 0.20 31.18
PtHMA10 107.76 5.47 106.37 0.32 31.49
PtHMA11 106.85 6.28 102.76 0.16 35.56
PtHMA12 106.59 5.40 106.26 0.20 37.13
PtHMA12 94.90 5.74 105.96 0.15 34.91
的只有其中的3类: P1B-1 (Cu
+/Ag+)亚类、P1B-2 (Zn
2+/
Cd2+/Pb2+)亚类和P1B-4 (Co
2+)亚类, 其中P1B-2和P1B-4均
属于Zn亚类。本研究以毛果杨、水稻和拟南芥
HMA基因的氨基酸序列构建进化树发现, HMA基
因家族分为3大类群, 与Argüello (2003)的分类标准
比较吻合。稍存疑问的是, 以结构域分类属于Zn
亚类的毛果杨PtHMA2和PtHMA3基因, 在进化树
中却与PtHMA5~13同归为Cu亚类。这一分析结果
表明, 依据序列的相似程度推断基因的功能有一定
的局限性, 一方面受序列比对数学模型的影响, 也
与基因的大小、一致性碱基的分布方式等有关。
不同HMA蛋白结构组成的差异, 决定了它们
吸收和转运重金属的不同, 基因转化实验提供了
很好的证据, 虽然目前这种关联性机制还不够清
表3 毛果杨HMA基因密码子的相对使用频率(RFSC)
Table 3 The RFSC value of HMA genes in P. trichocarpa
%
氨基酸 密码子 RFSC 氨基酸 密码子 RFSC 氨基酸 密码子 RFSC 氨基酸 密码子 RFSC
Phe UUU 61.26 Ser UCU 24.50 Tyr UAU 60.35 Cys UGU 51.85
UUC 38.74 UCC 13.65 UAC 39.65 UGC 48.14
Leu UUA 12.50 UCA 24.80 TER UAA 15.38 TER UGA 53.85
UUG 23.86 UCG 5.72 UAG 30.77 Trp UGG 100.00
CUU 28.23 Pro CCU 39.41 His CAU 70.18 Arg CGU 11.34
CUC 10.49 CCC 11.44 CAC 29.82 CGC 7.48
CUA 10.75 CCA 40.89 Gln CAA 56.07 CGA 11.56
CUG 14.16 CCG 8.26 CAG 43.93 CGG 7.71
Ile AUU 52.57 Thr ACU 38.47 Asn AAU 66.07 Ser AGU 17.57
AUC 20.45 ACC 18.24 AAC 33.93 AGC 13.76
AUA 26.98 ACA 35.49 Lys AAA 50.38 Arg AGA 35.83
Met AUG 100.00 ACG 7.79 AAG 49.62 AGG 26.08
Val GUU 41.63 Ala GCU 44.10 Asp GAU 70.97 Gly GGU 26.73
GUC 13.60 GCC 15.84 GAC 29.03 GGC 13.42
GUA 18.13 GCA 35.73 Glu GAA 62.16 GGA 40.26
GUG 26.64 GCG 4.32 GAG 37.84 GGG 19.58
  RFSC (relative frequency of synonymous codon)指某一密码子在样本中的实际观察数与该密码子对应的氨基酸在样本中的实际观察数
的比值; 加框的数据代表高频密码子, 表5同此。
植物生理学报898
楚。如水稻HMA9基因(Lee等2007)、拟南芥HMA5
基因(Andrés-Colás等2006; González-Guerrero和
Arguello 2008)对Cu的转运, 水稻HMA2基因(Nagas-
awa等2012)、鼠耳芥AhHMA4基因(Courbot等
2007)、车前草(Plantago asiatica) HMA2和HMA4基
因(Mills等2005)、杨树PtHMA4基因对Zn或Cd的
转运(Adams等2011)等。当然, HMA蛋白对重金属
的响应也不是唯一的, 即它可以受到不同类型重
金属离子的诱导, 并进行吸收和转运, 只是效率上
存在不同。如水稻HMA蛋白OsHMA9归类于Cu亚
类, 但其表达可受高浓度的Cu、Zn、Cd诱导。利
用T-DNA插入突变技术得到的OsHMA9功能缺失
的水稻突变株 , 地上部分比野生型累积更多的
Cu、Zn、Pb和Cd, 增长量分别为30%、15%、10%
和20% (Lee等2007)。拟南芥AtHMA1蛋白归类于
Zn亚类, 但也参与叶绿体Cu的运输。Seigneurin-
Berny等(2006)实验发现, 与野生型相比, 拟南芥
HMA1功能缺失突变株和AtHMA1过表达植株表型
无明显差异, 但HMA1突变体叶绿体中Cu的含量降
低了10%; Kim等(2009)对HMA1功能缺失的拟南芥
突变株分析发现, 用0.4 mmol·L-1的Zn处理后, 突变
株茎中Zn的积累量比野生型增加20%~30%。
基因序列中包含的另外一个重要信息是密码
子使用的偏好性, 它也是物种分类学上的一个重
要指标, 在微生物、人类中已有相关的报道(王艳
等2003; 刘庆坡等2004)。本研究通过对毛果杨
HMA基因的分析 , 获得了每一密码子的使用频
率、高频密码子的分布等基本信息。将其与拟南
芥和水稻进行比较, 发现3个物种HMA基因的密码
子使用有明显的物种特征: (1)同一密码子在不同
物种中的相对使用频率(RFSC)不同, 如CGG在3个
物种中的使用频率分别为7.71%、6.79%和16.71%
(表5); (2)同一氨基酸在不同物种中的高频密码子
不同, 如半胱氨酸(Cys)在拟南芥中的高频密码子
为UGU, 而在水稻中为UGC; (3)不同物种含有高
频密码子的数量和分布不同, 如毛果杨HMA的14
个氨基酸中存在有16个高频密码子, 另有色氨酸
(Ser)虽然没有高频密码子, 但密码子UCA的相对
使用频率是24.80, 亦趋近高频密码子范围。同为
双子叶植物的拟南芥中, 8个氨基酸中有8个高频
密码子。与毛果杨相似, 拟南芥高频密码子绝大
多数以U/A结尾。在单子叶植物的水稻HMA中,
仅有2个氨基酸中存在2个高频密码子; (4)在终止
密码子的使用上, 3种模式植物虽然都具有偏好的
终止密码子 , 但毛果杨和水稻的高频密码子为
UGA, 拟南芥则为UAG (表5)。密码子偏好性与基
因的表达有密切的关系(Duret和Mouchiroud 1999),
这些密码子特征也为今后HMA基因工程育种工作
提供了理论指导。
植物对重金属的吸收和转运是一个复杂的过
程, 目前相关领域的研究主要集中在草本植物上,
在木本植物上的投入相对较少。而木本植物在生
长素速度及生物量上的优越性, 使其在植物修复
重金属污染中占据重要的地位。本研究系统分析
了毛果杨中重金属吸收转运相关的HMA蛋白的基
本信息, 探讨了基因结构组成与转运重金属的关
系, 这些信息为探索木本植物重金属污染的修复
的分子机制搭建了一个基础平台, 为探索物种的
进化关系提供了依据, 对于今后基因工程育种工
作有重要的指导意义, 如特定重金属污染环境植
物修复基因的选择等。
参考文献
付海辉, 辛培尧, 许玉兰, 刘岩, 韦援教, 董娇, 曹有龙, 周军(2010).
几种经济植物UFGT基因的生物信息学分析. 基因组学与应
用生物学, 30 (1): 92~102
李艳,卜现亭(2011). 几种公路绿化草本植物对Cd的积累作用. 环境
监测管理与技术, 23 (4): 22~26
林涛, 倪志华, 沈明山, 陈亮(2002). 高频密码子分析法及其在烟
表5 几个密码子在3个物种中的RFSC值
Table 5 The RFSC value of several codons in P. trichocarpa
and other species
%
氨基酸 密码子 毛果杨 拟南芥 水稻
Cys UGU 51.85 67.84 36.60
UGC 48.14 32.16 63.40
Arg CGU 11.34 15.00 10.88
CGC 7.48 6.79 14.85
CGA 11.56 14.29 9.28
CGG 7.71 6.79 16.71
AGA 35.83 39.29 20.42
AGG 26.08 17.86 27.85
终止密码子 UAA 15.38 25.00 11.11
UAG 30.77 50.00 33.33
UGA 53.85 25.00 55.56
王晓桐等: 毛果杨HMA基因家族的生物信息学分析 899
草密码子分析中的应用. 厦门大学学报(自然科学版), 41 (5):
551~554
刘庆坡, 冯英, 董辉(2004). 20个物种同义密码子偏性的比较. 西北
农林科技大学学报(自然科学版), 32 (7): 67~71
刘仁虎, 孟金陵(2003). Map Draw, 在Excel中绘制遗传连锁图的宏.
遗传, 25 (3): 317~321
王艳, 马文丽, 郑文岭(2003). SARS冠状病毒的密码子偏爱性分析.
生命科学研究, 7 (3): 219~223
张春燕, 王瑞刚, 范稚莲, 施士争, 丁永祯, 郭军康, 赵玉杰(2013). 杨
树和柳树富集Cd、Zn、Pb的品种差异性. 农业环境科学学报,
32 (3): 530~538
Adams PJ, Adeli A, Hsu C-Y, Harkess LR, Page PG, Pamphilis WC,
Schultz BE, Yuceer C (2011). Poplar maintains zinc homeostasis
with heavy metal genes HMA4 and PCS1. Exp Bot, 62 (11):
3737~3752
Andrés-Colás N, Sancenón V, Rodríguez-Navarro S, Mayo S,
Thiele DJ, Ecker JR, Puig S, Peñarrubia L (2006). The
Arabidopsis heavy metal P-type ATPase HMA5 interacts with
metallochaperones and functions in copper detoxification of
roots. Plant J, 45 (2): 225~236
Argüello JM (2003). Identification of ion-selectivity determinants in
heavy-metal transport P1B-type ATPases. J Membrane Biol, 195
(2): 93~108
Argüello JM, Eren E, González-Guerrero M (2007). The structure and
function of heavy metal transport P1B-ATPases. Biometals, 20
(2-3): 233~248
Axelsen KB, Palmgren MG (2001). Inventory of the superfamily
of P-type ion pumps in Arabidopsis. Plant Physiol, 126 (2):
696~706
Bernard C, Roosens N, Czernic P, Lebrun M, Verbruggen N (2004). A
novel CPx-ATPase from the cadmium hyperaccumulator Thlaspi
caerulescens. FEBS Lett, 569 (1-3): 140~148
Cobbett CS, Hussain D, Haydon MJ (2003). Structual and functional
relationships between type 1B heavy metal transporting P-type
ATPases in Arabidopsis. New Phytol, 159 (2): 315~321
Courbot M, Willems G, Motte P, Arvidsson S, Roosens N, Saumitou-
Laprade P, Verbruggen N (2007). A major quantitative trait locus
for cadmium tolerance in Arabidopsis halleri colocalizes with
HMA4, a gene encoding a heavy metal ATPase. Plant Physiol,
144 (2): 1052~1065
Crooks GE, Hon G, Chandonia JM, Brenner SE (2004). WebLogo: A
sequence logo generator. Genome Res, 14: 1188~1190
De Hertogh B, Lantin AC, Baret PV, Goffeau A (2004). The archaeal
P-type ATPases. J Bioenerg Biomembr, 36 (1): 135~142
Duret L, Mouchiroud D (1999). Expression pattern and, surprisingly,
gene length shape codon usage in Caenorhabditis, Drosophila,
and Arabidopsis. Proc Natl Acad Sci USA, 96 (8): 4482~4487
Eren E, Argüello JM (2004). Arabidopsis HMA2, a divalent heavy
metal-transporting PIB-type atpase, is involved in cytoplasmic
Zn2+ homeostasis. Plant Physiol, 136 (3): 3712~3723
González-Guerrero M, Arguello MJ (2008). Mechanism of Cu-
transporting ATPases: Soluble Cu chaperones directly transfer
Cu to transmembrane transport sites. Proc Natl Acad Sci USA,
105 (16): 5992~5997
Goodstein DM, Shu S, Howson R, Neupane R, Hayes RD, Fazo J,
Mitros T, Dirks W, Hellsten U, Putnam N et al (2012). Phytozo-
me: a comparative platform for green plant genomics. Nucleic
Acids Res, 40: 1178~1186
Gu JG, Qi LW, Jiang WS, Liu DH, Gu JG (2007). Cadmium
accumulation and its effects on growth and gas exchange in four
populus cultivars. Acta Biologica Cracov Bot, 49 (2): 7~14
Hussain D, Haydon JM, Wang YW, Wong E, Sherson MS ,Young J,
Camakaris J, Harper FJ, Cobbetta SC (2004). P-type ATPase
heavy metal transporters with roles in essential zinc homeostasis
in Arabidopsis. Plant Cell, 16 (5): 1327~1339
Kim YY, Choi H, Segami S, Cho HT, Martinoia E, Maeshima M, Lee
Y (2009). AtHMA1 contributes to the detoxification of excess
Zn(II) in Arabidopsis. Plant J, 58 (5): 737~753
Lee S, Kim Y-Y, Lee YS, An GH (2007). Rice P1B-type heavy metal
ATPase, OsHMA9, is a metal efflux protein. Plant Physiol, 145
(3): 831~842
Mills FR, Francini A, Rocha P, Baccarini JP, Aylett M, Krijger C,
Williams EL (2005). The plant P1B-type ATPase AtHMA4
transports Zn and Cd and plays a role in detoxification of
transition metals supplied at elevated levels. FEBS Letters, 579
(3): 783~791
Miyadate H, Adachi S, Hiraizumi A, Tezuka K, Nakazawa N, Kawa-
moto T, Katou K, Kodama I, Sakurai K, Takahashi H et al (2011).
OsHMA3, a P1B-type of ATPase affects root-to-shoot cadmium
translocation in rice by mediating efflux into vacuoles. New
Phytol, 189 (1): 190~199
Morel M, Crouzet J, Gravot A, Auroy P, Leonhardt N, Vavasseur A,
Richaud P (2009). AtHMA3, a P1B-ATPase allowing Cd/Zn/
Co/Pb vacuolar storage in Arabidopsis. Plant Physiol, 149 (2):
894~904
Nagasawa SN, Mori M, Nakazawa N, Kawamoto T, Nagato Y, Sakurai
K, Takahashi H, Watanabe A, Akagi H (2012). Mutations in
Rice (Oryza sativa) heavy metal ATPase2 (OsHMA2) restrict the
translocation of Zinc and Cadmium. Plant Cell Physiol, 53(1):
213~224
Palmgren MG, Harper JF (1999). Pumping with plant P-type ATPases.
J Exp Bot, 50: 883~893
Papoyan A, Kochian VL (2004). Identification of Thlaspi caerulescens
genes that may be involved in heavy metal hyperaccumulation
and tolerance. Plant Physiol, 136 (3): 3814~3823
Peden JF (2000). Analysis of codon usage [Doctoral Thesis],
Nottingham, UK: University of Nottingham
Puig S, Andrés-Colás N, García-Molina A (2007). Copper and iron
homeostasis in Arabidopsis: responses to metal deficiencies,
interactions and biotechnological applications. Plant Cell
Environ, 30 (3): 271~290
Seigneurin-Berny D, Gravot A, Auroy P, Mazard C, Kraut A, Finazzi
G, Grunwald D, Rappaport F, Vavasseur A, Joyard J et al (2006).
HMA1, a new Cu-ATPase of the chloroplast envelope, is essen-
tial for growth under adverse light conditions. J Biol Chem, 281
(5): 2882~2892
Solioz M, Vulpe C (1996). CPx-type ATPase that pump heavy metals.
Trends Biochem Sci, 21 (7): 237~241
植物生理学报900
Takahashi R, Bashir K (2012). The role of heavy-metal ATPases,
HMAs, in zinc and cadmium transport in rice.Plant Signal Be-
hav, 7 (12): 1605~1607
Tuskan GA, Difazio S, Jansson S, Bohlmann J, Grigoriev I, Hellsten
U, Putnam N, Ralph S, Rombauts S, Salamov A et al (2006).
The genome of black cottonwood, Populus trichocarpa (Torr. &
Gray). Science, 313 (5793): 1596~1604
Verret F, Gravot A, Auroy P, Preveral S, Forestier C, Vavasseur A,
Richaud P (2005). Heavy metal transport by AtHMA4 involves
the N-terminal degenerated metal binding domain and the C-
terminal His11 stretch. FEBS Lett, 579 (6): 1515~1522
Wong CK, Jarvis RS, Sherson SM, Cobbett CS (2009). Functional
analysis of the heavy metal binding domains of the Zn/Cd-
transporting ATPase, HMA2, in Arabidopsis thaliana. New
Phytol, 181 (1): 79~88
Walker JM (2005). The Proteomics Protocols Handbook. Totowa, NJ,
USA: Humana Press
Williams LE, Mills RF (2005). P1B-ATPases−an ancient family of
transition metal pumps with diverse functions in plants.Trends
Plant Sci, 10 (10): 491~502
Zacchini M, Pietrini F, Mugnozza GS, Iori V, Pietrosanti L, Massacci
A (2009). Metal tolerance, accumulation and translocation in
poplar and willow clones treated with cadmium in hydroponics.
Water Air Soil Poll, 197 (1-4): 23~34