全 文 : Guihaia Feb. 2016ꎬ 36(2):216-223
http: / / journal.gxzw.gxib.cn
http: / / www.guihaia-journal.com
DOI: 10.11931 / guihaia.gxzw201506023
齐小琼ꎬ葛亚飞ꎬ李大卫. 水蕨血红蛋白基因的分子克隆和序列分析[J]. 广西植物ꎬ 2016ꎬ 36(2):216-223
QI XQꎬGE YFꎬLi DW. Molecular clone and sequence analysis of hemoglobin gene in Ceratopteris thalictroides[J]. Guihaiaꎬ 2016ꎬ 36(2):216-223
水蕨血红蛋白基因的分子克隆和序列分析
齐小琼1ꎬ 葛亚飞1ꎬ 李大卫2∗
( 1. 湖北第二师范学院 化学与生命科学学院 /植物抗癌活性物质提纯与应用湖北省重点实验室ꎬ 武汉 430205ꎻ
2. 中国科学院武汉植物园 植物种质创新与特色农业重点实验室ꎬ 武汉 430074 )
摘 要: 植物血红蛋白(Hemoglobin)是一类由珠蛋白(Globin)和血红素(Ferroheme)组成的结合蛋白ꎬ在植物
中广泛分布ꎬ迄今已在苔藓植物、裸子植物和被子植物中克隆到血红蛋白基因序列ꎬ但在蕨类植物中相关研究
还未见报道ꎮ 该研究采用热不对称交错 PCR(TAIL ̄PCR)方法克隆了水蕨血红蛋白基因的全长序列ꎮ 该基因
的序列总长为 949 bpꎬ包含 4个外显子和 3个内含子ꎬ编码 189个氨基酸ꎮ 预测的蛋白质(命名为 CtHb)的分
子量为 21.14 kDaꎬ等电点(pI)为 7.81ꎮ 三维结构模拟表明 CtHb 具有植物血红蛋白典型的三级结构:即含有
A、B、C、E、F、G和 H螺旋ꎬ形成了 3 ̄on ̄3的“三明治”结构ꎮ 和水稻血红蛋白的三级结构相比ꎬCtHb的大部分
结构(包括具有远端和近端组氨酸定位的 E螺旋和 F螺旋的位置等)同水稻的结构极为相似ꎮ 两者的不同之
处主要表现在:(1)CtHb 含有较长的 N ̄端区域ꎻ(2)两者 CD ̄loop的折叠方式不同ꎻ(3)两者螺旋 B 和螺旋 C
的连接方式不同ꎬCtHb是通过卷曲连接的ꎬ而水稻中借助的是螺旋ꎮ 结构进化分析揭示了植物血红蛋白从非
共生到共生进化过程中的一些关键改变ꎬ这些改变可能有助于非共生血红蛋白向共生血红蛋白结构的转变ꎬ
特别是有助于豆血红蛋白共生功能的实现ꎮ
关键词: 植物血红蛋白ꎬ 序列分析ꎬ 三级结构模拟ꎬ 结构进化ꎬ 水蕨
中图分类号: Q943.2ꎬ Q75 文献标识码: A 文章编号: 1000 ̄3142(2016)02 ̄0216 ̄08
Molecular clone and sequence analysis of hemoglobin
gene in Ceratopteris thalictroides
QI Xiao ̄Qiong1ꎬ GE Ya ̄Fei1ꎬ LI Da ̄Wei2∗
( 1. School of Chemistry and Life Sciencesꎬ Hubei University of Education / Hubei Key Laboratory of Purification and Application of
Plant Anticancer Active Ingredientsꎬ Wuhan 430205ꎬ Chinaꎻ 2. Key Laboratory of Plant Germplasm Enhancement and
Specialty Agricultureꎬ Wuhan Botanical Gardenꎬ Chinese Academy of Sciencesꎬ Wuhan 430074ꎬ China )
Abstract: Plantsꎬ like humansꎬ contain hemoglobins (Hbs)ꎬ which consist mostly of protein subunits (the “globin”
molecules) and heme groups. Phylogenomic analysis shows that Hbs are widely distributed in higher plantsꎬ and by com ̄
paring sequencesꎬ expression patternsꎬ and ligand ̄binding propertiesꎬ it is evident that three distinct types of Hb exist in
plants: symbioticꎬ non ̄symbioticꎬ and truncated Hbs. In the recent yearsꎬ the genes of Hb have been cloned and identi ̄
fied in various species of bryophytesꎬ gymnosperms and angiospermsꎬ but no study has been reported in the ferns until
收稿日期: 2015 ̄06 ̄24 修回日期:2015 ̄12 ̄04
基金项目: 国家自然科学基金(31201242ꎬC130405)ꎻ湖北省科学研究计划项目(Q20143004)ꎻ湖北省自然科学基金(2015CFB508)ꎻ植物抗癌活
性物质提纯与应用湖北省重点实验室开放课题 (HLPAI 2014004) [ Supported by the National Natural Science Foundation of China (31201242ꎬ
C130405)ꎻ Scientific Research Project of Educational Commission of Hubei Province (Q20143004)ꎻ Natural Science Foundation of Hubei Province
(2015CFB508)ꎻ Open Research Fund of Hubei Key Laboratory of Purification and Application of Plant Anticancer Active Ingredients(HLPAI 2014004)]ꎮ
作者简介: 齐小琼(1981 ̄)ꎬ女ꎬ山东昌邑人ꎬ博士ꎬ讲师ꎬ主要从事进化遗传学研究ꎬ(E ̄mail)108816564@ qq.comꎮ
∗通讯作者: 李大卫ꎬ博士ꎬ副研究员ꎬ主要从事果树遗传育种方向ꎬ(E-mail)david.lee1983@ 163.comꎮ
now. In the present studyꎬ a full ̄length Hb gene from Ceratopteris thalictroides was cloned by Thermal Asymmetric Inter ̄
laced (TAIL) PCRꎬ and sequence analysis was conducted by bioinformatics. The results revealed that the gene was 949
bp longꎬ containing 4 exons interrupted by 3 introns. The deduced protein (named CtHb) with 189 amino acid residues
had a predicted isoelectric point (PI) of 7.81 and a calculated molecular mass 21.14 kDa. Modeling of the tertiary struc ̄
ture indicated that CtHb possesses the typical tertiary structure as plant Hbs (including helices Aꎬ Bꎬ Cꎬ Eꎬ Fꎬ G and
Hꎬ these together forms a “sandwich” structure of 3 ̄on ̄3). Comparative structure analysis of CtHb with rice native
NsHb1 revealed that most of the CtHb structure was quite similar to that of rice NsHb1ꎬ including the positions of helices
E and Fꎬ where distal and proximal His were locatedꎬ respectively. Howeverꎬ the structure differences were as follows:
(1)The N ̄terminus region was longer in CtHb than in rice NsHb1ꎻ (2)The CD ̄loop folded differentlyꎻ (3)Helices to
coils transition at the connect regions of helices B and C were different. Structural comparison revealed major evolutionary
changes during plant Hbs evolution. Some of these structural changes would be helpful for the transition from nonsymbiot ̄
ic Hb to symbiotic Hb and for the specialization of a symbiotic function for symbiotic Hb.
Key words: plant hemoglobinꎬ sequence analysisꎬ tertiary structure modelingꎬ structural evolutionꎬ Ceratopteris thalic ̄
troides
植物血红蛋白(Hemoglobin)是一类由珠蛋白
(Globin)和血红素(Ferroheme)组成的结合蛋白ꎬ广
泛存在于植物界ꎬ在植物固氮及抵御胁迫中具有重
要作用ꎮ 随着研究的不断深入ꎬ根据血红蛋白的序
列、表达方式以及配体结合性质把植物中的血红蛋
白 分 为 三 类: 共 生 的 血 红 蛋 白 ( Symbiotic
hemoglobinꎬsHb)、非共生的血红蛋白(Nonsymbiotic
hemoglobinꎬNsHb)和截短的血红蛋白(Truncated he ̄
moglobinꎬtHb)ꎮ 共生的血红蛋白主要存在于豆类
和一些非豆类植物(主要是放线菌结瘤植物和榆科
植物某些属)固氮根瘤菌侵染的根瘤细胞中ꎮ 非共
生的血红蛋白比共生的血红蛋白分布更广泛ꎬ不仅
存在于含有共生血红蛋白的植物中ꎬ而且也存在于
其他植物中ꎻ并可在多种器官中表达ꎬ如正常生长条
件和胁迫条件下植物的根、茎、叶、花和种子中(An ̄
derson et alꎬ1996ꎻ Lira ̄Ruan et alꎬ2001ꎻ Ross et alꎬ
2004ꎻ Taylor et alꎬ1994ꎻ Trevaskis et alꎬ1997)ꎮ 截
短的血红蛋白首先在原核生物、原生动物和真核藻
类中发现ꎬ后来在一些植物中也发现了该蛋白
(Watts et alꎬ 2001)ꎮ 其序列比其他血红蛋白短
(Pesce et alꎬ2000)ꎬ三维结构是由 α ̄螺旋通过 2 ̄on ̄
2的方式排列而成ꎬ不同于 3 ̄on ̄3 标准的血红蛋白
折叠ꎮ 通过系统发育分析表明ꎬ植物中的 tHb 与
sHb、NsHb 形成了不同的谱系(Lineages)ꎬtHb 是通
过基因水平转移从细菌中获得(Vinogradov et alꎬ
2006)ꎬ具体的功能还不是很清楚ꎮ
血红蛋白基因在植物中普遍存在ꎬ就目前积累
的数据来看ꎬ大部分序列来自于被子植物ꎬ在裸子植
物和苔藓植物中有几条代表序列ꎬ但蕨类和石松类
植物中尚未见有相关报道ꎬ不完全的序列数据影响
了该基因家族的分子进化研究ꎮ 本研究通过分子克
隆手段获得蕨类植物水蕨的血红蛋白基因的完整编
码区序列ꎬ并进行生物信息学分析、三级结构模拟及
进化分析ꎬ试图阐明该基因在序列组成、基因结构、
三级结构等方面的特征ꎬ并推断其可能的功能ꎻ通过
与其他分类群中的血红蛋白基因进行比较分析ꎬ探
讨其在不同分类群中较独特的进化样式ꎮ
1 材料与方法
1.1 植物材料
蕨类植物水蕨的健康幼嫩叶片采自中国科学院
武汉植物园ꎮ
1.2 主要分子生物学试剂
普通 Taq DNA聚合酶、高保真 LA Taq酶、dNTP
等试剂购自 TaKaRaꎻDNA 凝胶纯化回收试剂盒购
于 Axygen生物技术有限公司ꎮ
1.3 试验方法
1.3.1 水蕨血红蛋白基因部分片段的扩增 分别用
拟南芥 ( Arabidopsis thaliana) AHB1 和 AHB2 基因
(登录号:AAD26949ꎬAAB82770)的蛋白序列作为查
询序列ꎬ通过对数据库中已报道的蕨类序列进行相
似性搜索ꎬ在 Ceratopteris richardii 中得到一条同目
标序 列 相 似 性 较 高 的 EST 序 列 ( 登 录 号:
BQ087262)ꎮ 根据这条序列设计一对特异引物ꎬ进
行 PCR扩增ꎮ 引物序列为 F ̄cera:5′ ̄TCACCGAGC ̄
ATCTGCGTCAAT ̄3′ꎻ R ̄cera: 5′ ̄TCAATAGGCAGTA ̄
CCTGACGA ̄3′ꎮ
7122期 齐小琼等: 水蕨血红蛋白基因的分子克隆和序列分析
PCR反应体系为 20 μLꎬ引物各 40 pmolꎬdNTP
各 1 pmolꎬ10×PCR 反应缓冲液 2.0 μLꎬTaq 酶 0.2
μL(5 U / μL)ꎮ 反应条件为 95 ℃预变性 5 minꎻ接着
94 ℃变性 50 sꎬ53 ℃退火 50 sꎬ72 ℃延伸 60 sꎬ共
36个循环ꎻ最后 72 ℃延伸 8 minꎮ
1.3.2 水蕨血红蛋白基因 3′侧翼序列的扩增 以提
取的总 DNA 为模板ꎬ用 3 个巢式单引物进行 3 轮
TAIL ̄PCR扩增ꎬ引物序列为 3′TAIL ̄1:5′ ̄TCTTAAT ̄
GTGAGTTCGCCTCTGTGA ̄3′ꎻ 3′ TAIL ̄2: 5′ ̄CTTTGAG ̄
CAGCACAGGAATGGTCTC ̄3′ꎻ 3′ TAIL ̄3: 5′ ̄CGGTG ̄
TAGTGGATGAGCATTATGAG ̄3′ꎮ
TAIL ̄PCR的反应体系为 50 μlꎬ简并引物 AD
(5′ ̄TC(G / C) TICGNACIT(A / T) GGA ̄3′) ( Liu and
Whittierꎬ1995 )ꎮ 各成分及用量如下: LA buffer
(Mg2+ plus)5.0 μLꎻdNTP Mix(2.5 mmol / L)8.0 μLꎻ
AD 引物(20 μmol / L) 5. 0 μLꎻ基因特异性引物(5
μmol / L)2.0 μLꎻLA Taq 酶(5 U / μL) 0.5 μLꎻDNA
(50 ng / μL)5.0 μLꎻH2O 24.5 μLꎮ
第一轮反应引物采用 3′TAIL ̄1 和 ADꎬ条件为
94 ℃预变性 1 minꎬ98 ℃预变性 1 minꎻ接着 94 ℃变
性 30 sꎬ65 ℃退火 1 minꎬ72 ℃延伸 2 minꎬ共 5个循
环ꎻ紧接着 94 ℃变性 30 sꎬ25 ℃退火 3 minꎬ在 3 min
内攀升到 72 ℃ꎬ72 ℃延伸 2 minꎬ进行一个循环ꎻ接
着 94 ℃变性 30 sꎬ65 ℃退火 1 minꎬ72 ℃延伸 2
minꎬ94 ℃变性 30 sꎬ65 ℃退火 1 minꎬ72 ℃延伸 2
minꎬ94 ℃变性 30 sꎬ44 ℃退火 1 minꎬ72 ℃延伸 2
minꎬ共 15 个循环ꎻ最后 72 ℃延伸 10 minꎮ TAIL ̄
PCR第二轮反应引物采用 3′TAIL ̄2 和 ADꎬ将第一
轮反应产物稀释 50 倍ꎬ取 1 μL 作为第二轮反应的
模板ꎬ其它成分与第一轮反应相同ꎮ 反应条件为 94
℃预变性 1 minꎻ接着 94 ℃变性 30 sꎬ65 ℃退火
1 minꎬ72 ℃延伸 2 minꎬ94 ℃变性 30 sꎬ65 ℃退火
1 minꎬ72 ℃延伸 2 minꎬ94 ℃变性 30 sꎬ44 ℃退火
1 minꎬ72 ℃延伸 2 minꎬ共 15 个循环ꎻ最后 72 ℃延
伸 10 minꎮ 第三轮反应引物采用 3′TAIL ̄3 和 ADꎬ
将第二轮反应产物稀释 50 倍ꎬ取 1 μL 作为第三轮
反应的模板ꎬ其它成分与第二轮反应相同ꎮ 反应条
件也同第二轮相同ꎮ
1.3.3 产物回收、连接、转化、克隆、测序 扩增片段
凝胶回收采用凝胶回收试剂盒ꎬ参照说明书进行ꎻ产
物连接采用 TaKaRa公司 pMD19 ̄T simple Vectorꎬ参
考说明书ꎬ反应体系稍作优化ꎮ 大肠杆菌感受态细
胞制备采用 CaCl2法ꎬ将目的基因通过热激法转化
到大肠杆菌感受态细胞中ꎬ阳性克隆采用蓝白斑筛
选方法并进一步采用 PCR 方法ꎬ扩增产物长度与目
的片段相当者为阳性克隆ꎮ 每个目的片段ꎬ随机选
取至少 3个阳性克隆ꎬ送华大基因测序ꎮ 序列测定
采用 ABI PRISM 3730 DNA测序仪用 BigDye Termi ̄
nator Kit(Applied Biosystems)进行双向克隆测序ꎮ
1.4 数据分析
采用 BioEdit 软件(http: / / www.mbio. ncsu. edu /
BioEdit / bioedit. html ) ( North Carolina State
University)对克隆测序得到的片段进行拼接ꎮ 采用
FGENESH 和 NCBI ( http: / / linux1. softberry. com /
berry.phtml)的 ORF finder 进行开放阅读框确定ꎮ
运用 DNAstar 软件推测氨基酸序列ꎬ分析蛋白质的
分子量、等电点和氨基酸组成ꎮ 使用 SignalP 3. 0
Server( http: / / www. cbs. dtu. dk / services / SignalP / )分
析蛋白 N ̄端氨基酸序列ꎬ根据 SignalP 分析得到的
Cmax值( the cleavage site score)、Smean( the signal
peptide score)和 HMM 值(Hidden Markov Model)判
别信号肽序列ꎬ确定是否存在信号肽ꎮ 使用 TargetP
Server v1. 01 ( http: / / www. cbs. dtu. dk / services / Tar ̄
getP / )确定分泌蛋白的分泌途径和亚细胞定位ꎮ 蛋
白质保守结构功能域用 PROSITE、SMART 软件和
PFAM 数据库( http: / / pfam. wustl. edu / )进行预测ꎮ
多条序列的一致性分析用 Bioedit 软件 sequence i ̄
dentity matrix 进行ꎮ 使用在线软件 SOPMA 预测蛋
白二级结构并计算各种二级结构所占的百分比ꎮ 将
推导的氨基酸序列提交瑞士生物信息研究所的
Swiss ̄model( http: / / www. isb ̄sib. ch / ) (Arnold et alꎬ
2006ꎻ Schwede et alꎬ2003)ꎬ基于同源建模的原理ꎬ
用水稻的 NsHb1 作为模板(PDB code: 1D8UA)进
行水蕨血红蛋白三级结构的预测ꎮ 预测结果用 Py ̄
MOL软件展示和编辑ꎮ
运用 Blast 工具( http / / blast. ncbi. nlm. nih. gov /
Blast.cgi)ꎬ以水蕨血红蛋白作为查询序列ꎬ进行序
列相似性搜索ꎬ并选取相似性较高的序列用 MEGA6
软件(Tamura et alꎬ2013)中的邻接算法进行进化树
的构建ꎬ其中多重序列比对采取 Clustalx软件进行ꎮ
2 结果与分析
2.1 水蕨血红蛋白基因的克隆
以水蕨的总 DNA 为模板ꎬ用一对特异引物(F ̄
cera和 R ̄cera)扩增得到一段约 820 bp 的片段(图
812 广 西 植 物 36卷
1:a)ꎮ 经过分析ꎬ该序列的 5′端是完整的ꎬ因此只
需通过染色体步移技术获得 3′侧翼序列ꎮ 基于获
得的序列片段ꎬ进一步设计了一组巢式引物通过
TAIL ̄PCR来获得 3′侧翼序列ꎮ 在 TAIL ̄PCR 的第
二轮和第三轮分别获得了几条清晰的条带ꎬ根据巢
式引物设计的相对位置ꎬ选取这两轮反应的产物大
小相差大约 100 bp的条带(图 1:b)作为目的条带ꎮ
将第三轮的目的条带回收、克隆测序ꎬ经分析ꎬ得到
的序列含有同已知序列完全一致的重叠区ꎮ 将上述
实验获得的序列拼接最终得到水蕨血红蛋白基因的
完整编码区序列ꎮ
将得到的序列同 C. richardii 的 EST(登录号:
BQ087262)序列进行比对ꎬ发现本研究获得的序列
比数据库中的序列多了三段区域ꎬ其它部分都完全
匹配ꎬ推测这三部分是基因的内含子区域ꎮ 由此获
知该基因含有 4个外显子ꎬ3 个内含子ꎬ这与其他植
物血红蛋白的基因结构相同ꎮ 说明血红蛋白基因的
外显子 ̄内含子结构在植物进化中是保守的ꎮ
2.2 全长基因序列及编码蛋白的基本性质分析
对已获得的克隆基因进行分析研究后ꎬ 得到水
图 1 特异 PCR(a)、TAIL ̄PCR(b)琼脂糖电泳检测
M.2000 bp 分子量标记ꎻ a 1. 特异引物 F ̄cera和 R ̄cera扩增得到
的大约 820 bp的产物ꎻ b II. 引物 3′TAIL ̄2通过 TAIL ̄PCR第二
轮反应得到的条带ꎻ b III. 引物 3′TAIL ̄3通过 TAIL ̄PCR第三轮
反应得到的条带ꎮ
Fig. 1 Agarose gel electrophoresis of the specific PCR(a)ꎬ
TAIL ̄PCR(b)products M. Molecular weight marker (DL2000)ꎻ
a 1. About 820 bp fragment generated by specific PCR with primer F ̄
cera and R ̄ceraꎻ b II. Several bands produced by the secondary reaction
of TAIL ̄PCR with primer 3′TAIL ̄2ꎻ b III. Two clear bands produced by
the tertiary reaction of TAIL ̄PCR with primer 3′TAIL ̄3.
表 1 序列一致性分析
Table 1 Analysis of percent sequence identify
序列名称
Sequence name
棉花
Ns1
Cotton
Ns1
拟南芥
Ns1
AHB1
大麦
Ns1
Barley
Ns1
玉米
Ns1
Maize
Ns1
水稻
Ns1
Rice
Ns1
苜蓿
Lb
Alfalfa
Lb
百脉根
Lb
Lotus
Lb
大豆
Lb
Soybean
Lb
羽扇豆
Lb1
Lupinus
Lb1
拟南芥
Ns2
AHB2
棉花
Ns2
Cotton
Ns2
小立碗藓
Phys ̄
comi ̄
trella
角齿藓
Cera ̄
todon
石松
Selag ̄
inellae
拟南芥 Ns1 AHB1 0.762
大麦 Ns1 Barley Ns1 0.709 0.674
玉米 Ns1 Maize Ns1 0.702 0.668 0.824
水稻 Ns1 Rice Ns1 0.650 0.644 0.777 0.789
苜蓿 Lb Alfalfa Lb 0.417 0.431 0.370 0.381 0.403
百脉根 Lb Lotus Lb 0.392 0.393 0.364 0.369 0.385 0.719
大豆 Lb Soybean Lb 0.390 0.378 0.345 0.339 0.367 0.628 0.655
羽扇豆 Lb1 Lupinus Lb 0.414 0.403 0.388 0.400 0.409 0.541 0.561 0.538
拟南芥 Ns2 AHB2 0.487 0.500 0.497 0.476 0.508 0.518 0.474 0.481 0.531
棉花 Ns2 Cotton Ns2 0.527 0.527 0.518 0.502 0.511 0.522 0.522 0.462 0.550 0.722
小立碗藓 Physcomitrella 0.450 0.411 0.401 0.412 0.417 0.316 0.322 0.292 0.348 0.366 0.408
角齿藓 Ceratodon 0.455 0.432 0.416 0.427 0.438 0.325 0.325 0.301 0.346 0.381 0.413 0.828
石松 Selaginellae 0.400 0.373 0.397 0.397 0.397 0.273 0.268 0.252 0.315 0.357 0.361 0.410 0.389
水蕨 Ceratopteris 0.373 0.365 0.343 0.375 0.380 0.269 0.259 0.243 0.285 0.342 0.329 0.307 0.303 0.341
注: AHB1和 AHB2分别代表拟南芥非共生血红蛋白 1和 2ꎻ Ns1代表非共生血红蛋白 1ꎻ Lb代表豆血红蛋白(共生血红蛋白)ꎮ
Note: AHB1 and AHB2 represent nonsymbiotic hemoglobin 1 and 2 from Arabidopsis thalianaꎬrespectivelyꎻ Ns1 indicates nonsymbiotic hemoglobin ̄1(NsHb ̄1)ꎻ while Lb
indicates leghemoglobin(symbiotic hemoglobin) .
蕨血红蛋白(命名为 CtHb)基因序列全长(图 2)为
949 bpꎬ该基因包括 4个外显子和 3 个内含子ꎬ编码
189个氨基酸ꎮ 氨基酸组成中含量最高的为丙氨酸
(Alaꎬ11. 6 )ꎬ其次缬氨酸 ( Valꎬ9. 0 )、丝氨酸
(Serꎬ8.5 )、亮氨酸( Leuꎬ7. 9 )和赖氨酸( Lysꎬ
7.9 )ꎮ 碱性氨基酸(ArgꎬLys) 24 个ꎬ强酸性氨基
酸(AspꎬGlu)23 个ꎬ疏水氨基酸(AlaꎬIleꎬLeuꎬPheꎬ
TrpꎬVal)71个ꎬ 不带电荷的极性氨基酸(Asnꎬ Cysꎬ
9122期 齐小琼等: 水蕨血红蛋白基因的分子克隆和序列分析
图 2 水蕨血红蛋白基因的核酸序列和推导的氨基酸序列 推导的氨基酸序列标注在开放阅读框下面ꎬ小写字母示内含子部分ꎮ
Fig. 2 Nucleotide and deduced amino acid sequences of hemoglobin gene from Ceratopteris thalictroides The predicted amino acid
sequence is shown below its open reading frameꎬ and the introns are present in lowercase letters.
GlnꎬSerꎬThrꎬTyr) 41 个ꎮ 预测的蛋白质分子量为
21.14 kDaꎬ理论等电点(pI)为 7.81ꎮ
2.3 蛋白质的信号肽预测及亚细胞定位分析
采用 SignalP 对该蛋白序列及其他分类群的代
表序列(包括苔藓植物 2 条(Physcomitrella patens 和
Ceratodon purpureus)、石松类 1 条(Selaginellae moel ̄
lendorfii)和被子植物 11条(具体的物种和序列名称
见表 1)进行在线搜索ꎬ发现这些蛋白存在信号肽的
概率都极低ꎬ不存在信号肽酶切位点ꎬ说明这些血红
蛋白很可能为非分泌蛋白ꎮ 进一步分析这些蛋白的
亚细胞定位ꎬ发现大部分蛋白是细胞质蛋白ꎬ只有小
立碗藓和江南卷柏的血红蛋白具有较高分值的叶绿
体定位信号ꎬ可能会定位于叶绿体中ꎮ
2.4 序列一致性分析
表 1 给出的是 15 条植物血红蛋白序列两两之
间的一致性指数ꎬ其中包括 2条苔藓植物序列(Phy ̄
scomitrella patens 和 Ceratordon purpureus)ꎬ1 条石松
类植物序列(Selaginellae moellendorfii)ꎬ1 条蕨类植
物序列(Ceratopteris thalictroides)及 11 条被子植物
序列ꎮ 本研究发现 CtHb与被子植物 NsHb1 的序列
一致性偏高ꎬ与豆科植物 sHb 的序列一致性偏低ꎬ
说明 CtHb属于 NsHb1ꎻ同时比较 CtHb 和其他分类
群 NsHb的一致性发现ꎬ与古老的苔藓、石松类植物
的 NsHb序列相比ꎬCtHb 在进化上更类似于被子植
物 NsHbꎮ
2.5 水蕨血红蛋白高级结构预测
在二级结构预测中ꎬCtHb 主要由 61.38 的 α ̄
螺旋ꎬ 6. 35 的延伸片层ꎬ 5. 82 的 β ̄转角和
26 46 无规卷曲组成ꎮ 其中 α ̄螺旋和卷曲是 CtHb
二级结构的主要构成成分ꎮ
了解水蕨血红蛋白的结构性质对于阐明植物血
红蛋白的进化多样性及其在植物中发挥的作用都有
022 广 西 植 物 36卷
图 3 a. 预测的 CtHb三级结构ꎻ b. 选取的 CtHb血红素口袋中的氨基酸三级结构 每个螺旋分别用字母 AꎬBꎬCꎬEꎬF和H表示ꎮ
Fig. 3 a. Predicted tertiary structure of CtHbꎻ b. Tertiary structure of selected amino acids in heme pocket of CtHb Helices (in ̄
cluding to prehelix A) are indicated with letters AꎬBꎬCꎬEꎬF and H.
图 4 A. CtHb(灰色表示)和水稻 NsHb1(黑色表示)三级结构比对图ꎻ B. 选取在 CtHb(灰色表示)和水稻 NsHb1(黑
色表示)血红素口袋中的氨基酸位点的三级结构比对图 每个螺旋分别用 AꎬBꎬCꎬEꎬF和 H表示ꎬ其中(a)为正面ꎬ(b)为背面ꎮ
Fig. 4 A. Overlay of predicted tertiary structure of CtHb(gray) and native rice NsHb1(black) tertiary structuresꎻ B. Tertiary struc ̄
ture overlay of selected amino acids in heme pocket of CtHb(gray) and native rice NsHb1(black) Helices(including to prehelix A) are
indicated with letters AꎬBꎬCꎬEꎬF and H. (a) is a front viewꎬwhile (b) is a back view.
着重要的意义ꎮ 通过计算机模拟可以从模板预测出
高质量的蛋白质三级结构ꎬ通过预测出的结构可以
考察血红蛋白的进化模式ꎬ在结构和功能方面理解
进化问题ꎮ 由于 CtHb和水稻 NsHb1具有接近 50
的相似性ꎬ所以可以用水稻 NsHb1(1D8UA)作为预
测 CtHb三级结构的模板ꎮ
图 3给出了 CtHb 三维结构模拟结果ꎮ 图中显
示ꎬCtHb具有植物血红蛋白典型的三级结构模式ꎬ
即含有 A、B、C、E、F、G 和 H 螺旋ꎬ形成了 3 ̄on ̄3的
“三明治”结构ꎮ 将 CtHb和水稻 NsHb1的三级结构
进行 overlay比较ꎬ结果如图 4:A 所示:预测得到的
CtHb三级结构具有典型球蛋白的折叠方式ꎬ它的大
部分结构(包括具有远端和近端组氨酸定位的 E 和
F螺旋的位置等)同水稻的结构非常相似ꎻ不同之处
主要表现在:(1)CtHb含有较长的 N ̄端区域ꎻ(2)两
者 CD ̄loop的折叠方式不同ꎻ(3)两者螺旋 B和螺旋
C的连接方式不同ꎬCtHb 是通过卷曲连接的ꎬ而水
稻 NsHb1借助的是螺旋ꎮ
在比对图 5中ꎬ发现苔藓植物、石松类和蕨类植
物 NsHb中都含有一段延长的 N ̄端序列ꎬRoss et al
(2002)在苔藓植物 NsHb中检测到了类似于前导肽
的蛋白位点ꎬ推测植物 NsHb 的祖先可能是定位于
1222期 齐小琼等: 水蕨血红蛋白基因的分子克隆和序列分析
图 5 植物血红蛋白的多序列比对 序列的保守性通过 ESPript化学等价策略进行可视化ꎬ设置相似性阈值来强调严格保守的位置ꎻ
不变残基添加黑色背景ꎬ理化性质相同的残基用灰色矩形框标注ꎻ 预测的 CtHb二级结构元件标注在序列比对的最上面ꎮ
Fig. 5 Multiple alignment of plant hemoglobins Sequence conservation is visualized according to the ESPript chemical equivalence measureꎬ
with a similarity threshold set to emphasize strictly conserved positionsꎻ Invariant residues are boxed in blackꎬ physico ̄chemical equivalent residues are
boxed in grayꎻ The deduced secondary structure of CtHb is shown above the alignment.
细胞器中的ꎬ这同软件预测的小立碗藓 NsHb 的亚
细胞定位结果一致ꎮ 推测这段延长的 N ̄端氨基酸
可能有助于蛋白的转运(Garrocho ̄villegas & Arre ̄
dondo ̄peterꎬ2008)ꎮ 在 CtHb 中ꎬA 螺旋之前存在较
长的一段序列ꎬ可能与苔藓植物延长的 N ̄端氨基酸
有着相似的作用ꎬ即与蛋白的转运有关ꎬ但信号肽和
亚细胞定位预测都没有支持这一推断ꎮ 这可能与采
用的生物信息学的预测方法有关ꎬ需要进一步的实
验证据来证明ꎮ 如果这些都被验证是正确的ꎬ那么
从进化的角度讲ꎬNsHb可能从细胞器的蛋白进化成
了细胞质的蛋白(Ross et alꎬ2002)ꎮ
本研究也检测了参与配基结合的一些重要位点
的氨基酸组成和相对位置(图 4:B)ꎬ结果表明近端
组氨酸(His)ꎬ 远端组氨酸ꎬ 螺旋 B 第 10 位的苯丙
氨酸 ( Phe)ꎬ CD ̄loop 第 1 位的苯丙氨酸及 172 /
150的酪氨酸(Tyr)在水蕨和水稻NsHb1中都非常一
222 广 西 植 物 36卷
致ꎬ位置完全吻合ꎮ 这表明 CtHb 具有水稻 NsHb1
类似的配基结合动力学性质ꎬ即具有很低的 O2解离
常数ꎬ很高的 O2亲和力ꎮ
4.6 血红蛋白的序列和结构进化
通过将 CtHb与其他分类群的代表序列比较发
现(图 5 ): CtHb 包含非常保守的近端组氨酸
(H95)ꎬ远端组氨酸(H130)和位于 B 螺旋第 10 位
的苯丙氨酸(F62)ꎻ同时也发现ꎬ在 CD ̄loop 的第 1
位上只有苔藓植物是酪氨酸(Tyr)而其他物种都是
苯丙氨酸(Phe)ꎮ 这说明 CD1在非共生血红蛋白的
祖先序列中是被酪氨酸占据的ꎬ而在进化过程中被
苯丙氨酸所取代ꎮ
图 6不同物种 GGPPS 蛋白序列的同源比较
采用Neighbor ̄joining算法ꎬ在MEGA6软件平台上构
图 6 不同物种的系统进化树
Fig. 6 Phylogenetic tree of different species
图 7 角齿藓、水蕨、水稻非共生血红蛋白和大豆豆血红蛋白三级结构和表面电荷分布比较 带有正电荷和负电荷的氨基酸
分别用蓝色和红色表示ꎻ 小立碗藓的三级结构坐标数据(ID number:PM0075013)从蛋白质模型数据库(Protein Model Database) (http: / / mi.
caspur.it / PMDB / )下载ꎬ水稻和大豆的三级结构坐标数据(ID numbers:1D8U和 1BIN)从 RCSB蛋白质数据库(RCSB Protein Data Bank)下载ꎮ
Fig. 7 Comparison of the predicted nonsymbiotic hemoglobin from Ceratodon purpureusꎬCeratopteris thalictroidesꎬnative rice
NsHb1 and soybean Lba tertiary structures and surface charge distribution Blue and red colors represent positively and negatively charged
amino acid residuesꎬrespectivelyꎻ Coordinates for nonsymbiotic hemoglobin from Ceratodon purpureus was obtained from Protein Model Database (http: / /
mi.caspur.it / PMDB / )under the ID number PM0075013. Coordinates for the rice NsHb1 and soybean Lba structures were obtained from RCSB Protein
Data Bank with the ID numbers 1D8U and 1BINꎬrespectively.
建了植物血红蛋白的分子系统进化树(图 6)ꎮ 根据
序列的差异分为两大分支—非共生血红蛋白 1
(Ns1)、古老的血红蛋白(Ns)组成的分支和非共生
血红蛋白 2(Ns2)、共生血红蛋白( sHb)组成的分
支ꎻCtHb 位于非共生血红蛋白 1 的基部ꎬ说明其可
能是非共生血红蛋白 1 的共同祖先ꎬ并且其进化地
位比古老的苔藓植物血红蛋白稍微高等一点ꎬ这跟
物种的进化关系是吻合的ꎮ
本研究也比较了角齿藓、水蕨、水稻非共生血红
蛋白及大豆的豆血红蛋白三维结构的差异ꎬ揭示了
植物血红蛋白从非共生到共生进化过程中的一些关
键改变(图 7)ꎮ 这些改变包括:(1)血红素辅基从
六配位体(Hexacoordinate)到五配位体(Pentacoordi ̄
nate)的转变(Gopalasubramaniam et alꎬ2008)ꎻ(2)
CD ̄loopꎬN ̄端和 C ̄端区域长度的缩短ꎻ(3)蛋白结
构更加紧凑ꎬ形成球状结构ꎮ 这些改变可能有助于
非共生血红蛋白向共生血红蛋白结构的转变ꎬ 特别
是有助于豆血红蛋白共生功能的实现(Gopalasubra ̄
maniam et alꎬ2008)ꎮ
(下转第 161页 Continue on page 161 )
3222期 齐小琼等: 水蕨血红蛋白基因的分子克隆和序列分析