全 文 :研究报告
生物技术通报
BIOTECHNOLOGY BULLETIN 2010年第 1期
甘蓝型油菜 碳酸酐酶的结构预测
邓秋红 栗茂腾 向福 余龙江
(华中科技大学生命科学与技术学院 ,武汉 430074)
摘 要: 根据已经克隆到的甘蓝型油菜 碳酸酐酶基因序列,概念地翻译成蛋白质的氨基酸序列。利用 Vecto rNT I
Suite、SOPMA、Sw issM ode l和 NCBIVAST等软件和服务器对甘蓝型油菜 碳酸酐酶的一级结构、二级结构、三维结构进行分
子结构模型预测, 并进行三维结构的比对。预测结果显示, 甘蓝型油菜 碳酸酐酶是定位于叶绿体基质的蛋白质,具有 类
碳酸酐酶所特有的保守性基序 CysXnH isX2Cys; SOPMA预测二级结构显示 螺旋 ( 3988% )、随机卷曲 ( 39 27% )、折叠
( 1631% )和 转角 ( 4 53% ); 用同源建模法构建了三维结构图;通过 VAST矢量比对工具将甘蓝型油菜 碳酸酐酶与模板
( 1ekjG )进行三维结构比对, 显示甘蓝型油菜 碳酸酐酶与豌豆 碳酸酐酶同型八聚体中的一个单体 ( 1ek jG )很好的匹配,推
测甘蓝型油菜 碳酸酐酶全酶也是同型八聚体。
关键词: 甘蓝型油菜 碳酸酐酶 分子结构 结构预测 结构比对
Structure Prediction of Carbonic Anhydrase from Brassica napus
DengQ iuhong L iM aoteng X iang Fu Yu Long jiang
(College of L ife Science and Technology,H uazhong University of Science and T echnology, W uhan 430074)
Abstrac:t The nuc leotide sequence of carbon ic anhydrase (CA ) ofB rassica napus was conceptua lly translated into am ino
acid sequence. The pr im ary structure, secondary structure, threed imensional structure and 3D struc ture alignm ent o fCA w ere pred ic
ted by using Vecto rNT I Su ite softw are, SOPMA server, Sw issM ode l serve r and NCB IVAST server, respective ly. The CA ofB. napus
w as located in chlorop last strom a and had the conservative m otif ( Cy sXn H isX2 Cys) pecu liar to type carbonic anhydrases. In the
secondary struc ture, he lix, random co i,l shee t, and tu rn we re 3988% , 39 27% , 16 31% , and 453% , respectively. The three
d im ensiona l structurew as construc ted by homo logy modeling. The 3D a lignm ent ofCA from B. napus and am onom er o fCA octam
e r from pea ( 1ek jG ) show ed that the 3D structure o fCA from B. napus cou ld m atch w e llw ith themonom er. The a lignm ent results im
p lied thatCA from B. napus was am onom er of the CA octame r from B. napus.
Key words: Brassica napus C arbon ic anhydrase Molecu lar structure Struc ture prediction Struc ture a lignm ent
收稿日期: 20091010
基金项目:国家重点基础研究发展计划 ( 2006CB403301 ) ,国家 863!高技术计划 ( 2009AA101105)
作者简介:邓秋红,女,博士研究生,研究方向:植物分子生物学; Em ai:l dengq iu1867@ s ina. com
通讯作者:余龙江,教授,从事资源生物学与生物技术研究; Em ai:l yu longjiang@ m ai.l hu st. edu. cn
碳酸酐酶 ( carbonic anhydrase, CA, EC 4211)
是一种含锌金属酶, 催化 CO2的可逆的水合反应
(H 2O + CO2 H
+
+ HCO
-
3 ), 是已知的催化速
率最高的酶之一。它广泛存在于动物, 植物, 古细
菌和真细菌中。到目前为止, 除了真菌外, 其它生
物体中都已经发现了碳酸酐酶的存在 [ 13]。目前已
知的碳酸酐酶分为 5种: CA、CA、 CA、!CA和
∀CA, 它们没有一级结构的相似性, 似乎独立进
化 [ 46]。植物的碳酸酐酶有 4种: CA、CA、 CA
和 !CA [ 7, 8]。在 C3植物的叶绿体基质中有很高水
平的碳酸酐酶活性, 这个活性主要来自于 CA [ 9]。
作者在先前的试验中, 以甘蓝型油菜的 CA为研
究对象,首次克隆并报道甘蓝型油菜 CA基因序列
( GenBank登录号: GQ356780) , 其编码的氨基酸序
列与其他植物的 CA有很高的同源性。例如, 甘
蓝型油菜 CA基因编码的氨基酸序列与拟南芥
CA、埃塞俄比亚芥 CA 的氨基酸序列分别为
979%和 94%的同源性 [ 10]。
生物技术通报 B iotechnology Bulletin 2010年第 1期
利用生物信息学软件及在线服务器, 可以模拟
甘蓝型油菜 碳酸酐酶的三维分子结构。甘蓝型
油菜 碳酸酐酶与豌豆 碳酸酐酶 (同源八聚体 )
的一个单体 1ek jG的氨基酸序列有 75%的同源性,
而豌豆 碳酸酐酶同源八聚体的 X射线晶体衍射
的 3D结构图已经解析 ( PDB登录号: 1ekj) [ 11] , 比
较甘蓝型油菜 碳酸酐酶与豌豆 碳酸酐酶的三
维结构,可以帮助人们更好地了解甘蓝型油菜 碳
酸酐酶的结构和功能。
1 材料与方法
11 甘蓝型油菜与其它植物的 碳酸酐酶氨基酸
序列同源性比较
氨基酸序列比核苷酸序列更保守,于是将克隆
到的 CA基因的核苷酸序列 ( 996 bp)转换成氨基
酸序列 ( 331 aa) , 在 NCB I网站 ( http: / /www. ncb.i
nlm. nih. gov )上进行 B lastP 比较。用 V ector NTI
Suite 90软件对甘蓝型油菜, 埃塞俄比亚芥, 遏蓝
菜,拟南芥, 豌豆的 CA的氨基酸序列进行同源性
分析。在 GeneDoc软件中用不同的阴影予以标识。
用 ProtScale程序 ( http: / /expasy. org / tools/protscale
htm l)计算蛋白质亲疏水性的分布;用 TM pred程序
( http: / /www. ch. embne.t o rg /so ftw are /TM PRED _
form. htm l)在线分析蛋白质跨膜区, PSORT[ 12] ( ht
tp: / /psor.t im s. utokyo. ac. jp / form. htm l)预测甘蓝
型油菜 碳酸酐酶的亚细胞定位。
12 甘蓝型油菜 碳酸酐酶二级结构预测
用 SOPMA在线分析软件进行甘蓝型油菜 碳
酸酐酶二级结构的预测 ( http: / /npsapb i.l ibcp. fr/
cg ib in /npsa_ automa.t p?l page= /NPSA /npsa_ sop
ma. htm l)
[ 13]。
13 用同源建模法预测甘蓝型油菜 碳酸酐酶 3
D结构
一般来讲, 目标序列与参考蛋白序列之间的同
源性在 50%以上,则通过参考蛋白搭建出来的蛋白
三维结构具有很高的准确性 [ 14]。甘蓝型油菜 CA
与豌豆 1ekjG的序列同源性为 75% , 可以用同源建
模法来预测甘蓝型油菜 碳酸酐酶三维结构。进
入 SW ISSMODEL主页 ( http: / / sw issmode.l expasy.
org) ,选择 First Approach M ode!模式, 在该模式下
填写项目名称 BnCA, 并输入一个选定的模板
( 1ek jG) , 点击 Subm itM ode ling Request!。服务器
返回分析结果,包括建模结果和模型评价。将建模
结果保存为 PDB格式 ( BnCA. pdb) , 然后用 Rastop
软件打开,实现可视化。用 Procheck软件包进行模
型质量评估 [ 15]。
14 甘蓝型油菜 碳酸酐酶与豌豆 碳酸酐酶单
体 1ek jG的 3D结构比较
通过 NCB IVAST矢量比对工具将甘蓝型油菜
碳酸酐酶与结构类似的蛋白进行 3D结构比对。
进入 VAST 主页 ( http: / /www. ncb.i n lm. n ih. gov /
Structure /VAST /vastsearch. htm l) , 输入同源建模时
生成的 PDB文件 ( BnCA. pdb ) Subm i,t 然后点击
Star,t最后选定结构相似性最高的 lek jG为目标蛋白
与甘蓝型油菜 碳酸酐酶进行结构比对。点击
V iew 3D A lignment!就获得三维图形的比对结果,
用 Cn3D软件实现可视化。
2 结果与分析
21 甘蓝型油菜与其他植物 碳酸酐酶氨基酸序
列的比对及一级结构分析
通过 NCBIB lastP比较, 结果显示甘蓝型油菜碳
酸酐酶属于 碳酸酐酶超家族, 与其它植物 CA
基因有很高的同源性 (图 1)。
甘蓝型油菜 CA具有 类碳酸酐酶所特有
的保守性基序 CysXn H isX2 Cys[ 16] , X代表任意
氨基酸。甘蓝型油菜 CA与拟南芥 CA1、遏蓝
菜 CA高度同源, 同源性分别为 94%和 935%。
同属芸苔属的甘蓝型油菜 CA与埃塞俄比亚芥
CA的同源性最高 ( 979% ),氨基酸序列只有细
微差异, 可能是由于同一属内不同种间差异造成
(图 2)。
112
2010年第 1期 邓秋红等:甘蓝型油菜 碳酸酐酶的结构预测
以甘蓝型油菜 碳酸酐酶为例进行疏水性分
析 (窗口大小选择 9) , Pro tScale以图形显示疏水性
分析结果 (图 3)。标度为正值表示疏水性,负值表
示亲水性。经 TM pred预测, 甘蓝型油菜 碳酸酐
酶存在 1个跨膜区,软件给出了 2种跨膜模型, 其中
以 1个跨膜螺旋模型更为可信, 跨膜区在 1- 15 aa
之间 (图 4)。 PSORT的预测表明该酶是一种定位
于叶绿体基质的蛋白,预测的细胞定位结果如表 1。
22 SOPMA预测甘蓝型油菜 碳酸酐酶二级结构
SOPMA分析显示该延长酶的二级结构有 4种形
式,分别为 螺旋 ( 3988% )、随机卷曲 ( 3927% )、
折叠 ( 1631% )和 转角 ( 453% ), 这 4种二级结
构在总体上穿插排列,但有一点明显特征,随机卷曲
主要存在于蛋白质的前部 (图 5)。
113
生物技术通报 B iotechnology Bulletin 2010年第 1期
表 1 细胞定位预测结果
位 置 可能性 (% )
叶绿体基质 837
类囊体膜 414
类囊体腔 349
线粒体脊间隙 10
23 甘蓝型油菜 碳酸酐酶 3D分子结构模拟
SW ISSMODEL服务器返回的建模结果见图 6。
三维图上展示的是 112- 331 aa这一区域的三维结
构 (图 7a)。在模拟的碳酸酐酶 3D分子结构中, 5
条平行的 折叠位于碳酸酐酶分子的中央, 螺旋
包围在 折叠的外面, 形成近似球形的蛋白质分子。
114
2010年第 1期 邓秋红等:甘蓝型油菜 碳酸酐酶的结构预测
该结构符合植物型 碳酸酐酶的结构特点 [ 11 ]。
Cys162, H is222和 Cys225这 3个氨基酸残基在空间
结构上充分靠近 (图 7b), 用于结合锌,构成碳酸酐
酶的催化活性中心。
用 Procheck程序进行模型质量评估, Ramachand
ran图是一个反应立体化学质量参数的图。可以检查
蛋白质骨架是否分布在 Ramachandran图的可接受区
域内。图 8中的黄色区域是最理想的区域。如果预
测蛋白质残基的骨架全部位于黄色核心区, 则表明
空间结构稳定。从图 8及表 2中可以看出, 所有的
氨基酸都处于许可区, 表明甘蓝型油菜 碳酸酐
酶的空间结构稳定。
图 8 甘蓝型油菜 碳酸酐酶 3D模型的 Ramachandran图
表 2 Procheck程序进行模型质量评估结果
残基种类 个数 百分数 (% )
分布在最支持区域的氨基酸残基 (A, B, L) 161 870
分布在额外允许区域的氨基酸残基
( a, b, ,l p)
23 124
分布在勉强允许区域的氨基酸残基
( ~ a, ~ b, ~ ,l ~ p)
1 05
分布在不允许区域的氨基酸残基 0 00
非甘氨酸和非脯氨酸的残基数 185 100
末端残基数 (不包括甘氨酸和脯氨酸 ) 2
甘氨酸残基数 (用三角形表示 ) 22
脯氨酸残基数 10
总的氨基酸残基数 219
24 甘蓝型油菜 碳酸酐酶与豌豆 碳酸酐酶单
体 1ekjG的 3D结构比较
通过 VAST矢量比对工具将甘蓝型油菜 碳酸
酐酶与结构类似的蛋白进行 3D结构比对。比对结
果如图所示,蓝色骨架显示有差异的氨基酸残基,红
色骨架显示氨基酸残基完全一样 (图 9)。图 10显
示的是甘蓝型油菜 碳酸酐酶与豌豆 碳酸酐酶
八聚体中一个单体 lekjG的结构比对图。推测甘蓝
型油菜 碳酸酐酶全酶和豌豆一样, 为同型八聚
体。克隆到的 CA基因所对应的蛋白质是甘蓝型
油菜 碳酸酐酶全酶 (同型八聚体 )中的一个单体。
3 讨论
碳酸酐酶按其晶体结构及亚基组成可以分为 3
种类型: 、、 [ 17 ]。CA主要分布在动物及某些
115
生物技术通报 B iotechnology Bulletin 2010年第 1期
单细胞绿藻、盐藻等, 一般无寡聚体形式, 分子量
26- 30 kD; CA主要存在于植物中,往往以双亚基
为基础形成寡聚体, 140 - 250 kD之间 [ 18 ] ; CA是
1994年在古细菌M ethanosarcina thermophila中发现
的,简称为 CAM !, 分子量为 69 kD, 是一个具有左
手平行的 螺旋折叠的同型三聚体 [ 19]。最近人们
又发现两种酶与 、和 这 3类酶有着相似的催
化机制,但无显著的序列同源性,研究人员将其命名
为 !型和 ∀型 CA [ 6, 20 ]。在 C3植物的叶绿体基质中
有很高水平的碳酸酐酶活性,这个活性主要来自于
CA。2007年 Fabre等 [ 21]总结了拟南芥中有 6个
CA基因 (A tCA1 - 6 ) ,并且用绿色荧光报告蛋白
的基因融合表达 CAs的 cDNA序列,将 6个 CA
进行了亚细胞定位: CA1和 CA5是在叶绿体
中; CA 2和 CA3在细胞液中; CA4在质膜上;
CA6在线粒体中。因此, 在甘蓝型油菜中可能不
止一个 CA,而是存在多个 CA。 PSORT的亚细
胞定位预测表明本研究的甘蓝型油菜 CA是一种
定位于叶绿体基质的蛋白质, 与拟南芥 CA1
( P27140)在细胞内的位置一样。可能是因为拟南
芥 CA1( P27140)与甘蓝型油菜 CA的氨基酸序
列同源性很高 ( 94% )。
目前对碳酸酐酶的研究主要集中在碳酸酐酶
的蛋白质分子结构、酶学特性、进化分类、参与植
物和藻类等光合生物的光合作用机制以及该酶在
人体医学领域的应用。本研究主要对甘蓝型油菜
碳酸酐酶的分子结构进行预测。本研究从先前
克隆到的 996 bp的甘蓝型油菜 CA基因出发,对
其编码的蛋白质一级结构、二级结构和三维结构
进行预测。根据氨基酸序列的同源性和三维结构
已知的蛋白质分子 1ekj提供的信息, 利用生物信
息学软件及服务器, 进一步对二者的三维结构比
对, 有助于从分子的水平认识这个蛋白质的结构
与功能。本研究发现甘蓝型油菜 碳酸酐酶的二
级结构和三维结构均符合植物 CA的结构特征。
蛋白质的结构比序列更保守, 基于甘蓝型油菜
CA与 lek jG (豌豆 CA同型八聚体中的一个单
体 )的序列同源性为 75%, 利用 Sw issMode l中的
同源建模法构建甘蓝型油菜 CA的三维结构。
然后用 Procheck程序进行模型结构的质量评估,
R am achandran图表明甘蓝型油菜 CA的三维空
间结构稳定;通过 NCB I服务器的 VAST矢量比对
工具将甘蓝型油菜 CA与 lek jG进行三维结构比
对,结果显示甘蓝型油菜 CA三维结构与 lek jG
可以很好地匹配, 推测甘蓝型油菜 CA全酶为同
型八聚体。 CA和 CA是严格的单体和三聚
体,但是 CA中有二聚体、四聚体、六聚体和八聚
体,其中二聚体是基本的构建单元 [ 11 ]。研究人员
对 CA的研究要落后于 CA, 直到 2000年才报
道第一个 CA的晶体结构 [ 22 ]。通过生物信息学
手段预测甘蓝型油菜 CA二级结构和三级结构,
为今后开展甘蓝型油菜 CA的晶体结构研究提
供了依据。
参 考 文 献
[ 1] Lindskog S. S tru cture and m echan ism of carbon ic anhydrase. Phar
m acolTherapeu t, 1997, 74( 1 ) : 120.
[ 2] Sm ith KS, Jakubz ick C, W h ittam TS, et a.l Carbon ic anhyd rase is an
ancient enzym e w idespread in prokaryotes. ProcN at lAcad SciUSA,
1999, 96( 26 ): 1518415189.
[ 3] Thom sS. H yd rogen bond s and the catalyt icm echan ism of hum an car
bon ic anhyd rase II. JTheor B io,l 2002, 215( 4 ) : 399404.
[ 4] H ew ettEmm et t D, T ashian RE. Functional d iversity, conservat ion,
and convergence in the evo lut ion of the alpha, beta, and gamm a
carbon ic anhydrase gene fam ilies. M ol Phylogenet E vo,l 1996, 5
( 1) : 5077.
[ 5] Roberts SB, Lan e TW, M orel FMM. Carbon ic anhydrase in th e m a
rin e d iatom Tha lassiosira w eissf log ii ( Bacillariophyceae) . J Phyco,l
1997, 33: 845850.
[ 6] S o AKC, E spie GS, W illiam s EB, et a.l A novel evolu tionary lin eage
of carbon ic anhyd rase ( ep silon class) is a com ponen t of the carboxy
som e sh el.l JB acterio,l 2004, 186 ( 3) : 623630.
[ 7] B adgerMR, P rice GD. The role of carbon ic anhydrase in photosyn
thes is. Annu Rev P lan t Physiol PlantM ol B io,l 1994, 45: 369392.
[ 8] Yu S, X ia D, Luo Q, et a.l Pu rification and characterization of car
bon ic anhydrase of rice (Oryza sa tiva L. ) expressed in E scherich ia
coli. Protein E xpres Puri,f 2007, 52: 379383.
[ 9] M oron ey JV, Bartlett SG, Sam uelsson G. C arbon ic anhyd rases in
p lan ts and algae. Plant C ellE nviron, 2001, 24 ( 2) : 141153.
[ 10] Deng QH, L iMT, Yu LJ. C lon ing and expression ofB rassica napus
carbon ic anhyd rase cDNA. Z Natu rforsch C, 2009, E pub ahead of
p rint.
[ 11] K imberM S, Pai EF. The act ive site arch itectu re ofP isum sativum
b etacarbon ic anhyd rase is a m irror im age of that of alphacarbon ic
anhydrases. EM BO J, 2000, 19( 7 ) : 14071418.
116
2010年第 1期 邓秋红等:甘蓝型油菜 碳酸酐酶的结构预测
[ 12 ] Nak aiK, H orton P. PSORT, A program for d etect ion sorting s ignals
in protein s and p red ict ing their subcel lu lar loca lization. T rends B io
chem Sc,i 1999, 24: 3436.
[ 13 ] Geourjon C, Del age G. SOPMA: S ign ificant imp rovem ent in protein
secondary stru cture pred ict ion by consensus prediction from mu lti
p le al ignm ents. B ioin form atics, 1995, 11: 681684.
[ 14 ] 李军,张莉娜,温珍昌.生物软件选择与使用指南.北京:化学工
业出版社, 2008.
[ 15 ] Laskow sk iRA, M acArthu rMW, M ossDS, et a.l PROCHECK: a pro
gram to check the stereoch em ical qu ality of protein structu res. JAp
p l C ryst, 1993, 26: 283291.
[ 16 ] Row lett RS, Chance MR, W irt MD, et a.l K in et ic and structu ral
characterization of sp inach carbon ic anhyd rase. B ioch em istry,
1994, 33( 47 ) : 1396713976.
[ 17 ] T ripp BC, Sm ith K, Ferry JG. Carbon ic anhyd rase: New ins igh ts for
an an cient enzym e. J B iol Chem, 2001, 276( 52) : 4861548618.
[ 18] 郭敏亮,高煜珠.植物的碳酸酐酶.植物生理学通讯, 1989, 3:
7580.
[ 19] A lber BE, Ferry JG. A carbon ic anhyd rase from th e arch aeonM eth
anosa rcina therm oph ila. Proc Natl Acad Sci USA, 1994, 91( 15 ):
69096913.
[ 20] Cox EH, M cLendonGL, M orel FMM, et a.l Th e active s ite structure
of Thalassiosira w eissf logi i carbon ic anhyd rase 1. B iochem ist ry,
2000, 39( 40 ): 1212812130.
[ 21] Fabre N, R eiter IM, Becuw eL inkaN, et a.l Characterization and ex
press ion analys is of genes encoding alph a and b eta carbon ic anhy
drases inA rabidopsis. P lant C ellEnv iron, 2007, 30( 5) : 617629.
[ 22] M itsuhash i S, M izushim a T, Yam ash ita E, et a.l Xray structu re of
carb on ic anhydrase from the red alga, P orphyrid ium purpu reum,
reveals a novel catalyt ic s ite for CO 2 hydrat ion. J B iolC hem, 2000,
275( 8) : 55215526.
(上接第 102页 )
[ 10 ] Xu G, L i Y, et a.l M in era lizat ion of C h lorpyrifos by C ocu lture of
Serratia andTrich osporon spp. B iotechn ol Lett, 2007, 29 ( 1 0 ) :
14691473.
[ 11 ] Tal lur PN, M egad iVB, et a.l B iodegradat ion of C yperm ethrin byM i
crococcu s sp. Strain CPN 1. B iodegrad at ion, 2008, 19( 1 ): 7782.
[ 12 ] L iuW, Gan J, et a.l Isom er Selectiv ity in A qu at ic Toxicity and B io
degrad at ion of C yperm ethrin. J Agric Food Ch em, 2004, 52 ( 20 ):
62336238.
117