免费文献传递   相关文献

孔石莼质体蓝素氨基酸序列分析和分子进化



全 文 :分子植物育种,2005年,第3卷,第2期,第203-208页
MolecularPlantBreeding,2005,Vol.3,No.2,203-208
研究报告
RESEARCHREPORT
孔石莼质体蓝素氨基酸序列分析和分子进化
刘振宇 1,3 谢荔岩 1 吴祖建 1,2 林奇英 1,2* 谢联辉 1,2
1福建农林大学植物病毒研究所,福州,350002;2福建农林大学生物农药与化学生物学教育部重点实验室,福州,350002;3山东农业大学植
物保护学院,泰安,271018
*通讯作者,linqiying@126.com
以孔石莼(!#$ %&’()*$)质体蓝素氨基酸序列在NCBI以BLASTp进行同源性检索,将获得具有一
定同源性的不同生物的质体蓝素氨基酸序列进行生物信息学分析。共比较37种生物的38个氨基酸序列,
包括13种藻类,1种苔藓,23种陆生被子植物的24个氨基酸序列。发现孔石莼质体蓝素的氨基酸序列与
其它序列的同源性从26.4!~88.8不等,所有生物的质体蓝素氨基酸序列表现出较大的保守性和进化性;
基于不同生物质体蓝素成熟肽的氨基酸序列之间的同源性,构建了它们的系统进化树,这些系统进化树能
够较准确地表现各种生物系统进化关系,可以说生物的质体蓝素的氨基酸序列可作为生物系统进化的一
个分子依据。
孔石莼,质体蓝素,生物信息学,分子进化
AminoAcidSequenceandMolecularEvolutionAnalysisofPlastocyanin
from+#, %&’()*,
LiuZhenyu1,3 XieLiyan1 WuZujian1,2 LinQiying1,2* XieLianhui1,2
1PlantVirusInstitute,FujianAgricultureandForestryUniversity,Fuzhou,350002;2KeyLaboratoryofBiopesticideandChemicalBiology,Min-
istryofEducation,FujianAgricultureandForestryUniversity,Fuzhou,350002;3PlantProtectionColege,ShandongAgricultureUniversity,Tai’an,
271018
*Corespondingauthor,linqiying@126.com
Plastocyaninsarefoundincyanobacteria,algae,andplants,wheretheyplayaroleinthephoto-
syntheticprocessbyshutlingelectrons.Anaminoacidsequenceofplastocyaninfrom!#, %&’()*,wasobtained
andsearchedinSwiss-protproeinbankwithblastp.Altheplatocyaninsequencesobtainedwereanalyzed,in-
cluding13algae,1moss,and23angiosperms,whichwere38aminosequencestogether.Aminoacidsequenceof
plastocyaninfrom!- %&’()*$shared26.4#~88.8$homologywithothersequenceofplastocyanin,whichpartly
impliedthataminosequenceofplastocyaninshowedbiggishevolutionandconservation.Phylogenetictreewas
createdbasedontheaminoacidsequenceofplastocyaninwhichcanexhibitedthephylogeneticrelationshipof
theorganismstested.Wecouldincludedthesequenceofplastocyanincanbeusedasthemolecularproofof
molecularevolutionandphylogenetics.
+#$ %&’()*$,Plastocyanin,Bioinformatics,Molecularevolution
质体蓝素( plastocyanin)是含有铜原子的蛋白
质,在光合作用过程中起着电子传递作用,它存在于
多数生物中,其物种跨度较大、家族成员较多。在研
究中我们对编码孔石莼(+- %&’()*$)质体蓝素的cD-
NA进行了克隆,并获得了其编码的氨基酸序列,探
讨了孔石莼质体蓝素氨基酸序列特征。通过对比其
它生物质体蓝素的氨基酸序列,发现质体蓝素氨基
酸序列的特征能够反映不同生物的系统进化,揭示
出它作为分子进化标尺的潜在价值。
经典的进化学家已经得出有机体进化历史的
分子植物育种
MolecularPlantBreeding
主要框架,然而形态和生理性状的进化极其复杂,
很难产生无可争议的进化历史的清晰图像。随着分
子生物学的进展,这种局面得到了改变。由于生命
是由基本组成物质(蛋白质、核酸等)经过漫长的进
化演变形成的复杂系统,因此生物大分子的进化研
究对揭示生命的起源与进化机制有重要意义( Nel
andKumar,2002)。氨基酸序列和基因序列对研究
生物的系统进化都有重要作用,重要的是得到合适
的可供比较的某类氨基酸或某类基因的大量序列。
本文在比较孔石莼质体蓝素氨基酸序列特征基础
上,分析了其作为分子进化依据的可能,期望能为
分子进化的研究提供一点素材。
1材料与方法
1.1氨基酸序列
孔石莼质体蓝素的氨基酸序列:本实验室经过
克隆,获得其cDNA序列,经过翻译后得到。
其它36种生物的 37个质体蓝素的氨基酸序
列均来自 SwissProt非冗余蛋白质数据库。截至
2004-11-21的01:24am,从158509个序列中搜索
得到的与孔石莼质体蓝素氨基酸序列具有同源性
的质体蓝素氨基酸序列。
1.2方法
将获得的孔石莼质体蓝素的氨基酸序列在
htp:/www.ncbi.nlm.nih.gov/BLASTp进行同源性
检索,并编辑检索得到的所有具有同源性的不同生
物的质体蓝素氨基酸序列,保留其成熟肽序列部
分,利用DNAMAN(htp:/www.lynnon.com)进行序
列的比较分析。
2结果分析
2.1孔石莼质体蓝素的氨基酸序列
将编码孔石莼质体蓝素的cDNA的ORF翻译
后,得到其氨基酸序列如下:MSFTLNTAKVANG
PRMAVQKVAKTVAAGVVAVGLSAGAANAAAI
VKLGGDDGSLAFVPNKITVAAGEAIEFINNAGFP
HNIVFDEDEVPAGVDADAISYDEYLNGKGQTVV
RKLSTAGTYGVYCEPHAGAGMKMTITVQ
该序列共包括 139个氨基酸残基,登录 htp:
/www.cbs.dtu.dk/services/SignalP/,用 SignalP分析
发现,该序列为孔石莼质体蓝素的前体肽序列,其
中N端前41个氨基酸为信号肽序列,其后的98个
氨基酸序列为质体蓝素的成熟肽。
2.2质体蓝素氨基酸序列的保守性和进化性
将SwissProt非冗余蛋白质数据库中与孔石莼
质体蓝素具有一定同源性的其它生物的质体蓝素
序列进行编辑,全部整理为只有成熟肽的序列。将
供试 37种生物的 38个质体蓝素氨基酸序列,以
DNAMAN进行序列比对分析。根据这38个氨基酸
序列的同源性矩阵( 结果未列出)可以看出,孔石莼
质体蓝素的氨基酸序列与其它序列的同源性从
26.4!~88.8不等,这个数据也是孔石莼质体蓝素
氨基酸序列与其它12种藻类生物的质体蓝素氨基
酸序列比较的同源性。而这38个序列之间的同源
性,最小为16.8#,最大为99.0$。可见生物的氨基
酸序列存在着较大的变异性。同样我们也可从孔石
莼与其它生物质体蓝素氨基酸序列的同源性比较
和38个氨基酸序列间的同源性可以看出,生物质
体蓝素的氨基酸序列存在着较大的保守性。从试验
结果中可以看到,孔石莼与同属于石莼属的 !
#$#%#&’’( P13133)、! ($)*’+,$#( P07465)的同源性分
别为88.8%和87.8&,而单独将供试的24种被子
植物的质体蓝素氨基酸序列进行同源性比较( 结果
未列出),发现其之间的同源性最小为61.5’,最大
可达98.0(;可见这24种被子植物间的质体蓝素
氨基酸序列的保守性更高。
2.3孔石莼质体蓝素氨基酸序列与其它序列
的共有保守氨基酸残基
在38个供比较的生物序列中,有15个氨基酸
残基是完全相同的。主要是非极性氨基酸残基G7、
G25、G88、G90和 P17、P37、P85,以及 A89、M91、
V97;3个不带电荷的极性残基N33、N39、C83;2个
带正电荷的极性残基H38、H86。比较于其它从原核
生物至低等的藻类植物到高等的被子植物的37个
质体蓝素的氨基酸序列,孔石莼中完全保守的氨基
酸残基数占孔石莼质体蓝素氨基酸残基的15.3),
从这一点上也可见质体蓝素在进化上具有很高的
保守性。
2.4基于质体蓝素氨基酸序列的供试生物的
系统进化
鉴于质体蓝素氨基酸序列存在的保守性和变
异性,这就为以质体蓝素氨基酸序列为依据进行生
物的系统进化提供了可能。我们将38个质体蓝素
的氨基酸序列以DNAMAN进行系统进化树构建,
204
得到的树状图见(图1)。图1所构建的是系统进化的
有根树,从此系统进化树图可以看到,在假定供比
较的 38个序列的生物均起源于共同祖先的前提
下,38个序列所代表的生物共进化为2簇,X和Y,
图1基于质体蓝素氨基酸序列的38个生物的系统进化树
Figure1Thephylogenitictreeof38organismsbasedontheaminoacidsequenceofplastocyanin
其中簇X由24个被子植物的质体蓝素氨基酸序列
组成的,簇Y则包括6种属于原核生物的藻类、6
种属于真核生物的藻类和1种苔藓植物。我们再将
其细分为A~G7个簇和U、V、W3个簇。对比当代
孔石莼质体蓝素氨基酸序列分析和分子进化
AminoAcidSequenceandMolecularEvolutionAnalysisofPlastocyaninfrom!#$ %&’()*$ 205
分子植物育种
MolecularPlantBreeding
较流行的系统发育系统中的柯朗奎斯特( ! #$%&!
’()*+)( 顾德兴,2002,普通生物学,pp.234-306)系统
所揭示的物种的分类,这些不同的簇分别包括了一
些在系统进化上相近的生物种类。
将13种藻类生物单独进行系统进化的比较,
得系统进化树(图2),图2所示为无根树。
由图2可见,按其质体蓝素氨基酸序列的同源
性,供比较的13种藻类可分为3簇。属于原核生物
蓝藻门( #,-&%.-/+0$)-)的7种生物组成了簇W;簇
U包括 1 2$%3)40$-( P56274,孔石莼,UPG75)和 1
2$%3)40$-( P07465,浒苔)及 1 -$-*-5))( P131333),它
们同属于绿藻门( #63%$%26,+-)、石莼目( 137-30*)、石
莼科( 137-/0-0)、石莼属( 137-);同属于绿藻纲
( #63%$%26,/0-0)的 #63%$033- 4(*/-( P00300,小球
藻)、8/0&090*:(* %.3)’((*( P26956,斜生栅列藻)以
及 #63-:,9%:%&-* $0)&6-$9+)) (P18068,莱茵衣藻),
它们分别属于属于绿球藻目 (#63%$%/%//-30*)、栅藻
科(8/0&090*:-/0-0)、栅藻属(8/0&090*:(*)以及团藻
目( ;%37%/-30*)、衣藻科( #63%$%/%//-30*)、衣藻属
( #63-:,9%:%&-*),这3种生物构成了簇V。
簇U和簇V属于真核生物,在我们所构建的系
统进化树中,它们并列为2簇。从系统发育上看,雷
氏衣藻(#63-:,9%:%&-* $0)&6-$9+)) 是最简单最原始
的原植体结构,单细胞,具有2条顶生等长的鞭毛,
小球藻(#63%$033- 4(*/-)也是单细胞生物,而斜生栅
列藻(8/0&090*:(* %.3)’((*)也仅仅是2~8个细胞组
成的单列或双列的群体,它们都属于陆生淡水藻
类;而簇U的3种藻类,则是生活在海水中的盐生
藻类,它们来源于进化的简单的不分枝的丝状体。
可见依据质体蓝素的氨基酸序列构建的系统进化
树在反映其系统进化上是合适的。
簇 U中的浒苔(1 2$%3)40$-),原来在归类上定
为浒苔属的 <&+0$%:%$26- 2$%3)40$-(李伟新等,1982,
海藻学概论,pp.181-218),现在根据其有关的特性,
将其归于石莼属。但从此系统进化树看来,它的亲
缘关系还是要远于原就划归为石莼属的2种生物。
簇 W中的 P46444和 O52830及 P00301的同源性
分别为99.0!和96.2(结果未显示),而P00301和
O52830的同源性也达95.2#,它们表现出很高的
亲缘关系。研究其归属关系,可见它们同属于念珠
藻目(=%*+%/-30*)、念珠藻科(=%*+%/-/0-0);而P46444
和 O52830质体蓝素氨基酸序列的相似性高达
99$,暗示着这2种生物高度相近。P46444的氨基
酸序列是由 1994年 Ghassemian等和 2001年
Kaneko等克隆编码 !&-.-0&- *2(鱼腥藻)质体蓝素
的基因翻译而来,其时他们把研究对象定为 ! *2
(鱼腥藻)并递交基因序列,现在根据这些生物的特
征,在GenBank上登录的生物体已经被修改为 =%*!
+%/ *2(念珠藻)。由此也可看出,质体蓝素作为生物
进化的分子依据的可靠性。
图2基于质体蓝氨基酸序列的13种藻类生物的系统进化树
Figure2Thephylogenitictreeof11algaebasedontheaminoacidsequenceofplastocyanin
206
鉴于供试的 23种被子植物在进化上的相近
性,按照图1所构建的有根树可能不能较准确的反
映其进化关系,因此根据24生物的质体蓝素氨基
酸序列构建了系统进化树的无根树( 进化树图未显
示),发现:其与根据38个氨基酸序列构建的有根
树中24个被子植物的系统亲缘关系有所不同。我
们可以将24个植物的氨基酸序列构建的无根树中
的生物分为5个簇,其中簇A、B、C、E所包括的生
物都没有变化,簇D、F、G则共同组成了一个新的
簇与簇A、B、C、E并列。
结合柯朗奎斯特( ! #$%&’()*+)系统,研究所比
较质体蓝素氨基酸序列所在的生物的归属关系,从
目这一级分类阶元上尚不能看出这5簇生物系统
归属关系,但是从科这一级分类阶元上看,属于同
一科的生物其同源性更高,基本上,在系统进化树
上都在各簇的分支中并列一起。如禾本科的大麦
( ,%$-(. /(012$3,P08248) 和水稻( 4$562 *2+)/2,
P20423),其同源性达95!( 图3),构成了簇F;蚕豆
( 7)8)2 92:2,P00288) 和 豌 豆( ;)*(. *2+)/(.,
P16002)的同源性也达95( 图3),归属于簇E的
分支;十字花科( <$2**)828323)的拟南芥( !$2:)-%=*)*
+>20)2&2,P11490)和荠菜( #2=*3002 :($*2?=2*+%$)*,
P00294),其同源性为84.7#( 结果未显示),归属于
B簇;同源性为87.9$( 结果未显示)的黄瓜( #(!
8(.)* *2+)/(*,P00292)和西葫芦( #(8($:)+2 =3=%,
P00293)则同属于葫芦科( #(8($:)+28323),也归属在
B簇生物中。茄科的5个质体蓝素氨基酸序列和属
于石竹目蓼科的P00298的同源性更高,而被归属
为同一簇,簇A,这其中 P35476和 P35477的同源
性高达98.0%( 图3),这2个质体蓝素的氨基酸序
列其实是来自同样生物烟草( @)8%+)2&2 +2:28(.)的
不同个体测定的结果,应该说这是必然的结果。同
属的马铃薯( A%02&(. +(:3$%*(.)和番茄( B58%=3$*)!
8%& 3*8(03&+(.,P17340)质体蓝素氨基酸序列之间
的同源性也高达98.0&。但也有特殊的结果,如属
于豆科的菜豆( ;>2*3%0(* /(012$)*,P00287)则属于簇
D,即使在构建的无根树中,它与蚕豆和豌豆也不属
于同一簇;而石竹目( #2$5%=>500203*)的 A)03&3 02+)9%!
0)2 *(:*= 20:2( P07030)、A=)&28)2 03$2832( P00289)
以及 C(.3D %:+(*)9%0)(*( P00298)却归属于 3个不
同的簇,D、C、A,即使在构建的无根树中其也属于
不同的3个簇。其中原因尚需进一步分析。但总的
来看,质体蓝素的氨基酸序列基本上能够反映这23
种生物系统进化关系。
总之,以上的进化都部分地验证了生物进化的
图324个植物质体蓝素氨基酸序列的同源性
Figure3Homologyanalysisofplastocyaninaminosequenceof
24organisms
孔石莼质体蓝素氨基酸序列分析和分子进化
AminoAcidSequenceandMolecularEvolutionAnalysisofPlastocyaninfromE0/2 =3$+(*2 207
由原核细胞到真核细胞、由单细胞到多细胞、由非
维管植物到维管植物、由简单到复杂、由水生到陆
生的生物进化趋势。也表明依据生物的质体蓝素的
氨基酸序列构建的系统进化树是科学合适的,可以
提供生物系统进化的科学信息。质体蓝素的氨基酸
序列可以作为生物系统进化的分子依据。
3讨论
本试验中在比对24个植物的质体蓝素氨基酸
序列后得出的植物系统进化关系上,存在着一定的
误差,甚至同属一个目的植物不在一个系统进化的
簇上,可能的原因是多个方面的,序列比对的软件
的使用是其中之一。本试验中采用的是较为常用的
生物信息学软件DNAMAN,它本身存在的一些逻
辑和计算方法上的缺漏使得难以在系统发育分析
上准确无误,相信随着系统分析方法的提高,利用
基因和蛋白质序列来更准确地得到生物间的系统
进化关系是完全可能的。误差存在的另外一个原因
就是在本试验中所使用的序列数目的偏少,尽管能
够大致反映生物之间的系统进化关系,但还不能完
全和准确。我们可以设想,如果在比对各种生物的
系统进化关系时,所选取的生物数量更大、代表性
更强、不同的进化单元都有一些代表种以供比较,
则其所表现出亲缘关系的改变也是可能。本试验中
苔藓同供试的23种被子植物一样,同属于有胚植
物,但在系统进化树图 1中,苔藓属于簇 Y,与 13
种藻类生物表现亲缘关系更近,这应当是因为所比
对的23种被子植物进化上更为高级,与它们相比,
苔藓在质体蓝素的进化上更趋近于这些水生的藻
类生物。假如在供试的23种被子植物与苔藓植物
之间,再增加一些中间种类生物的质体蓝素氨基酸
序列,则苔藓的系统进化关系表现得与这些有胚植
物更近一些,这是可能的。Mark等曾对475和499
种种子植物的DNA序列进行了探索性分析,这些
种类代表了种子植物种所有的主要分类群,他们发
现这些探索性分支中的某些主要分支是与经典的
分类系统是一致的( 陈之端和冯旻,1998,植物系统
学进展,pp.23-74)。相信随着生物的基因和氨基酸
序列的逐渐增加,数据库中数据的大量积累会使利
用质体蓝素的氨基酸序列来分析生物的系统进化
表现的更加成熟。
分子进化即微观进化,它依赖于核酸、蛋白质
序列的信息,阐明物种进化的分子基础。在研究从
病毒到人类的各种生物的进化历史中,DNA或蛋白
质序列的系统发育分析已经成为一个重要工具( Nel
andKumar,2002)。分子生物学的发展使得我们在追
溯进化谱系时不仅仅依据表型( 形态的、生理的、行
为的)特征,而且能够直接比较不同生物的基因型
特征,并在此基础上建立了分子系统学( molecular
systematics)。相信随着各种生物的基因和氨基酸序
列的大量获得,以及比较方法学的完善,分子系统
学必定会有更大的发展,依据其验证传统的进化系
统已成必然,甚至依靠分子特征的比较,提出和改
善经典的系统进化谱系也是可能的。
从供比较的生物的质体蓝素的氨基酸序列可
以看到,这类具有重要生物学功能的大分子在多处
氨基酸序列和残基上都具有高度的保守性,经分析
这些高度保守的氨基酸残基及其构成的序列是质
体蓝素重要的功能位点( 结果在另文讨论),可见这
种保守性对维持蛋白质功能的重要意义。同时也可
见质体蓝素分子结构的局部进化保守性并不是完
全随机的。相信必然存在着某种制约因素或控制机
制,而能够其维持这种进化保守性,进一步研究分
析这些序列特征的方法并深入比较这些序列,也许
能够得出这方面的一定的结论。
致谢
本研究为福建省科技厅重大研究资助项目,项
目编号:No.2000H004,2001Z127。
参考文献
GhassemianM.,WongB.,FereiraF.,MarkleyJ.L.,andStraus
N.A.,1994,Cloning,sequencingandtranscriptionalstudies
ofthegenesforcytochromec-553andplastocyaninfrom
!#$#%# &’(PCC7120,Microbiology,140(5):1151-1159
KanekoT.,NakamuraY.,WolkC.P.,KuritzT.,SasamotoS.,
WatanabeA.,IriguchiM.,IshikawaA.,KawashimaK.,
KimuraT.,KishidaY.,KoharaM.,MatsumotoM.,Mat-
sunoA.,MurakiA.,NakazakiN.,ShimpoS.,SugimotoM.,
TakazawaM.,YamadaM.,YasudaM.,andTabataS.,
2001,Completegenomicsequenceofthefilamentousni-
trogen-fixingcyanobacterium )#$#%# &’( strainPCC
7120,DNARes.,8(5):205-213
NelM.,andKumarS.,eds.,LvB.Z.,ZhongY.,GaoL.P.,trans.,
2002,MolecularEvolutionandPhylogeletics,HigherEdu-
cationPress,pp.1-14( NelM.,KumarS.,主编,吕宝忠,钟
扬,高莉萍,译,2002,分子进化与系统发育,高等教育出
版社,pp.1-14)
分子植物育种
MolecularPlantBreeding
208