全 文 :生物技术通报
BIOTECHNOLOGY BULLETIN·研究报告· 2008年第4期
收稿日期:2008-01-05
基金项目:天津市科委重点攻关项目(043182711);国家自然科学基金资助(30670493);天津市高等学校科技发展基金项目(20040711)
作者简介:侯李君(1984-),女,硕士生,研究方向:藻类生物柴油,E-mail:junjunamy@yahoo.cn;TEL:022-60601101
通讯作者:施定基(1939-),男,研究员,研究方向:蓝藻基因工程,E-mail:cyano.shi@yahoo.com.cn;TEL:022-60601116
微藻以其能够利用 CO2生长,生长周期短[1],产量高[2,3],不与农作物竞争土地,容易实现自动化等优势
被世界各国认为是生物柴油的新原料。其中利用生物技术改良微藻,得到高产油微藻是研究热点之一。磷
酸烯醇式丙酮酸羧化酶(PEPC)存在于所有光合生物中[4],是光合作用中的关键酶,同时还参与氨基酸代谢
中碳骨架的回补作用[5]。从已有的高等植物中有关 PEPC调控脂类的报道[6~8]可知,在脂类代谢中,PEPC的
活性影响着脂类的合成:即当抑制 PEPCase表达时,合成的丙酮酸促进了 ACCase催化乙酰辅酶 A进入脂
肪酸合成途径。
蓝藻是一种原核的光合自养生物,结构简单,生长迅速,适应性强,遗传操作和代谢途径简单[9],适合作
为高油脂工程微藻的材料。1986年,OwtrimG.W和 ColmanB等人从蓝藻 Coccochlorispeniocystis中纯化和
鉴定出了 PEPC,并对他的动力学性质作了分析,揭示出蓝藻 PEPC与 C3植物的 PEPC相类似,在蓝藻中起
蓝藻磷酸烯醇式丙酮酸羧化酶的生物信息学分析
侯李君 1 王学魁 1 施定基 1,2
(1天津科技大学海洋科学与工程学院,天津 300457;2中国科学院植物研究所 光合作用研究中心,北京 100093)
摘 要: 应用NCBI、Expasy等在线生物信息学网站对蓝藻磷酸烯醇式丙酮酸羧化酶(PEPC)与其他物种进行序列
同源比对,分析相同的保守序列及催化活性位点,构建分子进化树;预测跨膜结构、疏水性/亲水性、二级结构、功能域和
模体等。结果显示,蓝藻PEPC与高等植物、细菌、真核藻PEPC同源性都比较低(约为33%),但是它们含有两个类似的活
性部位和相同的催化活性位点;该蛋白质是非跨膜的亲水性不稳定蛋白,二级结构以a-螺旋和无规则卷曲为主,含有一
个功能结构域,主要的功能是参与氨基酸的合成。
关键词: 磷酸烯醇式丙酮酸羧化酶 生物信息学 蓝藻(蓝细菌) 生物柴油
BioinformaticsAnalysisonPhosphoenolpyruvate
CarboxylaseinCyanobacteria
HouLijun1 Wang Xuekui1 ShiDingji1,2
(1SchoolofMarineScienceandEngineering,TianjinUniversityofScience&Technology,Tianjin300457;2ResearchCenter
ofPhotosynthesis,InstituteofBotany,ChineseAcademyofSciences,Beijing100093)
Abstract: Themulti-sequencehomologicalalignmentofPhosphoenolpyruvateCarboxylasebetweencyanobacteria
andotherspecies,theconservativesequenceandcatalyseactivesiteswereanalysedbyonlineanalysisatbioinformatics
websitessuchasNCBIandExpasy.ThephylogenetictreewasconstructedbyEBIClustalW.Thetrans-membrane
structure,hydrophobicityorhydrophilicity,secondarystructure,functionaldomainandmotifsofPEPC from cyanobacteria
werepredicted.TheresultsshowedthathomologiesbetweenPEPC from cyanobacteriaandthosefrom bacteria,high
plantsandeukaryaalgae,wererelativelow(about33%).Buttheyhavesimilaractivesitesandidenticalactiveaminoacids
residue.Theproteinisanontrans-membrane,hydrophiliaandlabileprotein.Random coilanda-helixarethemajor
secondarystructure.Itcontainsafunctionaldomain,andmainfunctionistosynthesizeaminoacids.
Keywords: Phosphoenolpyruvatecarboxylase(PEPC) BioinformaticsBlue-greenalgae(Cyanobacteria) Biodiesel
生物技术通报Biotechnology Buletin 2008年第4期
功能填补作用[10]。随后在 1998年他们又研究得到 PEPC在蓝藻中调节着碳流[11]。1992年 Irene和 Coleman
从鱼腥藻中分离和鉴定出了 PEPC,序列分析得出其包含一个 3.08kb的开放阅读框[12]。但是对于蓝藻 PEPC
在进化过程中的位置,它的理化性质、功能、结构等的研究以及 PEPC在蓝藻中的表达调控研究则未见报
道。通过生物信息学的方法预测蓝藻中该基因编码蛋白的结构和功能特性,望为实验研究和应用前景提供
有价值的信息。
1 材料与方法
1.1 材料
不同物种 PEPC的核酸序列和氨基酸序列源于 NCBIGenBank数据库中。如下所列:被子植物,包括单
子叶植物:棉花 (Gossypiumhirsutum,AAB80714)、玉米 (Zeamays,CAD60555)、水稻 (Oryzasativa,
AAG00180);和双子叶植物:拟南芥 (Arabidopsisthaliana,NP_001031179.1)、烟草 (Nicotianatabacum,
CAA41758);细菌:棒状杆菌 (Corynebacteriumcrenatum,AAK92540)、黄杆菌 (Flavobacterialesbacterium
HTCC2170,EAR00669)、鞘 脂 桿 菌 (CytophagahutchinsoniATCC33406,ABG60103),绿 球 菌 (Chlorobium
phaeobacteroidesBS1,EAM64634)、硒热菌(Thermussp,BAA07723).黏胶球形菌(LentisphaeraaraneosaHTCC
2155,EDM24998)、红小梨形球菌(RhodopirelulabalticaSH1,CAD78193)、大肠杆菌(EscherichiacoliK12,
AAC76938)、肠杆菌(Enterobactesp.638,ABP62685)、沙门氏菌(SalmonelatyphimuriumLT2,AAL22958);真
核藻:蚝球藻(Ostreococcustauri,CAL57391)、莱因衣藻(Chlamydomonasreinhardti,AAS01721);蓝藻:鱼腥藻
7120(Anabaenasp.PCC7120,NP_488901)、泡沫节球藻(NodulariaspumigenaCCY9414,EAW44045)、原绿藻
(Prochloroccusmarinusstr.MIT9211,ABX09626)、聚球藻6301(SynechococcuselongatusPCC6301,BAD80036)聚
球藻 7002(Synechococcussp.PCC7002,AAV90837)、集胞藻 6803(Synechocystissp.PCC6803,BAA18393)、
鞘丝藻(Lyngbyasp.PCC8106,EAW37105)
1.2 方法
通过 NCBIBLAST程序、ORFFinder以及 ProtParam对序列进行在线比对、确定其完整编码框并预测蛋
白质理化性质;采用 EBIClustalW工
具构建分子进化树;通过蛋白分析专
家系统 Expasy所提供的在线分析工
具如 Prosite、ProtScale分析蛋白的保
守序列,模体及亲水性/疏水性;利用
在线工具 TMHMM分析蛋白质跨膜
结构域;利用 PHD在线工具完成蛋白
质二级结构的预测;Pfam查询蛋白质
催化活性位点;Smart分析酶的功能
结构域(表 1)。
2 结果与分析
2.1 蓝藻 PEPC核酸和氨基酸序列
目前已获得 40种蓝藻的 PEPC全序列,主要有原绿藻、聚球藻、鱼腥藻、集胞藻、鞘丝藻等。GenBank中
查得 6种蓝藻 PEPC的核酸和氨基酸序列。NCBIORFFinder查找了开放阅读框,ProtParam软件分析了氨
基酸序列的理化性质。结果如表 2:蓝藻 PEPC平均核苷酸对数为:3124bp;开放阅读框的长度约为
3080bp;多肽大小为:1025(118kd);GC百分含量为 48.3%;理论等电点约为:5.64;含有的主要氨基酸有
Leu,Glu,Arg;平均不稳定指数为 51.63%,预测蓝藻 PEPC蛋白为不稳定蛋白;亲水性平均系数为:-0.354,
预测蓝藻 PEPC蛋白为亲水性蛋白质。
表 1 有关 PEPC数据库和分析软件的生物信息学网址
150
2008年第4期
2.2 分子进化树的构建与分析
目前已得到 60种植物,50种细菌,40种蓝藻及 4种真核藻的 PEPC全长序列,但是古细菌的 PEPC序
列数据还没有获得。选取了 5种被子植物、10
种细菌、2种真核藻和 7种蓝藻共 24种物种
的 PEPC全序列与鱼腥藻 7120PEPC的氨基
酸序列进行比对,构建进化树(图 1)。结果显
示鱼腥藻 PEPC与泡沫接球藻 (Nodulariaspu
migena)的进化距离最近,其次是高等植物
PEPC;而与真核藻的距离比较远;与杆菌属和
沙门氏菌进化距离比较近,而与其他细菌进
化距离都比较远。
2.3 保守序列及催化活性位点同源性分析
从上面 24种生物中选取 9种代表性生物,以鱼腥藻 PEPC氨基酸序列为基准,用 NCBIBLAST进行序
列比对,用 Prosite软件分析 PEPC氨基酸序列中的保守序列。结果如表 3:细菌、真核藻、高等植物与鱼腥藻
PEPC氨基酸序列一致性约为 33%;每种生物 PEPC序列中均有两个保守序列,以鱼腥藻 PEPC为基准,进
行序列比对:蓝藻与其他生物 PEPC的保守序列同源性平均为 67%;第 2个保守序列的同源性高于第 1个
保守序列,这也说明在不同生物中 PEPCC端序列更为保守;Pfam数据库分析了这 9种生物 PEPC序列的
催化活性位点。可以看出,不同生物 PEPC的催化活性位点均为组氨酸 H、赖氨酸 K、精氨酸 R,而且 H和
K都分别位于 2个保守序列中,R都是位于距离 K41个残基的位置。
2.4 跨膜结构域的预测和分析
跨膜结构域是膜中蛋白和膜脂相结合的主要部位,它可能作为膜受体起作用,也可能定位于膜的锚定
蛋白或者离子通道蛋白等,因而,跨膜结构域的预测和分析对于了解蛋白质的结构、功能以及在细胞中的
作用部位具有重要意义[13]。用 TMHMM2.0Server软件对鱼腥藻、原绿藻、聚球藻、集胞藻、鞘丝藻 6种蓝藻
PEPC氨基酸序列的跨膜结构域进行分析。结果表明,蓝藻 PEPC的整条肽链都位于膜外,不存在跨膜结构
域,推测它在核糖体合成前体蛋白后,经过翻译后修饰加工成为成熟蛋白质,在细胞质中与相关代谢底物
结合发挥作用。
表 2 蓝藻 PEPC基因核苷酸序列、氨基酸序列及理化性质分析
图 1 蓝藻 PEPC与其他物种 PEPC的分子进化分析
侯李君等:蓝藻磷酸烯醇式丙酮酸羧化酶的生物信息学分析 151
生物技术通报Biotechnology Buletin 2008年第4期
2.5 疏水性/亲水性的预测和分析
疏水性是决定蛋白质最终三维构象的重要因素之一。蛋白质疏水性/亲水性的预测和分析是进行蛋白
质二级结构预测及功能域划分的一个必要过程。用 Protscale分析了 6种蓝藻 PEPC氨基酸序列的疏水性/
亲水性[14]。图 2显示了鱼腥藻 7120PEPC序列的疏水性/亲水性图谱,根据分值越低亲水性越强,分值越高
疏水性越强的规律,整个多肽链中绝大多数氨基酸的分值比较低,表明亲水性氨基酸均匀分布,且多于疏
水性氨基酸。PEPC整个多肽链表现为亲水性蛋白,即 PEPC属于亲水性蛋白,这与前面理化性质预测结果
相一致。由于没有明显的疏水区,所以推测不存在跨膜蛋白,与前面的跨膜结构域分析得到的结果相一致。
其他 5种蓝藻 PEPC的疏水性/亲水性也得到了同样的结果。
2.6 二级结构的预测和分析
蛋白质分子的多肽链通常折叠和盘曲成比较稳定的空间结构,以形成特有的生物学活性和理化性质。
因此,蛋白质二级结构的预测和分析对其空间结构的了解有着重要的意义。常见的二级结构元件主要有 a-
螺旋(a-Helix)、β-转角(β-turn)、β-折叠片(β-pleatedsheet)和无规则卷曲(Randomcoil)和延伸链(extend
strand)等[15]。用 PHD软件预测了 6种蓝藻 PEPC氨基酸序列的二级结构[16]。图 3显示出了鱼腥藻 7120
PEPC的二级结构,可以看到主要由 a-螺旋和无规则卷曲和延伸链组成,含量分别为 57.41%,36.74%,
5.85%。由图 3也可以看出 a-螺旋和无规则卷曲大量分布在肽链中,而延伸链稀疏地散布在其中;其他蓝
藻 PEPC的二级结构结果与鱼腥藻相一致。
2.7 功能结构域和功能的预测和分析
利用 Smart序列分析软件分析蓝藻 PEPC氨基酸序列的结构域,它们都只含有一个显著的结构功能
域,不包含跨膜区域、卷曲螺旋、信号肽,低复杂度片段。其它物种的功能结构域分析,也得到了同样的结
果。用 ProtFun对 PEPC蛋白的功能进行了预测,蓝藻和其他物种 PEPC蛋白最主要的功能都是参与氨基酸
生物合成,另外,它可能还参与辅因子的生物合成、能量代谢、脂肪酸代谢及翻译。
2.8 Motifs预测和分析
表 3 PEPC氨基酸序列及保守序列比对及催化活性位点分析
152
2008年第4期
利用 Prosite软件根据已知蛋白 Motifs来预测鱼腥藻 7120PEPC氨基酸序列中含有的 Motifs。结果表
明,鱼腥藻 7120PEPC序列中包含有 20个酪蛋白激酶磷酸化位点(CaseinkinaseIphosphorylationsites)、8
个 N-糖基化位点(N-glycosylationsites)、12个蛋白激酶 C磷酸化位点(ProteinkinaseCphosphorylationsites)、
11个 N-肉豆蔻酰化位点(N-myristoylationsites)、2个酪氨酸激酶磷酸化位点(Tyrosinekinasephosphorylation
sites)、2个白氨酸拉链模式 (Leucinezipperpaterns)、1个 cAMP、cGMP依托蛋白激酶磷酸化位点(cAMP-
andcGMP-dependentproteinkinasephosphorylationsites)、1个酰胺化位点(Amidationsites)(表 4)。
图 3 鱼腥藻 7120PEPC二级结构的预测图 2 鱼腥藻 7120PEPC疏水性/亲水性预测分析
表 4 鱼腥藻 7120PEPCMotifs预测
3 讨论
近年来,随着基因组和功能基因组研究的广泛开展,生物信息学理论和方法也得到了迅猛的发展和广
泛的应用。采用生物信息法得到了蓝藻 PEPC的一些基本理化性质,蓝藻 PEPC多肽大小约为 1020
(118kD),含有的主要氨基酸为 Leu、Glu,其次为 Arg、Ser;整个肽链带正电荷;PEPC蛋白为亲水性不稳定
蛋白;只含有一段功能结构域,无跨膜区域,无卷曲螺旋,无信号肽;作用部位为细胞质,无跨膜螺旋;二级
结构以 a-螺旋和无规则卷曲为主,零星散布着少量的延伸链。
多个物种 PEPC氨基酸序列比对分析表明,鱼腥藻 PEPC与其它几种蓝藻 PEPC的同源性比较高(平均
为 65%),与植物、细菌、真核藻的一致性只有 30%左右,同源性不明显;但是这些物种 PEPC都具有两个基
本相似的保守序列,同源性约为 70%左右。虽然不同物种中 PEPC全序列同源性不高,但是他们的活性中
心位置氨基酸序列相对保守,从而推测这些保守序列在 PEPC行使其功能时起重要作用。根据这一线索,
选择了鱼腥藻 PEPC中一段包含有保守序列的基因片段,设计引物,将这段基因反向连接到表达载体上,
并在大肠杆菌中进行表达,结果表明,转有反义 pepc基因载体的大肠杆菌中 PEPC的活性大大降低(待发
表)。这一实验也证实了这一共有的 PEPC保守序列在 PEPC表达中起重要作用。所有物种 PEPC都具有共
同的催化活性位点:组氨酸 H、精氨酸 K、赖氨酸 R,这 3个氨基酸残基可能参与底物结合,在 PEPC催化和
侯李君等:蓝藻磷酸烯醇式丙酮酸羧化酶的生物信息学分析 153
生物技术通报Biotechnology Buletin 2008年第4期
调节功能中起重要作用。这些位点的高度保守,揭示了 PEPC是研究物种分子进化理想的分子。
分子进化树显示,蓝藻 PEPC与高等植物在进化距离上较近,与真核藻和大部分细菌 PEPC的进化距
离比较远。从这一结果来看,蓝藻 PEPC与高等植物中 PEPC相类似,这与 Owtrim和 Colman关于蓝藻与
C3植物中的 PEPC相类似的研究结果相呼应。从进化树上也可以看出,细菌和植物是属于同一个祖先。
蛋白质功能预测分析显示,不同物种中 PEPC都只有一个显著的功能结构域,说明 PEPC在原核生物
和真核生物中都只有一个显著的功能,通过分析,这一功能是参与氨基酸的生物合成,此外 PEPC还参与
脂肪酸代谢。鱼腥藻 PEPC中含有多个 N-糖基化位点,和 N-豆蔻酰化位点。大量研究表明,N-糖基化位点、
N-豆蔻酰化位点与细胞内信号传导、蛋白质定位以及黏附等过程有关,而 N-糖基化位点还与转运有关。
上述这些生物信息学的研究,一方面为蓝藻中 PEPC酶性质的深入研究提供参考,另一方面为它在食
品和能源的生物技术研究领域提供参考。
参考 文献
1 ChistiY.BiotechnolAdvan,2007,25:294~306.
2 MetingFB.JIndMicrobiol,1996,17:477~489.
3 SpolaoreP,Joannis-CassanC,DuranE,IsambertA.JBiosciBioeng,2006,101:87~96
4 KatsuraIzui.AnnuRevPlantBiol,2004,55:67~84.
5 LeegoodRC,OsmondCB,in:DennisDT,TurpinDH.(Eds.),PlantPhysiology,BiochemistryandMolecularBiology,LonghamSciTech,Essex,
1990,274~298.
6 陈锦清,黄锐之,等.浙江大学学报,1999,25(4):365~367.
7 陈锦清,郎春秀,等.农业生物技术学报,1999,7(4):316~320.
8 赵桂兰,陈锦清,等.分子植物育种,2005,3(6):792~796.
9 KoksharovaOA,WolkCP.ApplMicrobiolBiotechnol,2002,58(2):123~137.
10 OwtrimGW,ColmanB.Bacteriology,1996,168:207~212.
11 OwtrimGM,ColmanB.BiochemistryandCelBiology,1988,66:93~99.
12 LuienenburgI,ColemanRJ,etal.GeneralMicrobiology,1992,138:685~691.
13 翟中和,王喜忠,丁明孝.细胞生物学[M].北京:高等教育出版社,2000,79~240.
14 KyceJ,DoolitleRF.JMolBiol,1982,157(6):105~132.
15 王廷华,邹晓莉.蛋白质理论与技术[M].北京:科学出版社,2005,171.
16 GeourjonC,DeleageG.ComputApplBiosci,1995,11(6):681~684.
154