免费文献传递   相关文献

植物阿魏酸-5-羟化酶生物信息学分析



全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2010 年第 6 期
植物阿魏酸-5-羟化酶生物信息学分析
李嘉 孟庆雄
(昆明理工大学生命科学与技术学院,昆明 650224)
摘 要: 阿魏酸-5-羟化酶(F5H)是木质素生物合成的关键酶之一,它依赖于细胞色素 P450 催化阿魏酸在 5 位上发生
羟基化反应。采用生物信息学的方法和工具对在 GenBank上注册的拟南芥(Arabidopsis thaliana)、油菜(Brassica napus)、杨树
(Populus trichocarpa)、番茄(Lycopersicon esculentum)、紫苜蓿(Medicago sativa)、喜树(Camptotheca acuminate)等植物的阿魏酸-
5-羟化酶基因的核苷酸序列及推导的氨基酸序列进行分析,包括组成成分、氨基酸翻译后修饰、跨膜拓扑结构域、疏水性 /亲水
性、蛋白质二级功能结构域等进行分析预测和推断。结果表明,植物 F5H是一个具有跨膜结构域的亲水性蛋白,存在于内质
网等分泌途径中,α-螺旋和不规则卷曲是其二级结构的主要结构元件,具有细胞色素 P450 家族特征性结构域及保守功能域。
关键词: 阿魏酸-5-羟化酶 生物信息学 木质素生物合成
Bioinformatics Analysis of Ferulate-5-hydroxylase in Plants
Li Jia Meng Qingxiong
(Faculty of Life Science and Technology,Kunming University of Science and Technology,Kunming 650224)
Abstract: Ferulate-5-hydroxylase is one of the key enzymes in the biosynthesis of lignins,that can catalyze the cytochrome P450
dependent introduction of a hydroxyl functionality at the 5-position. The nuclei acid sequence and amino acid sequence of ferulate-5-
hydroxylase(F5H)from Brassica napus,Arabidopsis thaliana,Populus trichocarpa,Lycopersicon esculentum,Medicago sativa and Camp-
totheca acuminate,registered in GenBank,were analyzed and predicted by the tools of bioinformatics in the following aspects,including
the composition of nuclei acid sequence and amino acid sequence,post-translational modification of amino acids,transmembrane topolo-
gical structure,hydrophobicity or hydrophilicity,secondary and conversed domain of protein. The results showed that F5H is a hydrophil-
ic and transmembrane protein,which exists in endoplasmic reticulum and other secretory pathway. The main motifs of predicted seconda-
ry structure of F5H are alpha helix and random coil. It contains several characteristic and conversed domains of P450 monooxygenases.
Key words: Ferulate-5-hydroxylase Bioinformatics Lignin biosynthesis
收稿日期:2010-01-22
作者简介:李嘉,硕士研究生,研究方向:生物化学与分子生物学;E-mail:lijiabio@ 126. com
通讯作者:孟庆雄,E-mail:qxmeng@ sina. com
木质素是复杂的苯丙烷单体聚合物,通常由紫
丁香基木质素(syringyl lignin,S-木质素) ,愈创木基
木质素(guaiacyl lignin,G-木质素)和对-羟基苯基
木质素(hydroxy-phenyl lignin,H-木质素)这三种单
体聚合而成,而这些单体均是由芥子醇、松柏醇和羟
基肉桂醇聚合而成。植物体木质素含量在 15% -
36%之间,裸子植物主要为愈创木基木质素(G) ;双
子叶植物主要含愈创木基-紫丁香基木质素(G-S) ;
单子叶植物则为愈创木基-紫丁香基-对-羟基苯基
木质素(G-S-H)[1]。它具有增强细胞壁的机械强
度、提高细胞运输能力以及抵御病菌微生物侵害的
生物学功能[2]。
对于木质素生物合成途径的研究至今未完全清
楚,但经过多年的研究普遍认为其合成可分为 3 个
步骤:(1)从植物光合作用后的同化产物到芳香氨
基苯丙氨酸、酪氨酸和色氨酸等的合成过程,称为莽
草酸途径;(2)从苯丙氨酸到羟基肉桂酸(HCA)及
其辅酶 A酯类,称为苯丙酮酸途径;(3)从羟基肉桂
基辅酶 A酯类到合成木质素单体及其聚合物的过
程,称为木质素合成的特异途径[3,4]。
阿魏酸-5-羟化酶(F5H)在苯丙烷代谢途径中
催化阿魏酸、松柏醛、松柏醇在 5 位上加羟基生成 5-
生物技术通报 Biotechnology Bulletin 2010 年第 6 期
羟基阿魏酸、5-羟基松柏醛和 5-羟基松柏醇[5]。木
质素生物合成关键酶基因的调控研究表明,F5H 对
S-木质素合成起限速的作用,过量表达能在真正意
义上增加 S-木质素含量,在总木质素含量不变的情
况下,能使 G 单体向 S 单体转化[1]。Chapple 等[6]
发现 F5H 活性缺失的拟南芥突变体 fah1 的木质素
中仅有 G-木质素;Meyer等[7]将拟南芥 F5H基因用
C4H启动子启动其过表达,发现转基因植株中木质
素主要由 S-木质素组成,G-木质素的合成被明显抑
制;Franke等[8]在烟草和杨树上分别过表达拟南芥
F5H基因;Sibout 等[9]在拟南芥中过表达杨树 F5H
基因,转基因植株的 S-木质素含量均增加了。由此
可以推断 F5H 的催化作用是 S-木质素合成中的必
需环节。
目前 F5H酶基因已从油菜(Brassica napus)、拟
南芥(Arabidopsis thaliana)、杨树(Populus trichocar-
pa)、番茄(Lycopersicon esculentum)、紫苜蓿(Medica-
go sativa)、喜树(Camptotheca acuminate)水稻(Oryza
sativa)等植物中分离克隆[10-12]。
生物信息学(Bioinformatics)是现代生命科学与
计算机科学、数理科学、化学等领域相互交叉而形成
的一门新兴学科[13],它通过对分子生物学试验数据
的获取、加工、存储、检索与分析,进而达到揭示这些
数据所蕴含的生物学意义的目的。随着人类基因组
计划(HGP)的不断推进,生物信息学已经成为当今
生命科学和自然科学的核心领域和最具活力的前沿
领域之一,它将会在功能基因的发现与识别、基因与
蛋白质的表达与功能研究方面都发挥着关键的作
用。本研究以拟南芥(Arabidopsis thaliana)为重点,
对杨树(Populus trichocarpa)、油菜(Brassica napus)、
水稻(Oryza sativa)、紫苜蓿(Medicago sativa)、喜树
(Camptotheca acuminate)等植物中 F5H 基因的核苷
酸序列和其推导氨基酸序列的组成成分、理化性质、
结构特征、功能等进行预测和分析,为该基因的进一
步研究提供一定的理论依据。
1 材料和方法
数据资料来源于 NCBI(National Center for Bio-
technology Information,NCBI)的核酸数据库及蛋白
数据库中已注册的阿魏酸 5-羟化酶基因的核酸序
列及其对应的氨基酸序列:拟南芥(Arabidopsis thali-
ana,AJ295580、CAC26936)、杨树(Populus balsamif-
era subsp. trichocarpa,AJ010324、CAB65335)、油菜
(Brassica napus,DQ679758、ABG73616)、水稻(Oryza
sativa,AB207252、BAF43422)、紫苜蓿(Medicago sa-
tiva,DQ222911、ABB02161)。
利用 DNAstar 软件与 NCBI(http:/ /www. ncbi.
nlm. nih. gov /)、EBI(http:/ /www. ebi. ac. uk /)、CBS
(http:/ /www. cbs. dtu. dk /)、ExPASy(http:/ / cn. ex-
pasy. org /)等网站提供的各种在线生物信息学软件
进行分析[14]。核酸及氨基酸序列的组成成分和理
化性质的分析、开放读码框(Open reading frame,
ORF)的查找和翻译利用 DNAstar 软件及 ProtParam
在线工具;核酸及氨基酸序列的同源性比对利用
Blast和 Clustal W 在线软件分析;氨基酸翻译后修
饰、蛋白质跨膜结构域、亲水 /疏水性及亚细胞定位
的分析利用在线工具 NetPhos 2 0 Server、TMHMM
2 0 Server、ProtScale、WOLFPSORT 完成;蛋白质保
守结构域的预测利用 CDD在线工具完成。
2 结果和讨论
2 1 不同植物 F5H基因核酸及氨基酸序列分析
用 DNAstar软件的 ORF Finder、Editseq,ProtParam
对拟南芥(AJ295580、CAC26936)、杨树(AJ010324、
CAB65335)、油 菜 (DQ679758、ABG73616)、水 稻
(AB207252、BAF43422)、紫苜蓿(DQ222911、ABB02161)
F5H基因的核酸序列及其氨基酸序列进行分析[15]
(表 1)。其中,拟南芥 F5H 基因的全长 cDNA 序列
及其推导的氨基酸序列如图 1 所示。分析结果显
示,不同植物 F5H基因开放读码框的碱基数及所编
码的氨基酸残基数变化不大,起始密码子均为
ATG,终止密码除水稻(Oryza sativa)为 TGA 外,其
它植物均为 TAA(表 1) ;而且,不同植物 F5H 的分
子量、理论等电点、酸性与碱性氨基酸的比例、带电
氨基酸的比例、极性氨基酸和疏水性氨基酸的比例
基本一致,其中在杨树氨基酸组成中,酸性 /碱性氨
基酸比例最高,而在疏水性氨基酸比例中紫苜蓿最
高;Leu、Ala、Val、Asp、Arg、Ser是这几种植物 F5H中
含量最丰富的氨基酸,它们均是不稳定类蛋白质
(表 1)。
691
2010 年第 6 期 李嘉等:植物阿魏酸-5-羟化酶生物信息学分析
表 1 F5H基因核酸序列及其所编码的氨基酸序列的理化性质分析
油菜(Brassica) 拟南芥(Arabidopsis) 杨树(Populus) 水稻(Oryza sativa) 紫苜蓿(Medicago)
基因全长(bp) 1569 2030 1873 1590 1904
开放读码框(bp) 1563 1563 1542 1590 1560
起始密码子 ATG ATG ATG ATG ATG
终止密码子 TAA TAA TAA TGA TAA
推导氨基酸残基数 520 520 513 529 519
分子量(kD) 58 51 58 68 58 48 58 99 58 57
理论等电点 PI 6 20 6 35 6 30 7 22 5 96
酸性 /碱性氨基酸比例 66 /62 66 /63 67 /63 61 /62 68 /61
极性氨基酸比例 113 /520 111 /520 106 /513 91 /529 98 /519
疏水性氨基酸比例 193 /520 193 /520 185 /513 212 /529 198 /519
带点氨基酸比例 128 /520 129 /520 130 /513 123 /529 129 /519
含量最丰富的氨基酸(%) Leu(9 4) Leu(9 2) Leu(10 3) Leu(11 3) Leu(11 0)
Val(7 3) Ala(7 3) Ala(6 8) Ala(8 9) Ala(7 7)
Ala(7 1) Asp(7 3) Asp(6 8) Val(8 1) Asp(6 6)
Asp(6 9) Val(6 7) Arg(6 2) Gly(8 3) Glu(6 6)
Ser(6 7) Arg(6 7) Ser(6 2) Arg(7 9) Val(6 4)
蛋白质不稳定性指数 49 66 45 59 51 23 43 18 40 21
不稳定 不稳定 不稳定 不稳定 不稳定
2 2 不同植物 F5H核酸及氨基酸序列的比对分析
用 Blast 程序[16]比对油菜与其它植物 F5H的核
酸及氨基酸序列同源性[25],结果表明,拟南芥 F5H的
核酸序列与其它植物如菘蓝(EF103135)、油菜
(DQ679758)、大豆(DQ340235)、杨树(AJ010324)、紫
苜 蓿 (DQ222911)、构 树 (AY850933 )、烟 草
(DQ350347)、番茄(AAD37433)等的核酸序列具有较
高的同源性,一致性分别为 90%、90%、72%、71%、
71%、74%、68%、69%;而相对于蛋白质-蛋白质的
Blastp比对结果,拟南芥 F5H的氨基酸序列与其它植
物的氨基酸序列有更广泛及更高的相似性,如与油菜
(ABG73616)、菘蓝(ABL07485)、杨树(CAB65335)、
喜树(AAT39511)、紫苜蓿(ABB02161)、大豆(ABC
68398)、番茄(AAD37433)的一致性分别 93%、93%、
74%、75%、75%、77%、72%。不难发现,不同植物
F5H的氨基酸序列之间的比对相对于核酸之间的比
对有着更高和更广泛的相似性。
根据以上 Blast的结果,用 EBI上的 Clustal W2[17]
程序对拟南芥、油菜、喜树、杨树、紫苜蓿的 F5H
氨基酸序列进行多序列比对,其结果(图 2)显
示,不同植物 F5H 在功能域是很保守的,前 25 个
氨基酸是一段富含疏水性氨基酸残基(P,V,L,I)
的序列,推测该区域可能是一个跨膜结构域
(TR) ;紧接其后的是一段富含脯氨酸的序列 PR
(PPGPRGWP) ,在第 450 个氨基酸附近还有一个 P
450 特征结构区 HBD(haem-binding domains,PFGS-
GRRSCPG)。以上的结果表明该结构域是完全保守
的区域[5,9]。
2 3 不同植物 F5H的亚细胞定位分析
细胞中蛋白质合在成后被转运到特定的细胞器
中,只有在转运到正确的部位才能参与细胞的各种
生命活动,如果定位发生偏差,将会严重的影响细胞
功能甚至危害细胞生命,因此蛋白质的亚细胞定位
是蛋白质功能研究的重要方面。又因蛋白质的亚细
胞定位分析及预测能极大的加速了蛋白质结构和功
能的研究[18],所以蛋白质的亚细胞定位分析及预测
791
生物技术通报 Biotechnology Bulletin 2010 年第 6 期
图 1 拟南芥 F5H基因 cDNA序列及推导的氨基酸序列
成为了生物信息学的研究热点。采用 WOLFPSORT
程序[19]对拟南芥、油菜 F5H 基因的编码产物进行
亚细胞定位分析,其结果(表 2)表明,拟南芥、油菜
F5H蛋白定位在内质网中的可能性最大,对其它植
物的预测也得到相同的结果,该结果和杨树中 F5H
被定位在微粒体的试验结果一致,从而更进一步说
明该蛋白是更多的是在分泌途径中。
891
2010 年第 6 期 李嘉等:植物阿魏酸-5-羟化酶生物信息学分析
“* ”“:”“、”及“.”分别表示氨基酸完全相同、保守和半保守 3 种情况;TR表示推测的跨膜结构域;
PR表示脯氨酸富含序列;HBD表示亚铁血红素结合结构域
图 2 不同植物 F5H氨基酸多序列比对
表 2 F5H亚细胞定位预测结果
内体网 微核体 细胞溶质 细胞膜 叶绿体
拟南芥 6 0 2 0 1 0 2 0 2 0
油菜 5 0 2 0 1 0 5 0 0 0
2 4 不同植物 F5H亲水性 /疏水性的预测和分析
组成蛋白质的氨基酸分子都具有一定的极性,
这些氨基酸分子的极性对蛋白质高级结构及功能性
结构域的形成有着重要的影响。用 ProtScale[20]对
拟南芥 F5H 氨基酸序列的亲水性 /疏水性进行预
测,结果表明,多肽链中的第 23 位的氨基酸(缬氨
酸,Val)具有最高的分值 3. 467,表明该位点的氨基
酸疏水性最强;而第 260 位的氨基酸(赖氨酸,Lys)
的分值最低(- 3 000) ,表明其亲水性最强。除前
30 个氨基酸序列表现为强疏水性外,其余多肽链均
表现出了极强的亲水性(图 3)。对杨树、喜树、油
菜、紫苜蓿氨基酸序列的亲水性 /疏水性进行分析,
也得到与拟南芥一致的结果。
2 5 不同植物 F5H跨膜结构域的预测和分析
一些蛋白质在细胞膜或质膜上发挥作用,根据
多肽链中的疏水氨基酸区的数目和位置可以预测其
穿膜情况[21]。用 TMHMM2. 0Server[22]对拟南芥、杨
树、喜树、紫苜蓿、油菜 F5H氨基酸序列的跨膜结构
域进行预测,从而判定它们的跨膜结构域。拟南芥
的预测结果(图 4)显示,整条肽链有 1 个跨膜结构
域,多肽链 1 - 14 位于膜外,15 - 32 横跨质膜,33 -
520 位于膜内。在结合上述导肽的预测,可推断植
物 F5H在质膜上发挥功能。杨树、喜树、紫苜蓿预
测结果和拟南芥一致,然而油菜的预测结果虽显示
了可能相同的跨膜结构域,但并不跨膜存在,其具体
的原因还有待进一步的验证。
2 6 不同植物 F5H翻译后修饰的预测和分析
多肽链在核糖体上合成释放后,一般要经过翻
译后修饰,如糖基化、甲基化、磷酸化等,才能正确折
叠形成有效的三维构象并运输到特定场所发挥功
能。翻译后修饰的预测分析,对正确认识和理解蛋
白质的细胞定位和功能划分具有重要的意义[23]。
用 NetPhos 2. 0 Server[24]对拟南芥 F5H 的翻译后修
饰预测的结果(图 5)表明,整个多肽链中分值在 0.
5(阈值)以上的氨基酸位点有 27 个,可知拟南芥
F5H 的磷酸化位点有 27 个,其中 Ser:18,Thr:8,
Tyr:1。杨树等的预测结果则与拟南芥一致。
2 7 不同植物 F5H二级的预测和分析
在蛋白质分子中,由二级结构组装而形成一
定的空间结构的方式是有限的,因此,蛋白质二级
结构的预测就成为由蛋白质的一级序列预测其空
间结构的最关键步骤[21]。用 SOPMA[25]对拟南芥、油
菜、杨树、喜树、紫苜蓿的 F5H 氨基酸序列的二级
991
生物技术通报 Biotechnology Bulletin 2010 年第 6 期
图 3 拟南芥 F5H亲水性 /疏水性的预测
图 4 拟南芥 TCTP跨膜结构域的预测
结构进行预测,其预测结果(图 6)表现出了高度的一
致性。拟南芥的 F5H由 46. 73%的 α-螺旋,12. 31%
的延伸链,36. 35%的不规则卷曲和 4. 62%的 β-转角
组成,α-螺旋是拟南芥 F5H中最多的结构元件,以不
规则卷曲的散布于整个蛋白质中。
2 8 不同植物 F5H保守结构域的预测和分析
结构域是蛋白质的基本组成部分,它具有三维的
定义。首先,它应该是一段具有序列保守性的蛋白质
序列(motif) ;其次,它具有保守的结构特征;再次,它
具有保守的功能,对结构域的研究和认识是理解蛋白
质功能的主要方面。用 NCBI 上的 CDD[26]分析了拟
南芥 F5H的保守结构域(图 7) ,发现该酶具有 P450
结构域,这也进一步证实了 F5H确实属于 P 450蛋白
家族。杨树等的预测结果和拟南芥一致。
002
2010 年第 6 期 李嘉等:植物阿魏酸-5-羟化酶生物信息学分析
图 5 拟南芥 F5H翻译后修饰预测
图 6 拟南芥 F5H二级结构的预测
图 7 拟南芥 F5H保守结构域的预测
3 讨论
本研究采用各种生物信息学分析工具对不同植
物主要是拟南芥的阿魏酸-5-羟化酶(F5H)进行了
预测和分析,推测出植物阿魏酸-5-羟化酶是一个具
有跨膜结构域的亲水性蛋白,存在域内质网等分泌
途径中,α-螺旋和不规则卷曲是其二级结构的主要
结构元件,同时该蛋白具有细胞色素 P450 家族特征
性结构域及保守功能域。通过对阿魏酸-5-羟化酶
的生物信息学分析对今后该酶的研究以及木质素合
成途径的更深入的了解提供一定参考依据。
参 考 文 献
[1]郭晓艺,胡尚连,曹颖,孙霞.调控 S木质素合成基因 F5H1研究进
展及对竹遗传改良的展望.福建林业科技,2007,34(3) :234-243.
[2]付月,李学龙,薛永常.木质素合成酶基因 F5H的克隆及其鉴定.
安徽农业科学,2006,34(8) :1553-1555.
[3]师竹娟.甘蓝型油菜木质素单体合成基因 COMT和 F5H的克隆及
表达调控[D].北京:中国农业科学院,2006.
[4]Costa MA,Collins RE,et al. An in silico assessment of gene function
and organization of the phenylpropanoid pathway metabolic networks
in Arabidopsis thaliana and limitations thereof. Phytochemistry,2003,
64(6) :1097-1112.
[5]YJ Kim,DG Kim,et al. Wound-induced expression of the ferulate 5-
hydroxylase gene in Camptotheca acuminata. Biochimica et Biophysica
Acta,2006,1760(2) :182-190.
[6]Chapple CCS,et al. An Arabidopsis mutant defective in the general
phenylpropanoid pathway . Plant Cell,1992,4(11) :1413-1424.
[7]Meyer K,Shirley AM,Cusumano JC,et al. Lignin monomer composi-
tion is determined by the expression of a cytochrome P450-dependent
monooxygenase in Arabidopsis . Proc Natl Acad Sci USA,1998,95
(12) :6619-6623.
[8]Franke R,McMichael CM,et al. Modified lignin in tobacco and poplar
plants over-expressing the Arabidopsis gene encoding ferulate 5-
hydroxylase . Plant Journal,2000,22(3) :223-234.
[9]Sibout R,Baucher M,Gatineau M,et al. Expression of a poplar cDNA
encoding a ferulate-5-hydroxylase /coniferaldehyde 5-hydroxylase in-
creases S lignin deposition in Arabidopsis thaliana . Plant Physiology
and Biochemistry,2002,40(12) :1087-1096.
(下转第 211页)
102
2010 年第 6 期 谢振荣等:α-葡萄糖苷酶高产菌株 HB-9-5 的选育及产酶条件的优化
pyranosidase of bacillus stearothermophilus ATCC12016 to a novel
exo-α-1,4-glucosidase active for oligomaltosaccharides and α-glu-
cans. Biochimica et Biophysica Acta,1984,787(3) :281-289.
[8]Herr D. Secretion of cellulase and β-glucosidase by Trichoderma
viride ITCC. 1433 in submerged culture on different substrates. Bio-
technol Bioeng,1979,21(8) :1361-1371.
[9]杨寿钧,等.嗜热栖热菌 HB8 耐热 α-葡萄糖苷酶的提纯和性质.
微生物学报,1992,32(1) :
櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧櫧
23-29.
(上接第 201 页)
[10]Aguade M. Nucleotide sequence variation at two genes of the phenyl-
propanoid pathway,the FAH1 and F3H Genes,in Arabidopsis thali-
ana. Mol Biol Evol,2001,18(1) :1-9.
[11]Reddy MS,Chen F,et al. Targeted down-regulation of cytochrome
P450 enzymes for forage quality improvement in alfalfa (Medicago
sativa L.). Proc Natl Acad Sci USA,2005,102(46) :16573-16578.
[12]Kim JH,Yang DH,et al. Cloning,characterization,and expression of
two cDNA clones for a rice ferulate-5-hydroxylase gene a cytochrome
P450-dependent Monooxygenase. J Plant Biol,2006,49:200-204.
[13]纪兆华,裴志利,等.生物信息学在新兴学科群中崛起. 电脑知
识与技术(学术交流) ,2007,22:1094-1096.
[14]Mount DW.生物信息学[M]. 钟扬,王莉,张亮主译. 北京:高等
教育出版社,2003:301-345.
[15]Altchul SF,Madden TL,Schüffer AA,et al. Gapped BLAST and
PSI-BLAST:a new generation of protein database search programs.
Nucleic Acids Res,1997,25(17) :3389-3402.
[16]Higgins D,Thompson J,Gibson T,et al. CLUSTAL W:improving the
sensitivity of progressive multiple sequence alignment through se-
quence weighting,position-specific gap penalties and weight matrix
choice. Nucleic Acids Res,1994,22:4637-4680.
[17]张松,黄波,夏学峰,孙之荣. 蛋白质亚细胞定位的生物信息学
研究.生物化学与生物物理进展,2007,34(6) :573-579.
[18]Horton P,Park KJ,et al. WoLF PSORT:protein localization predic-
tor. Nucleic Acids Research,2007,1-3.
[19]Kyte J,Doolittle RF. A simple method for displaying the hydropathic
character of a protein. J Mol Biol,1982,157(6) :105-132.
[20]李桂源,钱俊.基于 WWW 的生物信息学应用指南[M]. 长沙:
中南大学出版社,2004:270.
[21]Krogh A,Larsson B,et al. Predicting transmembrane protein topology
with a hidden Markov model:application to complete genomes. Jour-
nal of Molecular Biology,2001,305(3) :567-580.
[22]韩立敏,王喆之.植物水溶性蔗糖合成酶生物信息学分析初探.
植物生理学通讯,2006,42(5) :939-944.
[23]Blom N,Gammeltoft S,Brunak S. Sequence and structure based pre-
diction of eukaryotic protein phosphorylation sites. Journal of Molec-
ular Biology,1999,294(5) :1351-1362.
[24]Geourjon C,Deleage G. SOPMA:significant improvement in protein
secondary structure prediction by consensus prediction from multiple
alignments. Comput Appl Biosci,1995 ,11(6) :681-684.
[25]Marchler-Bauer A,Anderson JB,et al. CDD:a conserved domain da-
tabase for protein classification. Nucleic Acids Research,2005,33:
192-196.
112