免费文献传递   相关文献

Genome-wide prediction and analysis of the classical secreted proteins of Curvularia lunata

玉米弯孢叶斑病菌全基因组分泌蛋白的预测与分析



全 文 :植物保护学报 Journal of Plant Protection, 2015, 42(6): 869 - 876 DOI: 10􀆰 13802 / j. cnki. zwbhxb. 2015􀆰 06􀆰 002
基金项目:国家自然科学基金(31171798,31471734),国家现代农业(玉米)产业技术体系(CARS⁃02)
∗通讯作者(Author for correspondence), E⁃mail: jiechen59@ sjtu. edu. cn
收稿日期: 2015 - 07 - 10
玉米弯孢叶斑病菌全基因组分泌蛋白的预测与分析
高金欣1,2   高士刚1,2   李雅乾1,2   陈  捷1,2∗
(1.上海交通大学农业与生物学院, 农业部都市农业(南方)重点实验室, 上海 200240;
2.上海交通大学微生物代谢国家重点实验室, 上海 200240)
摘要: 为深入了解玉米弯孢叶斑病菌致病的分子机制,采用信号肽分析软件 SignalP 4􀆰 1 与
PSORTb 3􀆰 0􀆰 2、跨膜螺旋结构分析软件 TMHMM 2􀆰 0 与 THUMBUP、GPI 锚定位点分析软件 big⁃PI
Predictor和亚细胞器蛋白定位分析软件 TargetP 1􀆰 1 这 6 款软件综合预测该菌全基因组中10 372条
蛋白序列,并对筛选出的分泌蛋白信号肽基本特征进行分析。 结果表明,在玉米弯孢叶斑病菌全基
因组编码蛋白中共发现 804 个具有典型信号肽的分泌蛋白,占全基因组蛋白总数的 7􀆰 8% ;编码这
些蛋白的开放阅读框最小为 219 bp,最大为7 113 bp,平均为1 252 bp;引导它们的信号肽长度分布
在 13 ~ 37 aa之间,平均为 19 aa。 信号肽中出现频率最高的氨基酸依次为丙氨酸、亮氨酸和丝氨
酸。 信号肽切割位点与根癌土壤杆菌、粗糙脉孢霉和马铃薯晚疫病菌一样,同属于 A⁃X⁃A 型。 70
个具有功能描述的分泌蛋白主要是和细胞代谢与转运、信号转导有关的酶类;还有一些降解细胞壁
组分及与致病相关的酶类,可能与玉米弯孢叶斑病菌的毒性有关。
关键词: 玉米弯孢叶斑病菌; 基因组; 分泌蛋白; 信号肽
Genome⁃wide prediction and analysis of the classical secreted
proteins of Curvularia lunata
Gao Jinxin1,2   Gao Shigang1,2   Li Yaqian1,2   Chen Jie1,2∗
(1. Key Laboratory of Urban Agriculture (South), Ministry of Agriculture; School of Agriculture and Biology,
Shanghai Jiaotong University, Shanghai 200240, China; 2. State Key Laboratory of Microbial Metabolism,
Shanghai Jiaotong University, Shanghai 200240, China)
Abstract: In order to have a further understanding of the molecular mechanism of pathogenesis, 10 372
protein sequences of Curvularia lunata were analyzed by using the signal peptide prediction algorithms
SignalP 4􀆰 1 and PSORTb 3􀆰 0􀆰 2, transmembrane helix prediction algorithms TMHMM 2􀆰 0 and
THUMBUP, GPI⁃anchoring site prediction algorithm big⁃PI Predictor, and subcellular protein location
prediction algorithm TargetP 1􀆰 1. Meanwhile, the basic features of signal peptides in prediction results
were statistically analyzed. As a result, 804 secreted proteins were found, accounting for 7􀆰 8% of the
total number. For these proteins, the minimum and maximum of the open read frames were 219 bp and
7 113 bp, respectively, and the mean score was 1 252 bp. The distribution of length was concentrated in
13 - 37 amino acids and the average length was 19 amino acids. The top three frequent amino acids in
signal peptides were alanine, leucine and serine. The signal peptide cleavage site belonged to A⁃X⁃A
type, which was consistent with other secreted proteins from Agrobacterium tumefaciens, Neurospora crassa
and Phytophthora infestans. Among these, the functions of the 70 secreted proteins had been described
previously. Many of them were involved in cellular metabolism and signal transduction, etc. In addition,
some of the secreted proteins were functionally related to cell wall⁃degrading and pathogenicity, which
were likely to be associated with the virulence of C. lunata.
Key words: Curvularia lunata; genome; secreted protein; signal peptide
    由新月弯孢菌 Curvularia lunata 引起的玉米弯
孢叶斑病是一种世界性分布的玉米叶部病害(Gao
et al. ,2015a)。 近年来,该病害发生日益严重,给我
国玉米生产带来了巨大的经济损失 (李富华等,
2004;高金欣等,2015);尤其在北方,其危害已经超
过了玉米大斑病和玉米丝黑穗病 (高金欣等,
2011a,b;Gao et al. ,2014a)。 目前,针对该病害的
研究主要集中在发生规律和防治策略上,但对其致
病机理的研究尚不深入(Gao et al. ,2014a)。 2011
年,弯孢菌 CX⁃3 菌株的全基因组测序已基本完成
(Gao et al. ,2014b)。 在弯孢菌基因组中识别了 2
个促分裂原活化蛋白激酶基因 Clm1(王嘉渊和陈
捷,2011)和 Clk1(Gao et al. ,2012)、1 个二氢蝶酸
合酶基因(Gao et al. ,2015b)、1 个过氧化氢酶基因
CAT(Gao et al. ,2015c)、1个毒素合成相关基因 Clt⁃1
(Gao et al. ,2014a)、2 个黑色素合成基因 Brn1(Liu
et al. ,2011)和 Scd(Gao et al. ,2015d)。 基因组测
序的完成为弯孢菌每个基因在分子、细胞和生理功
能等多层次上的研究提供了全面的信息,标志着对
该病菌致病机制的解析已进入功能基因组研究阶
段。 在生物体内,蛋白质是结构和功能的主要体现
者,分析基因组所表达的蛋白组功能和特性自然就
成为其中的重要一环,而分泌蛋白组又是总蛋白组
中的一个重要组成部分。
分泌蛋白是指由生物体细胞合成的含有信号肽
并且可以分泌到细胞外的一类蛋白质(Blobel & Sa⁃
batini,1971)。 信号肽通常由 15 ~ 60 个氨基酸残基
组成,包含 N 区(氨基端)、H 区(疏水区)和 C 区
(羧基端)3 个结构域。 信号肽酶切位点位于 C 区,
氨基酸组成一般是 A⁃X⁃A(Martoglio & Dobberstein,
1998)。 起初分泌蛋白是在游离核糖体上合成,当
多肽链延伸至约 80 个氨基酸残基后,N端的信号肽
识别内质网膜上的受体并与之结合,进而引导多肽
链运至内质网腔。 腔内的信号肽酶识别、切除信号
肽,新合成的多肽链则通过内质网上的膜系统转运
到细胞外。 在植物病原真菌与寄主互作的过程中,
致病因子往往要分泌到胞外,才可以被寄主受体蛋
白识别(Catanzariti et al. ,2006)。
分泌蛋白通过各种途径分泌到细胞表面、质膜
外空间后,可以感知周围的环境并作出适应性反应。
有很多特殊的酶往往属于分泌蛋白,它们对于微生
物感应周边环境的物质、能量等信息具有重要作用
(Greenbaum et al. ,2001)。 在病原菌侵染寄主植物
的过程中,往往有大量分泌蛋白参与并发挥着重要
作用(Nimchuk et al. ,2003)。 植物的先天免疫系统
主要由病原相关分子模式激发的免疫反应(PAMP⁃
triggered immunity,PTI)和效应蛋白激发的免疫反应
( effector⁃triggered immunity, ETI)组成。 其中, ETI
是由植物的抗病蛋白(R 蛋白)识别病原微生物产
生的效应蛋白,从而引发植物产生特异性防卫反应。
病原菌产生的一些分泌蛋白与寄主抗性基因编码的
R蛋白间的互作是病原与寄主非亲和互作后引起
ETI效应的关键。 因此,本研究从功能基因组学角
度对弯孢菌全基因组中所有潜在的分泌蛋白及功能
进行预测,并对筛选出的分泌蛋白信号肽的基本特
征进行了统计分析,以期为深入研究弯孢菌 -玉米
分子互作机制,持续有效地开展玉米弯孢叶斑病的
防控提供新的思路。
1 材料与方法
1􀆰 1 材料
玉米弯孢叶斑病菌强致病性菌株 CX⁃3 全基因
组10 372个蛋白质的氨基酸序列从 Dryad Digital
Repository( http: / / doi􀆰 org / 10􀆰 5061 / dryad􀆰 22v18)
获得。
1􀆰 2 方法
应用 SignalP 4􀆰 1 软件 ( http: / / www. cbs. dtu.
dk / services / SignalP / )分析待测蛋白氨基酸序列是
否含有信号肽及其具体位置(Petersen et al. ,2011);
PSORTb 3􀆰 0􀆰 2 软件( http: / / www. psort. org / psortb /
index. html)分析该蛋白质信号肽切割位点是否可被
识别并切割(Nakai,2000);含有分泌型信号肽的蛋
白质序列含有跨膜区表明该蛋白可能是膜受体、膜
上的锚定蛋白或离子通道蛋白,采用 TMHMM 2􀆰 0
( http: / / www. cbs. dtu. dk / services / TMHMM / ) 和
THUMBUP 软件 ( http: / / sparks. informatics. iupui.
edu / Softwares⁃Services_files / thumbup. htm)预测蛋白
序列的跨膜螺旋结构,排除具有跨膜结构域的蛋白
质序列(Möller et al. ,2001;Zhou & Zhou,2003);GPI
锚定是真核生物蛋白质转录后一种较常见的修饰方
078 植  物  保  护  学  报 42 卷
式,GPI基团结合在羧基端的 γ 位点后可以帮助蛋
白锚定在质膜上,所以在进行分泌蛋白预测的时候
也应该排除这些蛋白质,big⁃PI Predictor 软件( ht⁃
tp: / / mendel. imp. ac. at / gpi / gpi_server)用来分析蛋
白质是否锚定在细胞膜上 ( Eisenhaber et al. ,
1999);TargetP 1􀆰 1 软件( http: / / www. cbs. dtu. dk /
services / TargetP / )分析靶标肽段在亚细胞器中的定
位和分布,以确定该段序列是否为穿膜信号肽(Eis⁃
enhaber et al. ,1998)。 在直系同源簇(cluster of or⁃
thologous group, COG) 数据库 ( http: / / www. ncbi.
nlm. nih. gov / COG / )中比对已获得的分泌蛋白序
列,得到其功能分类及描述。
2 结果与分析
2􀆰 1 玉米弯孢叶斑病菌分泌蛋白信号肽预测
图 1 玉米弯孢叶斑病菌分泌蛋白开放阅读框的长度分布
Fig. 1 The ORF length distribution of secreted proteins in Curvularia lunata 
SignalP 4􀆰 1 软件分析表明,弯孢菌全基因组编
码3 556个含有分泌型信号肽的蛋白质。 PSORTb
3􀆰 0􀆰 2 软件进一步筛选发现,在3 556个蛋白序列中
具有切割位点并且可以被信号肽酶识别、切割的蛋
白质序列有1 149个。 TMHMM 2􀆰 0 软件预测发现,
在1 149个蛋白质序列中有 951 个既符合跨膜螺旋
为 0,又具有分泌型信号肽的蛋白序列,其中经
THUMBUP软件分析发现没有跨膜螺旋区的蛋白质
序列有 857 个。 big⁃PI Predictor 软件对这 857 个候
选蛋白进行 GPI锚定位点预测,其中 817 个蛋白质
没有锚定位点。 采用 TargetP 1􀆰 1 软件预测弯孢菌
817 个蛋白序列在亚细胞结构中的分布,发现除 13
个分布于其它细胞器外,剩余 804 个都具有分泌途
径的信号肽,占全基因组10 372个蛋白质序列的
7􀆰 8% 。 在这 804 个分泌蛋白中,编码蛋白序列最小
的开放阅读框长度是 219 bp,最大长度为7 113 bp,
平均为1 252 bp,多集中在 600 ~ 899 bp(图 1)。 引
导分泌蛋白的信号肽长度介于 13 ~ 37 aa 之间,平
均为 19 aa。 其中含有 18 aa 的信号肽最多,达到
141 个;其次是长度为 19 aa的信号肽,有 138 个(图
2)。 信号肽的长度、结构相似,分布集中,说明信号
肽的功能可能是由氨基酸的种类、排列等微小差异
造成的。 信号肽的长度变化区间较大,可能与蛋白
质功能的多样性和生物进化有关。
2􀆰 2 玉米弯孢叶斑病菌分泌蛋白信号肽特征分析
对弯孢菌分泌蛋白信号肽切割位点分析表明,
在信号肽与成熟蛋白切割位点 - 3、 - 1 和 + 1 位上
使用频率最高的氨基酸都是丙氨酸,在 - 1 位上,氨
基酸种类尤为保守,丙氨酸所占比例高达 80􀆰 7% ;
而 - 2、 + 1 和 + 3 位氨基酸的使用种类和比例表现
出多样化的特征,分布最多的分别是丝氨酸、脯氨酸
和苏氨酸(表 1)。 对分泌蛋白信号肽中氨基酸的出
现频率进行统计分析,发现非极性、疏水氨基酸(丙
氨酸、缬氨酸、亮氨酸、甘氨酸、异亮氨酸、脯氨酸)
含量最高,占 58􀆰 5% ;其次是极性、不带电荷的氨基
酸(丝氨酸、苏氨酸、半胱氨酸、甲硫氨酸、天冬酰
胺、谷氨酰胺),占 27􀆰 6% ;带正电荷的碱性氨基酸
(赖氨酸、精氨酸、组氨酸)占 5􀆰 6% ;芳香族氨基酸
(色氨酸、苯丙氨酸、酪氨酸)占 7􀆰 6% ;带负电荷的
酸性氨基酸(天冬氨酸、谷氨酸)最少,仅占 0􀆰 6%
(图 3)。 在所有氨基酸中,丙氨酸含量最高,其次为
亮氨酸,最少的为天冬氨酸和谷氨酸。 含量超过
5%的氨基酸主要为脂肪族氨基酸中的中性氨基酸
1786 期 高金欣等: 玉米弯孢叶斑病菌全基因组分泌蛋白的预测与分析
图 2 玉米弯孢叶斑病菌分泌蛋白信号肽长度分布
Fig. 2 Length distribution of predicted secretory signal peptides in Curvularia lunata
 
丙氨酸、亮氨酸、缬氨酸以及含羟基或硫氨基酸丝氨
酸、苏氨酸、甲硫氨酸,这可能与分泌蛋白的性质有
关,使信号肽更容易穿透质膜,有利于引导分泌蛋白
的定位。
与已经进行过分泌蛋白预测的物种对比发现,
马铃薯晚疫病菌 Phytophthora infestans 的切割位点
- 3 ~ + 3 位使用最多的氨基酸都是丙氨酸,表现相
对保守,而弯孢菌与粗糙脉孢霉 Neurospora crassa和
根癌土壤杆菌 Agrobacterium tumefaciens 表现出相似
的特征,在 - 2、 + 2 和 + 3 位均已发生变化(表 2)。
对比这 4 种菌的切割位点处氨基酸使用频率的变化
情况发现,根癌土壤杆菌切割位点的氨基酸使用频
率变化最为明显,如在 - 3 位和 - 1 位丙氨酸使用频
率最高,分别达到了 81􀆰 0%和 93􀆰 7% ,而弯孢菌、马
铃薯晚疫病菌和粗糙脉孢霉的变化频率相对较小
(表 3)。
表 1 玉米弯孢叶斑病菌信号肽中 20 种氨基酸在酶切位点 -3 ~ +3 的使用频率
Table 1 Twenty amino acid residues at the cleavage position from - 3 to + 3 of the signal peptides in Curvularia lunata
氨基酸
Amino acid
- 3 - 2 - 1 + 1 + 2 + 3
数量
No.
百分比 (%)
Percentage
数量
No.
百分比 (%)
Percentage
数量
No.
百分比 (%)
Percentage
数量
No.
百分比 (%)
Percentage
数量
No.
百分比 (%)
Percentage
数量
No.
百分比 (%)
Percentage
丙氨酸 A 348 43􀆰 3 120 14􀆰 9 649 80􀆰 7 198 24􀆰 6 38 4􀆰 7 67 8􀆰 3
半胱氨酸 C 16 2􀆰 0 6 0􀆰 7 6 0􀆰 7 7 0􀆰 9 11 1􀆰 4 15 1􀆰 9
天冬氨酸 D 0 0􀆰 0 14 1􀆰 7 0 0􀆰 0 17 2􀆰 1 35 4􀆰 4 28 3􀆰 5
谷氨酸 E 0 0􀆰 0 16 2􀆰 0 0 0􀆰 0 18 2􀆰 2 19 2􀆰 4 18 2􀆰 2
苯丙氨酸 F 0 0􀆰 0 36 4􀆰 5 1 0􀆰 1 27 3􀆰 4 17 2􀆰 1 37 4􀆰 6
甘氨酸 G 20 2􀆰 5 8 1􀆰 0 69 8􀆰 6 23 2􀆰 9 39 4􀆰 9 36 4􀆰 5
组氨酸 H 0 0􀆰 0 44 5􀆰 5 0 0􀆰 0 61 7􀆰 6 7 0􀆰 9 25 3􀆰 1
异亮氨酸 I 32 4􀆰 0 24 3􀆰 0 1 0􀆰 1 29 3􀆰 6 20 2􀆰 5 80 10􀆰 0
赖氨酸 K 1 0􀆰 1 4 0􀆰 5 0 0􀆰 0 16 2􀆰 0 20 2􀆰 5 14 1􀆰 7
亮氨酸 L 16 2􀆰 0 142 17􀆰 7 3 0􀆰 4 79 9􀆰 8 26 3􀆰 2 88 10􀆰 9
甲硫氨酸 M 0 0􀆰 0 5 0􀆰 6 0 0􀆰 0 7 0􀆰 9 9 1􀆰 1 12 1􀆰 5
天冬酰胺 N 3 0􀆰 4 39 4􀆰 9 0 0􀆰 0 14 1􀆰 7 40 5􀆰 0 18 2􀆰 2
脯氨酸 P 0 0􀆰 0 3 0􀆰 4 7 0􀆰 9 0 0􀆰 0 277 34􀆰 5 61 7􀆰 6
谷氨酰胺 Q 1 0􀆰 1 44 5􀆰 5 2 0􀆰 2 101 12􀆰 6 22 2􀆰 7 17 2􀆰 1
精氨酸 R 0 0􀆰 0 15 1􀆰 9 3 0􀆰 4 19 2􀆰 4 15 1􀆰 9 16 2􀆰 0
丝氨酸 S 66 8􀆰 2 157 19􀆰 5 56 7􀆰 0 74 9􀆰 2 74 9􀆰 2 68 8􀆰 5
苏氨酸 T 98 12􀆰 2 59 7􀆰 3 6 0􀆰 7 42 5􀆰 2 64 8􀆰 0 101 12􀆰 6
缬氨酸 V 202 25􀆰 1 40 5􀆰 0 0 0􀆰 0 47 5􀆰 8 42 5􀆰 2 77 9􀆰 6
色氨酸 W 1 0􀆰 1 4 0􀆰 5 0 0􀆰 0 9 1􀆰 1 8 1􀆰 0 12 1􀆰 5
酪氨酸 Y 0 0􀆰 0 24 3􀆰 0 1 0􀆰 1 16 2􀆰 0 20 2􀆰 5 14 1􀆰 7
    A: Alanine; C: cysteine; D: aspartic acid; E: glutamic acid; F: phenylalanine; G: glycine; H: histidine; I: isoleucine; K:
lysine; L: leucine; M: methionine; N: asparagine; P: proline; Q: glutamine; R: arginine; S: serine; T: threonine; V: valine; W:
tryptophan;Y: tyrosine.
278 植  物  保  护  学  报 42 卷
图 3 玉米弯孢叶斑病菌分泌蛋白信号肽中 20 种氨基酸的出现频率
Fig. 3 The frequencies of 20 amino acids in the signal peptides of the secreted proteins in Curvularia lunata
A: 丙氨酸; C:半胱氨酸; D:天冬氨酸; E:谷氨酸; F:苯丙氨酸; G:甘氨酸; H:组氨酸; I:异亮氨酸; K:赖氨酸;
L: 亮氨酸; M:甲硫氨酸; N:天冬酰胺; P:脯氨酸; Q:谷氨酰胺; R:精氨酸; S:丝氨酸; T:苏氨酸; V:缬氨酸; W:色
氨酸; Y:酪氨酸。 A: Alanine; C: cysteine; D: aspartic acid; E: glutamic acid; F: phenylalanine; G: glycine; H: histidine; I:
isoleucine; K: lysine; L: leucine; M: methionine; N: asparagine; P: proline; Q: glutamine; R: arginine; S: serine; T: threo⁃
nine; V: valine; W: tryptophan; Y: tyrosine.
 
表 2 不同物种信号肽切割位点的氨基酸组成比较
Table 2 Amino acid composition comparison of signal peptide cleavage sites among different species
物种
Species
- 3 - 2 - 1 + 1 + 2 + 3
种类
Type
频率最高
Maximum
frequency
种类
Type
频率最高
Maximum
frequency
种类
Type
频率最高
Maximum
frequency
种类
Type
频率最高
Maximum
frequency
种类
Type
频率最高
Maximum
frequency
种类
Type
频率最高
Maximum
frequency
玉米弯孢叶斑
病菌 Curvularia
lunata
12 丙氨酸
Alanine
20 丝氨酸
Serine
12 丙氨酸
Alanine
19 丙氨酸
Alanine
20 脯氨酸
Proline
20 苏氨酸
Threonine
马铃薯晚疫病
菌 Phytophthora
infestans
20 丙氨酸
Alanine
20 丙氨酸
Alanine
20 丙氨酸
Alanine
20 丙氨酸
Alanine
20 丙氨酸
Alanine
20 丙氨酸
Alanine
粗糙脉孢菌
Neurospora
crassa
11 丙氨酸
Alanine
20 亮氨酸
Leucine
10 丙氨酸
Alanine
20 丙氨酸
Alanine
20 脯氨酸
Proline
- -
根癌土壤杆菌
Agrobacterium
tumefaciens
8 丙氨酸
Alanine
18 亮氨酸
Leucine
3 丙氨酸
Alanine
18 丙氨酸
Alanine
15 天冬氨酸
Aspartic
acid
20 亮氨酸
Leucine
表 3 不同物种信号肽切割位点氨基酸在酶切位点 -3 ~ +3 的使用频率变化比较
Table 3 Frequency variation comparison of signal peptide amino acid on cleavage sites among different species
物种 Species -3 -2 -1 +1 +2 +3
玉米弯孢叶斑病菌
Curvularia lunata
0 ~ 43􀆰 3% 0􀆰 4% ~19􀆰 5% 0 ~80􀆰 7% 0 ~24􀆰 6% 0􀆰 9% ~34􀆰 5% 1􀆰 5% ~12􀆰 6%
马铃薯晚疫病菌
Phytophthora infestans
0􀆰 6% ~20􀆰 1% 0􀆰 4% ~21􀆰 6% 0􀆰 9% ~22􀆰 4% 0􀆰 1% ~17􀆰 0% 0􀆰 3% ~14􀆰 5% 0􀆰 7% ~13􀆰 3%
粗糙脉孢菌
Neurospora crassa
0 ~ 38􀆰 7% 0􀆰 5% ~2􀆰 2% 0 ~77􀆰 3% 0􀆰 5% ~2􀆰 6% 1􀆰 1% ~33􀆰 4% -
根癌土壤杆菌
Agrobacterium tumefaciens
0 ~ 81􀆰 0% 0 ~17􀆰 7% 0 ~93􀆰 7% 0 ~25􀆰 9% 0 ~28􀆰 5% 0􀆰 6% ~11􀆰 4%
    - : 无统计信息。 - : No statistics.
3786 期 高金欣等: 玉米弯孢叶斑病菌全基因组分泌蛋白的预测与分析
2􀆰 3 玉米弯孢叶斑病菌分泌蛋白功能预测分析
将 804 个分泌蛋白与直系同源簇数据库进行比
对,总计得到 70 个有明确功能描述的蛋白质,其余
734 个为功能未知的推定蛋白。 在这 70 个分泌蛋
白中,参与氨基酸运输与代谢的最多,有 20 个,包括
黄素蛋白、缩肽酶等;其次是参与翻译后修饰、蛋白
质折叠和作为分子伴侣的分泌蛋白,有 11 个,包括
丝氨酸蛋白酶、硫氧还蛋白等;参与能量代谢与转换
(甘油磷酸二酯酶和细胞色素 b 合成相关蛋白)、转
录(DNA / RNA解旋酶和组蛋白乙酰转移酶)、无机
离子转运和代谢(2 个 ABC⁃型 Fe3 +转运蛋白)的分
泌蛋白较少,分别只有 2 个;而参与细胞运动(PPE⁃
重复蛋白)、胞内分泌和膜泡运输(脂肪酶)的最少,
分别只有 1 个。
3 讨论
在生物体生长、发育及凋亡的过程中,具有信号
肽的分泌蛋白通常发挥着重要作用。 分泌蛋白首先
在胞内合成,然后经内质网 -高尔基体 -质膜途径
分泌到胞外(杨福愉,1991)。 病原真菌在植物体内
侵染、定殖以及扩展的整个过程,都要分泌一定数量
的效应分子到植物体内,以实现致病、生长等生理过
程。 对分泌蛋白信号肽分析和跨膜预测的软件众
多,不同软件的算法不一致,这就导致了不同软件预
测的分泌蛋白有一定的差别。 采用多个软件对基因
组蛋白同时分析,可以有效地提高预测的准确性。
本研究应用 6 种软件对弯孢菌 CX⁃3 全基因组蛋白
进行了多重分析预测,筛选得到 804 个具有典型信
号肽的分泌蛋白,占编码蛋白总数的 7􀆰 8% ,这一结
果与菜豆根瘤菌 Rhizobium etli 的 5􀆰 4% (张武等,
2014)和根癌土壤杆菌的 4􀆰 5% (范成明等,2005)较
为接近,而与茎瘤固氮根瘤菌 Azorhizobium caulino⁃
dans的 1􀆰 2% (王新新等,2012)相距较远,这可能与
不同生物在不同生存环境下的生活状况有关。 茎瘤
固氮根瘤菌只与热带地区的长喙田菁共生形成根瘤
或茎瘤,而菜豆根瘤菌、根癌土壤杆菌和弯孢菌的寄
主范围较宽。
在大多数物种中,信号肽主要是在 4 种酶切位
点上被信号肽酶识别、切割,产生的成熟蛋白可以穿
过膜并转运至细胞不同的部位。 因此,信号肽酶切
位点的氨基酸组成及排列方式非常重要(Tjalsma et
al. ,2000)。 本研究中,在 - 1 位上弯孢菌氨基酸的
种类最为保守,主要以非极性疏水氨基酸为主,几乎
没有极性氨基酸存在,丙氨酸所占比例高达
80􀆰 7% ,与根癌土壤杆菌(范成明等,2005)和粗糙
脉孢霉(周晓罡等,2006)相似,后二者所占比例分
别为 93􀆰 7%和 77􀆰 3% ,这可能与生物膜的识别和结
合有关。 同时, - 1 位使用的氨基酸种类也很少,根
癌土壤杆菌只使用了丙氨酸、甘氨酸、丝氨酸 3 种氨
基酸,粗糙脉孢霉使用了丙氨酸、半胱氨酸、苯丙氨
酸、甘氨酸、赖氨酸、亮氨酸、脯氨酸、丝氨酸、苏氨
酸、酪氨酸 10 种氨基酸,弯孢菌则使用了丙氨酸、半
胱氨酸、苯丙氨酸、甘氨酸、异亮氨酸、亮氨酸、脯氨
酸、谷氨酰胺、精氨酸、丝氨酸、苏氨酸、酪氨酸 12 种
氨基酸,其余氨基酸都未使用。 在 - 3 位上出现比
例最高的也是丙氨酸,分别达到了 81􀆰 0% (根癌土
壤杆菌)、38􀆰 7% (粗糙脉孢霉)和 43􀆰 3% (弯孢
菌)。 此外,在 + 1 位上三者使用最多的也是丙氨
酸,只是氨基酸种类较多,比例较均匀。 在弯孢菌
中, - 2、 + 2、 + 3 位上 20 种氨基酸都有分布,使用
频率差异不显著。 表明 - 3、 - 1、 + 1 位是弯孢菌信
号肽酶的识别位点,而 - 1 位的保守性最强,其次是
- 3 位。 弯孢菌的信号肽切割位点是比较保守的,
与根癌土壤杆菌、粗糙脉孢霉和马铃薯晚疫病菌一
样,存在可被 SPaseI型信号肽酶识别的结构,即 - 3
到 - 1 位的氨基酸组成为 A⁃X⁃A。
目前,已有多个物种开展了分泌蛋白功能的预
测分析。 苏源等 (2006)发现稻瘟菌 Magnaporthe
grisea分泌蛋白具有参与细胞代谢、细胞修复、防卫
和降解细胞壁等功能;可以产生多种降解细胞壁的
酶,可能与稻瘟菌侵染水稻时形成附着胞、穿过细胞
壁的机制有关。 周晓罡等(2006)发现粗糙脉孢菌
全基因组编码 437 个分泌蛋白,205 个具有功能描
述,涉及转运、能量生成、细胞自身修复和防卫等多
种功能,此外发现一些功能酶类;这些蛋白可能在菌
体外的场所或膜外的周质空间发生作用,为稻瘟菌
的生存摄取营养和感知环境作出服务。 周晓罡等
(2011)发现马铃薯晚疫病菌全基因组编码 671 个
分泌蛋白,45 个具有功能描述,涉及信号转导、细胞
代谢等方面;此外,还发现一些类似激发子的分泌蛋
白,可能与晚疫病菌的致病性有关。 张武等(2014)
发现在菜豆根瘤菌的 332 个具有信号肽的分泌蛋白
中,186 个具有功能描述,并识别了丝氨酸蛋白酶和
Ⅰ、Ⅱ、Ⅲ、Ⅳ型分泌系统,这些蛋白质可能参与了根
瘤菌对宿主植物的侵染。 本研究中,通过对弯孢菌
全基因组预测得出的 804 个分泌蛋白进行功能分
析,发现主要集中在能量代谢与转换(如甘油磷酸
二酯酶等)、物质运输和代谢(如与氨基酸代谢相关
478 植  物  保  护  学  报 42 卷
的羧肽酶等)、转录翻译(如 DNA / RNA 解旋酶等)、
细胞壁的合成(如多聚半乳糖醛酸内切酶)等方面,
这一点与稻瘟菌分泌蛋白的功能较为相似(苏源
等,2006)。
研究表明,致病菌与非致病菌在分泌蛋白的功
能方面存在一定的差别,如稻瘟菌和弯孢菌分泌蛋
白中有一部分是降解细胞壁的酶类( β⁃葡萄糖苷
酶),它们可能与病原菌的侵染及致病性有关,而这
一类酶在粗糙脉孢霉中却未发现。 β⁃葡萄糖苷酶属
于纤维素酶类,是植物细胞壁主要成分纤维素分解
酶系中的重要组分,能够水解结合于末端非还原性
的 β⁃D⁃葡萄糖键,同时释放出 β⁃D⁃葡萄糖和相应的
配基。 β⁃葡萄糖苷酶作为一种重要的细胞壁裂解
酶,能够破坏或软化寄主的细胞壁,有利于弯孢菌侵
染宿主植物,并在寄主细胞内完成生活史。 由此可
见,生物体产生的分泌蛋白对于维持其正常的生命
活动起着重要作用,而且不同物种间的分泌蛋白在
功能上也存在着较大的差别。 本研究中还发现了 6
个丝氨酸蛋白酶、1 个脂肪酶、1 个细胞色素 P450 和
1 个 β⁃葡聚糖酶,丝氨酸蛋白酶和脂肪酶可以分别
降解宿主植物体内的蛋白质和脂质,细胞色素 P450
作为普遍存在于各类生物细胞内的解毒酶,与真菌
的抗逆性密切相关,β⁃葡聚糖酶则可能激活玉米自
身产生防卫反应。 此外,在弯孢菌基因组中还存在
大量功能未知的具有信号肽的分泌蛋白,对这些分
泌蛋白的进一步研究将对认识弯孢菌自身的特点、
对寄主的适应性及二者之间的互作具有重要意义。
致谢:西奈山国际教育 AEAc项目部的李哲老师在英文摘要
撰写方面提供帮助,特此致谢!
参 考 文 献 (References)
Blobel G, Sabatini DD. 1971. Ribosome⁃membrane interaction in
eukaryotic cells. / / Manson LA. Biomembranes. New York:
Plenum Press, pp. 193 - 195
Catanzariti AM, Dodds PN, Lawrence GJ, Avliffe MA, Ellis JG.
2006. Haustorially expressed secreted proteins from flax rust are
highly enriched for avirulence elicitors. Plant Cell, 18
(1): 243 - 256
Eisenhaber B, Bork P, Eisenhaber F. 1998. Sequence properties of
GPI⁃anchored proteins near the omega⁃site: constraints for the
polypeptide binding site of the putative transamidase. Protein
Engineering, 11(12): 1155 - 1161
Eisenhaber B, Bork P, Eisenhaber F. 1999. Prediction of potential
GPI⁃modification sites in proprotein sequences. Journal of Mo⁃
lecular Biology, 292(3): 741 - 758
Fan CM, Li CY, Zhao MF, He YQ. 2005. Analysis of signal pep⁃
tides of the secreted proteins in Agrobacterium tumefaciens C58.
Acta Microbiologica Sinica, 45(4): 561 - 566 ( in Chinese)
[范成明, 李成云, 赵明富, 何月秋. 2005. 根癌土壤杆菌
C58 Cereon中分泌蛋白信号肽分析. 微生物学报, 45(4):
561 - 566]
Gao JX, Gao ZG, Lü SX, Zhang XX, Zhuang JH, Zhang S. 2011a.
Establishment of UP⁃PCR system and genetic diversity analysis
of Exserohilum turcicum. Journal of Maize Sciences, 19 (6):
112 - 117 (in Chinese) [高金欣, 高增贵, 吕淑霞, 张秀霞,
庄敬华, 张硕. 2011a. 玉米大斑病菌 UP⁃PCR 体系的建立
和遗传多样性分析. 玉米科学, 19(6): 112 - 117]
Gao JX, Jing J, Chen J. 2015. Elementary coordinated expression
research on genes related to the synthesis of pathogenesis⁃relat⁃
ed melanin and toxin in Cochliobolus lunatus. Journal of Shang⁃
hai Jiaotong University (Agricultural Science), 33(4): 53 - 58
(in Chinese) [高金欣, 荆晶,陈捷. 2015. 玉米弯孢叶斑病
菌致病相关黑色素和毒素合成基因协同表达研究初探. 上
海交通大学学报(农业科学版), 33(4): 53 - 58]
Gao JX, Jing J, Liu T, Chen J. 2015d. Identification of Clt⁃1⁃regu⁃
lated proteins associated with the production of non⁃host⁃specific
toxin and pathogenicity in Cochliobolus lunatus. Journal of Phy⁃
topathology, 163(1): 33 - 41
Gao JX, Jing J, Liu T, Yu CJ, Li YQ, Chen J. 2015c. Identifica⁃
tion of proteins associated with the production of melanin and
with pathogenicity in maize pathogen Curvularia lunata. Aus⁃
tralasian Plant Pathology, 44(6): 599 - 603
Gao JX, Jing J, Yu CJ, Chen J. 2015a. Construction of a high⁃
quality yeast two⁃hybrid library and its application in identifica⁃
tion of interacting proteins with Brn1 in Curvularia lunata. The
Plant Pathology Journal, 31(2): 108 - 114
Gao JX, Liu T, Chen J. 2014a. Insertional mutagenesis and cloning
of the gene required for the biosynthesis of the non⁃host specific
toxin in Cochliobolus lunatus that causes maize leaf spot. Phyto⁃
pathology, 104(4): 332 - 339
Gao JX, Liu T, Chen J, Li YQ. 2015b. Identification of proteins as⁃
sociated with the production of methyl 5⁃( hydroxymethyl) fu⁃
ran⁃2⁃carboxylate toxin in Curvularia lunata. Tropical Plant Pa⁃
thology, 40(2): 119 - 126
Gao JX, Lü SX, Gao ZG, Zhuang JH, Zhang XF, Zhang S. 2011b.
Identification and dynamic analysis on physiological race of Ex⁃
serohilum turcicum in northeastern China in 2009. Journal of
Maize Sciences, 19(3): 138 - 140, 144 ( in Chinese) [高金
欣, 吕淑霞, 高增贵, 庄敬华, 张小飞, 张硕. 2011b. 东北
地区 2009年玉米大斑病菌生理小种鉴定与动态分析. 玉米
科学, 19(3): 138 - 140, 144]
Gao SG, Li YQ, Gao JX, Suo YJ, Fu KH, Li YY, Chen J. 2014b.
Genome sequence and virulence variation⁃related transcriptome
profiles of Curvularia lunata, an important maize pathogenic
fungus. BMC Genomics, 15: 627# . DOI: 10􀆰 1186 / 1471⁃2164⁃
5786 期 高金欣等: 玉米弯孢叶斑病菌全基因组分泌蛋白的预测与分析
15⁃627
Gao SG, Zhou FH, Liu T, Li YY, Chen J. 2012. A MAP kinase
gene, Clk1, is required for conidiation and pathogenicity in the
phytopathogenic fungus Curvularia lunata. Journal of Basic Mi⁃
crobiology, 53(3): 214 - 223
Greenbaum D, Luscombe NM, Jansen R, Qian J, Gerstein M.
2001. Interrelating different types of genomic data from pro⁃
teome to secretome: ′oming in on function. Genome Research,
11(9): 1463 - 1468
Li FH, Ye HZ, Wang YT, Xiong MP. 2004. The research progress
of maize Curvularia leaf spot disease. Journal of Maize Sci⁃
ences, 12(2): 97 - 101, 107 ( in Chinese) [李富华, 叶华
智, 王玉涛, 熊绵平. 2004. 玉米弯孢叶斑病的研究进展.
玉米科学, 12(2): 97 - 101, 107]
Liu T, Xu SF, Liu LX, Zhou FH, Hou JM, Chen J. 2011. Cloning
and characteristics of Brn1 gene in Curvularia lunata causing
leaf spot in maize. European Journal of Plant Pathology, 131
(2): 211 - 219
Martoglio B, Dobberstein B. 1998. Signal sequence: more than just
greasy peptides. Trends in Cell Biology, 8(10): 410 - 415
Möller S, Croning MDR, Apweiler R. 2001. Evaluation of methods
for the prediction of membrane spanning regions. Bioinformat⁃
ics, 17(7): 646 - 653
Nakai K. 2000. Protein sorting signals and prediction of subcellular
localization. Advances in Protein Chemistry, 54(9): 277 - 344
Nimchuk Z, Eulgem T, Holt BFⅢ, Dangl JL. 2003. Recognition
and response in the plant immune system. Annual Review of
Genetics, 37: 579 - 609
Petersen TN, Brunak S, von Heijne G, Nielsen H. 2011. SignalP
4􀆰 0: Discriminating signal peptides from transmembrane re⁃
gions. Nature Methods, 8: 785 - 786
Su Y, Li CY, Zhao ZW, Zhou XG, Li JB, Yang J, Liu L, Ye YF.
2006. Primary analysis of the secretory proteins in genome scale
of Magnaporthe grisea. Journal of Yunnan Agricultural Universi⁃
ty, 21(3): 271 - 275, 292 (in Chinese) [苏源, 李成云, 赵
之伟, 周晓罡, 李进斌, 杨静, 刘林, 业艳芬. 2006. 稻瘟
菌基因组规模分泌蛋白的预测分析. 云南农业大学学报,
21(3): 271 - 275, 292]
Tjalsma H, Bolhuis A, Jongbloed JDH, Bron S, van Dijl JM. 2000.
Signal peptide⁃dependent protein transport in Bacillus subtilis: a
genome⁃based survey of the secretome. Microbiology and Mo⁃
lecular Biology Reviews, 64(3): 515 - 547
Wang JY, Chen J. 2011. Cloning and functional analysis of Clm1 in
Curvularia lunata. Acta Phytopathologica Sinica, 41 ( 5 ):
464 - 472 (in Chinese) [王嘉渊, 陈捷. 2011. 玉米弯孢叶
斑病菌 Clm1 基因的克隆及其功能验证. 植物病理学报, 41
(5): 464 - 472]
Wang XX, Wu L, Zhu SF, Li GR, Zhao L, Lü Y, Li FX, Chen Y.
1991. Bioinformatics analysis of secreted proteins in the genome
of Azorhizobium caulinodans ORS571. Genomics and Applied
Biology, 31(4): 394 - 400 ( in Chinese) [王新新, 吴亮,
朱生凤, 李广茹, 赵林, 吕妍, 李飞雪, 陈宇. 2012. 茎瘤
固氮根瘤菌 Azorhizobium caulinodans ORS571 基因组分泌蛋
白的生物信息学分析. 基因组学与应用生物学, 31(4):
394 - 400]
Yang FY. 1991. The new advance of protein transmembrane re⁃
search. Progress in Biochemistry and Biophysics, 18(2): 81 -
87 (in Chinese) [杨福愉. 1991.蛋白质跨膜运送研究的新
进展. 生物化学与生物物理进展, 18(2): 81 - 87]
Zhang W, Ma JT, Pan W, Lei TY. 2014. Genome⁃wide identifica⁃
tion and analyses of the classical secreted proteins of Rhizobium
etli CFN42. Genomics and Applied Biology, 33(5): 961 - 969
(in Chinese) [张武, 马金田, 潘伟, 雷腾英. 2014. 菜豆根
瘤菌 Rhizobium etli CFN42 全基因组含信号肽分泌蛋白的鉴
定与分析. 基因组学与应用生物学, 33(5): 961 - 969]
Zhou HY, Zhou YQ. 2003. Predicting the topology of transmem⁃
brane helical proteins using mean burial propensity and a hid⁃
den⁃Markov⁃model⁃based method. Protein Science, 12 ( 7 ):
1547 - 1555
Zhou XG, Hou SM, Chen DW, Tao N, Ding YM, Sun ML, Zhang
SS. 2011. Genome⁃wide analysis of the secreted proteins of
Phytophthora infestans. Hereditas, 33(7): 785 - 793 ( in Chi⁃
nese) [周晓罡, 侯思名, 陈铎文, 陶南, 丁玉梅, 孙茂林,
张绍松. 2011. 马铃薯晚疫病菌全基因组分泌蛋白的初步
分析. 遗传, 33(7): 785 - 793]
Zhou XG, Li CY, Zhao ZW, Su Y, Zhang SS, Li JB, Yang J, Liu
L, Ye YF. 2006. Analysis of the secreted proteins encoded by
genes in genome of filamental fungus (Neurospora crassa). He⁃
reditas, 28(2): 200 - 207 ( in Chinese) [周晓罡, 李成云,
赵之伟, 苏源, 张绍松, 李进斌, 杨静, 刘林, 业艳芬.
2006. 粗糙脉孢菌基因组分泌蛋白的初步分析. 遗传, 28
(2): 200 - 207]
(责任编辑:李美娟)
678 植  物  保  护  学  报 42 卷