全 文 :http://www.cibj.com/
应用与环境生物学报 Chin J Appl Environ Biol 2012,18 ( 1 ) : 139~146
2012-02-25 DOI: 10.3724/SP.J.1145.2012.00139
Analysis and Prediction of Protein Interaction Network of
Ralstonia solanacearum*
JIANG Chunlei, ZHAO rui, LÜ Lingfeng, QIAO Dairong & CAO Yi**
(Sichuan Public Experiment Platform of Bioinformatics and Metabolic Engineering, College of Life Sciences, Sichuan University, Chengdu 610064, China)
Abstract Bacterial wilt caused by Ralstonia solanacearum is a worldwide soil-borne bacterial diseases. The complete
sequence of Ralstonia solanacearum genome make it possible to analysis the protein-protein interaction networks of R.
solanacearum from the proteomic. In this paper, Naïve Bayes model was used to integrate seven kinds of methods (Phylogenetic
profi le, gene neighbor method, gene fusion, operon method, interolog, microarray, domain interactions) and predict protein
interactions of R. solanacearum. The reliable networks were obtained based on threshold determined by Youden’s index. The
secretion system and signal transduction system were analyzed and possible drug targets (cyaB, pilD, Fli, Rsp1526, VsrA,
VsrB, PilH) were suggested. The function of proteins without comments in COG database was inferred according to protein-
protein interaction. A completely free online database support was provided, including convenient queries and download for R.
solanacearum protein interaction and function data (http://www.scbmp.org.cn/rsoppi.php). Fig 8, Tab 1, Ref 25
Keywords Ralstonia solanacearum; protein interaction networks; protein function; proteomic; bacterial wilt; Naïve Bayes
model
CLC S432 : Q936
茄科雷尔氏菌蛋白质相互作用
网络预测及分析*
姜春雷 赵 锐 吕林峰 乔代蓉 曹 毅**
(四川大学生命科学学院四川省生物信息与代谢工程共享实验平台 成都 610064)
摘 要 细菌性青枯病是由茄科雷尔氏菌(Ralstonia solanacearum)引起的一种世界范围的细菌性土传病害. 该细菌基
因组序列的完全测序,使得从蛋白质组角度来分析其蛋白质相互作用网络成为可能. 本文通过朴素贝叶斯模型整合系
统发生谱法、基因邻近法、基因融合法、操纵子法、同源映射法、微阵列法、域相互作用法等7种方法,并根据约豋指
数确定的阙值,预测了可信的茄科雷尔氏菌的蛋白质相互作用网络. 对网络中的分泌子网络和信号转导进行了分析,
提出可能的药物作用靶点(cyaB、pilD、Fli、Rsp1526、VsrA、VsrB、PilH). 对于未注释的蛋白依据蛋白相互作用推测了
部分蛋白质的功能. 本文也提供了完全免费的在线数据库支持,提供了方便的茄科雷尔氏菌的蛋白相互作用的查询及
相互作用数据和推测的蛋白质功能数据的查询和下载(http://www.scbmp.org.cn/rsoppi.php). 图8 表1 参25
关键词 茄科雷尔氏菌;蛋白质相互作用;蛋白质功能;蛋白质组学;青枯病;朴素贝叶斯模型
CLC S432 : Q936
收稿日期:2009-12-10 接受日期:2012-01-17
*国家自然科学基 金项目(Nos. 30871321,30771312,30971817)和国家重点基础研究发展计 划(“973”计 划,No. 20 09CB125910)资
助 Supported by the National Natural Science Foundation of China (Nos. 30871321, 30771312, 30971817), and the National Key Basic
Research & Development Program of China (“973” Program, No. 2009CB125910)
**通讯作者 Corresponding author (E-mail: caoyi_01@163.com)
140
18卷
应用与环境生物学报 Chin J Appl Environ Biol http://www.cibj.com/
茄科雷尔氏菌蛋白质相互作用网络预测及分析 1期
细 菌 性 青 枯 病(B a c t e r i a l w i l t)是 由 茄 科 雷 尔
氏菌(R a l s t o n i a s o l a n a c e a r u m,曾用 名 Pse u d o m o n a s
solanacearum)引起的一种世界范围的细菌性土传病害,是
一种存在于土壤中的致病菌,属革兰氏阴性好氧菌,细胞呈
长椭圆形,近杆形,广泛分布于热带、亚热带及某些温带地
区. Ralstonia solanacearum具有广泛的寄主,可侵染50多个科
的200多种植物,其中马铃薯、番茄、烟草等茄科作物受害最
为严重. 由于“温室效应”引起全球气候变暖,该菌表现出向
高纬度冷凉地区蔓延的趋势,给作物生产带来极大威胁. 目
前尚无有效防治该病的方法.
生物的 生理 功 能 主 要由细 胞中的 蛋白质 相 互作用 来
完 成,因 此 理 解 生物 体蛋白质 间的 相 互作用 是 理 解 生命
活动的基础 . 目前研究蛋白质相互作用主要有实验方 法和
计 算方 法两 种. 实 验 方 法主 要 有酵 母双 杂交 技 术(Yeast
two-hybrid)、GST pull-down技术、免疫共 沉淀技术(Co-
immunoprecipitation)和串联亲和纯化技术. 现在已经有一些
模式生物通过高通量实验技术得到了相互作用网络. 但各种
实验方法都明显存在耗费大量时间、人力和费用昂贵的缺
点. 计算方法有效地避免了上述问题,通过对计算方法的改
进,可以有效地获得不同物种蛋白质相互作用网络数据.
本文通过朴素贝叶斯模型整合了系统发生谱法 [1]、基因
邻近法 [2]、操纵子法 [3]、基因融合法 [4~5]、同源映射法 [6]、域相
互作用 [7]、微阵列法 [8],成功预测了茄科雷尔氏菌的蛋白质相
互作用网络. 通过对预测模型进行5倍交叉验证得到的ROC
曲线证明了模型是可靠的. 通过对网络拓扑分析和预测的分
泌系统通路以及信号转导通路的分析,证明了我们预测的相
互作用网络是可信的. 通过对子网络的分析也发现了可能的
药物靶点. 通过相互作用,我们还预测了159种未知蛋白的功
能,这对更好地理解茄科雷尔氏菌的蛋白相互作用网络提供
了帮助. 在这个基础上,可以更容易地发现更多的潜在药物
靶点,提出更好的防治茄科雷尔氏菌导致的青枯病的办法.
1 材料与方法
1.1 实验数据
茄科雷尔氏菌的实验材料选取 Ralstonia solanacearum
GMI1000,其基因组及相关信息、系统发生谱法使用的参考
物种及分类信息、COG分类注释信息、微阵列方法用到的微
阵列数据从NCBI(http://www.ncbi.nlm.nih.gov/)下载. 基因融
合法使用的结构域信息从PFAM(http://pfam.sanger.ac.uk/)
数据库下载. 同源映射法中使用的参考物种蛋白相互作用信
息从DIP (http://dip.doe-mbi.ucla.edu/dip/Main.cgi)数据库下
载. 构造训练集所用数据信息从KEGG (http://www.genome.
jp/kegg/)下载. DDI方法使用的数据从InterDom(http://datam.
i2r.a-star.edu.sg/interdom/help/faq.php)数据库下载.
1.2 实验方法
实 验 使 用了7种 方 法:系 统 发 生 谱 法(Phylogenet ic
profile)、基因邻近法(Gene neighbor method)、基因融合法
(Gene fusion method)、操纵子法(Operon method)、同源
映射 法(Interolog)、微阵列法(Microarray)、域相互作用
(DDI),最后通过朴素贝叶斯模型整合7种方法预测的结果
来构建茄科雷尔氏菌蛋白质相互作用网络.
系统发生谱法的计算是根据相互作用的两个蛋白的表
达谱相似较高的特点来预测相互作用. 首先按照Sun等人描
述的方法 [9]选择了483个参考物种,其中真核20种、细菌412
种、古菌20种,按照Date等人描述的方法 [10]计算得到系统发
生谱,最后通到计算蛋白质发生谱间的互相信息来确定是否
发生相互作用. 基因邻近法是利用形成相互作用的两个蛋白
的基因在染色体上邻近,并且在多个物种中保守 [2, 11]的特点
来预测相互作用. 基因融合法是根据形成相互作用的两个蛋
白的基因在另外一个物种中可能融合成一个新基因[3]的特点
来预测相互作用. 操纵子法是依据在原核生物中处于同一个
操纵子中的基因通常形成相互作用的特点来预测相互作用[3].
同源映射法是通过寻找其它物种中实验证明的相互作用对
在茄科雷尔氏菌中的同源蛋白来预测相互作用的 [12],选择了
DDI数据库中提供了完整相互作用数据的7个物种作为参考
物种.
目前,在GEO中没有关于茄科雷尔氏菌的微阵列信息,
我们选择了同茄科雷尔氏菌进化关系比较近的Burkholderia
p se u d o m al le i K 96243作为 微 阵 列 分 析 的 数 据 . 首先 对
Burkholderia pseudomallei K96243的微阵列数据进行分析,
计 算任意两个 蛋白对表 达数 据的pearson相关 系数,选 择
相关系数 >0.95的蛋白质对,通过blast比较茄科雷尔氏菌和
Burkholderia pseudomallei K96243的蛋白质序列,在任意两
个蛋白对之间选择e值最小的蛋白质对建立一一对应关系,
最后用茄科雷尔氏菌的蛋白替换Burkholderia pseudomallei
K96243的蛋白,这样就间接得到了茄科雷尔氏菌的微阵列方
法的相互作用数据.
蛋白质相互作用是 一种域(Domain)间的相互作用,
Interdom通过对实验证明具有相互作用的蛋白质序列分析,
得到每个蛋白存在的pfam域,认为两个蛋白质的域间具有相
互作用. 对茄科雷尔氏菌所有蛋白分析得到每个蛋白的pfam
域,如果两个蛋白质的pfam域的组合存在于Interdom推测的
相互作用的域中,就认为这两个蛋白具有相互作用.
为了通过贝叶斯方法整合7种方法预测到的数据,将各
种方 法得到的数据依据可信度进行打分. 系统发生谱法根
据互信息值进行打分,基因邻近法是根据茄科雷尔氏菌基因
同参考物种中同源基因的进化 距离来打分,同源映射 法是
根据基因在参考物种中出现的次数进行打分,DDI方法依据
141
18卷
1期 姜春雷等
http://www.cibj.com/ Chin J Appl Environ Biol 应用与环境生物学报
Interdom中提供的原始数据进行打分,微阵列数据依据计算每
个蛋白表达谱的pearson相互系数值来打分. 为了使不同方法的
分值具有可比性,每种方法的打分结果最后被归在0~1间.
正集和负集:正集选择的依据是茄科雷尔氏菌的蛋白质
相互作用数据在几个流行的蛋白质相互作用数据库中都没
有出现 . 分别选择KEGG的Module和KEGG中标注为形成复
合体的两个蛋白,以及在KEGG通路中体现为具有功能相互
作用关系的蛋白作为正集. 负集的选择对于所有的物种都没
有一个明确的标准,一个没被实验证明的蛋白质对或许是一
个潜在的相互作用对,通过两条标准来确定负集:(a)两个
蛋白位于KEGG不同的最高层分类;(b)两个蛋白质中的任
何一个都不能处于多个KEGG最高层分类中. 将完全符合以
上两条标准的蛋白质对作为负集.
朴素贝叶斯分类器(Naïve Bayesian Classifier,NBC)是
从贝叶斯理论发展起来的,经典贝叶斯公式为:
(1)
对于要解决的问题,C代表分类,M代表不同的方法,
C = (C1, C2),解决的问题是一个二分类的问题,所以C有两个
取值,C1代表具有相互作用,C2代表没有相互作用,M = (M1,
M2, M3, M4, M5, M6, M7),代表使用的7种方法.
在公式(1)中,直接计算P(M |C)很困难,因此我们假设
各个方法间独立,即C1, C2……C7中同C相关,这样就可以简
化求P(M|C)为:
(2)
把(2)代入(1)就得到了朴素贝叶斯公式:
(3)
由于要解决的是 一 个二分类问题,即具 有相互作用和
不具有相互作用,可以不关注一个相互作用对被具体分到哪
一类,只需要知道两个蛋白质对被分在具有相互作用的类C1
中的概率,就可以得到每一对相互作用被分在C1类的概率的
排名,因此,选择一个合适的阙值,就可以完成分类. 在朴素
贝叶斯分类器中,对于每一个分类P(M)是一个常量,可以不
关注P(C |M )的具体计算结果,只要计算(3)式分 子就可以衡
量P(C|M),这样要计算机的任务就变成 ,
P(C1)是一个常量,所以任务进一步简化为 ,似
然比(Likelihood rate,LR)定义为LR =
,考虑各个
方法间不相关,LR =
,LR可以做为衡量各种方法
贡献的一个指标,它也同朴素贝叶斯模型中的后验概率正相
关,因为将求解的问题最终转化为求似然比,这样就可以通
过构造的训练集(正集、负集)来获得合适的模型. 因为每一
种方法得到结果的得分也是衡量可信度的一个指标,把它也
同似然比相乘.
2 结果与分析
2.1 7种方法预测能力的评估
LR可以作为评 估各 个方法预测能力的一个标准,只要
LR大于0,就说明该方法有预测的能力. 从图1可以看出各个
方法对预测结果的贡献差异很大,基因融合法的贡献最大,
这也说明了通过朴素贝叶斯方法整合的必要性.
图1 7种方法的似然值比较
Fig. 1 Likelihood of seven methods
ma:微阵列;ddi:域相互作用;gc:操纵子法;gn:基因邻近法;io(interolog):同源映射法;pp:系统发生谱法;rs:基因融合法. 下同
ma: Microarray; ddi: DDI; gc: Operon method; gn: Gene neighbor method; io (interolog): Homology mapping method; pp: Phylogenetic prof ile;
rs: Gene fusion method. The same below
142
18卷
应用与环境生物学报 Chin J Appl Environ Biol http://www.cibj.com/
茄科雷尔氏菌蛋白质相互作用网络预测及分析 1期
2.2 各种方法的相关系数
在衡量不同方法间的相关性时以0.4作为阙值,表1中的
值没有超过这个值. 在应用朴素贝叶斯方法时,如果不同方
法间的相关性较高,会使预测结果的分数同真实值有差别,
但这种差别是朝着一个方向的,会使预测值小于真实值,由
于这种影响对每一对相互作用的效果是相同的,并不影响最
后预测结果的排名[13~14]. 表中还有一些值为负,说明两种方
法的预测结果是负相关即互补的,这说明每一种方法的预测
存在偏好,预测结果不全面,整合多种方法恰好弥补了这个
缺陷.
2.3 预测结果及网络拓扑结构分析
通过朴素贝叶斯模型整合7种方法的数据,得到了一个
包含17 444个连接的网络,覆盖了5 513个ORF中的4 747个,
占总数的92.84%. 其中最大的一个子网络包含3 818个蛋白质
(占整个网络的80.43%)和16 914对相互作用(占整个网络的
96.26%)(图2).
从这个最大的网络可以清楚地看出上下左右4个功能模
块(相同颜色聚集点),其中一个蓝色点居多(A),一个黑
色和未知各半(B),一个黄绿居多(C),另一个以灰色居多
(D). 蓝色聚集点大多数蛋白同细胞壁合成相关,灰色聚集
点多数蛋白功能未知,可能成为新的药物靶点,或对其危害
植物起重要作用的子网络. 将预测的网络中的蛋白根据COG
中的功能进行分类,共有23个分类(图3),不同功能的蛋白
中未知的蛋白占到了8%.
在 预 测 的 网 络 中 ,大 部 分 的 节 点 只 有 很 少 的 度
表1 7种方法pearson相关系数(表中值为×100后的值)
Table 1 Pearson correlation coeffi cient of the seven kinds of methods (the value after × 100)
方法 Method ma gc gn io pp rs ddi
ma 33.58 -0.20 5.46 -3.44 -4.59 -2.24
gc 33.58 21.64 8.51 7.14 4.88 2.23
gn -0.20 21.64 11.47 1.01 19.41 2.65
io 5.46 8.51 11.47 -3.70 7.31 20.85
pp -3.44 7.14 1.01 -3.70 0.65 -5.02
rs -4.59 4.88 19.41 7.31 0.65 3.71
ddi -2.25 2.23 2.65 20.85 -5.02 3.71
图2 最大子网络模块
Fig. 2 The maximum sub-network module
[J] Translation, ribosomal structure and biogenesis
[A] RNA processing and modifi cation
[K] Transcription
[L] Replication, recombination and repair
[B] Chromatin structure and dynamics
[D] Cell cycle control, cell division, chromosome partitioning
[Y] Nuclear structure
[V] Defense mechanisms
[T] Signal transduction mechanisms
[M] Cell wall, membrane, envelope biogenesis
[N] Cell motility
[Z] Cytoskeleton
[W] Extracellular structures
[U] Intracellular traffi cking, secretion, and vesicular transport
[O] Posttranslational modifi cation, protein turnover, chaperones
[C] Energy production and conversion
[G] Carbohydrate transport and metabolism
[E] Amino acid transport and metabolism
[F] Nucleotide transport and metabolism
[H] Coenzyme transport and metabolism
[I] Lipid e transport and metabolism
[P] Inorganic ion transport and metabolism
[Q] Secondary metabolites biosynthesis, transport and catabolism
[R] General function prediction only
[S] Function unknown
图3 茄科雷尔氏菌蛋白质在COG分类中的含量图
Fig. 3 The content of Ralstonia solanacearum protein in COG
categories
143
18卷
1期 姜春雷等
http://www.cibj.com/ Chin J Appl Environ Biol 应用与环境生物学报
(Degree),而少数节点则具有很大的度,这说明预测的网络
符合Scale-free属性(图4),x轴为节点的度,y轴为节点的个
数,为了便于观察,对x、y分别取对数. 图4对路径长度的分析
中可以看出大部分节点间的路径长度为8左右,这说明了预测
的网络符合Scale-free网络的小世界效应(Small world).
2.4 预测性能的评估
为了评 估 模 型的预测性能,通 过5倍交 叉验 证 来构造
ROC曲线评估预测模型的预测能力(图5). 曲线下部的面积
占95%,说明我们的预测方法是有效的,并且预测准确率比
较高.
2.5 胞外分泌系统分析
茄科雷尔氏菌对植物入侵和危害作用主要来自胞外分
泌系统,其危害物种的不同也同胞外分泌物有关 . 对茄科雷
尔氏菌胞外分泌系统的分析可以获得更多的关于其入侵和危
害机理,以便设计出应对办法. 在革兰氏阴性菌中通常有5个
类型的分泌通路 [15~19],全部在预测的网络中出现,预测结果
同以前描述的基本类似. 在细菌致病过程中,Ⅲ型分泌系统
具有最重要的作用,但在构成Ⅲ型分泌系统的主要基因hrp
基因缺失后,细菌仍然具有侵染植物维管束的能力[20],这说
明细菌在侵入植物过程中,各型分泌系统互相配合,共同发
生作用,并非单一因素起着决定性作用. 在5个分泌系统中,
Ⅴ型分泌系统功能比较单一,我们将在下面主要针对前4种
分泌系统进行分析.
Ⅰ型分泌系统也被称为ABC分泌系统(ATP-binding
cassette),它不依赖Sec途径,可以将蛋白直接从胞质分泌到
胞外,是一种在细菌中保守的分泌系统. 它转运的蛋白包括
成孔素、蛋白酶、酯酶、S-层蛋白等 [21]. 在预测的网络中出现
的主要蛋白有cyaB、RSp0290、RSp0291(图6),这3个蛋白分
别同E. coli中的HlyB、HlyD、TolC同源,E. coli的Ⅰ型分泌系
统是研究得比较透彻的一个系统,它由这3种蛋白构成. 这说
明茄科雷尔氏菌可能具有同E. coli类似的Ⅰ型分泌系统. cyaB
处于分泌系统的量底层,它最先同被转运的蛋白作用,它在
预测的网络中同大量的蛋白有连接,其中大部分蛋白功能未
知,很可能这些蛋白部分是向外分泌的蛋白.
Ⅱ型分泌系统(图7)主要由gsp基因组成,出现在这个
子网络中的蛋白还有pil基因,Rossier等人曾描述的Ⅱ型分泌
系统要依赖pilD [22],可能其它的pil基因对Ⅱ型分泌系统也是
必要的.
Ⅲ型分泌系统(图7)在茄科雷尔氏菌危害植物过称中起
着重要作用 [23~24],它所分泌的效应蛋白不在胞浆间隙停留,
直接分泌到细胞表面,多种蛋白参与了整个过程,是所有已
知蛋白质分泌系统最复杂的. 在致病菌中Ⅲ型分泌系统通常
形成基因簇,被称为毒力岛(Pathogenicity island),在非致病
细菌中通常缺少这些致病区. Ⅲ型分泌系统主要由hrc基因组
成. 在预测的网络中有很多Fli鞭毛蛋白质. Ⅲ型分泌系统同
鞭毛组装系统共用这些蛋白质,这同以前描述的鞭毛蛋白通
过Ⅲ型分泌系统分泌一致. Ⅲ型分泌系统是由鞭毛组装相关
蛋白演化而来,耶尔森菌的鞭毛蛋白同Ⅲ型分泌系统同样有
图4 茄科雷尔氏菌蛋白相互作用网络拓扑分析
Fig. 4 The topology analysis of Ralstonia solanacearum protein
interaction network
图5 ROC曲线
Fig. 5 ROC curve
144
18卷
应用与环境生物学报 Chin J Appl Environ Biol http://www.cibj.com/
茄科雷尔氏菌蛋白质相互作用网络预测及分析 1期
同源性 [25]. 这些鞭毛蛋白还可以作为分子伴侣,植物细胞不
存在鞭毛蛋白,这使它可能做为潜在的药物靶点. Ⅲ型分泌
系统另一种主要蛋白由hrp基因产生. Hrp既是Ⅲ型分泌系统
的组装蛋白,也可从Ⅲ型分泌系统分泌到胞外,hrp基因编码
的蛋白使非寄主植物产生过敏反映(Hypersensitive response,
HR),从而免受侵害. 茄科雷尔氏菌的hrp基因存在于它的质
粒 上,可能来自水平转移(HGT),在预测的子网络中,hrp
基因同Ⅲ型分泌系统的其它基因产物有着广泛的连接,这同
hrp基因的作用相符合. Rsp1526没有被注释过,猜测它可能是
潜在的avr基因,avr基因产物分泌到胞外同植物跨膜蛋白产
生亲和反应,导致细菌侵入.
Ⅳ型分泌系统(图7)主要由trb基因构成. 细菌胞间质粒
DNA的接合转移由Ⅳ型分泌系统完成. 在预测的Ⅳ型分泌系
统子网络中,还包括了traG基因,它被注释为接合转移蛋白
图6 茄科雷尔氏菌Ⅰ型分泌系统子网络
Fig. 6 Ralstonia solanacearum secretion system sub-network of type Ⅰ
图7 茄科雷尔氏菌Ⅱ、Ⅲ、Ⅳ型分泌系统子网络
Fig. 7 Ralstonia solanacearum secretion system sub-networks of type Ⅱ, Ⅲ, Ⅳ
145
18卷
1期 姜春雷等
http://www.cibj.com/ Chin J Appl Environ Biol 应用与环境生物学报
(Conjugal transfer coupling protein TraG),这是同Ⅳ型分泌
系统的功能相符合的.
2.6 信号转导网络分析
茄科雷尔氏菌的信号转导系统是一个十分复杂的系统,
如图8所示(这个子网络只包含了部分信号转导系统本身,没
有包含信号转导系统调控的蛋白),在不同蛋白质之间的连
接非常多,这同茄科雷尔氏菌复杂的生理调控过程是相一致
的,真正的相互作用网络可能更为复杂,这也是茄科雷尔氏
菌分布范围广、侵害物种多、能适应多种不同环境和难于防
治的原因.
茄科雷尔氏菌可以直接进入植物受伤部位,然后进入
导管,它在导管中繁殖时产生大量胞外糖,阻碍植物水分运
输,引起植物枯萎. 胞外多糖基因(eps)受到vsr基因的调节,
vsr是一种二元调控系统基因(Two-component System). 在预
测的信号转导子网络中,vsrA和vsrB出现在网络中,它们同其
它基因都有着大量的连接,这一方面说明了在vsr基因调控
eps基因产物时同时受到了更多的上层调控基因的调控,另
一方面也说明vsr基因可能还调控了很多别的基因,通过 对
整个网络的分析,发现vsr基因同非信号转导基因也有着大
量的连接,这间接地证明了我们上述的推断. 在茄科雷尔氏
菌侵害植物过程中,降解植物细胞壁的水解酶起到了很大的
作用,peh基因对水解酶的转录有影响,出现在预测的子网
络中的peh基因包括pehS和pehR,同它们连接的是一些二元
调控系统基因(Rsc3079,Rsc0077,Rsc0078),二元调控系统
可以将外界信号传到胞内,相关 基因对传入的信号做出反
应,表达或抑制相应的蛋白. 这同茄科雷尔氏菌在进入植物
体内才表达相应的水解蛋白是一致的. 同peh连接的RSc2515
在COG中注释为假定蛋白,没有相关功能,推测它可能也是
一个二元系统元件. Phc也是一种二元调控元件,出现在子网
络中的有phcR、phcS,它同vsr基因在茄科雷尔氏菌使植物致
病方面都起着核心作用[23]. vsr、peh、phc基因都同pilH基因有
连接,pilH在COG中注释为假定的蹭行运动二元系统反应器
调控转录调控蛋白(Putative twitching motility two-component
response regulator transcription regulator protein),预测的3种
二元调控系统在将信号传入细胞内时,使细菌产生侵害植
物的胞外分泌物,基于pilH基因功能的假定,茄科雷尔氏菌
的信号传到到体内还使细菌做出了另一个反应,就是它的运
动,这对细菌在植物中扩散以及扩散速度有着重要的作用,
我们认为这是一个潜在的药物靶点蛋白,如果能通过抑制这
个蛋白来控制细菌的运动,将大大减轻它的危害性. 预测的
信号转导途径也可能使我们更好地理解植物对茄科雷尔氏
菌的防御,在茄科雷尔氏菌侵入植物时,植物提供给茄科雷
尔氏菌的信号是其分泌胞外蛋白和运动的一个原因. 通过对
抗性植物和受侵害植物的对比研究,可能发现有助于茄科雷
图8 茄科雷尔氏菌信号转导子网络
Fig. 8 Ralstonia solanacearum signal transduction sub-network
146
18卷
应用与环境生物学报 Chin J Appl Environ Biol http://www.cibj.com/
茄科雷尔氏菌蛋白质相互作用网络预测及分析 1期
尔氏菌侵入植物的外部信号,从而找到有效的防治办法.
3 结 论
茄科雷尔氏菌是一种引起全世界范围的具有毁灭性植
物青枯 病的细菌,青枯 病的防 治一直 是学 术 界的难 题 . 本
文通过整合多种方法成功预测了茄科雷尔氏菌蛋白质相互
作用的网络,并对预测模型及网络进行了分析,证明预测的
网络 是可信的. 我们预测的数 据 也提 供免费且方便的网络
(http://www.scbmp.org.cn/rsoppi.php)查询和下载服务.
茄科雷尔氏菌中有8%的蛋白是功能未知的蛋白,我们
通过相互作用网络,预测了159种蛋白质的功能,全部预测结
果可以从网上下载,当然,进一步的证明还有待实验验证.
References
1 Pellegrini M, Marcotte EM, Thompson MJ, Eisenberg D, Yeates D.
Assigning protein functions by comparative genome analysis: Protein
phylogenetic profi les. Proc Natl Acad Sci USA, 1999, 96: 4285~4288
2 Overbeek R, Fonstein M, D’Souza M, Pusch GD, Maltsev N. The use of
gene clusters to infer functional coupling. Proc Natl Acad Sci, 1999, 96:
2896~2901
3 Strong M, Mallick P, Pellegrini M, Thompson MJ, Eisenberg D.
Inference of protein function and protein linkages in Mycobacterium
tuberculosis based on prokaryotic genome organization: A combined
computational approach. Genome Biol, 2003, 4: R59
4 Marcotte EM, Pellegrini M, Ng HL, Rice DW, Yeates TO, Eisenberg D.
Detecting protein function and protein-protein interactions from genome
sequences. Science, 1999, 285: 751~753
5 Marcotte CJV, Marcotte EM. Predicting functional linkages from gene
fusions with confi dence. Appl Bioinformatics, 2002, 1 (2): 93~100
6 Matthews LR, Vaglio P, Reboul J, Ge H, Davis BP, Garrels J, Vincent S,
Vidal M. Identifi cation of potential interaction networks using sequence-
based searches for conserved protein–protein interactions or “interologs”.
Genome Res, 2001, 11 (12): 2120~2126
7 Ng SK, Zhang Z, Tan SH, Lin K. InterDom: A database of putative
interacting protein domains for validating predicted protein interactions
and complexes. Nucleic Acids Res, 2003, 31 (1): 251~254
8 Ge H, Liu Z, Church GM. Correlation between transcriptome and
interactome mapping data from Saccharomyces cerevisiae. Nat Genet,
2001, 29 (4): 482~486
9 Sun JC, Xu JL, Liu Z, Liu Q, Zhao A, Shi TL, Li YX. Ref ined
phylogenetic profi les method for predicting protein-protein interactions.
Bioinformatics, 2005, 21 (16): 3409~3415
10 Date SV, Marcotte EM. Discovery of uncharacterized cellular systems
by genome-wide analysis of functional linkages. Nat Biotechnol, 2003,
21 (9): 1055~1062
11 Dandekar T, Snel B, Huynen M, Bork P. Conservation of gene order:
A fi ngerprint of proteins that physically interact. Trends Biochem Sci,
1998, 23 (9): 324~328
12 Yu H, Luscombe NM, Lu HX, Zhu X, Xia Y, Han JD, Bertin N, Chung
S, Vidal M, Gerstein M. Annotation transfer etween genomes: Protein–
protein interologs and protein-DNA regulogs. Genome Res, 2004, 14 (6):
1107~1118
13 Hand DJ, Yu K. Idiot’s Bayes-not so stupid after all? Intern Stat Rev,
2001, 69 (3): 385~398
14 Domingos P, Pazzani M. On the optimality of the simple Bayesian
classifi er under zero-one loss. Machine Learning, 1997, 29: 103~130
15 Fath MJ, Kolter R. ABC transporters: Bacterial exporters. Microbiol
Rev, 1993, 57 (4): 995~1017
16 Finlay BB, Falkow S. Common themes in microbial pathogenicity
revisited. Microbiol Mol Biol Rev, 1997, 61 (2): 136~169
17 Salmond GP, Reeves PJ. Membrane traffi c wardens and protein secretion
in Gram-negative bacteria. Trends Biochem Sci, 1993, 18 (1): 7~12
18 Van Gijsegem F, Genin S, Boucher C. Conservation of secretion
pathways for pathogenicity determinants of plant and animal bacteria.
Trends Microbiol, 1993, 1: 175~1801
19 Winans SC, Burns DL, Christie PJ. Adaptation of a conjugal transfer
system for the export of pathogenic macromolecules. Trends Microbiol,
1996, 4 (2): 64~68
20 Vasse J, Genin S, Frey P, Boucher C, Brito B. The hrpB and hrpG
regulatory genes of Ralstonia solanacearum are required for different
stages of the tomato root infection process. Mol Plant Microbe Interact,
2000, 13 (3): 259~267
21 Gentschev I, Dietrich G, Goebel W. The E. coli alpha–hemolysin
secretion system and its use in vaccine development. Trends Microbiol,
2002, 10 (1): 39~45
22 Rossier O, Starkenburg SR, Cianciotto NP. Legionella pneumophila
type II protein secretion promotes virulence in the A/J mouse model of
Legionnaires’ disease pneumonia. Infect Immun, 2004, 72 (1): 310~321
23 Schell MA. Control of virulence and pathogenicity genes of Ralstonia
solanacearum by an elaborate sensory network. Annu Rev Phytopathol,
2000, 38: 263~292
24 Alfano JR, Collmer A. Type Ⅲ secretion system effector protein: double
agents in bacterial disease and plant defense. Annu Rev Phytopathol,
2004, 42: 385~414
25 Yip CK, Kimbrough TG, Felise HB, Vuckovic M, Thomas NA,
Pfuetzner RA, Finlay BB, Miller SI, Strynadka NC. Structural
characterization of the molecular platform for type III secretion system
assembly. Nature, 2005, 435 (7042): 702~707