免费文献传递   相关文献

The structure and decomposition of the transcriptional regulatory network of Bacillus subtilis

枯草芽孢杆菌转录调控网络的连接结构及分解



全 文 :Aug.2∞7
· 58·
生物加工过程
ChineseJournalofBioprocessEngineering
第5卷第3期
2007年8月
枯草芽孢杆菌转录调控网络的连接结构及分解
刘 杨1,赵学明1,马红武1’2
(1天津大学 诧工学麓,天津3蝴72;
2.SchoolfInfo瑚atics,universityofEdinburgh,Edinburgh,EH89LEUK)
摘要:对枯草芽孢杆菌(嚣8c谢淞s“6砌赫)转录调控网络的全局连接性质进行分析之后,基于一种自上而下的思路,
将馥点放在最火弱连通体,提出了基于距离的分解方法,并对得出的模块进行了明确的生物学功能定义。研究结
暴表臻基于盖蒸蹇戆分解方法对于标识转录调控网络中戆生物擎磅瞧模块卡分有效。
关键词:转录调控网络;连接结构;网络分解;功能模块;枯草茅孢杆菌
中阑分类号:Q811.4 文献标识码:A 文章编号:1672—3678(2007)03—0058—06
Thestructureandecompositionofthetranscriptionalregul tory
薹le鼍姆01.k9£差汝e主Z矗ls霪掰否£泌
LIUYan91,ZHA0Xue—min91,MAHong.wul’2
(1。Se魏。蘸《强e藤c蠢E啄黼蔽珏g鞠d%e轴磋D醪,纛鞲泌馨nive鹳湾,娶8≤瓤3∞∞2,Chi珏a;
2.ScboolfIId撕naI:ics,uIliversity0fEdinbu曲,Edinburgh,EH89LEuK)
Ab瓣豫曛:X阮p糙辩醅lanew璩e滋嗣较i&测晦i麓蝴d鞋lesi毪th 毛残I翳e纛砖馘羹羚∥l鑫圭。猡珏et娴蝮
(豫N)of嚣∽i盯獬s珏6捌拈(蕊u)byat叩一down印proach.弧e甜obalconnectiV毋structureofthereg —
latorynetworkbtainedfromtwodatabaseswastudied.Fbcusingon出egiantweaklyconnectedompo—
ne燃(习驴CC)《凌en氆wo矗,adis耋蘸器ee南鹳eddeeo瑶posi珏gme凌odwasdeVelopeda珏d壕e§i蠢。露e基
functionsofidenti6edIno uleswereclearlydenned.Resultsindicate8thatthisdecompositionme h dwas
e撤cientf醅identifyingbiolo西callymeaningfulmodulesinTRN.
X盼嘲砖s:t糖珏se速最。瓣窿托g毛重la|o猡珏e添。戎(室R慕);connee基vi耄ys差瑾e攮黼;ne獬。交deco瑚posili好n;
functionaLlmodules:曰黜淑泌s“6捌鼢
对生物系统中浙有组成成分以及他们之鬻的
相互关系进行研究的系统生物学,是后基因组时代
研究的一个核心内容。复杂的生物网络是系统生
物学礤究的一个主要对象,溺前研究眈较广泛的生
物网络包括代谢网络、转录调控网络和蛋白质相互
作用网络等¨。3』。Brayl41提避了一种“蛊上面下”
(溺p—doWnview)研究瞬络组织结构的思想。驭整个
网络结构出发将网络分解成子系统或模块,这种方
法建立在大多数细胞功能是由一组基因互糨作用
形成功能模块来共同执行瞪3的瑗论基础之上。基
于这种研究思想,网络分解便成为其中最关键的步
骤。Tomow等∞1提出了一种将蛋白质穗互作用网
收稿日期:2006m12_20
蒸众项目:国家巍然辩学基金资助项霹(20536040);国家整点基础研究发展砖划资舫矮霹(2∞3eB716003,2∞7CB707802);炎津市爵技
发展资助项霹(嬲Y}EzGj国45∞);薮育部长江学者寿镯羲溺队发震诗翊资助矮蘑
作者简介:刘 杨(1982一),女,辽宁铁岭人,硕士研究生,研究方向:生物信息学。
联系人:马红武,副教授,E—mail:chemeng@tju.edu.cn
万方数据
2007年8月 刘杨等:枯草芽孢杆菌转录调控网络的连接结构及分解 ·59·
络和基因表达数据结合起来,通过研究拓扑性质对
网络进行分解的方法。Pereira-Leal等"1根据酵母
蛋白质相互作用网络的拓扑性质对网络进行加权
分析,从而提出分解功能模块的算法。文献[8—9]
则根据网络结构对bow.tie模型进行研究并分析了
代谢网络的模块性。由这些研究成果可以看出,首
先分析网络的全局连接结构,在此基础上对网络进
行分解,可以更好地建立系统水平的生物网络模型。
基因转录调控网络是非常重要的生物网络,对
于酵母和大肠杆菌等基因水平数据比较完全的生
物体,转录调控网络都取得了一些研究成果¨¨12j。
枯草芽孢杆菌具有复杂而典型的生长机制,是基因
水平数据最完全之一的革兰氏阳性菌。ogura等¨3。
对在枯草芽孢杆菌双组分调控关系总结的基础上,
尝试利用结果建立部分转录调控网络,Hamoen
等H41对枯草芽孢杆菌中关键复杂调控途径之问的
关系进行总结和讨论,这都为建立转录调控网络提
供了重要信息。随着DBTBs¨纠和ProdoricL1钊等基
因数据库的不断完善,从数据库中直接提取数据使
研究效率大大增加。Moreno—campuzano等u刊从基
因数据库中搜集信息并对枯草芽孢杆菌的转录因
子进行了定义和分类。本文以枯草芽孢杆菌为例,
自上而下的对转录调控网络进行分析,从全局连接
结构出发,提出基于距离的分解方法将网络分解,
并对分解出的模块定义了生物学功能。
1材料和方法
1.1网络数据来源
重建枯草芽孢杆菌的基因转录调控网络数据
以DBTBS为主,为了得到更加可靠的转录调控网
络,进一步补充了Prodoric中关于枯草芽孢杆菌的
数据。两个数据库都采用转录因子.操纵子的形式
表示转录调控关系,本文把这种形式转化成了转录
因子.基因的调控关系,目的是更加全面地呈现转录
调控信息,以更加深入地研究转录调控网络。
将两个数据库中信息进行转化和整合,移除重
复数据后得到网络。重建后的调控网络由718个基
因,1041组调控关系,89个调控子构成。由于该网
络整合了DBTBs和Pmdoric两个数据库的信息,并
且用转录因子一基因的关系表示网络,因此是目前涵
盖信息比较全面的枯草芽孢杆菌基因转录调控
网络。
1.2网络结构参数
(1)路径长度(pathlen舢)在网络中任选两个
节点,连通这两个节点的最少边数,为这两个节点
的路径长度。
(2)出度(outdegree)从一个节点出发的边的
数目。
(3)弱连通体(weaklyconnectedomponents,
wcc)在有向图中,如果一个集合中的任意一个节
点,在不计连接方向的前提下,可以到达集合中的
其他所有节点,那么这个集合叫做弱连通体。
(4)强连通体(stronglyco nectedomponents,
SCC)在有向图中,如果一个集合中的任意一个节
点,在考虑方向的前提下,可以到达集合中的其他
所有节点,那么这个集合叫做强连通体。
1.3网络结构的分析
网络结构分析采用软件Pajek¨8。进行计算。一
个转录因子直接调控靶基因的数目在软件中等于
它的出度。一个转录因子直接和间接调控的所有
靶基因的数目等于它的输出域。连通体和距离矩
阵的相关分析通过软件计算实现。
2结果与讨论
2.1调控网络连接结构
枯草芽孢杆菌的转录调控网络(图1)共有27
组弱连通体,最大的弱连通体由555个基因组成,占
整个网络基因总数的3/4还多,该性质与大肠杆菌
代谢网络和转录调控网络都很相似旧,19j,其次大的
弱连通体只有27个基因,只有5个弱连通体包含多
于10个基因,还包含一个仅自我调控的基因却C。
图l 枯草芽孢杆菌的初始转录调控网络
Fig.1Theori醇naluno唱aJlizedtranscriptional
regIJlatorynetworkf曰.sM6谢蠡
万方数据
· 60· 生物加工过程 第5卷第3期
网络的直径为5,即网络中最长的调控路径长度为5,
网络中有两条这样的路径:PhoP_ResD_Fnr_A删
_HrcA_GroEL和PhoP。ResD斗Fnr。A删_+HrcA
_GroES。这两条调控路径的前5个基因相同,最后
一步由HrcA调控Gr0EL和GmES分成两条路径,主
要与缺氧条件下蛋白质表达有关,该路径在网络中没
有调控捷径且调控路径最长,这很可能说明枯草芽孢
杆菌的缺氧信号传递机制比较复杂。
与大肠杆菌的转录调控网络不含强连通体不同
的是,枯草芽孢杆菌的转录调控网络有4个强连通
体,但规模都很小,最大的强连通体也仅由4个基因
组成:印00A,幼r,a6檀和5i,zR,这个强连通体进一步
与ro露和comK构成的强连通体相互调控,另两个强
连通体分别为:p矗oP和瑚D,如缓和如£s,如图2。这
几个强连通体的存在使枯草芽孢杆菌在转录调控水
平上存在反馈调控关系(基因A调控基因B,基因B
也调控基因A)。转录水平上的反馈较少存在于网络
中,我们发现枯草芽孢杆菌转录调控网络中强连通体
的功能主要与孢子形成有关。Luscombe等㈣1将特定
条件产生的生物子网络分为两种:内部过程和外部过
程,其中孢子形成是一种周期性且时间较长的细胞过
程,这种内部过程是多步骤的,并且依靠基因之间的
复杂调控来完成,这种过程产生的子网络与响应外界
环境变化而产生的子网络不同,响应外界的外部调控
过程主要由二元信号转导系统对外界刺激做出迅速
反应,因此孢子形成很可能是枯草芽孢杆菌转录调控
网络具有强连通体的主要原因。Ma等口u建立了大
肠杆菌转录调控网络的层次模型,并在此基础上提出
了转录调控网络的一种分解方法,这种方法能够实施
的前提是整个网络不存在反馈调控关系,而枯草芽孢
杆菌的调控网络存在反馈调控关系,因此这种方法无
法应用于枯草芽孢杆菌。对于在基因转录水平上有
·——气承
dc£S
。/三。D
p幻P
图2枯草芽孢杆菌转录调控网络的强连通体
Fig.2SCCsinthetranscriptionalregul tory
nemorkofB.5M掘凰
反馈的生物体,必须建立一种新的方法对网络进行
分解。
2.2分解方法
在对全局连接结构进行研究的基础上,设计了
基于距离的方法将网络分解。如上所述,网络最大
的弱连通体包含整个网络3/4的基因还多,它的结
构最复杂,也保存了整个网络的大部分性质,而其
他部分不相互连接,无需再进行分解。因此本文将
分解最大的弱连通体作为重点,对网络进行分解以
确定其中的功能模块。其步骤如下:
(1)找出主要的全局调控子作为网络中心
由于转录调控网络是无尺度网络(seale.freenet.
work),极少数的网络中心(hubs)起着十分重要的作
用。Moreno.campuzano等¨列定义枯草芽孢杆菌全局
调控子的方法综合考虑了转录调控网络的各种因素,
如被调控基因所属的转录单元、功能种类等,得出的
结论在本文的网络中正是出度最大的6个调控子,如
表1。这意味着调控子的出度本身与被调控基因的
功能多元化是相关的,当调控子的出度很大时,它参
与多种细胞功能的可能性也大大增加。
将这6个全局调控子作为网络中心,即ccpA,
spooA,AbrB,TnrA,comK,codY。ccpA是碳分解代
谢物阻遏(carboncataboliterepression,CcR)效应的
主要调控蛋白;SpoOA在孢子形成的开始阶段是最
重要的调控子之一;AbrB主要对过渡态(transition
state)基因有多效调控的作用;TnrA在细胞的氮代
谢中起着多效调控的作用;ComK是诱导感受态形
成的重要转录因子之一,负责激活晚期感受态基因
的表达;CodY是一个多效的阻遏调控子,主要对盯。
依赖型基因进行营养抑制(nutritionalrepression)。
将这6个调控子定义为网络中心,由此初步划分出
最大弱连通体的6个模块。
表1 枯草芽孢杆菌转录调控网络的主要调控子出度分布
Table1 0utdegreedistributionofimportantregulatorsin
tI.anscriptionalregulatorynetworkf露.s渤嬲蠡
主要调控子 ccpAsp00AAbrBTnrAcomKcodY
出度 125 92 68 53 51 43
(2)建立距离矩阵
在不计方向的前提下,以这6个网络中心为出
发点,依次计算出每个中心到达最大弱连通体中所
有基因的路径长度。如上所述,最大的弱连通体有
万方数据
2007年8月 刘杨等:枯草芽孢杆菌转录调控网络的连接结构及分解 ·61·
555个基因,定义6个网络中心。将6个网络中心
作为列,最大的弱连通体中所有基因作为行,得到
一个555×6的距离矩阵(图3)。对于该距离矩阵,
每一列的值代表每个网络中心到达最大弱连通体
中所有基因的距离值;每一行的值代表每个基因到
达所有模块中心的距离值。
图3最大弱连通体的距离矩阵
Fig.37IhedistaIlcematrixofthe百antWCC
(3)逐一分析每一行的距离值
如果一行距离值中只有一个最小值,那么该基
因属于此最小值所在列的调控子代表的模块。如
(a)最大弱连通体
果一行中有多个最小值,那么该基因属于几个相等
最小值所在列中出度最小的调控子代表的模块,主
要目的是使所得的功能模块中所含基因数目相当。
例如矩阵第一行舻F到达每个网络中心的距离中,
2为最小值但不唯一,说明它与AbrB和sp00A的距
离均为2,因此舻F属于AbrB和sp00A中出度较
小者所代表的模块,即AbrB。将最大弱连通体中所
有的基因一一划分到6个网络中心代表的模块中。
对于同一行距离值中存在相同最小值,即同一基因
到达几个网络中心的距离相等,这些基因很可能由
所有最小值所在列的网络中心代表的模块共享。
因为调控网络本身是一个动态的实体,不同的部分
在不同的情况下被激活嵋2|。因此很有可能存在这
样的基因,在一种条件下参与一种生物功能,在另
一种条件下参与另一种生物功能。距离矩阵中到
达不同网络中心具有相同最小值的基因就很有可
能是这种基因。在最大弱连通体中,这样的基因有
116个,占最大弱连通体的20.9%,整个网络
的16.2%。
通过以上步骤,网络的最大弱连通体被分成了
6个模块(图4(a)),除此之外,网络还有26组互不
连接的弱连通体和1个仅自我调控的基因。这26
组弱连通体<图4(b))仅有两个有多于1个调控子
进行调控,因此把它们分别作为一个单独模块,由
此整个网络被分解成32个模块。可以看出,通过对
枯草芽孢杆菌转录调控网络的分解,整个网络的复
杂度大大降低,枯草芽孢杆菌转录调控网络的模块
特点清晰地呈现出来。
2.3模块生物学功能
为了了解通过网络结构标识的模块是否真正
桊桊
图4弱连通体的功能模块
Fig.4FunctionalmodulesofWCC
(b)其他弱连通体
A
叩]lllllllllll●lllllllllllll『I●●、l●●I●l●●●lJ
(4
5
5
2
3
4
4
4
4
4
4
4
4
3
3
3
3
2
3:
2
3
5
4
5
2
2
2
2
2
2
2
2
l
l
1
1
l
1;
2
4
4
4
5
2
2
2
2
2
2
2
2
2
2
2
2
O
2;
3
4
4
5
6
l
1
l
1
1
l
1
1
2
2
2
2
1
2;
4
5
3
4
5
2
2
2
2
2
2
2
2
3
3
3
3
2
3;彬彬彬郴删础渤矽彬删艘秽蝴抛!砉船胪伽剃;
万方数据
· 62· 生物加工过程 第5卷第3期
在功能上相关,本文根据subt血st心3。数据库中的功
能分类对模块的功能进行定义。SubtiList的功能分
类根据功能将所有基因分为6大类,并进一步将每
种功能细化,使每个基因都有一个功能代码,具有
相同功能代码的基因参与同一种生物学功能。对
于最大弱连通体之外的26个模块,模块之间在转录
水平上没有调控关系,每个模块都有清晰的生物学
功能,在此不一一赘述。针对最大弱连通体的每个
模块,其包含基因的每种生物学功能赋值s¨它反
映了一种生物学功能在一个模块中的聚集性。这
个值由函数
.si2看斋
计算得出。其中:乃i代表模块i中具有功能.j的基因
数目;见i代表模块i的基因数目;ni代表最大弱连通
体中具有功能歹的基因数目。该函数基于广泛应用
于计算两个系统或物种相似性的simpson指数Ⅲ]。
在计算出.sii后需要确定一分割值(cut—offvalue)后,
当sii>后时,将功能,赋予模块i。统计分析表明对
于忌=o.5时Jsi瑚每一项,其对应nii的总和占最大
弱连通体的50.1%;尼=0.35时该值为80.5%;后=
0.2时该值为85.2%。这意味着Ij}=o.5时仅包含
一半基因,会造成大量信息遗失,所以该值不可取。
局值从o.35到o.2的变化使生物学功能的聚集性
大大减小,却只多包含了4.7%的基因,由此可见后
=O.35在保证信息量的前提下最好地反映了最大
弱连通体的生物学功能聚集性。因此将Jsi肭分割
值取为,当|si,>o.35时,将功能歹赋予模块i。通过
计算分析,每个模块都被赋予了明确的生物学功能
(表2)。结果表明,相同模块中的大部分基因在功
能上联系紧密。
然而同时也发现,一些模块中的几种生物学功
能看似联系不大。比如模块3中的一部分基因与抗
生素合成有关,而另一部分却与精氨酸分解利用相
关,通过对模块3的调控结构进行分析可以发现,这
两种生物学功能是通过AbrB联系在一起的。AbrB
对过渡态sbo和alb操纵元调控从而实现对抗生素
合成过程的调控,又与Ahrc共同调控arg,car操纵
子从而调控精氨酸的生物合成。在过渡态AbrD调
控抗生素合成,而根据环境需要对精氨酸合成进行
调控。对于模块4中的几种生物学功能,、生物膜合
成本身需要磷酸盐代谢和辅酶辅基代谢参与,在辅
酶辅基代谢与蛋白质折叠之问有一组HrcA(hemN
的调控关系,HrcA在对热休克蛋白I的编码基因进
行阻遏的同时对辅酶辅基代谢调控,可以使细胞产
生辅酶Q从而保护生物膜的完整结构。因此,从转
录水平上看,这些生物学功能实际上是紧密联系在
一起的。随着各种实验技术的不断完善和发展,我
们还可以将更多的信息囊括到基因转录调控网络
中以获取更多有价值的发现。
表2最大弱连通体功能模块的生物学功能
Table2 Functionalinvestigationofmodules
identifiedinthegiarltWCC
3结论
从两个数据库中提取信息构建了枯草芽孢杆
菌的转录调控网络,并对其全局连接结构进行了分
析。该网络的一些性质与大肠杆菌的转录调控网
络相似,但与其不同的是在枯草芽孢杆菌的网络中
存在强连通体。对于有强连通体存在的转录调控
网络,本文提出了基于距离的分解网络方法。将方
法应用于枯草芽孢杆菌转录调控网络最大的弱连
通体,得到6个模块,对其功能分析表明,这些模块
具有明确的生物学意义。通过对模块内部结构的
研究发现,一些看似不相关的生物学功能实际上通
过调控子的调控作用是联系在一起的。
参考文献:
[1]shen一0ⅡsS,MiloR,Mallgans,eta1.NetworkⅡ10tifsint11e
transcriptionalregul tionnetworkf西c矗盯池如∞尻[J].NatGen-
万方数据
2007年8月 刘 杨等:枯草芽孢杆菌转录调控网络的连接结构及分解 · 63·
[2]
[3]
[4]
[5]
[6]
[7]
[S】
[9】
[10]
[11]
[12]
[13]
et,2002,31《1):融《8。
何锋,马红武,赵学明,等#生物倍息学用于代谢网络研究的进
展与展望[J].化工学报,2004,55(10):1593—1601.
WuX,ZhuL,Guol+Predictionofyeastprotein—proteininterne—
tionnetwork:insightsfromtheGeneOntologyandannotations
[J].NucleicAcidsRes,2006,34(7):2137-2150.
BrayD.Molecularnetworks:thetop—downview[J].Science,
2003,301(5641):|864—1865。
BarabasiAL,OhvaiZN.Networkbiology:understandingthe
cell’sfunctionalorganization[J].NatRevGenet,2004,5(2):
101.113+
TomowS.MewesHW.Functionalm du esbyrelatingproteinin—
teractionnetworksandgenexpression[J].NucleicAcidsRes,
2003,3l(21):6283-6289.
Pereira—LealjB,Enri痨tAj,OuzounisC矗.Detectionoffune—
tionalmodulesfromproteininteractionnetworks[J].Proteins,
2004,54(1):49-57.
Ma鞋W,ZengAP。Theconnectivitystructure,giantstrongcorn-
ponentandcentralityofmetabolicnetworks[J].Bioinformaties,
2003,19(11):1423*1430.
Zhaol,YuH,LuoJH,ela1.Hierarchicalmodularityofnested
bow:tiesnmetabolicnetworks[j].BMCBioinformatics,2006
(7):386.
MakitaY,NakaoM,OgasawaraN,eta1.DBTBS:databaseof
transcriptionalregul tioninBacillussubtilisanditscontributiontO
comparativegenomics[J].NucleicAcidsRes,2004,32(Data.
baseissue):75-77.
M8l_lW,KumarB,DitgesU,eta1.Anextendedtranscriptional
regulatorynetworkfEscherlchiaeoliandnalysisofitshierarehi-
ca/structureandn tworkmotifs[J].NucleicAcidsResearch,
2004,32(22):6643-6649.
Martinez-AntomoA。CoUado—Videsj。I ntifying瘩abalre aflators
intranscriptionalregul torynetworksinbacteria[J].CurtOpin
Microbiol,2003,6(5):482489.
OguraM,TanakaT.RecentprogessinBacillussubtitistwo—corn—
ponentregulation[jj.FrontBiosci,2002,1(7):1815—1824.
[14JHamoenLw,VenemaG,
inBacilluss btilis:shared
2003,149(1):9-17.
Kuipors0P+Controllingeompotenee
useofregulators[J].Microbiology,
[15】MadanBM,TeichmannSA。Evolutionoftranscriptionfactorsand
thegeneregulatorynetworkinEscherichiacol [J].NucleicA ids
Res,2003,31(4):1234—1244.
[16]MunchR,HillerK,GroteA,eta1.VirtualFootprinta d
PRODORtC:anintegrativeframeworkf regulonpredictionin
prokaryotes[J].Bioinformaties,2005,21(22):4187-4189.
[17]Moreno.CampuzanoS,JangaSC,Perez-RuedaE.Identification
andanalysisofDNA-bindingtranscriptionfact rsi Bacillussubti一
托andotherFirmicutes—ag nomicapproach[j].BMCGenomics,
2006(7):147,
[18]BatageljV,MrvarA.Pajek—programforlargenetworkanalysis
[j],Connections,1998,21:4%57,
[19]MaHW,BuerJ,ZengAP.Hierarchicalstructureandmodules
intheEscherichiacolitranscriptionalregul torynetworkrevealed
byanewtop—downapproach[J].BMCBioinformatics,2004,16
(5):199.
[20]LuscombeNM,BabuMM,YuHY,eta1.Genomicanalysisof
regulatorynetworkdynamics№vealslargewpolo垂ealchanges[J】。
Nature,2004,431:308-312。
[21]MaHW,ZhaoXM,YuanYJ,eta1.Decompositionfmetabolic
networkintofunctionalmodulesba edontheglobalconnectivity
。structureofreaction辨馥[J】.Bioinformaties,2004,20(12):
1870:t876.
[22]BabuMM,LuscombeNM,AravindL,eta1.Structureandevo—
lutionoftranscriptionalregul torynetworks[J],Curt0pinStruct
Biol,2004,14(3):283-291.
[23]MoszerI,JonesLM,MoreiraS,etat.SubtiList:therethrenee
databasefortheBacillussubtilisgenomc[J].NucleicAcidsRes,
2002,30(1):62-65。
[24]JongmanRHG,BraakT.Dataan由sisncommunityandland—
scapecology[M].NewYork:CambridgeUniversity
Press。1995.
万方数据