免费文献传递   相关文献

大肠杆菌P4 FliC蛋白结构分析及同源建模



全 文 :研究报告
生物技术通报
BIOTECHNOLOGY BULLETIN 2010年第 10期
大肠杆菌 P4 FliC蛋白结构分析及同源建模
李任峰1  田香勤 2  何启盖 3  胡建和 1  赵坤1  李学斌 1  王三虎 1
( 1河南科技学院动物科学学院,新乡 453003; 2新乡医学院医学研究中心,新乡 453003; 3华中农业大学动物医学院
农业微生物学国家重点实验室动物病原分室,武汉 430070)
  摘  要:  为了进一步认识大肠杆菌鞭毛蛋白 (E scherichia coli F liC)的结构及功能, 深入研究细菌鞭毛的生物学特性, 采
用生物信息学方法, 对组成 Escher ichia coli P4 F liC蛋白质的理化性质、二级结构及三级结构等进行生物信息学分析,并在三级
结构的基础上进行同源建模。理化性质分析结果表明, E. coli P4 F liC蛋白为酸性结构蛋白, 与沙门氏菌鞭毛蛋白性质较为接
近, 二级结构以 螺旋和随机卷曲为主要构件, 其空间结构与 Salm onella typhimurium 的 3a5xA蛋白相似性较高, 以此为模板
成功构建了可靠的三维结构分子模型。F liC蛋白为多种细菌的鞭毛蛋白,与细菌的运动功能关系密切, 本研究为深入研究细
菌的运动机制及致病机理奠定基础。
关键词:  大肠杆菌  鞭毛蛋白  同源建模
Structure Analysis andHomologyM odeling of FliC
from Escherichia coli P4
L iRenfeng
1  T ian X iangqin2  H eQ iga i3  Hu Jianhe1  ZhaoKun1 
L iXueb in
1  W ang Sanhu1
(
1
Veterinary M edicine College, H enan Institu te of Science and T echnology, X inxiang 453003;
2
M edicine
Research Center, X inxiangM edical College, X inx iang 453003;
3
D ivision of A nimal InfectiousD isease,
NationalK ey Laboratory of Agr iculturalM icrobiology, H uazhong Agricultural University, Wuhan 430070)
  Abstrac:t  The research was to lucubra te b ionom ics o f flage llin of bacteria. The am ino ac id sequence of F liC from E scherichia coli
P4 was se lected from NCB I, and ana lyzed by the too ls o f b io info rm atics in the fo llow ing aspects, inc lud ing the com pos ition of am ino acid
sequences, m o lecular structure, physica l and chem ical characters, secondary and te rtiary structure of pro te in. Results show ed that theE.
co li P4 F liC w as an acidic structure prote in, wh ich was sim ilar w ith flage llin of Salmonella, he lix and random co ilw erem a in com po
nent of a ll secondary structures. The 3D models o f P4 F liC w ere construc ted based on the temp la te o f 3a5xA by hom o logy modeling. The
flage llin is related to mo tility of bac teria, supporting tha t it would be a prom ising cand ida te for further resea rch on them echan ism of bac
ter ia mo tility and nosogenesis.
Key words:  Escher ichia coli F lage llin H omo logy m ode ling
收稿日期: 20100713
基金项目:河南省基础与前沿技术研究项目 ( 082300430020 ) ,河南科技学院青年创新基金项目 ( 20065053 )
作者简介:李任峰,男,硕士,研究方向:动物分子病原学及生物信息学; Em ai:l lirenfeng@ s ina. com
通讯作者:王三虎,男,教授,硕士生导师,研究方向:动物分子病原学及生物信息学; Em ai:l w angsanhu@ h ist edu cn
病原性大肠杆菌 ( E scherichia coli )是一种重要
的条件性致病菌,能引起人或动物的严重腹泻和败
血症 [ 1]。O ( lipopo lysaccharide)抗原和 H ( flagellar)
抗原是当前用于大肠杆菌分型的主要依据, 其中 H
抗原主要指细菌的鞭毛成分 [ 2]。鞭毛是多种细菌
最主要的运动器官,主要介导细菌的黏附、运动和趋
化, 帮助细菌附着于宿主体内并迁移到营养物质丰
富的位置去, 其化学组成主要是蛋白质 [ 3]。而 F liC
是大肠杆菌鞭毛蛋白的重要组成部分 [ 4]。 F liC在
用于研究 E. coli的分型和致病机理方面具有重
要意义。
本研究旨在通过分析 E. coli P4 FliC蛋白的理
生物技术通报 B iotechnology  Bulletin 2010年第 10期
化性质、二级结构及三级结构, 并在三级结构的基础
上进行空间结构的同源建模, 为进一步研究 E. coli
P4 FliC的功能及特征奠定基础。
1 材料与方法
1. 1 材料
供试蛋白质序列来自 G enB ank数据库 ( http: / /
www. ncb.i n lm. n ih. gov) ,菌株编号及蛋白质序列登
录号分别为大肠杆菌 P4( AAP13333. 1)、沙门氏菌
CDC str. 2579( AAR10572. 1)、痢疾志贺氏菌 M1354
( AAR97969. 1 ) ; 三级结构可视化软件 Cn3D及
Sw issPdbV iew er( SPDBV)等。
1. 2 P4 FliC蛋白的一级结构分析
利用 Expert Prote in Ana lysis System ( ExPASy )
Proteom ics too ls ( http: / /www. expasy. ch / too ls/ )对
P4 FliC蛋白质性质进行分析。ProtParam分析蛋白
的氨基酸序列组成、相对分子质量、等电点等理化性
质, ScanProsite分析蛋白质的功能域 [ 5]。
1. 3 P4 FliC蛋白质二级结构分析
应用 NPS@ 服务器 ( http: / /pb i.l ibcp. fr /htm /
index. php)上的 PHD方案在线分析 F lic蛋白的二
级结构成分, 包括 螺旋、转角、无规则卷曲及延
伸链等。该方案的参数意义见文献 [ 6]。
1. 4 P4 FliC蛋白的三级结构分析及同源建模
在瑞士日内瓦 G laxo Sm ith K line中心提供的自
动蛋白质分子模建服务器 (Automated ProteinM odel
ling Server) SW ISSMODEL ( http: / /www. expasy. ch/
sw issmod/SW ISSMODEL)中进行。将 P4 FliC的氨基
酸序列提交到 SW ISSMODEL服务器,用同源建模方法
获得该蛋白质的三级结构, 用在线评价服务器 PRO
CHECK对所建模型进行评价 [ 7]。
2 结果
2. 1 P4 FliC蛋白的氨基酸组成特性
分析结果 (图 1)表明, P4 F liC蛋白由 498个氨
基酸组成,原子总数为 7 149个,分子式为 C2163H 3553
N 631O798 S4,分子量为 51. 2949 kD,理论等电点为
431。在所有编码氨基酸中, 苏氨酸含量最高为
131% ,甲硫氨酸只占 08%, 而未见编码半胱氨
酸、组氨酸和色氨酸。
大肠杆菌与沙门氏菌、痢疾志贺氏菌 3种不同
细菌 F liC氨基酸组成的比较结果 (表 1)表明,大肠
杆菌 P4 FliC的氨基酸残基总数比沙门氏菌 CDC
str. 2579多 3个、比痢疾志贺氏菌 M1354多 22个;
酸性氨基酸数目比沙门氏菌 CDC str. 2579多 1个、
比痢疾志贺氏菌 M1354多 19个; 碱性氨基酸数目
比沙门氏菌 CDC str. 2579少 3个、比痢疾志贺氏菌
M1354多 9个;极性氨基酸的数目比沙门氏菌 CDC
str. 2579多 18个、比痢疾志贺氏菌 M1354多 47个;
疏水性氨基酸的数目比沙门氏菌 CDC str. 2579少
14个、比痢疾志贺氏菌 M1354多 34个。另外,大肠
杆菌 P4 F liC的原子总数及分子量也与沙门氏菌
CDC str. 2579更为接近, 这与亲缘关系的远近相
符合。
图 1 P4 F ilC蛋白的氨基酸组成
2. 2 P4 F liC蛋白的结构域分析
将 P4 F liC蛋白的氨基酸序列提交到 ScanPros
ite服务器, 对 P4 F liC蛋白进行翻译后修饰位点结
构分析。结果 (表 2)表明,该蛋白中有 11个 N糖基
化位点、8个酪蛋白激酶 磷酸化位点、14个豆蔻酰
化位点、2个酪氨酸激酶磷酸化位点、5个蛋白质激
酶 C磷酸化位点和 1个亮氨酸拉链模体, 并在其序
列中发现富含苏氨酸基序 (图 2)。
144
2010年第 10期 李任峰等 :大肠杆菌 P4 F liC蛋白结构分析及同源建模
表 1 三种不同细菌 F liC蛋白氨基酸组成的比较
比较项目 大肠杆菌 P4( AAP13333. 1) 沙门氏菌 CDC str. 2579 (AAR10572. 1) 志贺氏菌 M 1354( AAR97969. 1 )
氨基酸残基总数 498 495  376
原子总数 7 149 7 196  5 326
分子式 C2163H3553N 631O 798 S4 C2193H3586N 638O 775 S4  C1617H 2645N471O589 S4
分子量 51 294. 9D 51 418. 6D  38 236. 8D
带电氨基酸 99 103  70
酸性氨基酸 53 52  34
碱性氨基酸 36 39  27
极性氨基酸 193 175  146
疏水性氨基酸 162 176  128
表 2 ScanProsite搜索得到的结构和功能位点
 序号  基序  功能位点  功能描述
 PDOC00001
 PS00001  N{ P} [ ST ]{ P}
 2124 NQSA, 141144 NGSM
 153156 NQT I, 178181NDTV
 265268 NATV, 272175 NTTK
 313316 NDTD, 333336 NETT
 443446 NNTT, 448451 NLSE
 467470 NM SK
 N糖基化位点
 PDOC00006
 PS00006  [ ST] . { 2} [ DE ]
 2730 SSIE, 4043 SAKD
 103106 TNSE, 111114 S IQD
 118121 SRLD, 237240 TGGD
 267270 TVTD, 345248 TYTD
 酪蛋白激酶 II磷酸化位点
 PDOC00008
 PS00008
 G[ E^DRKH PFYW ].
 { 2 } [ STAGCN ] [ P^ ]
 3540 GLRINS, 4752 GQA IAN
 6065 GLTQAA, 7175 G ISVAQ
 149154 GANDNQ, 191196 GATTTN
 202207 GITLST, 215220 GTNPAS 261266
 GATANA, 293298 GSATAN
 325330 GNLYAA, 362367 GGDDGK
 386391 GNLQTG, 429434 GAVQNR
 豆蔻酰化位点
 PDOC0007
 PS0007
 [RK]. { 2, 3} [DE] . {2, 3}Y  311318 KGNDTDTY, 455461 R IQDADY  酪氨酸激酶磷酸化位点
 PDOC00005
 PS00005
 [ ST] . [ RK]  4042 SAK, 143145 SMK 174176 SVK, 273275 TTK
 340342 SVK
 蛋白质激酶 C磷酸化位点
 PDOC00029
 PS00029
 L. { 6} L. { 6} L. { 6 } L  428449 LGAVQNRLDSAVTNLNNTTTNL  亮氨酸拉链基序
145
生物技术通报 B iotechnology  Bulletin 2010年第 10期
2. 3 P4 FliC蛋白的二级结构分析
通过 NPS@ 服务器 ( http: / /pb i.l ibcp. fr /htm /
index. php)上的 PHD方案预测 P4 F liC蛋白二级结
构成分,结果 (图 3)表明, 螺旋和不规则卷曲是
P4 FliC蛋白整体结构中的主要组成结构元件,有利
于稳定蛋白质的结构; 该蛋白不易形成 转角; 延
伸链散布于整个蛋白质中, 易形成抗原表位区。
螺旋主要位于氨基酸序列两侧 ( 1 - 125和 407 -
498)区域, 而中间区段 ( 126- 406)含有大量的不规
则卷曲和散在的延伸链,而无 螺旋分布。
图 2 P4F liC蛋白中富含苏氨酸基序
图 3 P4 F liC蛋白二级结构预测结果
2. 4 P4 FliC蛋白的三级结构分析及同源模建
通过在 ExPDB晶体图像数据库中 ( http: / /
www. rcsb. org /pdb / )搜索相似的序列, 得到一个同
源性较高的蛋白质结构数据 3a5xA, 同源性为 53% ,
两序列比对结果见图 4, 符合同源模建条件。以此
序列的结构信息为原子模型 (图 5)登录 Sw issModel
服务器进行结构排列 ,并运用结构仿真模拟 ( P ro
M od 程序 ) 和能量最小化分析 ( GROMOS96程
序 ) 构建目标序列的结构。模建结果见图 6。利
用 PROCHECK对模建结果进行检测, 计算得出
R amachandran图 (图 7 ) , 从图 7可以看出,模拟得
到的 P4 F liC蛋白结三维结构的 角和 ! 角有
985%位于 Ramachandran图中合理区域, 从理论上
表明模拟得到的 P4 F liC蛋白的三维结构是可靠的。
3 讨论
鞭毛作为细菌的运动器官,在细菌的感染与免
疫及细菌分类鉴定等方面发挥重要作用 [ 8]。鞭毛
的化学组成主要是蛋白质, 分子量约为 30- 60 kD,
抗原性良好, 可作为细菌的分类依据之一 ( H 抗
原 ) [ 8 ]。目前用于大肠杆菌分型的 O抗原有 176
种, H抗原有 53种 [ 10]。
研究表明,大肠杆菌鞭毛蛋白 ( E. coli F liC )主
要由 3部分区域组成:两端 ( 5!N端和 3!C端 )高度
保守的 C1区和 C2区及中间 C3高变区 [ 11]。本研
究采用生物信息学方法分析了 E. coli P4 FliC蛋白
的理 化 性 质, 并 与 沙 门 氏 菌 CDC str. 2579
(AAR105721)和痢疾志贺氏菌 M1354(AAR97969. 1)
进行了比较,结果表明, E. coli P4 FliC蛋白的氨基酸残
基总数、酸性氨基酸数目、碱性氨基酸数目、极性氨基
酸的数目、疏水性氨基酸的数目、原子总数、分子量及
等电点等均与沙门氏菌 CDC str. 2579更为接近,这与
亲缘关系的远近相符合。
146
2010年第 10期 李任峰等 :大肠杆菌 P4 F liC蛋白结构分析及同源建模
图 4 P4 F liC氨基酸序列与模板序列比对结果
图 5 模板 3a5xA蛋白的
空间结构
图 6 P4 F liC蛋白的空间
结构模拟图
图 7 P4 F liC蛋白三维结构
Ram achandran评价图
147
生物技术通报 B iotechnology  Bulletin 2010年第 10期
蛋白质的二级结构是氨基酸序列和三维构象之
间的桥梁,对蛋白质二级结构的预测能得到许多重
要的结构信息。 PHD程序是目前预测蛋白质二级
结构的最好程序之一。本研究采用 PHD程序对来
自 E. coli P4 F liC蛋白的二级结构进行预测和分析,
结果表明, 螺旋主要分布于该蛋白的两侧保守区,
有利于蛋白质结构的稳定,而中间区段 126- 406含
有大量的不规则卷曲和散在的延伸链, 该区域也属
于高变区,常用于 E. coli的分型及选择抗原表位作
为候选疫苗。
在分析 E. coli P4 F liC蛋白结构域时发现, 在该
蛋白氨基酸序列的 428- 449区段存在亮氨酸拉链
基序, 推测该区域可能参与某种基因的表达调控。
同时发现,在 180- 284氨基酸之间存在一段富含苏
氨酸区域, 推测该区域可能与调节蛋白 (如苏氨酸
激酶等 )结合,形成特异的信号分子复合物, 将信号
向下游传递,继而参与细菌的迁移活动。
目前, E. coli P4 F liC蛋白的晶体结构尚未见
报道,本研究根据同源建模的方法模拟得到了 E.
coli P4 F liC蛋白的三维结构, Ramachandran图评
价结果表明该预测结构是合理的, 符合立体化学
规则。
4 结语
E. coli P4 F liC蛋白在研究 E. coli的分型及致
病机理方面具有重要作用, 本研究利用生物信息学
方法分析了该蛋白的理化性质、二级结构及三级结
构等,并在此基础上进行了同源建模。但由于蛋白
质的结构及功能行使极其复杂,预测结果尚需进一
步试验验证。
参 考 文 献
[ 1] B lat tner FR, P lunkett G I, B loch CA, et a.l The com p lete genom e
sequence of E scherich ia col i K12. Science, 1997, 277 ( 5331 ):
14531474.
[ 2] Ek lundM, Le ino K, S iitonen A. C lin icalE sch erichia coli strains car
rying stx genes: stx varian ts and stxposit ive v iru lence prof iles. JC lin
M icrob io,l 2002, 40( 12 ) : 45854593.
[ 3] Feng L, L iu B, L iu Y, et a.l A genom ic isletm ediates flagel lar phase
variation in E sch erichia coli strains carrying the f lagellinspecifying
locu s flk. J Bacterio,l 2008, 190( 13) : 44704477.
[ 4 ] Beu tin L, S trauch E. Iden tif icat ion of sequ ence d iversity in th eE sche
rich ia coli fl iC genes encod ing flagellar types H 8 and H 40 and its
u se in typ ing ofSh iga tox inp roducing E. coli O8, O22, O111, O174,
and O179 strains. JC linM icrob io,l 2007, 45( 2) : 333339.
[ 5] K opp J, S chw ede T. Th e SW ISSMODEL Repository: new featu res
and fun ct ional it ies. Nucle ic Acids Research, 2006, 34( 1 ) : 315318.
[ 6] Geourjon C, D eleage G. sign if icant im p rovem ents in protein seconda
ry structu re pred ict ion byconsen sus pred ict ion from m u lt ip le al ign
m en ts. Com pu tApp lB iosc,i 1995, 11( 6 ) : 681684.
[ 7] ArnoldK, B ordol iL, Kopp J, et a.l Th e SW ISSMODELWorkspace:
A w ebbased environm en t for protein stru cture h omo logy m odell ing.
B ioin form at ics, 2006, 22( 2 ): 195201.
[ 8] 李任峰,田香勤,何启盖,等.猪胸膜肺炎放线杆菌 f lic蛋白二级
结构与 B细胞表位预测.生物技术, 2009, 19( 4) : 1315.
[ 9] Lothar B, E ckhard S, S on ja Z. Gen et ical and fun ct ional investigation
of fliC gen es encod ing flagellar serotyp e H 4 in w ild type stra ins of
E scherich ia coli and in a laboratory E. col i K12 strain expressing
f lagellar an tigen type H 48. JC linM icrob io,l 2007, 45( 2 ) : 333339.
[ 10] Ek lundM, Leino K, S iitonenA. C linicalE sch erichia coli stra ins car
rying stx gen es: stx variants and stxpos itive viru len ce p rofiles. J
C lin M icrobio,l 2002, 40 ( 12) : 45854593.
[ 11] B eut in L, Krause G, Zimm erm ann S, et a.l C haracterizat ion of Sh iga
toxinproducing E sch erichia coli strain s isolated from human pa
tients in Germ any over a 3year period. J C l inM icrob io,l 2004, 42
( 3) : 10991108.
(上接第 142页 )
[ 11 ] Zhou RY, L i XL, Li LH, et a.l E volut ion and d ifferent iat ion of the
prion protein gene ( PRNP) am ong species. Journ al of H ered ity,
2008, 99( 6) : 647652.
[ 12 ] Rozas J, SachezDelB arrio JC, M esseguer X, Rozas R. DnaSP, DNA
polymorph ism analyses by the coalescent and other m ethod s. B ioin
form at ics, 2003, 19( 18 ): 24962497.
148