全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2010 年第 7 期
狂犬病病毒 CVS株糖蛋白、核蛋白生物信息学分析
李江涛1 殷相平2 张金卫1 丁农1 柳纪省2
(1湖州市农业科学研究院,湖州 313000;2中国农业科学院兰州兽医研究所 家畜疫病病原生物学国家重点实验室 农业部
畜禽病毒学重点开放实验室 农业部草食动物疫病重点开放实验室,兰州 730046)
摘 要: 对狂犬病毒(rabies virus,RV)CVS株糖蛋白、核蛋白基因进行了克隆与测序,推导出相应的氨基酸序列。后采
用 Gamier-Robson方法和 Chou-Fasman方法预测了蛋白的二级结构,用 Kyte-Doolittle方法对蛋白的亲水性进行了分析,用 Emi-
ni方法预测了蛋白的表面可能性,以 Jameson-Wolf方法预测了蛋白的抗原指数;综合分析预测蛋白的 B细胞抗原表位。结果
表明,糖蛋白在序列的 121 - 126、133 - 137、161 - 165、191 - 193、201 - 204、214 - 216、221 - 225、264 - 267 区域,核蛋白在序列
的 143 - 152、166 - 172、263 - 273、411 - 427 区域或其附近最有可能是 B细胞抗原表位的优势区域。
关键词: 狂犬病毒 糖蛋白 核蛋白 二级结构 B细胞表位
Bioinformatics Analysis of G Protein Gene and N Protein Gene
of Rabies Virus CVS Strain
Li Jiangtao1 Yin Xiangping2 Zhang Jinwei1 Ding Nong1 Liu Jixing2
(1Huzhou Academy of Agricultural Science,Huzhou 313000;2Key Laboratory of Animal Virology of Ministry of Agriculture,
State Key Laboratory of Veterinary Etiological Biology,Key Laboratory of Grazing Animal Diseases of Ministry of Agriculture,
Lanzhou Veterinary Research Institute,Chinese Academy of Agricultural Sciences,Lanzhou 730046)
Abstract: The G protein gene and N protein gene of rabies virus CVS strain was cloned and sequenced,and the amino acids se-
quence was deduced from the G gene and N gene. The secondary structure of G protein and N protein was predicted by the methods of
Gamier-Robson and Chou-Fasman,and hydrophilicity,surface probability and antigenic index were obtained by the methods of Kyte-
Doolittle,Emini and Jameson-Wolf,respectively. Combining the results according to these methods,the B cell epitopes for G protein and
N protein were predicted. The results showed that the predominant epitopes of the B cell of G protein were probably in the regions of
121 - 126,133 - 137,161 - 165,191 - 193,201 - 204,214 - 216,221 - 225,264 - 267. The N protein were probably in the regions of
143 - 152,166 - 172,263 - 273,411 - 427. This study would provide reference for research of reverse vaccine of rabies virus.
Key words: Rabies virus G protein N protein Secondary structure B cell epitopes
收稿日期:2010-01-05
基金项目:湖州市科技计划项目(2009YN03)
作者简介:李江涛,男,硕士研究生,研究方向:动物传染病学与分子免疫学;E-mail:ljtuj@ yahoo. con. cn
通讯作者:柳纪省,男,研究员,博士生导师,主要从事动物传染病学与分子免疫学研究;E-mail:Liujixing@ hotmail. com. cn
狂犬病(rabies)是由狂犬病病毒(rabies virus,
RV)感染引起的高致死性人兽共患传染病,广泛分
布于亚、非、欧、美等各大洲,一旦发病即引起 100%
死亡,严重威胁人畜的健康[1]。全球每年约有
5. 5 万人死于狂犬病,约 90%发生在亚洲、非洲等发
展中国家。近年来,我国人狂犬病发病和死亡人数
呈上升趋势,自 2003 年以来,年发病例数均超过
2 000例。RV基因组为单股不分节段的负链 RNA,
含 5 个大的开放阅读框,编码 5 种结构蛋白,即核蛋
白(N)、基质蛋白(M)、磷酸化蛋白(P)、糖蛋白(G)
和转录酶蛋白(L)[2],其中,糖蛋白主要刺激机体产
生保护性中和抗体,是疫苗研究的首选免疫基因,核
蛋白在刺激细胞免疫方面发挥主要作用,也是毒粒
中最保守的蛋白,已被国外学者用于不同系统的表
达和免疫研究[3 - 6]。
反向疫苗学是通过分析病毒的基因组序列来预
生物技术通报 Biotechnology Bulletin 2010 年第 7 期
测病原体的抗原信息,然后筛选出合适的候选抗原,
进而研制出有效的疫苗[7]。本研究在基因序列测
定的基础上,应用生物信息学技术对 RV CVS 株糖
蛋白、核蛋白二级结构和 B 细胞表位进行分析和预
测,为 RV反向遗传学及基因工程疫苗的研究提供
参考。
1 材料与方法
1. 1 材料
狂犬病病毒 CVS 株致死小鼠﹑ JM109 菌株由
兰州兽医研究所家畜疫病病原生物学国家重点实验
室保存。pMD 18-T 载体﹑ AMV 反转录酶、Premix
Taq DNA 聚合酶、RNA酶抑制剂、dNTP、限制性内切
酶 BamHⅠ、Not I 和 EcoRⅠ、λ-EcoT14 I digest、
DL2000 plus DNA Marker、胶回收试剂盒及质粒提取
试剂盒均为大连宝生物工程有限公司产品。RNA
提取试剂盒购自 Qiagen 公司。其它试剂均为分析
纯试剂。
1. 2 引物设计与合成
参考 GenBank 中收录的 CVS 株 G、N 基因序列
设计了如下两对引物,并在划线处分别加入BamHⅠ、
EcoRⅠ及 Not I 酶切位点。
上游引物 G1:5-GCAGGATCCTTCCTCAGGT-
TCTT-3(BamH Ⅰ酶切位点)
下游 引 物 G2:5-GACGAATTCTCACAGTCT-
GATCTC-3(EcoRⅠ酶切位点)
上游引物 N1:5-AGGATCCATGGATGCCGA-
CAAGAT-3(BamHⅠ酶切位点)
下游引物 N2:5-AGCGGCCGCTTATGAGTCAT-
TCGAATACGT-3(Not I 酶切位点)
1. 3 病毒 RNA 的提取
取狂犬病病毒 CVS株致死的小鼠一只,无菌解剖
取脑组织少许,加适量含抗生素的溶液研磨,用 PBS 制
成 1∶ 5 的悬液,反复冻融。然后以 7 500 r / min 于 4℃
离心 10 min,取上清液用于提取 RNA。其它步骤按
RNA 提取试剂盒说明书进行。获得的 RNA 于 -20 ℃
保存或直接用于反转录。
1. 4 目的基因的扩增、克隆及序列分析
使用合成的引物 G2、N2,用 AMV 反转录酶和
Premix Taq DNA 聚合酶,进行 RT-PCR 反应扩增目
的基因,用 10 g /L 的琼脂糖凝胶电泳检测扩增结
果。将 PCR产物纯化回收,并与 pMD 18-T 载体连
接,转化 JM109 感受态细胞,用 Amp + LB 琼脂平板
筛选,提取质粒,采取双酶切及 PCR 方法鉴定重组
质粒,阳性克隆分别命名为 pMD-G、pMD-N,送大连
宝生物工程有限公司测序。应用生物软件对序列进
行分析。
1. 5 糖蛋白、核蛋白蛋白二级结构预测
应用 DNAStar Protean 软件提供的模版,用
Chou-Fasman方法[8]从氨基酸残基的晶体结构来预
测蛋白质的二级结构,Gamier-Robson 方法[9]计算特
定氨基酸残基在特定结构内部的可能性,Karplus-
Schultz方法[10]预测蛋白质骨架区的柔韧性。
1. 6 糖蛋白、核蛋白 B细胞抗原表位的预测
应用 DNAStar Protean软件,采用 Kyte-Doolittle
方法[11]对结构蛋白质的疏水性进行了分析,用
Emini方法[12]预测个结构蛋白的表面可能性,以
Jameson-Wolf方法[13]预测结构蛋白的抗原指数。
然后综合评价糖蛋白、核蛋白的 B 细胞抗原表位
的地位。
2 结果
2. 1 基因的扩增和克隆
RT-PCR分别扩增出约 1. 5 kb、1. 3 kb 片段,与
预测结果一致。回收扩增产物,分别克隆到 pMD
18-T载体中,得到重组质粒 pMD-G、pMD-N。pMD-
G经 PCR扩增、BamHⅠ和 EcoRⅠ双酶切鉴定均正
确(图 1) ,pMD-N经 BamH Ⅰ和 Not Ⅰ双酶切鉴定
正确(图 2)。
M. λ-EcoT14 I digest;1,2. pMD-G/BamHⅠ+ EcoR Ⅰ;3.
PCR 扩增产物
图 1 pMD-G经 BamH Ⅰ和 EcoR Ⅰ酶切鉴定
081
2010 年第 7 期 李江涛等:狂犬病病毒 CVS株糖蛋白、核蛋白生物信息学分析
M. DL2000 plus DNA Marker;1,2. pMD-N /BamHⅠ+ NotⅠ
双酶切产物
图 2 pMD-N经 BamHⅠ和 NotⅠ酶切鉴定
2. 2 序列测定与分析
2. 2. 1 G基因序列测定与分析 测序结果表明,狂
犬病病毒 CVS株 G基因 cDNA阅读框全长为 1 575
bp,编码 524 个氨基酸。整个蛋白质中含有 56 个碱
性氨基酸,58 个酸性氨基酸,165 个疏水氨基酸和
141个极性氨基酸。编码蛋白的分子量为约58. 76 kD,
在 pH7. 0 时,G蛋白所带电荷为 0. 299。Protein Pre-
diction 在线软件分析发现 G 蛋白在 56、223、338 以
及 499 位含有潜在的糖基化位点。
本研究中所测 CVS 株 G 基因核苷酸序列与
GenBank中登录号为 DQ 506997 的 CVS 株 G 基因
相比,核苷酸同源性为 99. 4%,氨基酸同源性为
98. 7%;与 CVS-11、PV-11、SRV 9 和 SAD-B19 标准
毒相比,核苷酸同源性为 89. 3% - 98. 8%,氨基酸
同源性为 87. 5% - 97. 0%,其中只有与 CVS-11 株
的同源性高于 90%,与其它 3 株的同源性均低于
90%;与 HEP-Flury、ERA、3aG 疫苗株相比,核苷酸
同源性分别为 89. 0% - 94. 3%,氨基酸同源性分别
为 87. 2% -90. 7%。
2. 2. 2 N基因序列测定与分析 测序结果表明,狂
犬病毒 CVS株 N基因 cDNA阅读框全长 1 353 bp,编
码 450个氨基酸。整个蛋白的分子量约为50. 73 kD,
其中含有 49个碱性氨基酸,55 个酸性氨基酸,152 个
疏水氨基酸和 123个极性氨基酸,在 pH 7. 0 时,蛋白
所带电荷为 -4. 090。
本研究中所测 CVS 株 N 基因核苷酸序列与
GenBank中登录号为 DQ 286762 的 CVS 株 N 基因
相比,核苷酸同源性为 99. 7%,氨基酸同源性为
99%;与 CVS-11、PV-11、SRV 9 和 SAD-B19 标准毒
相比,核苷酸同源性为 92. 6% - 99. 6%,氨基酸同
源性为 97. 6% -99. 3%;与 HEP-Flury 和 ERA疫苗
株相比,核苷酸同源性分别为 96. 7%和 92. 9%,氨
基酸同源性分别为 98. 7%和 98. 0%。
2. 3 糖蛋白的二级结构及 B细胞抗原表位预测
2. 3. 1 糖蛋白二级结构的预测 从图 3 中可以看
出,用 Gamier-Robson 方法预测的 G 蛋白的较大的
α-螺旋区域有 9 个,较大的 β-折叠区域有 22 个,且
分布比较均匀。用 Chou-Fasman方法预测的较大的
α-螺旋区域有 7 个,较大的 β-折叠区域有 11 个。两
种方法预测的共有的较大的 α-螺旋区域在 60 - 67、
287 - 307、342 - 348、400 - 409、426 - 440 区段,其
共有的较大的 β-折叠区域在 5 - 11、78 - 86、91 -
98、139 - 144、350 - 355、377 - 383、457 - 462、467 -
476、498 - 503 区段。在各 β-折叠单元之间存在长
短不一,且较为丰富的转角区域。用 Karplus-Schultz
方法预测糖蛋白含有较多的柔韧性区域,尤其在
50 - 240、420 - 520 区段更为丰富,提示该区段蛋白
肽段的柔韧性较大,发生扭曲、折叠的几率较高,能
形成丰富的二级结构。
A. α-螺旋区域;B. β-折叠区域;T.转角区域;F.柔韧区域
图 3 不同的方法预测 G蛋白的二级结构
181
生物技术通报 Biotechnology Bulletin 2010 年第 7 期
2. 3. 2 糖蛋白的亲水性分析 对糖蛋白的亲水
性分析结果(图 4)可见,该蛋白含有众多的亲水
性区域,分布较为均匀,尤其是 98 - 150、186 -
236、480 - 495 区段亲水性较高,表明这几个区域
作为抗原表位的可能性较大。
图 4 G蛋白的亲水性分析
2. 3. 3 糖蛋白的表面可能性分析 用 Emini 方法
对糖蛋白的表面可能性分析显示(图 5) ,该蛋白大
多数区域表面可能性较低或表现为负值,有 10 个区
域较高,尤其 124 - 128、200 - 204 以及 483 - 499 等
区域的表面可能性值最高。
图 5 G蛋白的表面可能性分析
2. 3. 4 糖蛋白的抗原指数分析 对糖蛋白的抗
原指数分析(图 6)表明,该蛋白大多数区域的抗
原指数都比较高,主要包括 28 - 31、103 - 113、121
- 148、160 - 178、199 - 206、212 - 243、263 - 275、
359 - 388、483 - 520 区域。
图 6 G蛋白的抗原指数分析
根据 G蛋白的亲水性、表面可能性、抗原指数
及二级结构的预测结果综合分析,该蛋白含有许
多潜在的蛋白抗原决定簇,分布较为均匀;但在蛋
白氨基酸序列的 121 - 126、133 - 137、161 - 165、
191 - 193、201 - 204、214 - 216、221 - 225、264 -
267 区域或其附近区域存在 B 细胞抗原位点的可
能性最高。
2. 4 核蛋白的二级结构及 B细胞抗原表位预测
2. 4. 1 核蛋白二级结构的预测 从预测结果(图
7)可以看出,两种方法预测的共有的较大的 α-螺
旋区域在 1 - 8、72 - 81、166 - 192、252 - 273、
330 - 337、354 - 382 区段,共有的较大的 β-折
叠区域在 18 - 25、144 - 152、222 - 234、284 -
291、304 - 328、418 - 427 区段。在各 β-折叠
单元之间存在长短不一且较为丰富的转角区
域。用 Karplus-Schultz 方法预测核蛋白含有较
多的柔韧性区域,尤其在 50 - 180、350 - 450
区段更为丰富,提示该区段蛋白肽段的柔韧性
较大,发生扭曲、折叠的几率较高,能形成丰富
的二级结构。
281
2010 年第 7 期 李江涛等:狂犬病病毒 CVS株糖蛋白、核蛋白生物信息学分析
A. α-螺旋区域;B. β-折叠区域;T.转角区域;F.柔韧区域
图 7 不同的方法预测 N蛋白的二级结构
2. 4. 2 核蛋白的亲水性分析 用 Kyte-Doolittle 方
法对核蛋白的亲水性分析显示(图 8) ,核蛋白含有
较多的亲水性区域,分布较为均匀,其中 150 - 172、
262 - 284、350 - 450 区段亲水性较高,表明这几个
区域作为抗原表位的可能性较大。
图 8 N蛋白的亲水性分析
2. 4. 3 核蛋白的表面可能性分析 对核蛋白的表
面可能性分析显示(图 9) ,其大多数区域表面可能
性较低或表现为负值,但 25 - 30、352 - 368、388 -
402、444 - 450 区段的表面可能性值较高。
图 9 N白的表面可能性分析
2. 4. 4 核蛋白的抗原指数分析 对核蛋白的抗原
指数分析(图 10)表明,该蛋白大多数区域的抗原指
数都比较高,主要包括 83 - 136、143 - 172、263 -
282、292 - 304、349 - 405 及 411 - 436 等区域。
图 10 N蛋白的抗原指数分析
根据 N 蛋白的亲水性、表面可能性、抗原指数
及二级结构的预测结果综合分析,该蛋白含有许多
潜在的蛋白抗原决定簇,分布较为均匀,但在蛋白氨
基酸序列的 143 - 152、166 - 172、263 - 273、411 -
427 区域或其附近区域存在 B细胞抗原位点的可能
性最高。
381
生物技术通报 Biotechnology Bulletin 2010 年第 7 期
3 讨论
糖蛋白和核蛋白在狂犬病的免疫研究中占有重
要的作用,本研究对 RV CVS株糖蛋白、核蛋白基因
进行序列、二级结构及其 B 细胞抗原表位预测和分
析,以期从中对 RV CVS 株进行生物信息学分析。
由序列测定结果可知,与国内外不同毒株比较,CVS
株 G基因同源性较低,其中核苷酸同源性最低为
89. 0%,氨基酸同源性最低为 87. 2%,序列差异性
较大,表明 G基因易发生变异;CVS 株 N 基因同源
性较高,核苷酸同源性都在 92. 6%以上,氨基酸同
源性最低也在 97. 6%,说明 N基因具有高度的保守
性,也可以作为群变异的一个指标。
蛋白质的二级结构对抗原表位影响很大。α-螺
旋、β-折叠等二级结构的化学键(氢键)键能较高,
能够比较牢固地维持蛋白质分子的高级结构,且常
处于蛋白质的内部,很难与合适的抗体嵌合,而 β-
转角和无规卷曲是比较松散的结构,易于发生形变,
以突出到蛋白表面,有利于与抗体结合,因此这些区
域有成为抗原表位的可能性[14,15]。蛋白亲水性、表
面可能性和抗原指数的预测结果显示,应用不同的
方法,预测的抗原表位个数和抗原表位可能出现的
肽段区域不同;但多种预测方法均显示有共同的肽
段区域,结合二级结构的 β-转角和无规卷曲的预测
结果,狂犬病毒糖蛋白含有较多的 B 细胞抗原优势
表位区域,主要集中在氨基酸序列的 121 - 126、133
- 137、161 - 165、191 - 193、201 - 204、214 - 216、
221 - 225、264 - 267 区域;核蛋白含有的 B 细胞抗
原优势表位区域相对较少,主要在 143 - 152、166 -
172、263 - 273、411 - 427 区域。
本研究中使用的方法是基于单个氨基酸的性质
进行预测的,但抗原表位又与蛋白质的高级结构密
切相关,因此这个预测具有一定的局限性,但是本研
究分析结果仍可作为确定糖蛋白、核蛋白潜在优势
表位的参考。
参 考 文 献
[1]Rupprechti CE,Hanlon CA,Hemachudha T. Rabies reexamined.
Lancet Infectious Diseases,2002,2:327-343.
[2]殷震,刘景华. 动物病毒学(第 2 版) [M]. 北京:科学出版社,
1997:777-955.
[3]李文辉,张云,王树惠,等. 表达狂犬病毒糖蛋白基因复制缺陷
型重组腺病毒的构建及其特性. 中国医学科学院学报,2003,25
(6) :650-654.
[4]扈荣良,杜坚,涂长春,等. 肌注狂犬病病毒糖蛋白 cDNA 表选
质牲诱导小鼠体液免疫反应. 中国兽医学报,1996,14(4) :
321-325.
[5]Goto H,Minamoto N,Lto H,et al. Expression of the nucleoprotein of
rabies virus in Escherichia coli and mapping of antigenic sites. Arch
Virol,1995,140:1061-1074.
[6]Perea Arango I,Loza Rubio E,et al. Expression of the rabies virus
nucleoprotein in plants at high levels and evaluation of immune re-
sponses in mice. Plant Cell Rep,2008,27:677-685.
[7]Greory AP,Inna GO,Kenneth LJ. The role of massspectrometry in
vaccine development. Vaccine,2001,19:2691.
[8]Chou PY,Fasman GD. Prodiction of the Secondary Structure of Pro-
tein Conformation[M]. New York:Plenum Press,1990:549-586.
[9]Garnier J,Osguthorpe DJ,Robson B. Analysis of the accuracy and
implications of simple method for predicting the secondary structure
of globular proteins. Journal of Molecular Biology,1978,12:
97-120.
[10]Karplus PA,Schultz G. Prediction of chain flexibility in proteins.
Naturwissenschaften,1985,72:212-213.
[11]Kyte J,Doolittle RF. A simple method for displaying the hydropath-
ic character of a protein. Journal of Molecular Biology,1982,157:
105-132.
[12]Emini EA,Hughes JV,Perlow DS,et al. Induction of hepatitis A
virus-neutralizing antibody by a virus-specific synthetic peptide. J
Virol,1985,55:836-839.
[13]Jameson BA,Wolf H. The antigenic index:a novel algorithm for
predicting antigenic determinants. CABIOS,1988,4:181-186.
[14]万涛,孙涛,吴家金. 蛋白顺序性抗原决定簇的多参数综合预
测.中国免疫学杂志,1997,13(6) :329-333.
[15]王新军,吴海玮,张兆松,等. 应用因特网对 SARS 病毒 M 蛋白
B 细胞抗原表位的预测. 南京医科大学学报:自然科学版,
2003,23(6) :558-561.
481