全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2012年第3期
收稿日期 : 2011-09-21
基金项目 : 暨南大学科研培育与创新基金研究项目(216113103), 深圳市卫生局重点课题(200608)
作者简介 : 张毅 , 男 , 硕士研究生 , 研究方向 : 基因与分子生物学 ; E-mail: zhangyi870907@yahoo.cn
通讯作者 : 李体远 , 男 , 研究员 , 硕士生导师 , 研究方向 : 分子生物学 ; E-mail: tiyuan_li@163.com
重叠延伸 PCR法扩增 EB病毒 BZLF1N-BLRF2
融合基因及生物信息学分析
张毅1, 2 周淑艳1 陈锐1, 2 孙业红1 李体远1
(1 暨南大学附属第二医院 深圳市人民医院 临床医学研究中心,深圳 518020 ;2 暨南大学药学院,广州 510632)
摘 要: 利用重叠延伸 PCR技术扩增 EB病毒 BZLF1N-BLRF2融合基因,构建原核表达载体 pGEX-4T-1-BZLF1N-BLRF2,
并进行了蛋白的诱导表达。通过序列测定和 ORF软件分析,该融合基因含有 1个 1 005 bp的 ORF,编码 335个氨基酸。应用生物
信息学方法,对该融合基因编码的蛋白 ZtaN-p23从氨基酸组成、理化性质、信号肽、疏水性 /亲水性、二级结构、亚细胞定位、
功能域和高级结构等方面进行了预测和分析。结果表明,该蛋白的预测分子量为 46.2 kD,理论等电点约为 8.97,是亲水性蛋白,
推测它定位于细胞质中。序列分析表明,该蛋白可能具有信号转导、转录调控、免疫应答等功能。预测的二级结构及三级结构都
表明该蛋白含有较多的不规则卷曲和 α-螺旋,三级结构上呈对称形状。
关键词: 重叠延伸 PCR EB病毒 BZLF1N基因 BLRF2基因 生物信息学
Construction of Epstein-barr Virus BZLF1N-BLRF2 Gene by
Overlap Extension PCR and Bioinformatics Analysis
Zhang Yi1, 2 Zhou Shuyan1 Chen Rui1, 2 Sun Yehong1 Li Tiyuan1
(1Clinical Medical Research Center,Shenzhen Peoples Hospital,the 2nd Affiliated Hospital of Jinan University,Shenzhen 518020;
2Pharmacy College of Jinan University,Guangzhou 510632)
Abstract: Epstein-Barr virus BZLF1N gene and BLRF2 gene were amplified and linked by overlap extension PCR method. The
prokaryotic expression vector pGEX-4T-1-BZLF1N-BLRF2 was constructed, which expressed in E. coli. The fusion gene contained an ORF with
the longest length of 1 005 bp, and encoding 335 amino acids. The physicochemical characteristics, structures and functions of fusion protein
ZtaN-p23 which encoded by BZLF1N-BLRF2 were predicted and analyzed with software tools and database of bioinformatics. The results showed
that the molecular weight and pI of deduced protein is 46.2 kD and 8.97 as well as it has not signal peptide, which is a hydrophilic protein
locating in cytoplasm. The sequencing analysis displayed that the protein holds the possibility of signal transducer, transcription regulation and
Immune response. The predicted second and tertiary structure indicates that ZtaN-p23 contains more random coil and helix and a small quantity
of extended strand.
Key words: Splicing overlap extension PCR Epstein-Barr virus BZLF1N gene BLRF2 gene Bioinformatics
EB 病毒(Epstein-Barr virus,EBV)属疱疹病毒
γ 亚科,是一种嗜 B 淋巴细胞的人类疱疹病毒,与
鼻咽癌(NPC)、单核细胞增多症、Burkitt 淋巴
瘤等肿瘤的发生密切相关[1]。EBV 分为 A、B 两
型[2],在亚洲以 A 型为主,主要通过唾液、飞沫
传播,也可经输血传播。由于 EBV 在其生长周期
中表达不同的蛋白产物,因此临床上常常采用这
些蛋白作为诊断抗原来进行 EB 病毒抗体的检测,
通过大规模的人群筛查来达到早期预防和诊断的
目的。
EBV 立即早期基因(Immediate early gene)BZL-
F1N 编码的 ZtaN 蛋白在 EB 病毒从潜伏状态进入裂
生物技术通报 Biotechnology Bulletin 2012年第3期174
解复制状态的早期启动阶段发挥着关健作用[3]。因
此将其作为诊断抗原可以在 EB 病毒增殖早期立即
发现机体的感染,从而进行早期预防治疗。BLRF2
基因编码的 p23 蛋白是 EB 病毒衣壳抗原 VCA 的主
要抗原多肽,它是临床上 EB 病毒大量复制感染的
确证指标[4],将其作为诊断抗原可以确诊 EB 病毒
感染,具有很高的特异性和敏感度。本研究利用重
叠延伸 PCR 法将 BZLF1N 和 BLRF2 两个基因融合
后克隆至 pGEX-4T-1 中,构建原核表达载体 pGEX-
4T-1-BZLF1N-BLRF2,并进行蛋白的诱导表达,旨在
通过生物信息学分析技术对融合片段的核酸序列及
蛋白结构和功能进行预测,为后续的蛋白诊断应用
奠定基础。
1 材料与方法
1.1 材料
EB 病毒 B95-8 细胞购自中国科学院细胞库 ;大
肠杆菌 BL21(DE3)、质粒 pGEX-4T-1 为本实验室
保存。限制性内切酶 BamHⅠ、XhoⅠ、T4 DNA 连
接酶、蛋白 Marker、DNA Marker、逆转录试剂盒
购自 Fermentas 公司 ;质粒 DNA 提取纯化试剂盒、
DNA 凝胶回收试剂盒购自 OMEGA 公司。引物由上
海生工生物技术有限公司合成。测序由欣海凌生物
科技有限公司完成。
1.2 方法
1.2.1 引 物 设 计 根 据 GenBank 公 布 的 序 列
(NC_007605),利用 Primer Premier 5.0 设计引物,
上下游引物的下划线部分为引入的 BamHⅠ和 XhoⅠ
酶切位点。BZLF1N 上游引物 :5-CGCGGATCCATG
ATGGACCCAAACTCGAC-3;下游引物 :5-CCGCTC
GAGCGATTCTGGCTGTTGTGGTT-3。BLRF2 上游引
物 :5-CGCGGATCCATGTCAGCTCCACGCAAAGTCA
G-3;下游引物:5-CCGCTCGAGTTAATCAGAAATTT
GCACTTTCT-3。融合序列上游引物:5-GGTGGCGG
TGGTAGTGGTGGTGGCCGATTCTGGCTGTTGTGG-3;
下游引物 :5-GCCACCACCACTACCACCGCCACCAT
GTCAGCTCCACGC-3。
1.2.2 BZLF1N、BLRF2 基因的 RT-PCR 扩增及融
合 取 B95-8 细胞常规培养后,利用 Trizol 试剂提
取总 RNA ;通过逆转录试剂盒将总 RNA 逆转录成
cDNA,再以 cDNA 为模板,通过两轮 PCR 扩增出
融合基因 BZLF1N-BLRF2。第一轮 PCR 的反应程序
为 :BZLF1N 基因 95℃ 5 min ;95℃ 45 s,62℃ 45 s,
72℃ 1 min,32 个循环 ;72℃ 10 min。BLRF2 基因
95℃ 5 min ;95℃ 45 s,56℃ 45 s,72℃ 1 min,27
个循环 ;72℃ 10 min。分别切胶回收 PCR 产物后并
将其等体积混合作为模板,聚合酶为 Pyrobest Taq,
进行第 2 轮融合 PCR。PCR 反应程序为 :95℃ 45 s,
62℃ 45 s,72℃ 1 min,20 个循环。PCR 产物用 1.5%
琼脂糖凝胶电泳进行鉴定。
1.2.3 原核表达载体的构建 用 BamHⅠ和 XhoⅠ分
别双酶切上述的融合片段和 pGEX-4T-1 原核表达
载体,再分别切胶回收纯化。载体和融合片段按一
定比例混合后加入 T4 DNA 连接酶,16℃过夜连接
后转化 BL21(DE3)感受态细胞,挑取阳性克隆
抽提质粒。并将双酶切 BamHⅠ/XhoⅠ及测序鉴定
正 确 的 重 组 质 粒, 命 名 为 pGEX-4T-1-BZLF1N-
BLRF2。
1.2.4 重组蛋白 ZtaN-p23 的诱导表达 挑取阳性单
菌落接种到含氨苄青霉素的 LB 液体培养液中,于
37℃振荡摇菌过夜。次日,按照 1 100 的比例接
入同样的培养基中,至 OD600 值约为 0.6 时,加入
IPTG 进行诱导表达。离心收集菌体,超声破碎后
分为全菌、沉淀、上清进行 8% 的 SDS-PAGE 电泳,
检测重组蛋白的表达及可溶性情况。
1.2.5 生物信息学分析 将测序得到的融合基因序
列用 NCBI 数据库中的 BLAST 进行序列比对 ;用
ORF finder 程序预测其编码阅读框 ;用 ExPASy 的
ProtParam 程序预测编码蛋白的氨基酸残基组成、理
论分子量和等电点 ;应用 ProtScale 程序计算蛋白质
的疏水性图谱 ;通过 TMHMM 程序(http://www.cbs.
dtu.dk/services/TMHMM-2.0)预测蛋白的跨膜区 ;通
过在线分析软件 SignalP(http://www.bs.dtu.dk/service/
SignalP)进行信号肽分析[5];通过 SOPMA 方法对
ZtaN-p23 进行二级结构分析 ;利用 PSORT 程序对
ZtaN-p23 蛋白亚细胞定位进行预测 ;用 Protfun 在
线分析工具预测 ZtaN-p23 蛋白的功能分类 ;利用
Geno3D[6]程序对 ZtaN-p23 蛋白的三维结构进行预
测分析。
2012年第3期 175张毅等 :重叠延伸 PCR 法扩增 EB 病毒 BZLF1N-BLRF2 融合基因及生物信息学分析
2 结果
2.1 BZLF1N和BLRF2的扩增融合及重组质粒的
构建
第 1 轮扩增产物经琼脂糖凝胶电泳后,可见
BZLF1N 和 BLRF2 基因分别在 519 bp 和 486 bp 附
近有扩增产物,与预期相符(图 1)。第 2 轮融合
PCR 得到约 1 005 bp 的片段,经 BamHⅠ和 XhoⅠ
双酶切后与预期目标一致(图 2),将测序结果与
GenBank 上公布的序列进行比对,证实重组质粒构建
成功。
序 列 分 析, 结 果 表 明 BZLF1N-BLRF2 存 在 一 个
1 005 bp 的开放阅读框,预测编码 335 个氨基酸。
利用 ExPASy 的 ProtParam 程序对融合基因编码产物
ZtaN-p23 的 335 个氨基酸进行序列分析,结果表明
该蛋白的分子量是 46.2 kD,理论等电点为 8.97,原
子组成是 C1546H2500N454O490S12;正电荷残基(Arg+Lys)
33 个,负电荷残基(Asp+G1u)29 个 ;不稳定系数
(Instability index)为 61.05,表明该蛋白状态不稳定;
脂肪系数为 69.10,总平均亲水性为 -0.463,说明该
蛋白是一个亲水蛋白。
2.4 ZtaN-p23蛋白的亲水性/疏水性分析
利用 ProtScale 程序对 ZtaN-p23 蛋白氨基酸序列
的疏水性 / 亲水性进行预测。根据氨基酸分值越低
亲水性越强,分值越高疏水性越强的原则,多肽链
第 128 位的缬氨酸(Val)具有最高分值 2.244,疏
水性最强 ;第 161 位的脯氨酸(Pro)具有最低分
值 -3.144,亲水性最强。由图 4 可以看出,亲水性
的氨基酸均匀散布在整个肽链中,且多于疏水性氨
基酸,因此可推断 ZtaN-p23 是一种可溶性蛋白。
2.5 ZtaN-p23蛋白的跨膜结构和信号肽预测
采用 TMHMM 在线分析,未发现 ZtaN-p23 含有
跨膜结构。通过 SignalP 对 ZtaN-p23 蛋白的信号肽
进行预测,分析结果见图 5。第 26 位氨基酸残基具
有最高的原始剪切位点分值 0.278,第 43 位氨基酸
残基具有最高综合剪切位点,分值为 0.021,第 2 位
氨基酸残基具有最高的信号肽,分值为 0.039。由此
可以推断融合蛋白 ZtaN-p23 不存在信号肽,是非分
泌蛋白,在细胞质中合成后,不进行蛋白转运。
M. DNA Marker 2000 ;1. BZLF1N ;2. BLRF2
图 1 BZLF1N、BLRF2的 RT-PCR扩增
M. DNA Marker 2000 ;1-5. BamHⅠ和 XhoⅠ双酶切的重组质粒
图 2 重组质粒 pGEX-4T-1-BZLF1N-BLRF2的双酶切鉴定
2.2 重组蛋白ZtaN-p23的诱导表达
重组质粒在 IPTG 0.2 mmol/L,25℃,4 h 时目的
蛋白的表达量达到最大,并且蛋白大小出现在 46 kD
位置上,并且以可溶性形式存在,与预期一致(图 3)。
2.3 BZLF1N-BLRF2基因的ORF及理化性质分析
将融合基因利用 NCBI 上的 ORF finder 进行
M. 蛋白 Marker ;1-6. 重组质粒在 0.2 mmol/L IPTG,25℃,4 h 条件下
进行表达 ;7. 破菌后的沉淀 ;8, 9. 破菌后的上清
图 3 重组蛋白 ZtaN-p23的诱导表达分析
生物技术通报 Biotechnology Bulletin 2012年第3期176
2.6 ZtaN-p23蛋白的二级结构预测
通过 SOMPA 方法对 ZtaN-p23 蛋白进行了
二级结构的分析。结果(图 6)表明,该蛋白的
二级结构中包含 27.46% 的 α-螺旋,13.43% 的
延伸链,3.58% 的 β-折叠和 55.52% 的不规则卷
曲。由此可以推测,螺旋结构和卷曲结构散布于
其整个蛋白质中,构成 ZtaN-p23 融合蛋白二级
结构的骨架。
图 4 ZtaN-p23蛋白的亲水 /疏水性预测结果 图 5 ZtaN-p23蛋白的信号肽预测结果
图 6 ZtaN-p23蛋白的二级结构预测图谱
2.7 ZtaN-p23蛋白的亚细胞定位及功能预测分析
通过 PROST 工具预测结果显示,ZtaN-p23 蛋白
亚细胞定位可能性为:细胞质 9.65,细胞膜 0.01,细
胞壁 0.17,细胞外 0.17。因此可以推断该蛋白主要
定位于细胞质中发挥生物学作用。利用CBS的Profun
软件进行预测分析,其功能分类见表 1。该蛋白具
有信号转导、转录调控和免疫应答的可能性分别为
0.735、1.902 和 0.863,说明该蛋白在信号转导调控
及免疫应答方面发挥重要作用,与预期结果一致。
2.8 ZtaN-p23蛋白的高级结构分析
利用 ExPASy 的工具中 Swiss-model 来预测该蛋
白的三级结构,用 RasMol2.7.0.1 软件观看 ZtaN-p23
蛋白的三维立体分子结构(图 7)。从图 7 可以看出,
ZtaN-p23 蛋白是由 26-27 个 α-螺旋,3-4 个 β-折叠,
以及许多不规则卷曲构成的对称结构,与预测的二
级结构大致相同。
3 讨论
EB 病毒是一种嗜 B 淋巴细胞的人类疱疹病毒,
属于 DNA 病毒的一种,具有传染性强和潜伏感染
的特点。流行病学研究显示,全球大约有 90% 以上
的成年人都曾经感染过这种病毒。在初次感染后,
EBV 可在宿主体内建立起终身潜伏感染,在一定条
2012年第3期 177张毅等 :重叠延伸 PCR 法扩增 EB 病毒 BZLF1N-BLRF2 融合基因及生物信息学分析
期预防的目的。
目前,基因融合的方法主要有酶连接法和重叠
延伸 PCR 法。酶连接法是将两个目的基因经过适
当限制性内切酶消化后再连接起来,但缺点是只能
在具有合适的酶切位点处进行连接,而用重叠延伸
PCR 法建重组质粒则可解决上述问题。
重叠延伸 PCR 技术可以将 2 个或多个基因片段
通过末端互补的方式连接起来,而不依赖于限制性
内切酶和连接酶,比传统的酶连接法更加快速简便
有效。该技术的关键在于连接引物的设计,本研究
所设计采用的 Linker(Gly4Ser) 2 是最为常用的接头
氨基酸,其中的甘氨酸和丝氨酸提供了充分的柔性
和亲水性,并减少了空间位阻,可以保证所连接的
蛋白正确折叠并保持各自独立的生物学功能和活性。
在目前的研究中,多个 EBV 抗原组分联合包
被检测 EBV 抗体已经成为一种趋势,并且临床上的
应用也在逐步推广和发展[11]。本研究预测分析的
ZtaN-p23 蛋白作为 EB 病毒抗体的诊断抗原将具有
更好的特异性和敏感度,为相关疾病的早期诊断和
预防提供了一个新的角度和方法,并为后续的 EBV
抗体检测试剂盒的研制奠定了理论和技术基础。
4 结论
本研究结合分子生物学技术和生物信息学分析,
通过重叠延伸 PCR 方法,设计了一对特异性的连接
引物,将 BZLF1N 基因和 BLRF2 基因融合连接,成
功构建了原核表达载体 pGEX-4T-1-BZLF1N-BLRF2,
并进行了蛋白的诱导表达。应用生物信息学对重组
质粒编码的蛋白产物 ZtaN-p23 的理化性质、亲水
性 / 疏水性、二级结构、信号肽、跨膜结构、蛋白
功能和高级结构等进行了预测。结果分析表明,融
合基因开放阅读框为 1 005 bp,编码 335 个氨基酸,
平均疏水性为 -0.463,说明该蛋白水溶性较好,为
亲水性蛋白。该蛋白无信号肽和跨膜结构[10],主要
定位于细胞质中,具有信号转导、转录调控、免疫
应答等功能。
参考文献
[1] Junker AK. Epstein-Barr virus. Pediatr Rev, 2005, 26(3): 79-85.
[2] Qin HD, Jia WH, Zhang LL, et al. Elevated Epstein-Barr virus sero-
表 1 ZtaN-p23蛋白功能预测
Gen ontology category Prob odds
信号传导 0.266 0.735
受体 0.006 0.035
荷尔蒙 0.001 0.206
结构蛋白 0.005 0.172
转载体 0.025 0.229
离子通道 0.013 0.233
电压门控离子通道 0.004 0.185
阳离子通道 0.010 0.220
转录 0.211 1.651
转录调控 0.238 1.902
胁迫应答 0.006 0.063
免疫应答 0.215 0.863
生长因子 0.005 0.372
金属离子转移 0.009 0.020
件下可被特异性激活,引起增殖性感染,从而刺激
细胞的增生和转化[7]。
立即早期基因 BZLF1N 编码的 ZtaN 蛋白是 EB
病毒进入裂解复制状态必需的激活元件,它可以促
使病毒从潜伏状态进入增殖状态。Dardari 等[8]研
究指出,将 ZtaN-IgG 作为 NPC 早期诊断的抗体阳性
率可以达到 90% 以上。BLRF2 基因编码的衣壳蛋白
主要抗原多肽 p23 蛋白是确诊 EBV 新近感染的最有
价值的抗原指标,周鹰等[9]采用 ELISA 方法检测
3 562 例 EB 病毒感染患者血清中的 p23-IgG,发现
p23-IgG 抗体阳性率为 72.6%。因此,将 ZtaN 蛋白
和 p23 蛋白共同作为临床早期诊断病毒感染的蛋白
标志物将具有较高的特异性和敏感度,从而达到早
图 7 ZtaN-p23蛋白的三维结构预测
生物技术通报 Biotechnology Bulletin 2012年第3期178
reactivity among unaffected members of families with nasopharyngeal
carcinoma. J Med Virol, 2011, 83(10):1792-1798.
[3] Adam P, Bonzheim I, Fend F, et al. Epstein-Barr Virus-positive dif-
fuse large B-cell lymphomas of the elderly. J Adv Anat Pathol, 2011,
18(5):349-355.
[4] Szkaradkiewicz A, Majewski W, Wal M, et al. Epstein-Barr virus
(EBV)infection and p53 protein expression in gastric carcinoma. J
Virus Res, 2006, 118(1-2): 115-119.
[5] 蒋彦 . 基础生物信息学及应用[M]. 北京 : 清华大学出版社 ,
2003: 150-160.
[6] Combet C, Jambon M, Deleage G, et al. Geno3D: automatic compara-
tive molecular modeling of protein. J Bioinformatics, 2002, 18: 213-
214.
[7] Hoshikawa Y, Satoh Y, Murakami M, et al. Evidence of lytic infection
of Epstein-Barr virus in EBV-positive gastric carcinoma. J Med Viro,
2002, 66(3): 351-359.
[8] Dardari R, Hinderer W, Lang D, et al. Antibody responses to recom-
binant Epstein-Barr virus antigens in nasopharyngeal carcinoma
patients: complementary test of ZEBRA protein and early antigens
p54 and p138. J Clin Microbiol, 2001, 39(9): 3164-3170.
[9] 周鹰 , 朱洪 . 血清 EB 病毒抗体检测对鼻咽癌的临床诊断价值 .
第四军医大学学报 , 2009, 30(12): 1102.
[10] Jensen LJ, Strfeldt HH, Borunak S. Prediction of human protein
function according to gene ontology categories. J Bioinformatics,
2003, 19(5): 635-642.
[11] Yu KJ, Hsu WL, Pfeiffer RM, et al. Prognostic utility of anti-EBV
antibody testing for defining NPC risk among individuals from high-
risk NPC families. J Clin Cancer Res, 2011, 17(7): 1906-19.
(责任编辑 马鑫)
ISAAA信息
2011 年,全球转基因作物种植面积增长了8%(1 200 万 hm2),达到 1.6 亿 hm2。2011 年是转基因作物商业化的
第 16 年,在连续 15 年(1996 至 2011 年)的增长后,2011 年转基因作物种植面积持续增加。
2011 年种植转基因作物的 29 个国家中,有 19 个是发展中国家,10 个为发达国家。发展中国家转基因作物的种
植面积约占全球的 50%,增长了 11%(820 万 hm2)。巴西连续三年带动全球转基因作物的增长,其增长率达世界第一。
排名前十位的国家种植面积及其转基因作物如下 :
美国 (6 900 万 hm2): 玉米、大豆、棉花、油菜、甜菜、苜蓿、番木瓜、南瓜 ;
巴西 (3 030 万 hm2): 大豆、玉米、棉花 ;
阿根廷 (2 370 万 hm2):大豆、玉米、棉花 ;
印度 (1 060 万 hm2):棉花 ;
加拿大 (1 040 万 hm2):油菜、玉米、大豆、甜菜 ;
中国 (390 万 hm2):棉花、番木瓜、杨树、马铃薯、甜椒 ;
巴拉圭 (280 万 hm2):大豆 ;
巴基斯坦 (260 万 hm2):棉花 ;
南非 (230 万 hm2):玉米、大豆、棉花 ;
乌拉圭 (130 万 hm2):大豆、玉米。
2011 年转基因大豆继续作为主要的转基因作物,占全球转基因作物种植面积的 47%(7 540 万 hm2),其次为转
基因玉米(32%,5 100 万 hm2),转基因棉花(15%,2 470 万 hm2)和转基因油菜(5%,820 万 hm2)。
(www.isaaa.org)