全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2011 年第 9 期
蜜蜂 TPI基因克隆与生物信息学预测
王琦1 李玮妮2 王荣3
(1长治学院生物科学与技术系,长治 046011;2福建农林大学生命科学学院,福州 350002;3长治卫生学校,长治 046000)
摘 要: 利用电子克隆方法获得蜜蜂(Apis mellifera)磷酸甘油醛异构酶(triosephosphate isomerase,TPI)基因,并采用生
物信息学方法对该基因编码蛋白从等电点、疏水性 /亲水性、二级结构等进行了预测,以及试验验证,结果表明蜜蜂 TPI基因全
长为 1 768 bp,具有完整的开放阅读框架(ORF) ,并得到了试验证实。
关键词: 蜜蜂 电子克隆 磷酸甘油醛异构酶 生物信息学
cDNA Cloning and Bioinformatic Prediction of
TPI Gene from Apis mellifera
Wang Qi1 Li Weini2 Wang Rong3
(1Department of Biology Science & Technology,Changzhi University,Changzhi 046011;2School of Life Sciences,
Fujian Agriculture and Forestry University,Fuzhou 350002;3Changzhi Municipal Health School,Changzhi 046000)
Abstract: Triosephosphate isomerase gene from Apis mellifera cloned by electronic cloning based on the EST sequences from
Unigene of NCBI. Some characters of the TPI that can encode amino acid were analyzed and predicted by the tools of bioinformatics in
the following aspects,including hydrophobicity or hydrophilicity,pI,secondary structure. Results showed that the full length of TPI
gene from Apis mellifera was 1 768 bp and contained a complete ORF which encoded 247 amino acids and the experiment is veri-
fied.
Key words: Apis mellifera Electronic cloning Triosephosphate isomerase(TPI) Bioinformatics
收稿日期:2011-02-14
基金项目:长治学院校级课题(2010111)
作者简介:王琦,男,硕士研究生,讲师,研究方向:生物化学与分子生物学,生物信息学;E-mail:wangqiwq@ 126. com
磷酸甘油醛异构酶(TPI,EC 5. 3. 1. 1)是由核
基因表达的,催化二羟丙酮磷酸与 3-磷酸甘油醛之
间的转化[1]。TPI基因突变可使磷酸二羟丙酮的分
解受阻,促进糖异生,抑制葡萄糖的分解,细胞获得
的能量大大减少,并引发神经系统疾病[2,3]。该基
因在物种进化方面高度保守,TPI 基因可作为研究
物种群体遗传结构一个有效的遗传标记[4 - 9]。
当前,随着计算机技术的提高和生物基因测序
数据的不断积累,生物信息学这门交叉学科得到了
迅速发展,作为生物信息学这门学科重要组成部分
之一,电子克隆技术成为当前伴随着基因组计划而
发展起来的基因克隆新方法。
目前已从人(Homo sapiens)、果蝇(Drosophila
melanogaster)及家蚕(Bombyx mori)等多种生物中克
隆到 TPI基因,但尚无蜜蜂(Apis mellifera)TPI 基因
的相关报道,本研究利用电子克隆的方法得到蜜蜂
TPI基因的全长 cDNA 序列并进行了试验验证,进
而对其做了初步生物信息学预测。利用蜜蜂表达序
列标签数据库(EST)电子克隆蜜蜂新基因的研究工
作有一定的现实意义,为进一步在分子水平研究蜜
蜂提供更多的基础资料。
1 材料与方法
1. 1 材料和主要试剂
家蚕 TPI基因序列,序列处理在线工具包。蜜
蜂由长治学院生物科学与技术系白海艳副教授提
供。克隆载体 pTG19-T 为金思特科技(南京)有限
公司生产。SDS、溴酚蓝、琼脂糖购自 Amresco公司,
Tris碱、标准分子量 λDNA /Hind Ⅲ购自北京经科宏
2011 年第 9 期 王琦等:蜜蜂 TPI基因克隆与生物信息学预测
达生物技术有限公司,引物由金思特科技(南京)有
限公司合成,氯仿、异丙醇、乙醇等其他常规试剂均
为进口或国产分析纯。
1. 2 方法
1. 2. 1 电子克隆与设计引物 用模式生物家蚕
(Bombyx mori)的 TPI 基因,将该片段在 NCBI 网站
(http:/ /www. ncbi. nlm. nih. gov /BLAST /)进行蜜蜂
EST数据库的 BLAST检索,获得与其部分相似的蜜
蜂 EST群,从中选取一条相似性较高的蜜蜂 EST 作
为种子序列。用种子序列在蜜蜂 EST 数据库中检
索,获得若干与之有高度同源性的 EST,将检索到的
EST序列用 BioEdit软件拼接组装为重叠群,再以此
重叠群序列检索蜜蜂 EST 数据库,重复上述过程,
反复进行 EST重叠群序列的拼接和比对,直至检出
所有的重叠 EST或重叠群不能继续延续,获得所有
参与组装较长 cDNA 序列的 EST 候选清单,将获得
所有参与拼接组装的候选 EST 序列全部输入到 Bi-
oEdit软件中,拼接组装为重叠群,即为最终的 cDNA
序列。根据电子克隆所获得的完整 cDNA 序列,分
别在起始密码子区域和终止密码子区域设计特异引
物:引物 1:5-AGTCTCGAGTCACTGCTTAGCGTTA-
AC-3,引物 2:5-ATCGGATCCGCCATGGGTCGTA-
AATT-3。
1. 2. 2 蜜蜂 DNA基因组的提取 采用植物基因组
DNA提取方法抽提蜜蜂基因组 DNA[10]。
1. 2. 3 PCR 扩增蜜蜂 TPI 基因片段 以蜜蜂基因
组 DNA 为模板,用特异引物 1 和引物 2 进行 Am
TPI基因的 PCR 扩增。PCR 反应体系为 25 μL,其
中含有 2. 5 μL 10 × PCR 反应缓冲液,0. 2 μL 模板
DNA,2 μL dNTPs,引物 1 和引物 2 各1 μL,Taq 酶
0. 3 μL。PCR 扩增程序:94℃预变性4 min;94℃变
性 60 s,63℃复性 40 s,72℃延伸 60 s,35 个循环;
72℃充分延伸 10 min,4℃保存。反应后取 1 μL
电泳。
1. 2. 4 目的片段回收 PCR 扩增得到的目的片段
回收方法参考文献[11]。
1. 2. 5 蜜蜂 TPI 基因编码区克隆 使用上述回收
得到的片段直接进行质粒重组,在进行质粒 pTG19-
T载体克隆后用 BamHⅠ双酶切阳性克隆。
1. 2. 6 生物信息学预测 推导蜜蜂 TPI 基因开放
阅读框架(ORF) ,利用 ProtScale 程序对蜜蜂 TPI 基
因进行疏水性进行分析[12,13],利用 ANTHEPROT 软
件分析等电点,利用在线蛋白质结构域分析工具
SMART与 SCANPROSITE 分别对所编码的蛋白质
进行分析[14,15],利用 ANTHEPROT 软件和 HNN 网
络服务器预测蛋白质的二级结构,并进行相关数据
分析。
2 结果与分析
2. 1 蜜蜂 TPI基因的电子克隆
用家蚕 TPI 基因序列(AY734490)检索蜜蜂的
EST数据库,获得部分相似的蜜蜂 EST 群。分析这
些 EST群,从中选取一条相似性较高的蜜蜂 EST 作
为种子序列(BI517266) ,其序列见图 1。该种子序
列与 AY734490 序列相似区域的 73 nt中有 60 nt是
一致的,匹配率达到 82%。
图 1 蜜蜂 EST种子序列
用种子序列在蜜蜂 EST数据库中 BLAST检索,
检索获得 9 条 EST(BI509036、BI511723、BI509972、
BI516689、DB732619、BI511970、DB746584、DB737111 和
BI511024),将这些序列作为组装拼接的候选 EST,与种
子序列 BI517266 一起组装拼接为重叠群。重复上述
BLAST检索过程,用 BioEdit软件组装所检索出的 EST
序列,得到一个完整的重叠群,总长度为 1 768 bp 的
cDNA序列。最后将所重叠群序列再到 NCBI 的蜜蜂
EST数据库里进行 BLAST检索,发现此序列完全受蜜
蜂 EST的支持(图 2)。
2. 2 PCR结果
PCR产物经琼脂糖凝胶电泳分离后呈现一条
长约 1 200 bp 的特异性条带,与预期扩增片段十分
接近(图 3)。
901
生物技术通报 Biotechnology Bulletin 2011 年第 9 期
图 2 获得的 cDNA序列与蜜蜂 EST库 BLAST检索结果
M. Marker;1,2. PCR产物
图 3 PCR产物琼脂糖凝胶电泳
2. 3 蜜蜂 TPI基因编码区克隆与分析
使用上述回收得到的片段直接进行质粒重组,
在进行质粒 pTG19-T载体克隆后用 BamHⅠ双酶切
阳性克隆(pTG19-T 重组质粒中目的片段的两端各
含有一个 BamHⅠ的酶切位点) ,酶切结果用琼脂糖
凝胶电泳分析出现一条约 1 200 bp的条带(图 4)。
M. Marker;1.重组质粒 DNA;2. BamHⅠ酶切重组质粒 DNA
图 4 阳性克隆(有内含子)的酶切鉴定
2. 4 蜜蜂 TPI基因 cDNA序列的生物信息学分析
将电子克隆得到的蜜蜂 TPI 基因 cDNA 在 NC-
BI中进行开放阅读框分析,分析得知是一个完整的
开放阅读框(图 5)。图 6 显示蜜蜂 TPI cDNA 序列
与基因组 DNA及电子克隆的比较。
图 5 Am TPI基因 cDNA序列的 ORF分析
利用 ProtScale程序对获得的蜜蜂 TPI 基因疏水
性进行分析,结果(图 7)显示,负值越大表明疏水性
越强,正值越大表明亲水性越强。在 -0. 5 - +0. 5 之
间表明是两性氨基酸。如图 7所示,在疏水性分值在
+1. 5 - +2. 0之间有 3处,预示此处富含疏水性氨基
酸,且在 Position:42,Score:1. 911为疏水性最大。
011
2011 年第 9 期 王琦等:蜜蜂 TPI基因克隆与生物信息学预测
NW_001253149为基因组序列;Sequencing为序列结果;EF493864为电子克隆 cDNA序列;黑色字体为三者一致序列;黑色方框为三者相差较大序列
图 6 蜜蜂 TPI cDNA序列与基因组 DNA及电子克隆的比较
用 ANTHEPROT软件分析蛋白质的等电点,从
图 8 可以看出等电点为 8. 515。
据 Skolnick等[16,17]研究,按蛋白质二级结构分
型标准,蛋白质二级结构可分为 H、E、T 和 C 4 型,
分别代表螺旋、折叠、转角和卷曲。当 H > 45%、E
<5%时为 all-α 型;当 H < 5%、E > 45%时为 all-β
型;当 H > 30%、E > 20%时为 α-β 型;其他情况为
mixed型。故 GOR1 法预测蜜蜂 TPI 蛋白属于 α /β
蛋白,图 9 为 HNN 预测结果,α 螺旋(H)、β 折叠
(E)、卷曲(C)分别占 32. 39%、22. 27%、45. 34%,
无转角(T)。HNN 预测蜜蜂 TPI 蛋白也属于α /β
蛋白。 图 7 AmTPI疏水性分析
111
生物技术通报 Biotechnology Bulletin 2011 年第 9 期
图 8 AmTPI的等电点
3 讨论
3. 1 电子克隆与生物信息学
进行 EST序列电子延伸的关键是选择与种子
序列具有高度同源性的序列[18]。为了达到电子延
伸准确性提高的目的,经过检验,选择概率值为
“1e - 30”,可以获得与种子序列高度同源的比较
理想的 EST序列来完成电子延伸过程。采用生物
信息学方法对 DNA 序列进行电子序列延伸分析,
将为实践研究提供重要的基础资料[19,20]。在进行
电子克隆未知基因时,主要依靠网络资源以及相
关的生物软件,因此成本较低,不需要投入太多的
资金即可进行研究。但应当注意,DNA 序列进行
电子克隆获得的结果只能作为参考,因在有些情况
下反而会产生一些不良后果,比如,对于具有不同序
列剪切形式的基因就无法直接通过此种方法获得多
种剪切形式之间的差异。所以,真正的 cDNA 序列
还需要通过试验获得并进行验证。
3. 2 磷酸甘油醛异构酶(TPI)
TPI基因在生物的新陈代谢中具有重要的功
能,几乎所有包括三糖磷酸酯的代谢途经都包含着
竖线由长至短分别为 α螺旋(H)、β折叠(E)和卷曲(C)
图 9 HNN法预测蛋白质的二级结构
这一转化,比如糖酵解、糖异生、戊糖磷酸途径及脂
肪酸的生物合成等。同时,这一过程还是光合作用
中 CO2固定(Calvin 循环)所不可缺少的。TPI 是由
同二聚体亚基构成,每个亚基大约由 246 - 255 个氨
基酸残基组成[7],分子量大约 27. 5 kD。从已有的
一级结构来看,各种来源的 TPI基因是相当保守的,
它们的三级结构和作用方式也是十分相近的。
3. 3 蜜蜂 TPI cDNA与基因组 DNA
将克隆得到的蜜蜂 TPI基因片段与蜜蜂基因组
比对过程中发现,其 ORF由 3 个外显子构成,且被 2
个内含子所隔开;比对基因组过程中发现在蜜蜂基
因组的第 16 染色体碱基序列中含有一段 50 bp 的
未知序列,在基因组中以“N”表示,而克隆得到的序
列正好覆盖了该区域部分序列,在图 6 中黑色方框
内线条右侧的未知碱基通过测序将其补充。比对过
程中还发现,在其他染色体中还有多处为未知序列,
可以设想,是否可以通过将未知序列上下游的已知
序列通过电子克隆的方法拼接出一段相对完整的碱
基序列,为蜜蜂分子生物学的深入研究提供更有价
值的参考。
211
2011 年第 9 期 王琦等:蜜蜂 TPI基因克隆与生物信息学预测
通过进一步的研究,将电子克隆应用到补充
蜜蜂基因组的技术进一步完善。可将相关网站和
软件的整合以及相关数据的衔接,加速蜜蜂基因
组补充的进程。另一方面,将电子克隆技术进一
步应用到其他物种的基因组补充完善上面,并通
过相应软件的开发,整合各种资源,将此技术标准
化、工程化,加速基因组数据库的补充和完善。
参 考 文 献
[1] Knowles JR. Enzyme catalysis:not different,just better. Nature,
1991,350(6314) :121-124.
[2] Orosz F,Vértessy BG,Hollán S,et al. Trosephosphate isomerase
deficiency:predictions and facts. J Theor Biol,1996,182 (3) :
437-447.
[3]Helfert S,Estevez AM,Bakker B,et al. Roles of triosephosphate
isomerase andaerobic metabolism in Trypanosoma brucei. Biochem J,
2001,357(Pt 1) :117-125.
[4]Marchionni M,Gilbert W. The triosephosphate isomerase gene from
maize intronsantedate the plant-animal divergence. Cell,1986,46
(1) :133-141.
[5] Xu Y,Yu H,Hall TC. Rice triosephosphate isomerase gene 5
[prime]sequence directs[beta]-glucuronidase activity in transgenic
tobacco but requires an intron for expression in rice. Plant physiol,
1994,106(2) :459-467.
[6]Xu Y,Harris-Hailer LW,McCollum JC,et al. Nuclear gene enco-
ding cytosolic trios-ephosphate isomerase from rice(Oryza sativa
L.). Plant Physiol,1993,102(2) :697.
[7]Xu Y,Hall TC. Cytosolic triosephosphate isomerase is a single gene
in rice. Plant physiol,1993,101(2) :683-687.
[8]Raines RT,Sutton EL,Straus DR,et al. Reaction energetics of a
mutant triose phosphate isomerase in which the active-site glutamate
has been changed to aspartate. Biochemistry,1986,25 (22) :
7142-7154.
[9]Zhang XH,Chinnappa CC. Plant physiology,Biochemistry and mo-
lecular biology[M]. Harlow:Lonman scientific & technical,1994,
22:77-100.
[10]向仲怀,张孝勇,余茂德,等. 采用随机扩增多态性 DNA 技术
(RAPD)在桑属植物系统学研究的应用初报.蚕业科学,1995,
21(4) :203-208.
[11]周君,陈正凯,徐剑,等.琼脂糖凝胶中 DNA 回收技术的探讨.
常熟理工学院学报,2007,21(8) :42-47.
[12]Wilkins MR,Gasteiger E,Bairoch A,et al. Protein identification
and analysis tools in the ExPASy server. Methods Mol Biol,1999,
112:531-552.
[13] Cserzo M,Eisenhaber F,Eisenhaber B,et al. On filtering false
positive transmembrane proteinpredictions. Protein Eng,2002,15
(9) :745-752.
[14]De Castro E,Sigrist CJ,Gattiker A,et al. ScanProsite:detection of
PROSITE signature matches and ProRule-associated functional and
structural residues in proteins. Nucleic Acids Res,2006,34(suppl.
2) :362-365.
[15]Marchler-bauerA,Anderson JB,Cherukuri PF,et al. CDD:a con-
served domain database for protein classification. Nucleic Acids
Res,2005,33(1) :192-196.
[16]Peitseh MC. Protein modeling by e-mail. From amino acid sequence
to protein structure:A free one-hour service. Nature Biotechnolo,
1995,7(13) :658-660.
[17] Skolnick J,Fetrow JS. From genes to protein structure and func-
tion:Novel application of computational approaches in genomic era.
Tibtech,2000,18:34-39.
[18]Altschul SF,Madden TL,Schaffer AA,et al. Gapped BLAST and
PSI-BLAST:a new generation of protein database search programs.
Nucleic Acids Res,1997,25(17) :3389-3402.
[19]张成岗,孙焕东,欧阳曙光,等.基于 PC /Linux的核酸序列电子
延伸系统的构建及其应用.遗传,2002,24(1) :50-54.
[20]张成岗,贺福初.生物信息学方法与实践[M].北京:科学出版
社,2002:23-27.
(责任编辑 马鑫)
311