全 文 :研究报告
生物技术通报
BIOTECHNOLOGY BULLETIN 2010年第 11期
大豆异戊烯焦磷酸异构酶基因的
电子克隆及生物信息学分析
魏琦超1 畅丽萍 2 薛晓锋 1 周岩 1
( 1河南科技学院生命科技学院,新乡 453003; 2新乡学院建筑工程系,新乡 453003)
摘 要: 利用电子克隆方法获得大豆异戊烯焦磷酸异构酶基因 ( IP I)的 cDNA序列,并采用生物信息学方法对该基因及
其编码蛋白的一般理化性质、疏水性、信号肽、二级结构和亚细胞定位等方面进行了预测和分析。结果表明, 大豆异戊烯焦磷
酸异构酶基因的 cDNA序列全长 1 384 bp, 包含一个 906 bp的 ORF,编码 301个氨基酸。大豆 IP I酶为一亲水性的非分泌蛋
白, 螺旋和无规则卷曲是其主要的二级结构,该酶定位于叶绿体。
关键词: 大豆 异戊烯焦磷酸异构酶 电子克隆 生物信息学分析
E lectronic C loning and Bioinformatical Analysis of
IPI Gene from Glycinemax
W eiQ ichao
1
Chang L ip ing
2
XueX iaofeng
1
Zhou Yan
1
(
1
Schoo l of L ife Science and T echnology, H enan Institute of Science and T echnology, X inx iang 453003;
2
D epar tment of Build ing Engineering, X inx iang University, X inx iang 453003)
Abstrac:t An cDNA sequence of isopenteny l d iphosphate isom e rase( IP I) g ene from G lycine max w as cloned by e lectronic c lo
n ing. Som e characte rs o f the IP I and encoded pro te in sequence w ere pred icted and ana ly zed by the m ethods of b io inform a tics in the
fo llow ing aspec ts, inc lud ing the general physica l and chem ical prope rties, hydrophob ic ity, s ignal peptide, secondary structure and lo
ca lization sites in cells. Results show ed tha t the fu lllength o f IP I from G lycine max w as 1 384 bp long and con tained a com plete ORF
( 906 bp) wh ich encoded 301 am ino ac id. The isopenteny l d iphospha te isom erase ( IP I) o fG ly cine m ax w as a dydroph ilic and
Nonsec re tory prote in, w h ich loca ted in ch lo rop last. The m a in secondary structure e lem ents of IP I w ere a lpha he lix and random
co i.l
Key words: Glycine max Isopenteny l d iphosphate isom erase( IP I) E lectronic c lone B io info rm atics ana lysis
收稿日期: 20100720
基金项目:教育部回国留学人员科研启动基金项目 (教外司留 [ 2008] 890 ),河南省科技厅基础与前沿技术研究计划项目 ( 072300430120 )
作者简介:魏琦超,男,讲师,硕士,研究方向: 植物分子生物学与基因工程; Em ai:l w eiqc@ 126. com
通讯作者:周岩,女,教授,博士,研究方向: 植物分子生物学与基因工程; Em ai:l yanzhou68@ 126. com
萜类化合物 ( terpeno ids)是自然界中分布广泛、
种类繁多、骨架庞杂且具有广泛生物活性的一类重
要成分。至 1997年, 此类化合物已发现 26万种以
上 (包括部分合成物 ) [ 1]。1953年, Ruzicka[ 2]提出了
生源的 异戊二烯法则 ( biogenet ic isoprene ru le ) !。
在萜类化合物的生物合成中,首先合成活性异戊烯前
体物,即由乙酰辅酶 A ( acety lCoA )与乙酰乙酰辅酶
A ( acetoacety lCoA)生成 3羟基 3甲基戊二酸单酰
辅酶 A( 3hydroxy3methy lglutary l CoA, HMGCoA ) ,
后者还原生成甲戊二羟酸 (MVA )。MVA经数步反
应转化成异戊烯焦磷酸 ( isopenteny l d iphosphate,
IPP) , IPP再经硫氢酶 ( sulphydry l enzym e)及异戊烯
焦磷酸异构酶 ( isopentenyl diphosphate isom erase,
IPI)转化为其同分异构体二甲基丙烯焦磷酸 ( dim e
thy lallyl diphosphate, DMAPP)。 IPP和 DMAPP两者
均可转化为半萜,并在酶的作用下,头 -尾相接缩合
为焦磷酸香叶酯 ( gerany l pyrophosphate, GPP), 衍生
为单萜类化合物, 或继续与 IPP分子缩合衍生为其
2010年第 11期 魏琦超等:大豆异戊烯焦磷酸异构酶基因的电子克隆及生物信息学分析
他萜类物质 [ 3]。目前,已有 50余种绿色植物的 IPI
基因被克隆, 如金盏花 ( Adon is aestivalis )、杧果
(Mangifera ind ica)、拟南芥 (Arabidop sis thaliana )、喜
树 ( Camp totheca acum inata )、烟草 (N icotiana taba
cum )
[ 4- 8]等。
本研究以拟南芥 IPI基因为探针, 搜索到多条
大豆 (G lycine max )的 EST序列,在此基础上利用电
子克隆方法识别获得了一条大豆 IPI基因序列, 并
对该基因及其编码蛋白进行生物信息学分析。
1 材料与方法
11 大豆 IPI基因的电子克隆
以拟南芥已知的 IPI基因 ( AY065053)为探针,
通过 BLASTN程序 [ 9]搜索 GenBank的大豆 EST数
据库。利用 V ector NTI Suite 9软件中的 ContigEx
press程序对搜索到的与 AY065053序列相似性较高
的大豆 EST序列进行拼接。以新获得的序列重叠
群为探针重复进行上述步骤, 直至不能获得延伸
为止。
12 大豆 IPI基因开放阅读框的确定及基因功能
预测
利用 NCB I网站的在线工具 ORF F inder( ht
tp: / /www. ncb.i n lm. n ih. gov /gorf /gor.f h tm l)分析拼
接好的大豆 EST重叠群, 以获取其开放阅读框的
位置信息。在此基础上, 将开放阅读框的核苷酸
序列翻译成氨基酸序列, 并将该氨基酸序列应用
BLA STP程序 [ 9, 10 ]搜索 GenB ank的 Nonredundant
pro te in sequences( nr)数据库, 以检查大豆 EST重
叠群在拼接过程中有无移码突变并根据搜索到的
同源蛋白序列的注释信息判定该 EST重叠群编码
产物的功能。
13 大豆 IPI基因编码蛋白质的生物信息学分析
用 ExPASy 网站 [ 11, 12 ] 的在线工具 ProtParam
( http: / /cn. expasy. org / too ls/pro tparam. htm l)分析
大豆 IPI基因编码蛋白质的氨基酸残基性质、分子
量及理论等电点等信息, 并用在线工具 Pro tScale分
析蛋白质的疏水性质。利用在线工具 S igna lP3 0
Server
[ 13]进行大豆 IPI基因编码蛋白质的信号肽分
析。利用在线工具 PSORT ( http: / /psor.t im s. utoky
o. ac. jp / )对大豆 IPI基因编码蛋白质的亚细胞定位
进行预测。
2 结果与分析
21 大豆 EST数据库的检索结果
以拟南芥已知的 IPI基因 ( AY065053)为探针,
应用 BLASTN程序搜索 GenBank的大豆 EST数据
库。EST是单次测序的结果,存在序列精确度较低,
重复结果多等缺陷。根据前人经验 [ 14, 15] , 选取 Score
值∀ 100,对齐长度∀ 100 bp的 91条大豆 EST序列
进行拼接。
22 IPI基因同源大豆 EST序列的拼接
利用 V ectorNTI Suite 9软件中的 Cont igExpress
程序对搜索到的上述 91条大豆 EST 序列进行拼
接,获得一个序列重叠群。将该序列重叠群作为查
询序列, 使用 BLASTN程序搜索 N uc leotide co llection
( nr /nt)数据库, 获得一致率较高 ( ∀ 93% )、由大豆
EST序列拼接,但无基因功能注释信息的 3条核酸
序列 ( BT088826、BT093805、AK287405)。以该 3条
核酸序列为参考,对大豆 EST的序列重叠群中两处
简并碱基进行校正, 最终获得了一条长度为 1 384
bp的大豆 EST序列重叠群 (图 1)。
23 IPI基因同源大豆 EST序列重叠群开放阅读
框的分析
利用在线工具 ORF F inder( http: / /www. ncb.i
n lm. n ih. gov /gorf /go r.f htm l)分析大豆 EST序列重
叠群的开放阅读框。结果 (图 1)表明,该序列包含
一个 906 bp的开放阅读框 ( 68 - 973位碱基 )。该
开放阅读框编码 301个氨基酸, 起始密码子符合
KOZAK规则 [ 14 ]。进一步分析发现, 在终止密码子
下游存在一个加尾信号。
24 开放阅读框编码氨基酸序列推测及功能鉴定
将 906 bp的开放阅读框序列翻译成氨基酸序
列 (图 2)。为验证该氨基酸序列的功能, 以其为查
询序列,使用 BLASTP程序搜索 GenBank的 Nonre
dundant protein sequences( nr)数据库。结果表明,该
氨基酸序列与葛藤 (Pueraria montana var. lobata,
AAQ 84167)、喜树 ( O48965 )、烟草 ( BAB40973)、番
茄 ( So lanum lycopersicum, ACS34993 )等物种的 IPI
酶具有同源性 ( ∀ 78% )。由此判定, 我们获得了一
条拼接正确的大豆 IPI基因 cDNA序列。
97
生物技术通报 B iotechnology Bulletin 2010年第 11期
图 1 拟南芥 IPI基因同源大豆 EST序列重叠群
图 2 开放阅读框编码氨基酸序列的预测
25 大豆 IPI酶理化性质分析
综合应用 ExPASy网站在线程序, 分析大豆 IPI
酶的理化性质。编码氨基酸残基数目: 301,相对分
子量: 3415 kD,理论等电点: 589, 负电荷残基数目
(A sp+ G lu) : 41, 正电荷残基数目 ( A rg+ Lys): 34,
分子式: C1523H2387N419O452 S11。
26 大豆 IPI酶疏水性分析
用 Pro tSca le对大豆 IPI酶氨基酸序列的疏水性 /
亲水性进行分析,结果 (图 3)表明,多肽链 221位的
亮氨酸 ( Leu)疏水性最强 (疏水参数: 1662), 213位
色氨酸 ( T rp)亲水性最强 (疏水参数: - 2233)。整条
多肽链表现为亲水性,平均疏水性 ( Grand average o f
hydropathicity, GRAVY): - 0253。
27 大豆 IPI酶二级结构分析
利用在线工具 GOR4( http: / /npsapbi.l ibcp. fr /
cg ibin /npsa_ automa.t p l page = /NPSA /npsa_ gor4.
htm l)分析大豆 IPI酶的二级结构,结果 (表 1)表明,
有多个氨基酸残基参与了 螺旋 ( he lix )、股
( strand)和无规则卷曲 ( random co il)等二级结构。
利 用 PSIPRED ( http: / /b io in.f cs. uc.l ac. uk /
psipred / )分析表明,该蛋白质共有 12个 螺旋, 19
个 股和 26个无规则卷曲。
98
2010年第 11期 魏琦超等:大豆异戊烯焦磷酸异构酶基因的电子克隆及生物信息学分析
图 3 大豆 IP I酶疏水性图
表 1 大豆 IP I酶二级结构预测
二级结构类型 氨基酸残基数 百分比 (% )
螺旋 107 3555
股 53 1761
无规则卷曲 141 4684
28 大豆 IPI酶信号肽分析
用在线工具 S igna lP 3 0 Server的神经网络法
对大豆 IPI酶的信号肽进行预测 (图 4) ,由于其 5项
指标: m ax. C、max. Y、max. S、m ean S、m ean D的得分
均低于其相应的 Cu toff值,因此判定大豆 IPI酶是非
分泌蛋白, 其在细胞质中合成后, 不进行蛋白质的
外运。
图 4 大豆 IPI酶信号肽预测
29 大豆 IPI酶的亚细胞定位分析
植物中, IP I基因多以基因家族的形式存在, IP I
酶定位于细胞质、线粒体、过氧化物酶体和质体等部
位 [ 17, 18 ]。利用 ExPASy网站的在线工具 TargetP分
析大豆 IPI酶的亚细胞定位, 结果 (表 2)表明该酶
定位于细胞的叶绿体中。叶绿体是植物细胞中结构
较为复杂的细胞器,为了更精细地确定由电子克隆
方法得到的该大豆 IPI酶的定位信息, 用在线工具
PSORT ( h ttp: / /psor.t im s. utokyo. ac. jp / form. htm l)
进行分析,结果表明该蛋白定位于叶绿体基质、类囊
体膜和类囊体基质的得分分别为 0607、0345
和 0345。
表 2 大豆 IPI酶的亚细胞定位预测
定位 叶绿体 线粒体 分泌蛋白 其他
得分 0964 0073 0003 0017
Cu toff值 0000 0000 0000 0000
3 讨论
电子克隆是以一条种子序列检索 EST 数据
库,将获得的 ESTs拼接成序列重叠群, 然后以该
重叠群为新的种子再次进行 EST数据库的检索和
序列拼接,直到序列重叠群不能再延伸为止,最后
得到的序列重叠群是比原来 EST更长的新序列。
截至 2010年 6月 25日, EST数据库共收录 EST序
列 66 043 262条, 其中大豆 1 459 639条。随着基
因组计划的进展及 EST数据库的迅速扩展, 没有
被 EST项目检测过的基因将会越来越少, 采用基
于 EST拼接的同源基因克隆方法, 为电子克隆基
因提供了一个新的思路。
本研究采用电子克隆的方法获得了一条由拟南
芥 IPI基因同源大豆 EST序列拼接而成的重叠群,
经对 GenBank数据库的检索表明, 该重叠群为一条
新的大豆 IPI基因 cDNA序列, 为实验室克隆全长
的大豆 IPI基因 cDNA奠定了基础。在此基础上,
还对 cDNA序列编码 IPI酶的理化性质、二级结构、
亚细胞定位等进行了生物信息学分析, 其分析结果,
有助于加深对 IPI酶性质的了解, 对进一步利用生
物化学方法研究该酶的分离纯化、酶活特性等有一
定的指导意义。
参 考 文 献
[ 1] 匡海学.中药化学 [M ] . 北京: 中国中医药科技出版社, 2003:
181225.
99
生物技术通报 B iotechnology Bulletin 2010年第 11期
[ 2] Ru zicka L. The isopren e ru le and the b iogen es is of terpen ic com
pounds. E xperien tia, 1953, 9 ( 10) : 357367.
[ 3] 吴立军.天然药物化学 (第 5版 ) [M ] .北京: 人民卫生出版社,
2008: 215265.
[ 4] Cunn ingham FX Jr, Gan ttE. A portfolio of p lasm id s for id ent if icat ion
and an alysis of carotenoid pathw ay en zym es: Ad onis aestiva lis as a
case study. Photosynthes is Research, 2007, 92( 2) : 245259.
[ 5] Pand itSS, Kulkarn iRS, G iriAP, et a.l Expression prof iling of various
genes du ring the fru it d evelopm ent and rip en ing of m ango. P lan t
Physiology B iochem istry, 2010, 48( 6) : 426433.
[ 6] C am pb ellM, H ahn FM, Pou lter CD, et a.l An alysis of the isopen tenyl
d iphosphate isom erase gene fam ily from Arabid opsi s tha liana. P lan t
M olecu lar B iology, 1998, 36( 2) : 323328.
[ 7] Pan X, Ch enM, L iu Y, et a.l A n ew isopentenyl d iphosphate isom er
ase gene from Camptoth eca acum inata: clon ing, characterization and
functional exp ress ion in E sch erichia col i. DNA Sequen ce, 2008, 19
( 2) : 98105.
[ 8] Nakamu ra A, Sh im ada H, M asuda T, et a.l Two d ist inct isopen tenyl
d iphosphate isom erases in cytosol and p last id are d ifferen tially in
duced by env ironm en tal stresses in tobacco. FEBS Letters, 2001, 506
( 1) : 6164.
[ 9] A ltschu l SF, M add en TL, S chf fer AA, et a.l Gapped BLAST and
PS IBLAST: a new generation of protein database search program s.
NucleicA cids Research, 1997, 25( 17 ) : 33893402.
[ 10] A ltschul SF, Wootton JC, G ertzEM, et a.l Protein datab ase searches
us ing compos it iona lly ad jus ted sub stitut ionm atrices. FEBS Journa,l
2005, 272( 20 ): 51015109.
[ 11] G asteiger E, Gatt ikerA, H oogland C, et a.l E xPASy: th e p roteom ics
server for indepth p rotein know ledge and analys is. Nucleic A cids
Research, 2003, 31( 13 ) : 37843788.
[ 12] Walker JM. The Proteom ics Protoco ls H andb ook [M ] . New Jersey:
H um ana Press, 2005: 571607.
[ 13] Bend tsen JD, N ielsenH, vonH eijn eG, et a.l Imp roved p red ict ion of
s ignal pept ides: S ignalP 30. Journal ofM olecu lar B iology, 2004,
340( 4) : 783795.
[ 14] 邵筱,余新炳,吴忠道,等.日本血吸虫 (大陆株 )成虫表达序列
标签的获取及电子延伸. 中国地方病学杂志, 2004, 23 ( 4 ):
297299.
[ 15] 邵筱,吴忠道,刘翰腾,等.应用 EST和电子克隆策略研究血吸
虫表达基因谱.基础医学与临床, 2005, 25 ( 7) : 602606.
[ 16] K ozakM. Com p ilat ion and analys is of sequen ces upstream from the
translational start s ite in eukaryotic mRNA s. Nucleic Acid s Re
search, 1984, 12 ( 2) : 857872.
[ 17] RamosV ald ivia AC, van der H eijd en R, Verpoorte R. Isopen teny l
d iph osphate isom erase: a core enzym e in isoprenoid biosyn th es is. A
review of its b iochem istry and funct ion. Natural Produ ct Reports,
1997, 14( 6 ) : 591603.
[ 18] Cunn ingham FXJr, Gan ttE. Iden tif icat ion ofm u ltigene fam ilies en
cod ing isopen teny l d iphosphate isom erase in plan ts by heterologous
com p lem en tat ion in E scherich ia coli. Plant & C ell Physiology,
2000, 41( 1 ) : 119123.
(上接第 95页 )
[ 5] Ph elanML, S if S, N arlikar G J, et a.l Reconst itu tion of a core ch rom a
tin remodeling com plex from SW I/SNF subun its. M ol Cel,l 1999, 3
( 2) : 247253.
[ 6] Sridh a S, Wu K. Iden tificat ion ofA tHD2C as a novel regu lator of ab
scisic acid respon ses in Arabid opsis. P lan t J, 2006, 46 ( 1) : 124133.
[ 7] G eng F, Cao Y, Lau rent BC. Essen tia l roles of Snf5p in Sn f /Sw i ch ro
m at in remodeling in vivo. M olC ell B io,l 2001, 21( 13 ) : 43114320.
[ 8 ] Neely KE, H assan AH, Brown CE, et a.l T ranscript ion activator in ter
act ion s w ith mu ltiple SW I/SNF subun its. M ol Cel l B io,l 2002, 22
( 6) : 16151625.
[ 9 ] Proch asson P, Neely KE, H assan AH, et a.l Targeting act ivity is re
qu ired for SW I /SNF funct ion in v ivo and is accomp lish ed th rough tw o
part ial ly redund ant activatorin teract ion dom ains. M ol C el,l 2003, 12
( 4) : 983990.
[ 10 ] C heng SW, Davies KP, Yung E, et a.l cMYC in teracts w ith IN I1 /
hSNF5 and requ ires th e SW I/SNF comp lex for transact ivat ion func
tion. NatG enet, 1999, 22: 102105.
[ 11 ] Brzesk i J, Pods tolsk iW, O lczak K, et a.l Iden tif icat ion and analys is
of th eArabidopsis thal iana BSH gene, a m em ber of the SNF5 gene
fam ily. Nucleic A cids Res, 1999, 27 ( 11) : 23932399.
[ 12 ] E stelleM , Som ervil le C. Aux inres istan tm utan ts ofArabidopsis tha li
ana w ith altered m orphology. M ol Gen Genet, 1987, 206 ( 2 ):
200206.
[ 13 ] Ros G, G agete AP, Castil lo J, et a.l Abscisic acid and desiccat ion
depend ent expression of a n ovel pu tat ive SNF5type ch rom atinre
m odeling gene in P isum sa tivum. Plant Physiol B iochem, 2007, 45
( 67) : 427435.
[ 14 ] Podell S, G ribskov M. Pred icting Nterm inal myristoylat ion s ites in
p lan t p rote ins. BMC Gen om ics, 2004, 5: 3751.
100