免费文献传递   相关文献

丹参晚期胚胎蛋白基因SmLEA的克隆及表达分析



全 文 :研究报告
生物技术通报
BIOTECHNOLOGY BULLETIN 2009年第 5期
丹参晚期胚胎蛋白基因 SmLEA的克隆及表达分析
刘丛玲  王喆之
(陕西师范大学生命科学学院 药用植物资源与天然药物化学教育部重点实验室 西北濒危药材资源开发国家工程实验室,西安 710062 )
  摘  要:  对丹参 EST序列进行 B last分析, 发现一条序列与晚期胚胎丰富蛋白 ( late em bryogenesis abundant)基因有较高
的相似性, 在此基础上设计引物, 分别从 cDNA和 gDNA水平克隆到该基因的全长 ( Genbank注册号: AY725206) , 命名为
SmLEA。该序列全长 739 bp, 无内含子,包含 1个长为 495 bp的开放阅读框,编码 164个氨基酸。序列比对结果显示, 该序列
与番茄的晚期胚胎丰富蛋白 Lemm i9有较高的相似性 ( 69% ) ,推测该编码蛋白属于晚期胚胎蛋白 LEA14家族成员。生物信息
学显示, SmLEA所编码蛋白 SmLEA的相对分子质量为 1734 kD, 理论等电点为 451, 富含天冬氨酸及 AS、IP、KV、VS、T IP肽
段, 定位于细胞质中,为稳定类蛋白。实时荧光定量 PCR结果显示, 该基因在丹参的根、茎、叶中均有表达, 为组成型表达
基因。
关键词:  晚期胚胎丰富蛋白  生物信息学  组成型基因  丹参
C loning and Expression Analysis of SmLEA
from Salvia m iltiorrhiza Bunge
L iu Congling W ang Zhezhi
(College of Life Sciences, Shaanx iN ormal University, K ey Laboratory of M ed icinal P lant Resources and Natural
Pharmaceutical Chem istry, M inistry of Education, N ational Engineering Laboratory forResourceD evelop ing of
Endangered Chinese Crude D rugs in N orthw est of China, X ian 710062)
  Abstrac:t  By ana ly zing EST sequences of Salvia m iltiorrh iza , one sequences w hich show ed high hom ologyw ith late em bryogene
sis abundant pro teins were found The fu lllength cDNA and DNA sequence o f the gene w ere c loned and nam ed as SmLEA ( GenBank
accession number: AY725206)SmLEA consists o f 739 nuc leo tides, includ ing a sing le 495 bp open ing reading fram e and encod ing 164
am ino acidpeptide w ithout introns SmLEA shared high am ino ac id sequence hom o logy ( 69% ) w ith Lemm i9, a tom ato la te em bryo
genesis abundant pro te in and cou ld be c lassified into the LEA14 fam ily accord ing to its sequence cha racte rization B io inform atics ana ly
sis show ed that SmLEA w ith a ca lcu lated m o lecular mass o f 1734 kD and a theo re tica l isoe lectr ic po in t of 451, w as r ich in aspartic
and AS, IP, KV, VS, T IP peptide It located in cytop lasm and be longs to stable pro te inReal tim e PCR results indicated Sm lea w as a
constitute expression gene wh ich expressed in roo ts, stem s and leaves of Sm iltiorrhiza
Key words:  La te emb ryogenesis abundant prote in B io inform atics Constitute expression gene Sm iltiorrhiza
收稿日期: 20081111
作者简介:刘丛玲 ( 1985) ,女,在读研究生,研究方向:植物生物技术
通讯作者:王喆之,教授,博士生导师, Em ai:l zzw ang@ snnu edu cn
  晚期胚胎富集蛋白 ( late embryogenesis abundant
protein, LEA )是指胚胎发育后期种子中大量积累的
一系列蛋白质,它不仅广泛存在于高等植物发育种子
中 [ 1] ,还在细菌 [ 2, 3]、酵母 [ 4]、绿藻 [ 5]和线虫 [ 6~ 9 ]等物
种中均有发现。根据W ise[ 10]的分类方法, LEA蛋白
可分为 9组,分别为 D19 LEA (第 1组 )、D11 LEA (第
2组,又称脱水素 )、D7LEA (第 3组 )、D113 LEA(第 4
组 )、D29 LEA (第 5组 )、D34 LEA (第 6组 )、D73 LEA
( Lea 5组 )、D95 LEA ( Lea 14组 )和其它。
目前, 晚期胚胎富集蛋白基因的研究已经成为
逆境生理学研究的热点之一 [ 1]。从目前研究现状
来看,大多数 LEA蛋白具高度的亲水性, 能把足够
的水分捕获到细胞内,从而保护细胞免受水分胁迫
的伤害, 但其具体生理和生化功能仍旧未知 [ 11, 12]。
2009年第 5期 刘丛玲等 :丹参晚期胚胎蛋白基因 SmLEA的克隆及表达分析
LEA蛋白的表达还受外源脱落酸 ( ABA )、低温、脱
水信号等因素的诱导 [ 13]。 Sivam ani[ 14]将大麦 HVA 1
基因转入小麦,使转基因小麦的抗旱性得到了提高。
K im等 [ 15]将 CaLEA6基因转入辣椒中, 获得的转基
因辣椒对干旱和盐渍的耐受力提高。 Imai等 [ 16 ]将
番茄 L ea25基因导入酿酒酵母能提高其抗寒能力。
进而推测, LEA蛋白可能在植物的耐旱、耐盐、耐寒
方面发挥重要作用。
丹参 ( Salvia m iltiorrhiza Bunge)为唇形科鼠尾
草属多年生草本药用植物, 在治疗心脑血管疾病中
有显著的作用 [ 17]。本研究从丹参中克隆到了晚期
胚胎丰富蛋白基因, 并检测了其在丹参不同器官中
的表达特性,为培育丹参抗旱新品种奠定了一定的
基础。
1 材料与方法
11 材料
丹参种子种于含蛭石的营养钵中,放于人工气候
箱 (宁波江南仪器厂, 型号为 RXZ500D )中培养 (温
度 25  2 ,湿度 48%,光照强度 216 mo l m2  s1,
光照时间 16 h d1 ),待长出 6片真叶时备用。
12 丹参总 RNA的提取及 cDNA第一链的合成
用 pB iozo l试剂 ( B ioF lux公司 )提取丹参根、茎、
叶的总 RNA,以提取的总 RNA为模板,按照 B io RT
逆转录试剂盒 (杭州博日科技有限公司 )说明合成
丹参 cDNA第一链。
13 DNA的提取
采用常规的 CTAB法 [ 18]提取丹参 DNA。
14 SmLEA 基因的克隆
依据丹参 EST序列,采用 Prem ier Primer 50软
件设计一对特 异性引物 ( 5ATGGAGCTCTTG
GAGAAGGCGAA3和 5TTCCCGGCCTTATCCATG
CAA3)。分别以丹参 cDNA和 gDNA为模板, 扩增
SmLEA片段。反应程序为 95 变性 3 m in; 95 变
性 30 s, 68 退火 30 s,每次下降 1 ,直到 63 ,每
个温度循环 2次, 72 延伸 1 m in, 95 变性 30 s,
63 退火 30 s, 72 延伸 1m in, 20个循环; 72 延伸
10 m in。PCR扩增产物经胶回收 (安徽优晶生物工
程有限公司 )与 PMD19T simp le vector (宝生物公
司 )连接转化大肠杆菌 DH5,送至上海桑尼测序公
司测序。
15 SmLEA蛋白的生物信息学分析
番茄 (Solanum ly copersicum ) ( Z46654),大豆 (Glycine
max ) (U08108),棉花 (Gossyp ium hirsutum ) (M88322), 辣
椒 (Capsicum annuum ) ( AF168168), Lindernia brevidens
( EF364563), Craterostigma p lantagineum ( M62990), 拟
南芥 (Arabidop sis thaliana ) ( NM 100029)中晚期胚胎
富集蛋白的氨基酸序列来自于 NCB I核酸数据库,根
据生物信息学软件进行在线分析 http: / /www. ncb.i
nlm. n ih. gov /、http: / /www. cbs. dtu. dk /、http: / /cn.
expasy. org /、http: / /psor.t n ibb. ac. jp /。用 DNA star、
Prot Param进行开放阅读框的查找和翻译,氨基酸序
列的组成成分、理化性质分析; 用 B last和 C lustalW 2
在线工具完成氨基酸序列的同源性比对和多序列比
对; 用在线工具 PSORT、TMHMM 20 Server、Prot
Scale、SOPMA、Sw issM ode l完成蛋白质亚细胞定位,
跨膜结构域、亲水 /疏水性、二级结构和三维结构的
分析。
16 SmLEA基因的表达分析
以丹参根、茎、叶的 cDNA为模板进行荧光定量
PCR反应。进行实时荧光定量 PCR检测时,以丹参持
家基因 GAPDH ( glyceraldehyde 3phosphate dehydrogen
ase, 3磷酸甘油醛脱氢酶 ) (引物: 5CCACCGTC
CACTCCATCACT3和 5TGGGAACT CGGAACGAC
ATAC3)为内参, 检测 SmLEA (引物: 5TCACGTCTC
CAACCCGTA3和 5CTCAAGGTGGGTGCTGTCG3)的
表达量。反应条件: 95 变性 3 m in; 95 变性 10 s,
60 退火 20 s, 40个循环。每个样品 3个重复。
2 结果与讨论
21 SmLEA基因的克隆
在 cDNA和 gDNA水平上克隆到 SmLEA 全长,
序列分析显示,该基因全长 739 bp, 包含 1个长 495
bp的开放阅读框, 与原 EST序列相比缺少 3个碱
基, 共编码 164个氨基酸,无内含子。
22 不同植物来源的 LEA蛋白氨基酸序列的比对
分析
用 B lastp程序对 SmLEA蛋白氨基酸序列进行
比对,结果表明 SmLEA蛋白氨基酸序列和已注册的
其他植物, 如番茄、大豆、棉花、辣椒、Lbrevidens、
Cplantagineum的 LEA蛋白的氨基酸序列有较高的相
似性,分别为 69%、64%、64%、62%、61%和 60%。利用
81
生物技术通报 B iotechnology  Bulletin 2009年第 5期
MDL2000; 1, 2扩增的 cDNA序列; 3, 4扩增的 DNA序列
图 1 PCR扩增结果
图 2 SmLEA的 cDNA序列及其编码的氨基酸序列
C lustalW2对丹参和番茄、大豆、棉花、辣椒、L. brevi
dens、C. p lantagineum的 LEA蛋白的氨基酸序列进行多
序列比对,结果 (图 3)显示,这 6种植物的 LEA蛋白的
氨基酸除 C端外都较为保守, 用 B lastConserved Do
mains Search进行结构域分析时,发现丹参及其它 6种
植物都具有 LEA2结构域 (图 4),根据W ise的分类方
法 SmLEA应属于 LEA14家族。
23 不同植物来源的 LEA蛋白对应的氨基酸组成
成分和理化性质分析
根据 Prot Param软件 ( http: / /cn. expasy. org /网站
提供 )对丹参、拟南芥、番茄、大豆、棉花、C. p lantagine
um中晚期胚胎富集蛋白的氨基酸序列分析结果 (表 1)
表明,拟南芥、大豆、棉花、Cplantagineum的 LEA的氨
图 3 SmLEA蛋白与其它植物 LEA的多序列比对
图 4 SmLEA蛋白的功能域预测
基酸残基数相近, 番茄的较多, 丹参的介于其中。 6
种蛋白都为稳定性蛋白,这也是 LEA蛋白最大的特
点。富含天冬氨酸及 AS、IP、KV、VS、TIP肽段,精氨
酸含量较少是 LEA 14家族蛋白的普遍特征 [ 10] ,
SmLEA也符合此特征。
24 SmLEA蛋白氨基酸序列的亲水性 /疏水性、跨
膜结构域及亚细胞定位分析
蛋白质的折叠总是倾向于把疏水残基埋藏在分
子的内部, 蛋白质的亲水性 /疏水性预测, 对于蛋白
质的三维结构的预测提供了理论参考。利用
Pro tScale预测 SmLEA蛋白的氨基酸序列的亲水性 /
疏水性,结果显示该蛋白为疏水性蛋白, 这是含有
LEA2结构域家族共同的特征, 也是区别于其它
LEA家族的显著特征 [ 11] ,这预示着该家族蛋白在保
护细胞脱水方面存在的不同作用机制。
利用 TMHMM 20 Server程序对 SmLEA蛋白的
跨膜结构域进行分析,结果显示该蛋白无跨膜区域。
82
2009年第 5期 刘丛玲等 :丹参晚期胚胎蛋白基因 SmLEA的克隆及表达分析
表 1 不同植物中 LEA蛋白的理化性质比较
不同 LEA蛋白 LEA Lea14 Lemm i9 D954 Lea14A pcC2745
物种 丹参 拟南芥 番茄 大豆 棉花 Cp lan tag ineum
氨基酸数 ( aa) 164 151 174 152 151 151
分子量 ( kD) 1734 1654 1912 1649 1642 1627
理论等电点 451 474 46 494 484 590
部分氨基酸比例和肽段数目 D 67% D 106% D 98% D 92% D 86% D 73%
AS 2 AS 1 AS 1 AS 3 AS 3 AS 2
IP 3 IP 5 IP 4 IP 3 IP 3 IP 3
KV 2 KV 1 KV 3 KV 3 KV 3 KV 2
VS 1 VS 1 VS 3 VS 3 VS 5 VS 2
TIP 2 T IP 1 T IP 1 TIP 2 T IP 2 T IP 1
R 12% R 20% R 17% R 13% R 20% R 20%
碱性氨基酸比例 (% ) 73 106 115 105 99 113
酸性氨基酸比例 (% ) 134 152 184 132 139 126
蛋白质不稳定性指数 (% ) 1294属于稳定类蛋白
1079
属于稳定类蛋白
2647
属于稳定类蛋白
1937
属于稳定类蛋白
1930
属于稳定类蛋白
925
属于稳定类蛋白
D天冬氨酸; A丙氨酸; S丝氨酸; I异亮氨酸; P脯氨酸; K赖氨酸; V缬氨酸; T苏氨酸; R精氨酸
  蛋白质在细胞中的定位与其所发挥的作用是密
切相关的。在所报道的有关 LEA蛋白的亚细胞定
位的文献中,软件预测和试验证据都表明不同家族
的 LEA蛋白在细胞中的定位是不同的。譬如拟南
芥中含有 LEA4结构域的 LEA蛋白经预测定位在
细胞质中 [ 11] , COR15A经试验证明定位于叶绿体基
质 [ 19] , RAB28则定位于细胞核中 [ 20 ]。细胞中不同
的定位预示了它们可能有不同的作用方式。利用
PSORT程序对丹参 LEA蛋白进行定位的结果显示,
该蛋白分布于细胞质中, 初步判断该蛋白在细胞质
中发挥作用。
25 SmLEA蛋白高级结构的预测
蛋白质的生物功能决定于它的高级结构, 蛋白
质的高级结构的预测对于理解蛋白质功能有一定的
意义。利用 SOPMA程序对 SmLEA蛋白的二级结
构进行预测, 结果显示该蛋白的二级结构由
4634%的不规则卷曲、2744% 的延伸链、2256%
的 螺旋和 366%的 转角构成,不规则卷曲是该
蛋白二级结构的主要成分。据研究报道, LEA蛋白
的 螺旋和不规则卷曲可能在束缚盐离子和水分
子方面起着重要的作用 [ 21, 22]。
采用 Sw issModel对 SmLEA蛋白氨基酸序列进
行蛋白质三级结构预测并结合 MoMl o l 12视图软
件得到该蛋白质的三维结构 (图 5), 显示其三维结
构中含有 2个 螺旋和 9个 折叠, 折叠呈反向
平行,这与由试验证实的拟南芥中 LEA14蛋白的三
维结构相似 [ 23]。而且, 拟南芥 LEA14蛋白在自然
条件下具有三级结构,而第一家族和第二家族的蛋
白大部分都被证实在自然状况下是不具有三级结构
的 [ 24~ 26] ,这进一步揭示了该家族蛋白的功能特征。
图 5 SmLEA蛋白的三维结构
26 SmLEA基因的表达分析
以丹参 GAPDH 基因为内参, 进行 SmLEA 基因
的荧光定量分析,结果显示, 该基因为构成型表达基
因, 在丹参的根、茎、叶中均有表达,以根中表达最丰
富, 其次是叶中, 茎中表达量最低。据报道,拟南芥
中 LEA 14 家族的蛋白在 其根、茎、叶中 均有
表达 [ 27]。
83
生物技术通报 B iotechnology  Bulletin 2009年第 5期
图 6 SmLEA在丹参不同器官的表达量
3 总结
本研究从丹参中克隆到了 SmLEA, 它可能属于
LEA14家族成员。该蛋白和该家族其它蛋白具有
相似的特征,对该蛋白的生物信息学分析和表达特
征的分析为该蛋白可能不同于 LEA蛋白其它家族
的功能特点的研究奠定了一定的基础。
参 考 文 献
1 詹立平,赵鑫,邹学忠 吉林林业科技, 2007, 36 ( 2) : 1~ 4
2 Batt is ta JR, ParkM J, M cLemoreAE C ryob iology, 2001, 43 ( 2) :
133~ 139
3 S tacy RA, Aalen RB Planta, 1998, 206 ( 3) : 476~ 478
4 S alesK, BrandtW, Rumbak E, et a lB ioch im B iophys A cta, 2000,
1463 ( 2) : 267~ 278
5 H on joh K I, M atsum oto H, Sh im izu H, et alB iosci B iotechnol B io
ch em, 2000, 64 ( 8) : 1656~ 1663
6 Brown e J, Tunnacliffe A, Bu rn ellANature, 2002, 416( 6876) : 38
7 B row ne JA, DolanKM, Tyson T, et alEukaryot ic C el,l 2004, 3 ( 4 ):
966~ 975
8 Gal TZ, G lazer I, Ko ltaiH J Parasito,l 2003, 89 ( 4) : 761~ 766
9 Gal TZ, G lazer I, Ko ltaiHFEBS Lett, 2004, 577 ( 1~ 2) : 21~ 26
10 W ise M JBM C B ioin form atics, 2003, 4: 52~ 70
11 Ingram J, B artels DAnnu Rev P lan t Phys iol P lantM ol B io,l 1996,
47: 377~ 403
12 H undertm arkM, H inch aDK BMC Genom ics, 2008, 9: 118~ 140
13 俞嘉宁,山仑 生物工程进展, 2002, 22 ( 2 ): 10~ 14
14 S ivam an iE, Bah ield in A, et alPlant Sc,i 2000, 155 ( 1) : 1~ 9
15 K im HS, Lee JH, et alGen e, 2005, 344: 115~ 123
16 Im aiR, Chang L, Oh ta A, et alGen e, 1995, 170 ( 2) : 243~ 248
17 黄芬 湖南中医药导报, 2004, 10 ( 7 ) : 69~ 71
18 Doyle JJ, Doyle JL Phytochem Bu l,l 1987, 19: 11~ 15
19 L in C, Thom ashow MF Plant Physio,l 1992, 99 ( 2) : 519~ 525
20 BorrellA, Cu tandaMC, Lumb rerasV, et alP lan tM olB io,l 2002,
50 ( 2 ) : 249~ 259
21 C arayArroyo A, Colm en eroF lores JM, C aroiarrub io A, C ovarrubias
AA J B iolchem, 2000, 275 ( 8) : 5668~ 5674
22 Sw ireC lark GA, M arcotleWR Jr P lan tM ol B io,l 1999, 39 ( 1 ):
117~ 128
23 S ingh S, Corn ilescu CC, TylerRC, et alProtein Sc,i 2005, 14 ( 10 ):
2601~ 2609
24 L isse T, Bartels D, Ka lb itzer HR, Jaen icke RB iol Chem, 1996, 377
( 9) : 555~ 561
25 S ou lages JL, K im K, W alters C, Cu shm an JCPlant Phys io,l 2002,
128( 3) : 822~ 832
26 S ou lages JL, K im K, A rrese EL, W alters C, C ushm an JCP lan tPhys i
o,l 2003, 131 ( 3 ) : 963~ 975
27 B iesE theve N, Gaub ierCom ella P, Debu resA, et alPlan tM olB io,l
2008, 67 ( 1~ 2) : 107~ 124
84