免费文献传递   相关文献

菘蓝色氨酸合成酶基因的克隆与生物信息学分析



全 文 :第42卷 第6期 陕西师范大学学报(自然科学版) Vol.42 No.6
 2014年11月 Journal of Shaanxi Normal University(Natural Science Edition) Nov.,2014 
文章编号:1672-4291(2014)06-0066-05
收稿日期:2014-07-25
基金项目:国家自然科学基金资助项目(31200221);中央高校基本科研业务费专项资金项目(GK201405001)
第一作者:杨树,男,博士研究生,研究方向为菘蓝转录组以及次生代谢.E-mail:bigtree_5308816@163.com
 *通信作者:李焘,女,副教授,博士.E-mail:litao@snnu.edu.cn
菘蓝色氨酸合成酶基因的克隆与生物信息学分析
杨 树,潘淑琴,张丽红,王喆之,李 焘*
(药用资源与天然药物化学教育部重点实验室,西北濒危药材资源开发国家工程实验室,
陕西师范大学 生命科学学院,陕西 西安710119)
摘 要:对菘蓝色氨酸合成酶基因IiTSA进行克隆,并对其进行生物信息学分析.结果表明:菘蓝
IiTSA基因全长2 111bp,包含8个外显子和7个内含子;cDNA全长1 035bp,编码311个氨基
酸,编码的蛋白定位在叶绿体基质中,是一种无信号肽和跨膜结构域的疏水性蛋白;二级结构主要
由α-螺旋、β-转角、延伸链和不规则卷曲组成;序列比对结果显示,菘蓝IiTSA核酸序列和氨基酸
序列与其他多种植物的TSA核酸序列和氨基酸序列均具有较高的同源性.
关键词:菘蓝;靛蓝;色氨酸合成酶;生物信息学
中图分类号:Q517;Q93.2  文献标志码:A
Gene cloning and bioinformatic analysis of tryptophan
synthase fromIsatis indigotica
YANG Shu,PAN Shuqin,ZHANG Lihong,WANG Zhezhi,LI Tao*
(Key Laboratory of the Ministry of Education for Medicinal Plant Resource and Natural
Pharmacentical Chemistry,National Engineering Laboratory for Resource Developing
of Endangered Chinese Crude Drugs in Northwest of China,School of Life Sciences,
Shaanxi Normal University,Xi′an 710119,Shaanxi,China)
Abstract:Tryptophan synthase gene fromIsatis indigotica was cloned,and its bioinformatic were ana-
lyzed.The results showed that the ful length of IiTSAis 211bp,and it contains 8exons and 7introns;
cDNA is 1 035bp in length,coding 311amino acids.Encoding protein is a hydrophobic protein located
in the chloroplast stroma without signal peptide and transmembrane domain.The secondary structure of
IiTSAmainly includes the alpha helix,beta corner,extension chains and irregular curly.The nucleic
acid sequence of IiTSAhas high homology with the nucleic acid sequence of TSA in other plants,and
the amino acid sequence also has high homology.
Key words:isatis indigotica;indigo;tryptophan synthase;bioinformatics
  菘蓝(Isatis indigotica Fort)是十字花科(Cru-
ciferae)菘蓝属(Isatis)两年生草本植物,主要分布
在河北、江苏、浙江、安徽等地;具有清热解毒、凉血
消斑的功效,是板蓝根、大青叶药材及其制剂的主要
来源[1];其有效成分包括生物碱类、有机酸类、氨基
酸类、喹唑酮类、芥子苷类及腺苷、多糖等,其中靛蓝
为菘蓝主要的次生代谢产物之一,靛玉红是靛蓝的
同分异构体.
关于靛蓝在植物体内的合成过程一直都是植物
学家关注的热点和难点.目前,微生物合成靛蓝的过
程已经十分明确,而大量的文献研究也表明,植物中
靛蓝的合成过程与微生物相类似[1].由色氨酸合成
途径产生的吲哚-3-甘油磷酸(indole-3-GP)在色氨
酸合成酶(TSA)的催化下形成靛蓝的起始物质吲
  第6期 杨树 等:菘蓝色氨酸合成酶基因的克隆与生物信息学分析 67 
哚[2];吲哚在细胞色素P450单加氧酶(CYP)的催
化下形成吲哚酚[3];吲哚酚在 β-D-葡萄糖苷酶
(GLU)的催化下形成一系列靛蓝的前体物质[4],并
最终合成靛蓝类色素物质.因此,色氨酸合成酶
(TSA)在靛蓝合成过程中扮演了十分重要的
角色[5-6].
目前,关于菘蓝中靛蓝合成途径催化各步反应
的关键酶及其编码基因的功能研究鲜见报道,极大
地限制了利用生物技术手段提高靛蓝合成效率的进
程.因此,有必要深入开展菘蓝分子生物学的研究,
阐明相关基因在靛蓝类色素物质合成乃至其他一些
次生代谢产物的合成、积累及调控过程中的重要作
用.为此,我们以菘蓝转录组数据为基础,以菘蓝为
研究对象,克隆菘蓝色氨酸合成酶基因,并对其进行
生物信息学分析,以期进一步明确其生物学功能.
1 材料与方法
1.1 材料
菘蓝种子:采自陕西师范大学校园内,种于含蛭
石的营养钵中,放于人工气候箱(宁波江南仪器厂,
RXZ-500D)中培养(温度25±2℃,湿度48%,光照
强度216μmol/(m
2·s),光照时间16h/d).
菌株与载体:大肠杆菌DH5α;PMD 19-T Sim-
ple Vector购自TaKaRa Biotechnology公司.
试剂与药品:植物基因组 DNA 提取试剂盒;
DNA凝胶回收试剂盒;DL2000,2×Taq PCR Mas-
ter Mix,ddH2O;LB培养基(固、液体),1×TAE缓
冲液,溴化乙锭(EB),氨苄青霉素等.
1.2 实验方法
1.2.1 IiTSA引物的设计 采用本实验室已经建
立的菘蓝转录组数据库信息,利用DNAStar软件寻
找菘蓝色氨酸合成酶 Unigene序列的开发阅读框,
发现该 Unigene序列具有完整的开放阅读框.经
NCBI氨基酸比对发现,该Unigene为cDNA全长,
比对结果如图1所示.
图1 已知Unigene序列氨基酸比对结果
Fig.1 Unigene known amino acid sequence alignment results
利用软件Primer premier 5.0在已知 Unigene
序列的开放阅读框之外设计引物 TSA-R:5′-TG-
CAGTATCCATAGCTTCTTAC-3′,TSA-F:5′-
CACAATCAA GAATGATTTCTGC-3′,并 合 成
(北京奥科鼎盛生物科技有限公司)[7-8].
1.2.2 菘蓝基因组DNA的提取 参照Biospin植
物基因组DNA提取试剂盒进行.
1.2.3 菘蓝色氨酸合成酶基因的克隆 IiTSA的
克隆主要包括PCR的扩增、扩增产物的电泳检测、
凝胶回收、T载体的连接、回收产物转化到大肠杆菌
DH5α感受态细胞以及阳性克隆的挑选等过程.
1.2.4 菘蓝色氨酸合成酶基因的生物信息学分析
 利用 DNAStar软件和http://www.ncbi.nlm.
nih.gov./;http://www.ebi.ac.uk/;http://
psort.hgc.jp/;http://www.cbs.dtu.dk/;http://
cn.expasy.org/等网站提供的各类生物信息学分析
软件对菘蓝色氨酸合成酶基因的核酸序列和编码的
氨基酸序列进行在线分析[7].开放阅读框的查找、核
酸序列和氨基酸序列的组成、蛋白质的理化性质、亲
水性/疏水性、信号肽、跨膜结构域、亚细胞的定位、
二级结构和三级结构的分析分别用DNAStar软件
和在 线 工 具 ClustalW2、BlastX、ExPASy Prot-
Param、ProtScale、SignalP 3.0Server、TMHMM、
PSORT、SOPMA和ESyPred3D进行分析.核酸序
列和氨基酸序列的同源性分别用 Blast和 Clust-
alW2进行分析.
2 结果与讨论
2.1 IiTSA的克隆和结构分析
根据已知的 Unigene到 NCBI进行比对,该
Unigene为cDNA 全长,利用 DNAStar5.0寻找
cDNA的开放阅读框,在开放阅读框外设计引物,以
菘蓝基因组DNA为模板进行PCR扩增,获得该基
因的全长.分析发现,cDNA全长1 035bp,包含5′
端非编码区42bp、3′端非编码区57bp和一个936
bp的开放阅读框,编码311个氨基酸;IiTSA 全长
为2 111bp,包括8个外显子和7个内含子,这与欧
洲菘蓝和玉米一样[5-6],且每个内含子的两端具有内
含子的保守序列GT/AG,符合典型的GT-AG规则
(见图2).利用在线工具ExPASy Protparam预测
显示:IiTSA编码的氨基酸序列分子量为32.922 1
kDa,理论等电点6.76.经在线工具PSORT分析,
IiTSA定位在叶绿体基质中的可能性最大,这与拟
南芥中TSA的定位一致[7].
68  陕西师范大学学报(自然科学版) 第42卷
图2 IiTSA的全长及其推导的氨基酸序列
Fig.2 DNA sequence of IiTSAand the deduced amino acid
起始密码子和终止密码子用下划线标出,内含子和
非编码区均用小写字母表示,外显子用大写字母表
示,氨基酸位于对应的密码子下方.
2.2 IiTSA的疏水性/亲水性分析
疏水性是指氨基酸远离周围水分子,包埋进蛋
白质核心的相对趋势,是蛋白质三维空间构象的影
响因素之一[9].疏水性和亲水性的分析,对蛋白质高
级结构的预测和功能结构域的分析有重要意义.用
在线工具Protscale对IiTSA氨基酸序列的疏水性
和亲水性进行预测,结果如图3所示.75~175之间
为明显的疏水区域,270~280之间疏水性最强,无
明显的亲水区域,整条肽链表现为疏水性.再经Ex-
PASy ProtParam 预测显示IiTSA 编码的氨基酸
GRAVY(Grand Average of Hydropathicity,即总
平均亲水性)值为0.117,因此,IiTSA为疏水蛋白.
图3 IiTSA疏水性/亲水性的预测
Fig.3 Predicted hydrophobicity/hydrophilicity of IiTSA
2.3 IiTSA信号肽分析
信号肽是与蛋白分选相关的信号序列,均含有
一段或几段特殊的氨基酸序列,可用于引导蛋白质
进入细胞的特定部位,通常位于蛋白质的氨基端,一
般由15~30个氨基酸残基组成,在信号肽的中部有
一段疏水核心区[10].信号肽的预测和分析,对分析
和理解蛋白质在细胞中的定位及分选有着重要的参
考价值.用SignalP 3.0Server对IiTSA 氨基酸序
列的信号肽进行预测,结果如图4所示.分析结果发
现IiTSA不具有信号肽.据此推测,IiTSA合成后,
不进行蛋白质的转运,直接在合成部位发生作用.
图4 IiTSA信号肽的预测
Fig.4 Predicted signal peptide of IiTSA
2.4 IiTSA跨膜结构域预测
跨膜结构域是内在膜蛋白与膜脂相结合的主要
部位,一般由20个左右的疏水氨基酸残基组成,形
成α螺旋(长度约3.2nm),其外部疏水侧链通过范
德华力与脂双层分子脂肪酸链相互作用[10].跨膜结
构域的预测和分析,有助于分析蛋白质的结构、种
类、功能和定位.用TMHMM2.0Server对TSA氨
基酸序列的跨膜结构域进行预测,结果如图5所示.
IiTSA具有跨膜结构域的可能性很小,推测不具跨
膜结构域,不属于跨膜蛋白.
2.5 IiTSA高级结构预测
蛋白质的高级结构决定了其生物学功能,而高
级结构又取决于蛋白质的氨基酸序列.多肽链借助
氢键排列成沿一维方向有规则的二级结构,二级结
构借助范德华力、氢键、离子键和疏水作用等形成蛋
  第6期 杨树 等:菘蓝色氨酸合成酶基因的克隆与生物信息学分析 69 
图5 IiTSA跨膜结构域的预测
Fig.5 Predicted transembrane domain by TMHMM 2.0sever
白质的三级结构,从而发挥正常的生物学功能[10].
因此,蛋白质高级结构的预测和分析,对认识蛋白质
结构和功能之间的关系有着重要意义.用SOPMA
对IiTSA氨基酸序列的二维结构进行预测,结果表
明,IiTSA由43.41%的α-螺旋、16.72%的延伸链、
7.72%的β-转角和32.15%的无规则卷曲构成.从
整个蛋白质的结构分析,α-螺旋和无规则卷曲是
IiTSA的主要结构元件,β-转角和延伸链散布于整
个蛋白质.
氨基酸序列相似的蛋白质,它们的三维结构也
相似[11].用ESyPred3D在线同源建模法构建IiT-
SA的三级结构,结果见图6.该模型以玉米中的
BX1(吲哚合酶)的三维结构为模板构建,二者的相
似性为50.8%,其结构模型显示,整个三级结构呈
“桶状”,IiTSA 主要由10个α-螺旋和一些无规则
卷曲构成,这与二级结构的预测结果一致.
图6 IiTSA三维结构的预测
Fig.6 Predicted the three dimensional structure model
of IiTSAby Esypred 3D
2.6 不同物种间TSA的核酸序列及其推导的氨基
酸序列的同源性分析
运用NCBI上的Blastn程序对IiTSA 的核酸
序列进行比对.比对结果表明,IiTSA 的核酸序列
和欧洲菘蓝(Isatis tinctoria,AJ841705.1)、拟南芥
(Arabidopsis thaliana,U18993.1)的一致性较高,
分别为96%、87%;用 Blastp程序以及在线工具
ClustalW2对IiTSA 编码的氨基酸进行序列同源
性分析,结果显示IiTSA编码的氨基酸与多种植物
TSA 编码的氨基酸序列均具有较高同源性(见图
7),与欧洲菘蓝(Isatis tinctoria,CAH56477)、拟南
芥(Arabidopsis thaliana,AAM65526)、琴叶拟南
芥 (Arabidopsis lyrata subsp.lyrata,XP _
002877992)、蓖 麻 (Ricinus communis,XP _
002520975)、玉米(Zea mays,NP_001123592)、花生
(Arachis hypogaea,ABI84259)等的一致性分别
为:98%、92%、90%、72%、69%、75%,其中与欧洲
菘蓝的同源性最高达98%,说明本次实验克隆出的
基因确实为菘蓝色氨酸合成酶基因.
3 结论
色氨酸是菘蓝中靛蓝合成的基础,而色氨酸合
成酶是菘蓝中靛蓝合成过程中的关键酶,目前关于
色氨酸合成酶基因的研究还较少,在植物中仅见于
拟南芥、欧洲菘蓝、玉米等.本实验根据已知 Uni-
gene利用PCR技术获得了IiTSA 全长,它与同属
植物欧洲菘蓝和玉米一致,与拟南芥等物种中色氨
酸合成酶基因的长度接近,且有较高的一致性.
IiTSA的克隆和功能分析可为进一步揭示靛蓝次
生代谢途径奠定基础.
参考文献:
[1]Sheldon R A,Arends I,Hanefeld U.Green chemistry
and catalysis[M].Berlin:Wiley-VCH Verlag GmbH &
Co.KGaA,Weinheim,2007:353-355.
[2]Frey M,Chomet P,Glawischnig E,et al.Analysis of a
chemical plant defense mechanism in grasses[J].Sci-
ence,1997,277:696-699.
[3]Warzecha H,Frank A,Peer M,et al.Formation of the
indigo precursor indican in geneticaly engineered tobac-
co plants and cel cultures[J].Plant Biotechnology Jour-
nal,2007,5:185-191.
[4]Maugard T,Enaud E,Choisy P,et al.Identification of
an indigo precursor from leaves of Isatis tinctoria
(Woad)[J].Phytochemistry,2001,58:897-904.
[5]Papanastasiou M,Alen N S,McMahon A,et al.Anal-
ysis of indigo-type compounds in natural dyes by nega-
tive ion atmospheric pressure photoionization mass spec-
trometry[J].Dyes and Pigments,2012,92 (3):
1192-1198.
[6]欧阳剑,李家洋.拟南芥色氨酸与吲哚乙酸生物合成的
研究进展[J].生物工程进展,1998,18(2):2-11.
[7]Salvini M,Boccardi T M,Sani E,et al.Alpha-trypto-
phan synthase of Isatis tinctoria:gene cloning and ex-
pression[J].Plant Physiology and Biochemistry,2008,
46:715-723.
[8]丁超.实时荧光定量PCR应用及实验条件优化[J].大
70  陕西师范大学学报(自然科学版) 第42卷
图7 菘蓝TSA与其他几种植物的TSA的同源性比对
Fig.7 Homology alignment in IiTSAand other species
  连医科大学学报,2007,29(4):404-407.
[9]李铮,王喆之.植物萜类合成酶1-脱氧-D-木酮糖-5-磷
酸还原异构酶的分子结构特征与功能预测分析[J].植
物研究,2007,27(1):59-67.
[10]翟中和,王喜忠,丁明孝.细胞生物学[M].3版.北京:
高等教育出版社,2007:88-90.
[11]王镜岩,朱圣庚,徐长法,等.生物化学(上册)[M].3
版.北京:高等教育出版社,2002:157-181.
〔责任编辑 王 勇〕