免费文献传递   相关文献

丹参硫氧还蛋白基因SmTrxh 的克隆和生物信息学分析



全 文 :植物生理学通讯 第 45 卷 第 5 期,2009 年 5 月 433
收稿 2008-12-01 修定  2009-02-24
资助 国家 “ 十一五 ” 科技支撑计划(2006BAI06A12-04)。
* 通讯作者(E-ma il : zzwa ng@snnu .edu .cn; Tel: 0 29 -
8 5 3 1 0 2 6 0 )。
丹参硫氧还蛋白基因 SmTrxh的克隆和生物信息学分析
李松丽, 王 之 *
陕西师范大学药用资源与天然药物化学教育部重点实验室, 西北濒危药材资源开发国家工程实验室, 西安 710062
提要: 对丹参 EST数据库进行 BLAST同源性比对发现, 登录号为 CV165156的 EST序列与硫氧还蛋白基因(Trx)有很高的
同源性。进一步用 PCR方法从丹参基因组水平上克隆到长 1 806 bp的DNA序列(登录号为 FJ217699), 与 cDNA序列比对
发现, 该基因(SmTrxh)含有 2个内含子。生物信息学分析表明, SmTrxh所编码蛋白的分子质量为13.4 kDa, 理论等电点为
5.53, 无信号肽, 属于定位于细胞质中的稳定类蛋白。该蛋白与其他 7种植物中的 Trx高度同源, 同源性介于 68%~74%之
间。实时定量 PCR检测的结果显示, SmTrxh在丹参中为组成型表达基因, 在根、茎和叶中都有表达, 主要在根部表达, 茎
中的表达量最低。
关键词: 生物信息学; 实时定量PCR; 丹参; 硫氧还蛋白
Cloning and Bioinformatics Analysis of SmTrxh in Salvia miltiorrhiza Bunge
LI Song-Li, WANG Zhe-Zhi*
Key Laboratory of the Ministry of Education for Medicinal Resources and Natural Pharmaceutical Chemistry, National Engineering
Laboratory for Resource Development of Endangered Crude Drugs in Northwest of China, Shaanxi Normal University, Xi’an
710062, China
Abstract: The expressed sequence tags of Salvia miltiorrhiza were analyzed using the BLAST approach of
NCBI. One of these sequences (CV165156) showed high homology with thioredoxin gene. A 1 806 bp DNA
sequence of the SmTrxh (GenBank accession number FJ217699) was cloned by PCR from genome of S.
miltiorrhiza. The sequence aligned with cDNA showed that there were two introns in the encoding region.
Bioinformatics analysis showed that the calculated molecular mass was 13.4 kDa and theoretical isoelectric
point was 5.53. SmTrxh was a stable protein without signal peptide. Amino acids homology of SmTrxh com-
pared with other seven plants ranged from 68% to 74%. Real-time PCR result showed that the SmTrxh was a
constitutive expression gene, which expressed in root, stem and leaf. The mRNA of SmTrxh was most abundant
in root, and the least in stem.
Key words: bioinformatics; real-time PCR; Salvia miltiorrhiza; thioredoxin
硫氧还蛋白(thioredoxin, Trx)是一类广泛存在
于生物体内的多功能酸性蛋白, 分子量约为 1 2
kDa。根据氨基酸序列的不同, Trx 分为家族 I 和
家族 II 2个大家族。家族 I 含有一个独特的Trx区
域而家族 II 则有 1 个或更多的 Trx 区域, 绝大多数
生物的硫氧还蛋白属于家族 I (郑琼等 2006)。在
高等植物中, 根据初级结构的不同, Trx家族 I被分
为六大类: h、f、m、o、x 和 y (Gelhaye 等 2004)。
不同的Trx在进化中相当保守, 有一个二硫化物活
性中心Trp-Cys-Gly(Ala)-Pro-Cys (WC[G/P]PC), 活
性中心有 2 个具有氧还活性的半胱氨酸残基(卫丽
等 2006; Yi 等 2007; Gelhaye 等 2005), 在多种反应
中通过可逆的二硫键和硫醇起氧化还原载体的作
用, 与酶的活性调节蛋白。Trx 最初是在大肠杆菌
(Escherichia coli)中发现的, 后来在原核生物直到
高等真核生物中均有发现, 但植物中的Trx系统较
动物和细菌复杂。植物中的 Trx 最初是在叶绿体
中发现的, 认为是光合作用中一些关键酶的活化调
节蛋白, 后来在细胞质和线粒体中也发现了硫氧还
蛋白, 但它们在结构和功能上都有差异(刘雷和尹钧
2003)。
一般认为, 高等有机体中硫氧还蛋白系统是由
Trx (Trx1、Trx2)、NADPH、TrxR (二硫醇二
硫化物氧化还原酶 - 硫氧还蛋白还原酶) 3 部分组
成的(卜于骏和丁树哲 2003), 还原态的 Trx 通过巯
基供氢导致其他含二硫键的蛋白还原; 氧化态的
植物生理学通讯 第 45 卷 第 5 期,2009 年 5 月434
Trx被NADPH 还原, 继续发挥作用(郑琼等 2006)。
Trx 在生物体内参与一系列的生理生化反应。除
了还原靶蛋白的二硫键外, 还作为H+ 供体参与对酶
的调节(Holmgren 1989), 对转录因子进行调控(Hirota
等1999), 并在逆境中也起作用(夏德习等2007)等。
本实验室用组织培养2~13周的丹参幼苗为材料构
建丹参 cDNA 文库, 测序并注册了 10 288 条 EST
序列(闫亚平 2005)。本文采用BLAST工具分析该
EST数据库时, 发现一条序列(CV165156)与其他生
物中的硫氧还蛋白基因(Trx)有较高的同源性。用
生物信息学方法分析丹参(Salvia miltiorrhiza)、 甘
薯(Ipomoea batatas)、大车前(Plantago major)、
烟草(Nicotiana tabacum)、紫花苜蓿(Medicago
sat i va )、辣椒(Ca ps ic um a nnuu m )、马铃薯
(Solanum berthaulti i)和截形苜蓿(Medicago
truncatula)中 Trx 的同源性和理化性质, 对丹参
Trxh 的疏水性、亚细胞定位以及结构进行了预测
和分析, 并用实时定量PCR检测了Trxh在丹参根、
茎和叶中的表达特性。
材料与方法
丹参(Salvia miltiorrhiza Bunge)种子种在含蛭
石的营养钵中, 放在人工培养箱(宁波江南仪器厂,
型号 RXZ-500D)中培养, 培养条件: 温度(25±2)℃,
光照 16 h·d-1, 光照强度为 40 μmol·m-2·s-1。长出 3
对真叶时用于RNA和DNA提取。总RNA提取试
剂盒(Biozol)、逆转录试剂盒(Bio RT)购于杭州博
日科技有限公司; SYBR Premix Ex Taq、pMD19-T
vector购于TaKaRa公司; PCR产物回收试剂盒购于
北京百泰克生物技术有限公司。
用 Biozol 试剂分别提取丹参根、茎和叶总
RNA, 以 1.0% 的琼脂糖凝胶电泳检测 RNA 质量。
以提取的总RNA为模板, 按照逆转录试剂盒说明合
成丹参 c D N A 第一条链。采用改良 C T A B 法
(Porebski 等 1997)提取丹参总 DNA。依据登录号
为CV165156的序列设计一对PCR特异性引物, 上
游引物 SmTrxhF: 5 TCGTGAATTTCCCAAG-
ACTAGAG 3, 下游引物 SmTrxhR: 5 TCATAA-
TCAAGCAGAGGCAGTG 3 。分别以丹参总
DNA、cDNA 为模板进行 PCR 扩增, 反应程序为:
94 ℃预变性 3 min; 94 ℃变性 30 s, 54 ℃退火 30 s,
72 ℃延伸 3 min, 30 个循环; 72 ℃延伸 10 min。
PCR 产物经 1.0% 琼脂糖凝胶检测, 回收目的条带
并与 pMD19-T vector连接转入DH5α, 经菌落PCR
检测为阳性的克隆送上海生工生物工程技术有限公
司测序。测序获得的序列递交国际公共DNA数据
库(登录号 FJ217699)。
甘薯(登录号 AAQ23135)、大车前(登录号
CAH59450)、烟草(登录号 CAA41415)、紫花苜
蓿(登录号AAZ32865)、辣椒(登录号AAR83852)、
马铃薯(登录号 ABD65296)、截形苜蓿(登录号
AAZ98843) Trx 的氨基酸序列来自 National Center
for Biotechnology Information (NCBI)。根据 http://
www.ncbi.nlm.nih.gov/、http://www.cbs.dtu.dk/ 和
http://cn.expasy.org/网站提供的各类生物信息学软
件进行在线分析。氨基酸序列的组成成分分析、
理化性质分析、开放阅读框(open reading frame,
ORF)的查找和翻译用 ProtParam、ORF finder在线
工具进行; 蛋白质信号肽的预测、跨膜结构域、
疏水性 /亲水性、二级结构和三维结构的分析用在
线工具 SignalP 3.0 Server、TMMHMM 2.0 Server、
ProtScale、SOPMA、SWISS-MODEL 完成, 三维
视图用 MolMol 1.2 软件完成。
根据荧光定量PCR引物设计原则, 设计定量引
物 SmTrxhS: 5 TGCCGCTTCATTGCTCCTATT 3,
SmTrxhA: 5 GCACCCACAACCCTGTCAATC 3。
以持家基因GAPDH为内参, 其引物为GAPDHS: 5
CCAC CGTCCACTCCATCACT 3, GAPDHA: 5
TGGGAACTCGGAACGACATAC 3, 以SYBR Primix
Ex Taq 为荧光染料。反应程序为: 95 ℃预变性 3
min; 95 ℃ 10 s, 60 ℃ 20 s, 40 个循环; 每个样品重
复3次。
结果与讨论
1 丹参 Trxh基因 cDNA、DNA序列和推导的氨
基酸序列
丹参cDNA文库的EST序列的BLAST分析结
果显示, 其中一条序列(CV165156)与Trx基因有较
高的一致性。该序列与已记录的来源于其他植物
的 Trx基因编码的氨基酸序列的一致性分别为: 甘
薯 7 4 %、大车前 7 2 %、烟草 7 1 %、紫花苜蓿
70%、辣椒 70%、马铃薯 69%、截形苜蓿 68%。
用ORF Finder在线工具查找其ORF和编码的氨基
酸序列显示, 该序列包含 369 bp 的 ORF, 编码 122
植物生理学通讯 第 45 卷 第 5 期,2009 年 5 月 435
个氨基酸, 将其命名为 SmTrxh。
提取的丹参中总 RNA 经 RT-PCR 反应后, 扩
增出一条长 405 bp的条带, 包含 369 bp的ORF, 测
序结果与EST序列一致。以丹参总DNA为模板经
PCR扩增出一条 1 806 bp的条带, 与 cDNA序列比
对发现该序列包含 3 个外显子和 2 个内含子。外
显子长度分别为 93、123 和 150 bp, 内含子长度
分别为 914 和 487 bp, 符合典型的 GT-AG 规则(图
1), 且内含子的位置与报道的烟草和拟南芥的Trxh
一致(Sahrawy等 1996)。该 DNA 序列在 GenBank
图 1 SmTrxh 的核酸序列和推导的氨基酸序列
Fig.1 The nucleic acide sequence and deduced amino acid of SmTrxh
划线处为活性位点; 方框内分别为起始和终止密码子; * 表示终止密码子。
植物生理学通讯 第 45 卷 第 5 期,2009 年 5 月436
上的登录号为 FJ217699。
2 不同植物 Trx编码的氨基酸序列组成和理化性
质分析
采用 Gasteiger 等(2005)的方法, 用软件 ORF
Finder和http://cn.expasy.org/网站提供的ProtParam
等程序分析丹参、甘薯、大车前、烟草、紫花
苜蓿、辣椒、马铃薯、截形苜蓿中 Tr x 的氨基
酸序列组成和理化性质的结果(表1)中可知: 不同植
物Trx基因编码的氨基酸残基数相差不大; 组成Trx
蛋白的酸性氨基酸比例大于碱性氨基酸, 表明 Trx
为一种酸性蛋白质; 不同植物中 Trx 的分子量、
理论等电点基本一致; 均富含赖氨酸、缬氨酸、
谷氨酸和丙氨酸这四种氨基酸, 且都属于稳定蛋
白质。
表 1 不同植物中 Trx 蛋白的组成成分和理化性质分析
Table 1 Analysis of compositions and physical and chemical characters of Trx in different plants
品种 登录号 推导的氨基 分子量 / 理论等 碱性氨基酸 酸性氨基酸 含量丰富的氨基酸比例 /% 蛋白质不稳
酸残基数 kDa 电点 比例 /% 比例 /% 定性指数
丹参 FJ217699 122 13.43 5.53 11.48 14.75 缬氨酸 11.5 丙氨酸 10.7 24.18
谷氨酸 9.0 赖氨酸 9.0 属于稳定蛋白
甘薯 AAQ23135 123 13.48 6.06 12.20 13.82 丙氨酸 15.4 缬氨酸 13.0 29.12
赖氨酸 9.8 谷氨酸 7.3 属于稳定蛋白
大车前 CAH59450 119 13.22 5.80 13.45 15.97 赖氨酸 11.8 缬氨酸 11.8 13.02
谷氨酸 10.1 丙氨酸 9.2 属于稳定蛋白
烟草 CAA41415 126 13.96 5.62 12.70 15.08 缬氨酸 13.5 丙氨酸 11.1 28.20
赖氨酸 11.1 谷氨酸 9.5 属于稳定蛋白
紫花苜蓿 AAZ32865 117 12.80 5.59 11.97 14.53 丙氨酸 12.8 缬氨酸 11.1 8.31
赖氨酸 11.1 谷氨酸 9.4 属于稳定蛋白
辣椒 AAR83852 124 13.72 5.01 10.48 16.13 缬氨酸 13.7 丙氨酸 11.3 30.80
谷氨酸 9.7 赖氨酸 8.9 属于稳定蛋白
马铃薯 ABD65296 123 13.56 5.54 12.20 15.45 缬氨酸 13.8 赖氨酸 10.6 36.30
丙氨酸 9.8 谷氨酸 8.9 属于稳定蛋白
截形苜蓿 AAZ98843 120 13.34 5.27 14.17 17.50 谷氨酸 12.5 赖氨酸 12.5 19.64
缬氨酸 11.7 丙氨酸 10.8 属于稳定蛋白
3 丹参 Trxh的疏水性 /亲水性分析
疏水性是指氨基酸远离周围水分子, 包埋进蛋
白质核心的相对趋势, 是蛋白质三维空间构象的影
响因素之一。用 ProtScale 预测丹参 Trxh 蛋白的
疏水性 / 亲水性的结果(图 2)表明, 多肽链第 20 位
的谷氨酸具有最低值为-2.567, 亲水性最强。第50
位的异亮氨酸最高值为 2.067, 疏水性最强。从整
体上看, 大部分氨基酸属于亲水性氨基酸(分值为
负), 整个多肽链表现为亲水性。
4 丹参 Trxh的信号肽、跨膜结构域和亚细胞定

信号肽(singnal peptide)位于蛋白质的N端, 是
一段引导新合成的肽链进入细胞器的识别序列, 一
般由16~26个氨基酸残基组成, 蛋白质在细胞质中
的核糖体上合成后, 在信号肽的引导下, 转运至不
同的细胞器或细胞质基质的特定部位发挥作用(翟
中和等 2000)。因此, 信号肽的预测与分析对了解
图 2 SmTrxh 疏水性 /亲水性预测
Fig.2 Predicted hydrophobicity/hydrophilicity of SmTrxh
蛋白质的亚细胞定位与功能途径和机制有一定的意
义。用 SignalP 3.0 Server 工具预测丹参 Trxh 蛋
白的信号肽(Nielsen等1997; Bendtsen等2004)的结
植物生理学通讯 第 45 卷 第 5 期,2009 年 5 月 437
表 2 SmTrxh 亚细胞定位预测
Table 2 Predicted subcellular location of SmTrxh
细胞质 叶绿体基质 叶绿体类囊体膜 叶绿体类囊体腔
可信度 0.450 0.200 0.200 0.200
结论 细胞质蛋白
果显示, 该蛋白无信号肽。
跨膜结构域是膜内在蛋白与膜结合的区域, 一
般由 20 个左右的疏水氨基酸残基组成, 形成 α 螺
旋, 它固着于细胞膜上起 “ 锚定 ” 作用(翟中和等
2000)。跨膜结构域的预测和分析, 有助于正确认
识和理解蛋白质的结构、种类、功能和定位。用
TMHMM 2.0 Server 预测 SmTrxh 氨基酸序列的跨
膜结构域的结果表明, SmTrxh不具有跨膜结构域。
蛋白质在细胞中的定位与蛋白质执行的功能
密切相关。植物中 Trx 是一个大的基因家族, 不同
的Trx蛋白异构体不仅存在于细胞质中, 在线粒体
和叶绿体中均有分布(Gelhaye等2005)。用PSORT
在线工具预测 SmTrxh 的结果(表 2)显示, SmTrxh
定位于细胞质。从信号肽、跨膜结构域和亚细胞
定位的结果来看, 本文克隆的SmTrxh编码的是一种
细胞质蛋白。
1995)的结构一致。这一结构为硫氧还蛋白家族的
保守结构(Svensson等 2007), 通常称为硫氧还蛋白
折叠(卫丽等 2006; Martin 1995)。说明Trx 蛋白的
高级结构非常保守, 暗示其可能有相同的功能。
5 丹参Trxh蛋白高级结构的预测
正常情况下蛋白质并不是以完全伸展的多肽
链, 而是以一定的高级结构来行使其生物活性的, 而
高级结构则取决于蛋白质的一级结构即氨基酸顺序
(王镜岩等 2002)。因此, 蛋白质高级结构的预测和
分析, 对理解蛋白质结构与功能之间的关系是重要
的。用 SOPMA在线工具预测 SmTrxh氨基酸序列
的二维结构的结果显示, SmTrxh由 53.28%的α螺
旋、19.67% 的片层、8.20% 的 β 转角和 18.85%
的不规则卷曲组成。α螺旋是 SmTrxh的主要结构
元件 。
用 SWISS-MODEL 在线同源建模方法分析
SmTrxh 和用 MolMol 1.2 软件得到的三维结构(图
3)显示, SmTrxh 三维结构含有 5 个保守的 β 链, 被
4 个 α 螺旋包围, 保守的活性位点序列 WCGPC 连
接第 2 个 β 折叠和第 2 个 α 螺旋, 位于第 2 个 β 链
的末端和第 2个 α螺旋的起始端, 并形成了第 2个
α 螺旋的第一个转折点。该预测结果与啤酒酵母
的Trx (Amorim等 2007)、大肠杆菌Trx (Holmgren
图 3 SmTrxh三维结构
Fig.3 Three-dimensional structure of SmTrxh
图 4 SmTrxh 在丹参不同器官中的表达
Fig.4 Expressions of SmTrxh in different
organs of S. miltiorrhiza
6 SmTrxh基因在不同器官中的表达特异性
以长出3对真叶的丹参幼苗为材料, 分别提取
根、茎和叶的总 RNA。反转录后, 用实时荧光定
量PCR检测SmTrxh基因在不同器官中表达的结果
(图 4)显示, SmTrxh 基因在所有检测的部位均有表
达, 但表达水平有较大的差异。如图4所示, SmTrxh
在根中的表达量最高, 约是茎中的 20倍, 这一结果
与拟南芥 Trxh5 基因的表达特性一致(Reichheld等
2002)。叶中次之, 茎中的表达量最低。
植物生理学通讯 第 45 卷 第 5 期,2009 年 5 月438
参考文献
卜于骏, 丁树哲(2003). 硫氧还蛋白系统研究进展. 中国运动医学
杂志, 22 (5): 487~489
刘雷, 尹钧(2003). 硫氧还蛋白的研究. 东北农业大学学报, 34
(2): 219~225
王镜岩, 朱圣庚, 徐长法(2002). 生物化学(上册). 第 3 版. 北京: 高
等教育出版社, 197~249
卫丽, 黄晓书, 李鹏坤, 张慧琴, 王同朝(2006). 植物硫氧还蛋白研
究进展. 贵州农业科学, 34 (6): 129~131
夏德习, 管清杰, 金淑梅, 李宇佳, 梁涵, 张欣欣, 西内俊策, 高野哲
夫, 柳参奎(2007). 拟南芥硫氧还蛋白 M1 型基因(AtRTXm1)
与环境逆境之间的关系. 分子植物育种, 5 (1): 21~26
闫亚平(2005). 基于 EST 技术的丹参大规模基因克隆及其外源基
因转化技术研究[硕士论文] . 陕西: 陕西师范大学生命科学
学院
翟中和, 王喜忠, 丁明孝(2000). 细胞生物学. 北京: 高等教育出版
社, 78~193
郑琼, 马旭俊, 杨传平(2006). 硫氧还蛋白(Trx)的研究进展. 分子
植物育种, 4 (6): 78~82
Amorim GC, Pinheiro AS, Netto LES, Valente AP, Almeida FCL
(2007). NMR solution structure of the reduced form of
thioredoxin 2 from Saccharomyces cerevisiae. J Biomol
NMR, 38 (1): 99~104
Bendtsen JD, Nielsen H, von Heijne G, Brunak S (2004). Improved
prediction of signal peptides: SignalP 3.0. J Mol Biol, 340
(4): 783~795
Gasteiger E, Hoogland C, Gattiker A, Duvaud S, Wilkins MR, Appel
RD, Bairoch A (2005). Protein identification and analysis
tools on the ExPASy server. In: Walker JM (ed). The
Proteomics Protocols Handbook. Totowa: Humana Press,
571~607
Gelhaye E, Rouhier N, Jacquot JP (2004). The thioredoxin h
system of higher plants. Plant Physiol Biochem, 42 (4):
265~271
Gelhaye E, Rouhier N, Navrot N, Jacquot JP (2005). The plant
thioredoxin system. Cell Mol Life Sci, 62 (1): 24~35
Hirota K, Murata M, Sachi Y, Nakamura H, Takeuchi J, Mori K,
Yodoi J (1999). Distinct roles of thioredoxin in the cyto-
plasm and in the nucleus. A two-step mechanism of redox
regulation of transcription factor NF-kappaB. J Biol Chem,
274 (39): 27891~27897
Holmgren A (1989). Thioredoxin and glutaredoxin systems. J
Biol Chem, 264 (24): 13963~13966
Holmgren A (1995). Thioredoxin structure and mechanism: con-
formational changes on oxidation of the active-site sulfhy-
dryls to a disulfide. Structure, 3 (3): 239~243
Martin JL (1995). Thioredoxin-a fold for all reasons. Structure, 3
(3): 245~250
Nielsen H, Engelbrecht J, Brunak S, von Heijne G (1997). Identi-
fication of prokaryotic and eukaryotic signal peptides and
prediction of their cleavage sites. Prot Eng, 10 (1): 1~6
Porebski S, Bailey LG, Baum BR (1997). Modification of a CTAB
DNA extraction protocol for plants containing high polysac-
charide and polyphenol components. Plant Mol Biol Rep,
15 (1): 8~15
Reichheld JP, Mestres-Ortega D, Laloi C, Meyer Y (2002). The
multigenic family of thioredixin h in Arabidopsis thaliana:
specific expression and stress response. Plant Physiol
Biochem, 40: 685~690
Sahrawy M, Hecht V, Lopez-Jaramillo J, Chueca A, Chartier Y,
Meyer Y (1996). Intron position as an evolutionary marker
of thioredoxins and thioredoxin domains. J Mol Evol, 42
(2): 422~431
Svensson MJ, Stenberg P, Larsson J (2007). Organization and
regulation of sex-specific thioredoxin encoding genes in the
genus Drosophila. Dev Genes Evol, 217 (9): 639~650
Yi SY, Choi D, Ryu CM (2007). Implication of a pepper h-type
thioredoxin in type I- and II-nonhost resistance to Xanthomonas
axonopodis. Plant Biotechnol Rep, 1: 117~123