免费文献传递   相关文献

Cloning and Sequence Analysis of Chalone Synthase Gene from Cassia tora

决明查尔酮合成酶全长基因序列的克隆与分析



全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2013年第5期
真核生物基因的一个基本特征是它们被一个或
多个内含子所间隔,这些内含子在转录后被除去以
形成具有完整读码框的 mRNA。尽管真核生物基因
翻译后获得的蛋白质序列中不含有内含子的信息,
但是内含子的存在对基因表达有着积极的作用,能
够促进基因转录、促进 mRNA 的翻译、参与基因
收稿日期 : 2012-11-19
基金项目 : 国家自然科学基金项目(31271302),教育部中央高校基本科研业务费专项资金(SWJTU11CX114),西南交通大学“希望之星”,
国家级大学生创新创业训练计划项目(201210613050)
作者简介 :钟德馨,男,研究方向 :生物信息学 ; E-mail :fymm2010@126.com
通讯作者 :周嘉裕,女,博士,副教授,研究方向 :植物资源及生物技术 ; E-mail :spinezhou@yahoo.cn
决明查尔酮合成酶全长基因序列的克隆与分析
钟德馨  方袁梦梦  郭壮浩  安红强  董银松  丁若凡   
王万军  廖海  周嘉裕
(西南交通大学生命科学与工程学院,成都 610031)
摘 要 : 从决明(Cassia tora)的新鲜子叶中提取基因组 DNA 作为模板,利用一对特异引物进行 PCR 扩增,然后克隆测
序得到决明查尔酮合成酶(CHS)的基因全长。测序结果表明,决明 CHS 基因全长为 1 766 bp,含有 2 个外显子和 1 个内含子。
将其提交 GenBank,登录号为(JX676773)。决明 CHS 基因的内含子位于 188-765 bp 之间,长度为 578 bp,内含子的剪切符合
GU-AG 规律,含有多个酶切位点和顺式调控元件,可能与决明 CHS 基因的表达调控有关。CHS 基因内含子具有多态性,可能是由
不同植物存在多样性的生活史与生活环境导致的。决明 CHS 基因外显子 2 较为保守,编码几乎所有 CHS 的功能位点。构建外显子
2 编码氨基酸序列的 NJ 系统发育进化树,能够正确反映不同植物的亲缘关系,可用于不同植物的遗传分化和分子进化研究。
关键词 : 决明 查尔酮合成酶 内含子 基因克隆 序列分析
Cloning and Sequence Analysis of Chalone Synthase Gene
from Cassia tora
Zhong Dexin Fang Yuanmengmeng Guo Zhuanghao An Hongqiang Dong Yinsong Ding Ruofan
Wang Wanjun Liao Hai Zhou Jiayu
(College of Life Science and Engineering,Southwest Jiaotong University,Chengdu 610031)
Abstract:  The chalcone synthase (CHS) gene was cloned from the fresh cotyledons of Cassia tora, using genomic DNA as a template
and a pair of specific primers for PCR amplification. The sequencing results showed that the Cassia tora CHS gene is 1 766 bp, containing
two exons and one intron. The CHS gene of Cassia tora was submitted to GenBank with an accession number of (JX676773). The intron is
located between 188-765 bp, in line with the GU-AG rule, and contained multiple enzyme digestion sites and cis-regulatory elements which
may be involved in expression regulation. The intron of CHS gene had polymorphism, which may be led by the diversity of life history and living
environment of different plants. The exon 2 of Cassia tora CHS was more conservative, encoding almost all functional sites of CHS. The NJ
phylogenetic evolutionary tree of the amino acid sequence encoded by exon 2, accurately reflect the genetic relationship of the different plants,
which can be used in different plant genetic differentiation and molecular evolution research.
Key words:  Cassia tora Chalcone synthase Intron Gene cloning Sequence analysis
的差异表达,是真核生物基因表达调控的重要元件
之一。
黄酮类化合物是一类重要的植物次级代谢产物,
在植物花色形成、植物育种、低抗紫外线辐射、防
止病原微生物侵染中都发挥了重要作用。并且,黄
酮类化合物还具有预防心血管疾病、抗癌、调节免疫、
生物技术通报 Biotechnology Bulletin 2013年第5期100
抗衰老、抗菌、抗炎等多种生物活性,是一些药用
植物的主要活性成分[1,2]。查尔酮合成酶(Chalcone
synthase,CHS)是植物中黄酮类化合物合成途径的
关键酶,是调控植物黄酮类化合物代谢的关键基因
之一。CHS 催化黄酮类化合物生物合成途径的第一
步,丙二酸单酰 CoA 与香豆酰 CoA 缩合成查耳酮的
反应[3]。目前,已从等多种植物中克隆了 CHS 基因,
包括百合花、紫叶李、大豆、金鱼草和拟南芥等[4-7]。
虽然对植物 CHS 基因的克隆已有一些报道,但
对相关基因的全长、外显子和内含子构成及其所属
的 CHS 基因家族的分子进化研究得却较少。决明
(Cassia tora)为豆科草本植物,其干燥成熟种子被
称为决明子。决明子是一种常用的中药,有效成分
主要是蒽醌类及黄酮类化合物[8]。为研究决明 CHS
基因的结构、进化及表达调控机制,本研究在前期
已获得决明 CHS 基因的全长 cDNA 的基础上[9],首
次从决明子叶中克隆得到决明 CHS 基因的全长序
列,分析该基因的外显子和内含子区域,并对内含
子中可能的调控位点进行了预测。在此基础上,利
用 CHS 基因构建系统进化树,展开进化分析,确定
CHS 基因是否能用于分析植物的遗传分化和分子进
化研究问题。
1 材料与方法
1.1 材料
决明种子购自成都市中药公司,用 MS 培养基
培养种子,取萌发的子叶作试验材料。
大 肠 杆 菌 BL21, 表 达 载 体 pET28a(+) 由 作
者所在实验室保存。测序载体 pMD19-T 载体(衍生
自 pUC-19,Ampr)、ExTaq DNA 聚合酶,dNTP、氨
苄青霉素、限制性内切酶、T4 连接酶、DNA Marker
DL2000 均为大连宝生物工程有限公司产品 ;胰蛋白
胨和酵母提取物购自 OXIOID 公司 ;琼脂糖和琼脂
粉为 Amersham 产品 ;其余试剂均为国产分析纯。
1.2 方法
1.2.1 决明子叶基因组的制备 取决明子叶 0.1 g,
加液氮研磨成粉末,用北京百泰克生物有限公司的
植物基因组 DNA 提取试剂盒对决明子叶基因组进行
提取,具体步骤按说明书进行。琼脂糖凝胶电泳分
析 DNA 质量。
1.2.2 引物设计与合成 应用 Primer Premier 5.0 引
物设计软件,根据我们在 GenBank 中发表的决明
CHS(GenBank 登录号:EU430077)基因序列在 CHS
基因上下游设计 1 对引物。该对引物理论跨幅包
括决明 CHS 基因的开放阅读框序列 1 173 bp,由上
海英俊生物技术有限公司合成。引物序列,如表 1。
表 1 PCR 扩增所用引物序列
引物 序列(5-3)
上游引物 GCG GAATTC ATG GTG AGT GTG AGT GAG ATC AGG
下游引物 GCG CTCGAG TTA GTT AAC TCC CAC ACT GCG AAG
1.2.3 决明查尔酮合成酶基因的扩增 以决明子叶
基因组为模板,利用 PCR 从中扩增出决明 CHS 基因
序列,用 1% 琼脂糖凝胶电泳检测 PCR 产物。PCR
反应体系为 DNA 溶液 1 μL,LA Taq 酶(5 U/μL)0.3
μL,10×LA Taq Buffer 4.0 μL,MgCl2(25 mmol/L)
1.0 μL,dNTPs(各 2.5 mmol/L)2.5 μL,上下游引物
各(20 μmol/L)1.0 μL,ddH2O 14.2 μL。混匀后,于
Applied Biosystems 2720 Thermal Cycler PCR 仪 上 进
行 PCR 扩增。反应程序 :95℃ 4 min ;94℃ 1 min,
55℃ 1 min,72℃ 4 min,35 个循环;72℃ 10 min,4℃,
保存。
1.2.4 PCR 产物克隆与测序 采用百泰克生物公司
的多功能 DNA 纯化回收试剂盒对 PCR 产物进行回
收。将回收的 DNA 产物连接到 pMD19-T 载体上。
将连接产物转化 E. coli DH5α 感受态细胞,在含有
50 mg/mL 氨苄青霉素的 LB 琼脂平板培养基上 37℃
培养 16 h。挑取该平板中的成熟阳性单菌落,进行
菌落 PCR 鉴定,反应体系包含 :上下游引物各 1
μL ;dNTP(2.5 mmol/L)2 μL ;MgCl2(2.5 mmol/L)
1.5 μL ;10×Ex Taq PCR buffer 2.5 μL ;Ex Taq 酶(5
U/μL)0.2 μL ;加 ddH2O 至 25 μL,反应条件与之前
相同。琼脂糖凝胶电泳检测 PCR 产物。再挑取相应
的单阳性菌落接种于含氨苄青霉素(50 mg/L) 的液
体 LB 培养基中,37℃振荡培养 12 h,由三博科技有
限公司进行测序。
1.2.5 CHS 基因序列分析 将测序结果用在线软件
Spidey(http ://www.ncbi.nlm.nih.gov/IEB/Research/
Ostell/Spidey)进行分析,再用 DNAMAN4.0 软件与决
明 cDNA 序列进行序列比对,获得内含子序列,并
2013年第5期 101钟德馨等 :决明查尔酮合成酶全长基因序列的克隆与分析
对内含子的酶切位点进行分析。使用在线分析软件
CDD(http ://www.ncbi.nlm.nih.gov/Structure/cdd/wrp
sb.cgi)与 PlantCARE(http://bioinformatics.psb.ugent.
be/webtools/plantcare/html/)分别对外显子 2 的保守功
能结构域和内含子中的调控序列进行分析。从 NCBI
资源库(http ://www.ncbi.nlm.nih.gov/)中选取矮牵
牛(Petunia hybrida,GenBank 登 录 号 :X14591.1),
百合(Lilium hybrid division,GenBank 登录号 :HM-
622754.1),大豆(Glycine max,GenBank 登录号:M-
98871.1),黄芩(Scutellaria baicalensis,mRNA Gen-
Bank 登录号 :AB008748.1,intron GenBank 登录号 :
EU814894.1), 金 荞(Fagopyrum dibotrys,GenBank
登录号 :GU169470.1),苦荞(Fagopyrum tataricum,
GenBank 登录号:HQ434624.1),拟南芥(Arabidopsis
thaliana,mRNA GenBank 登 录 号 :NM_121396.3,
全基因 GenBank 登录号 :NM_121396.3),日本水稻
(Oryza sativa,mRNA GenBank 登录号 :AB000801.2,
全 基 因 GenBank 登 录 号 :AC134256.4), 紫 叶 李
(Prunus cerasifera,GenBank 登 录 号 :DQ856583.1,
内含子参考文献[5]),欧洲赤松(Pinus sylvestris,
GenBank 登 录 号 :X60754.1) 等 植 物 的 CHS 基 因,
用 Clustalx1.8 和 MEGA4 软件分别对外显子和内含
子构建 NJ 系统进化树,展开进化分析。
2 结果
2.1 基因组质量分析
由图 1-A 左可以看到从决明子叶中提取得到的
DNA 分子量在 2 kb 以上,无 RNA 和蛋白质污染。
能够用于下一步的 PCR 扩增。
2.2 决明CHS基因的克隆
根据 GenBank 登录的决明 CHS 基因序列的保守
区域设计 1 对特异引物,并进行 PCR 扩增,扩增的
特异性比较好,获得了近 2 000 bp 的清晰条带(图
1-B)。将该条带回收后,连接到 pMD19-T 载体上,
并转化 E. coli DH5α 感受态细胞,在含有氨苄青霉
素的 LB 琼脂平板培养基上培养。挑取该平板中的
成熟阳性单菌落,菌落 PCR 鉴定阳性单菌落中含有
2 000 bp 的目的条带,结果见图 1-C。
1 MA B C
2
kb
1
2 M
2
kb
1
3 M
2
kb
1
A :决明基因组提取结果 ;B :PCR 扩增结果 ;C :菌落 PCR 结果 ;1 :经试
剂盒提取的决明基因组 DNA ;2 :经 PCR 扩增出来的 CHS 基因 ;3 :菌落
PCR 结果 ;M :DL2000 marker
图 1 电泳结果
24812427661760
10187Exon
1
Exon
2
length identity mismatches
1 760
gaps Donorsite
Acc.
site
mRNA
coordinates
Genomic
10
coordinates
70247 178 98.3% 3 0 d
995 95.1% 49 0 a
2.3 生物信息学分析结果
2.3.1 决明 CHS 的 DNA 全长分析 将含有 2 000 bp
目的条带的单菌落进行测序,测序得到的 CHS 基
因的起始序列为 ATG,终止序列为 TGA,全长为
1 766 bp,含有 1 个长度为 1 173 bp 的完整开放阅
读框(open reading frame)。将其提交 GenBank,登
录号为(JX676773)。利用 Spidey 软件分析获知决
明 CHS 基因中含有 1 个内含子和 2 个外显子,其
中内含子位置在 188-765 bp 之间,长度为 578 bp
(图 2)。
内含子 5-端碱基为 GT,3-端碱基为 AG,符
合 GU-AG 剪切规律。外显子 1 的位置在 10-187 bp,
长度为 178 bp,编码 59 个氨基酸和半胱氨酸的第一
个碱基,外显子 2 位于 766-1 760 bp,编码半胱氨
图 2 决明 CHS 基因外显子内含子分析
生物技术通报 Biotechnology Bulletin 2013年第5期102
酸的第 2、3 个碱基及 331 个氨基酸。在 NCBI 上利
用 CDD 在线工具分析决明外显子 2 编码氨基酸序列
的功能结构域,结果(图 3)显示,外显子 2 编码
氨基酸序列中包含了几乎所有 CHS 的功能位点,包
括活性位点、产物结合位点、丙二酰辅酶 A 结合位
点和二聚体接口。
product binding site
active site
malony1-CoA binding site
CHS_like
cond_enzymes superfamily
dimer interface
Query seq.
1 50 100 150 200 250 331300
Specific hits
Superfamilies
Multi-domains
图 3 外显子 2 保守结构域及活性位点分析
2.3.2 决明 CHS 的 DNA 内含子分析 通过 DNAMAN
分析获知决明 CHS 内含子中含有多个酶切位点,其
中 VspⅠ 酶 切 位 点 2 个、SnaBⅠ 酶 切 位 点 2 个 及
HpaⅠ、PacⅠ、SspⅠ酶切位点各 1 个(图 4)。使用
在线软件 PlantCARE 分析获知 CHS 基因的内含子中
含有 18 个顺式调控序列,包括光诱导反应模块、增
强子、水杨酸诱导反应元件和生理节奏控制表达元
件等 (表 2)。
1
61
121
181
241
301
361
421
481
541
Vsp I
SnaB I
Hpa I
SnaB I
Ssp I
Vsp I
Pac I
图 4 决明 CHS 内含子序列及酶切位点
2.3.3 不同物种的 CHS 基因内含子比对分析 利用
NCBI 资源库查讯到矮牵牛、百合、大豆、黄芩、金荞、
苦荞、拟南芥、日本水稻、紫叶李和欧洲赤松等 10
种植物 CHS 基因全长序列。利用在线软件 Spidey 进
行分析,发现 10 种植物的 CHS 基因中均含 2 个外
显子和 1 个内含子。不同植物 CHS 基因内含子的位
置极度保守,即位于第 65 位(以欧洲赤松 Pinus syl-
vestris 的 PSCHS 为标准)的半胱氨酸密码子内第 1
和 2 位碱基之间。但是,不同植物 CHS 基因的内含
子序列长度变化较大,其中拟南芥 CHS 基因的内含
子最短,只有 87 bp,而日本水稻 CHS 基因的内含
子最长,有 1 655 bp(表 3),表明不同植物 CHS 基
因的内含子具有多态性,推测这种差异是由于在进
化过程中,不同植物存在多样性的生活史与生活环
境,导致 CHS 基因发生不同程度的基因重复 - 分歧。
根据不同植物的内含子序列,计算 CHS 基因的
相似度,构建 NJ 系统进化树,结果(图 5)发现进
化树 Bootstrap 值较低,除蓼科植物金荞、苦荞外,
2013年第5期 103钟德馨等 :决明查尔酮合成酶全长基因序列的克隆与分析
表 2 CHS 内含子调控序列分析
名称 位置 正 / 负链 序列 功能
5UTR 富含嘧啶区 60 - TTTCTCTCTCTCTC 顺式作用元件,提高转录水平
5UTR 富含嘧啶区 236 - TTTCTTCTCT 顺式作用元件,提高转录水平
5UTR 富含嘧啶区 441 - TTTCTTCTCT 顺式作用元件,提高转录水平
ACE 351 + CTAACGTATT 顺式作用元件,参与光诱导反应
AE 盒 477 + AGAAACAT 光诱导反应的模块
4 盒 172 + ATTAAT 光诱导反应的保守 DNA 模块
4 盒 516 + ATTAAT 光诱导反应的保守 DNA 模块
CAAT 盒 18 - CAAT 启动子和增强子中常见的顺式作用元件
CAAT 盒 376 + CAAT 启动子和增强子中常见的顺式作用元件
CAAT 盒 547 - CAAT 启动子和增强子中常见的顺式作用元件
CAAT 盒 312 + CAAT 启动子和增强子中常见的顺式作用元件
G 盒 209 - CACGTT 光诱导反应中的顺式调控元件
GAG 基序 81 + AGAGAGT 光反应元件的一部分
GARE 基序 473 + AAACAGA 赤霉素反应元件
GT1 基序 468 + GGTTAA 光反应元件
I 盒 235 + AAGATAAGA 光反应元件的一部分
TCA 元件 157 + CCATCTTTTT 水杨酸诱导反应的反应元件
类 2 盒 447 + GATAATGATG 参与芽特异性表达和光诱导反应
Circadian 558 - CAAAGATATC 生理节奏控制的表达中的顺式调控元件
表 3 各物种间 CHS 基因内含子相似性
㍛ਦᵾ Prunus cerasifera
⅗⍢䎔ᶮ Pinus sylvestris
ߣ᰾ Cassia tora
ᤏই㣕 Arabidopsis thaliana
≤に Oryza sativa
㤖㦎 Fagopyrum tataricum
䠁㦎 Fagopyrum dibotrys
Ⲯਸ Liliumhybri ddivision
哴㣙 Scutellaria baicalensis
བྷ䉶 Glycine max
⸞⢥⢋ Petunia hyhrida
46
0.1
46
52
11
10
24
大部分科的植物处在不同分支上,这种差异的形成
可能与植物的生活史、生活环境等因素的影响有关,
因此很难用于不同植物的遗传分化和分子进化研究。
2.3.4 外显子 2 编码的氨基酸序列的系统进化树构
建及 Bootstrap 检验 分析不同植物 CHS 基因编码的
氨基酸序列,发现 CHS 基因中外显子 1 较短,编码
约 57-64 个氨基酸,长度变化较大 ;外显子 2 较长,
编码约 340 个氨基酸,没有大的插入和(或)缺失
突变。由于外显子 2 的长度和序列上比前者要保守,
因此进一步选择外显子 2 编码氨基酸序列构建 NJ 系
统进化树。
在用 NJ 法构建的外显子 2 系统进化树(图 6)
大部分 Bootstrap 值 >70,表明进化树可靠性较高,
从进化树中发现金荞与苦荞等蓼科植物的进化关系
更为接近,而大豆和决明等豆科植物进化关系更为
接近,表明 CHS 外显子 2 编码的氨基酸序列是 CHS
中较为保守的部分,可作为生物遗传分化和分子进
化研究中的重要依据。
图 5 内含子序列系统发育分析
物种 长度(bp)
矮牵牛 1347
百合 215
大豆 445
黄芩 99
金荞 462
苦荞 463
拟南芥 87
日本水稻 1655
紫叶李 351
决明 578
欧洲赤松 109
生物技术通报 Biotechnology Bulletin 2013年第5期104
cell lines[J]. Prostate Cancer Prostatic Dis, 2006, 9(1):68-76.
[2] 朱文振 , 马龙 , 李国荣 . 黄酮类化合物的抗癌作用及作用机
制[J]. 生命科学 , 2012, 24(5):444-449.
[3] Heller W, Craig R, Harris CM. Two alleles of single ocopy chalcones
synthase gene in parsley differ by a transporsable Olike element [J].
Arch Biochem Biophya, 1980, 200 :617-619.
[4] Nakatsuka A, Izumi Y, Yamagishi M. Spatial and temporal expression
of chalcone synthase and dihydroflavonol 4-reductase genes in the
Asiatic hybrid lily [J]. Plant Sci, 2003, 165(4):759-767.
[5] 史宝胜 , 卓丽环 , 张依 , 等 . 紫叶李叶色发育相关基因 chs 的克
隆[A]中国林学会树木学分会第十二届学术研讨会论文集[C],
2006.
[6] Akada S, Kung SD, Dube SK. Nucleotide sequence of a soybean chal-
cone synthase gene with a possible role in Ultraviolet-B sensitivity
Gmchs6[J]. Plant Physiol, 1993, 102(2):699-701.
[7] Feinbaum RL, Ausubel FM. Transcriptional regulation of the Arabid-
opsis thaliana chalcone synthase gene[J]. Mol Cell Biol, 1988, 8 :
1985-1992.
[8] 唐力英 , 王祝举 , 傅梅红 , 等 . 决明子中游离蒽醌类化学成分研
究[J]. 中药材 , 2009, 32(5):717.
[9] 廖海 , 周嘉裕 . 决明查尔酮合成酶基因的克隆及序列分析[J].
西北植物学报 , 2008, 28(9):1728-1733.
(责任编辑 李楠)
0.05
97
72
58
53
71
76
100
100
㍛ਦᵾ Prunus cerasifera
⅗⍢䎔ᶮ Pinus sylvestris
ߣ᰾ Cassia tora
ᤏই㣕 Arabidopsis thaliana
ᰕᵜ≤に Oryza sativa
㤖㦎 Fagopyrum tataricum
䠁㦎 Fagopyrum dibotrys
Ⲯਸ Lilium hybrid division
哴㣙 Scutellaria baicalensis
བྷ䉶 Glycine max
⸞⢥⢋ Petunia hyhrida
图 6 外显子序列系统发育分析
3 讨论与结论
虽然不同植物的 CHS 基因只有 1 个内含子,但
其长度变化较大,具有明显的多态性。构建不同植
物 CHS 基因内含子序列的系统进化树,结果发现大
部分科的植物处在不同分支上,很难用来不同植物
的遗传分化和分子进化研究。相比较 CHS 基因外显
子 1,外显子 2 的长度和序列均更加保守,因此构
建外显子 2 编码氨基酸序列的系统进化树能够较准
确反映不同植物的亲缘关系,可作为植物遗传分化
和分子进化研究的重要依据。
以决明子叶为材料,获得了决明 CHS 基因的全
长序列。该基因编码区起始密码子为 ATG,终止密
码子为 TGA,全长 1 766 bp。决明 CHS 基因由 1 个
内含子和 2 个外显子组成,其中外显子 2 比外显子
1 的序列更趋于保守,编码几乎所有功能位点。决
明 CHS 基因的内含子长度为 578 bp,符合 GU-AG
剪切规律,含有 Vsp Ⅰ、Sna B Ⅰ、Hpa Ⅰ、Pac Ⅰ
和 Ssp Ⅰ酶切位点,以及光诱导反应模块、增强子、
水杨酸诱导反应元件和生理节奏调控元件等 18 个顺
式调控元件,是内含子影响基因表达调控的有力结
构依据,但其具体作用机制有待进一步研究。
参 考 文 献
[1] Haddad AQ, Venkateswaran V, Viswanathan L, et al. Novel antipro-
liferation flavonoids induce cell cycle arrest in human prostate cancer