免费文献传递   相关文献

草麻黄高通量转录组分析及黄酮类代谢途径相关基因的鉴定



全 文 :浙江农业学报 Acta Agriculturae Zhejiangensis,2016,28(4):609 - 617 http:/ /www. zjnyxb. cn
马婧,成铁龙,孙灿岳,等. 草麻黄高通量转录组分析及黄酮类代谢途径相关基因的鉴定[J]. 浙江农业学报,2016,
28(4):609 - 617.
DOI:10. 3969 / j. issn. 1004-1524. 2016. 04. 11
收稿日期:2015-08-05
基金项目:林木遗传育种国家重点实验室专项(CAFYBB2012040);国家自然科学基金资助项目(31270707)
作者简介:马婧(1990—),女,山东临沂人,硕士研究生,研究方向为抗逆分子生物学。E-mail:majing19900121@ sina. com
* 通信作者,成铁龙,E-mail:ctielong@ 126. com
草麻黄高通量转录组分析及黄酮类代谢途径相关基因的鉴定
马 婧1,成铁龙1,2,* ,孙灿岳3,邓 楠1,史胜青1,江泽平1
(1.中国林业科学研究院 林业研究所 /国家林业局林木培育重点实验室,北京 100091;2.南京林业大学 生物与环境学院,江苏 南京
210037;3.南宁树木园,广西 南宁 530031)
摘 要:草麻黄(Ephedra sinica Stapf)植物富含黄酮类和生物碱类化合物,具有重要药用价值,并且适应性强,
在防风固沙、改善沙漠环境等方面具有重要作用。通过对已测序草麻黄转录组的原始数据进行重新组装、拼
接等生物信息学分析,共得到 7 947 954 个 clean reads,13 389 条 unigene 序列。经过 Nr,KOGs,GO,KEGG 和
Swiss-Prot等数据库分析后,获得 10 481 个 Nr注释,4 533 个 KOG功能注释,7 121 个 GO 功能注释,5 833 个
KEGG注释,8 039 个 Swiss-Prot注释,并利用 KEGG通路分析技术发掘草麻黄中参与黄酮类化合物代谢途径
相关基因,为克隆草麻黄黄酮合成关键基因、黄酮类化合物的生物合成提供重要的遗传资源,同时为其抗逆
机制的研究和药用价值开发提供依据。
关键词:草麻黄;转录组;高通量测序;黄酮类化合物
中图分类号:S567. 239 文献标志码:A 文章编号:1004-1524(2016)04-0609-09
Characterization of transcriptome reveals pathway of flavonoids in Ephedra sinica Stapf
MA Jing 1,CHENG Tie-long 1,2,* ,SUN Can-yue 3,DENG Nan 1,SHI Sheng-qing 1,JIANG Ze-ping 1
(1. Key Laboratory of Tree Breeding and Cultivation,State Forestry Administration / Research Institute of Forestry,
Chinese Academy of Forestry,Beijing 100091,China;2. College of Biology and the Enviroment,Nanjing Forestry U-
niversity,Nanjing 210037,China;3. Nanning Tree Garden,Nanning 530031,China)
Abstract:Ephedra sinica Stapf is not only an important medicinal plant rich in flavonoids and alkaloids,but also an
important sand-fixing plant in the desert environment. In this study,the transcriptome of E. sinica from SRA data-
base in GenBank was further analyzed by bioinformatics method. 7 947 954 clean reads and 13 389 unigenes were
acquired after de novo assembly;10 481 annotations were acquired from Nr database,4 533 from KOG database,7
121 from GO database,5 833 from KEGG database,8 039 from Swiss-Prot database after function annotation against
five databases. We also discovered a series of unigenes which were associated with flavonoids biosynthesis by KEGG
pathway analysis,which benefits the cloning of related genes and biosynthesis of related components in flavonoids
pathway. This study could provide references for understanding the resistance mechanism of E. sinica and utilization
of its medicinal value in the future studies.
Key words:Ephedra sinica Stapf;transcriptome;high-throughput sequencing;flavonoids
草麻黄(Ephedra sinica Stapf)属于麻黄科
(Ephedraceae)麻黄属(Ephedra),是草本状灌木
植物,属于超旱生、强旱生、旱生系列植物,根系
发达,适应性强,四季常绿[1]。该属植物在防风
固沙、增加植被覆盖等方面具有重要作用,是河
西和西北荒漠地区的主要建群种[1]。麻黄属在
我国有广泛的分布,现已报道的有 19 种[2],包括
5 个变种。在这 19 种麻黄植物中,草麻黄富含生
物碱(主要为麻黄碱、伪麻黄碱)和黄酮类化合
物[3 - 5],具有重要的药用价值,是中国特有的中
草药。其中黄酮类化合物是植物在长期的生态
适应过程中为抵御恶劣生态条件形成的一大类
次生代谢产物,参与植物生态防御[6],它广泛存
在于高等植物及羊齿植物的根、茎、叶、花、果实
等[7],数量种类繁多、结构类型复杂多样[8]。该
类化合物具有抑制酶活性、抗氧化、抗癌、抗菌、
抗病毒、抗炎症、抗过敏、抗糖尿病并发症等功
能,且无毒无害,对治疗和预防肿瘤、衰老、心血
管病等退变性疾病有重要意义[8 - 9]。
中国是全球天然麻黄的主要产地,内蒙古、
山西大部分地区均有较丰富的野生草麻黄资
源[10]。近年来,人们由于经济利益的驱使对草
麻黄进行了掠夺式的开发,导致麻黄资源日益匮
乏。因此利用生物技术提高麻黄品质、开发新的
麻黄资源成为今后麻黄生产利用的发展方向。
目前药用植物黄酮类化合物的研究主要集中在
提取工艺、成分分析及药理活性方面[11],同时分
子生物学也开始涉及药用植物的研究。药用植
物黄酮类化合物代谢合成途径中的相关功能基
因的研究主要集中在 CHS(查耳酮合成酶)基
因[12 - 13]、CHI(查耳酮异构酶)基因[14 - 16]、IFS(异
黄酮合成酶)基因[17]等。
随着高通量测序技术的出现,Groves等[18]利
用 RNA-seq技术在转录组水平对草麻黄的麻黄
生物碱(麻黄碱和假麻黄碱)合成途径进行了发
掘,初步发现了合成相关化合物的关键基因和通
路;然而,并未见其对黄酮类合成代谢途径的报
道。在邓楠等[19]对中麻黄黄酮类代谢途径的转
录组水平初步鉴定的基础上,为更好地了解麻黄
属植物中黄酮类代谢途径,本研究以草麻黄为研
究对象,利用 NCBI中已有的转录组原始数据,重
新进行组装、拼接,获得草麻黄的重组装转录组
数据,并初步发掘了黄酮类化合物代谢途径相关
基因,为草麻黄中该途径关键合成基因的克隆、
其遗传改良及药用价值的研究开发奠定基础。
1 材料与方法
1. 1 转录组原始数据来源
草麻黄转录组原始测序数据来自 NCBI 的
SRA数据库,测序材料为草麻黄嫩梢(shoot),平
台为 Illumina Genome Analyzer II 双端测序,编号
为 ERR364402,大小为 1. 5 G。
1. 2 数据的拼接和组装
首先将下载的 raw reads进行过滤,去除带接
头的 reads,去除 N(N表示无法确定碱基信息)的
比例大于 10%的 reads,去除低质量 reads(质量值
Qphred≤5 的碱基数占总 reads 的 50%以上),获
得 clean reads。再用 Trinity[20]对 clean reads进行
拼接,将 Trinity 拼接得到的转录本序列 tran-
script,作为后续分析的参考序列,鉴于 Trinity 拼
接的算法和原理,取每条基因中最长的转录本作
为 unigene,以此进行后续的分析。
1. 3 基因功能注释
为获得全面的基因功能信息,用 Blast 软件
将所获得的 unigene序列分别与 Nr(非冗余蛋白
数据库)、KOG(clusters of orthologous groups of
proteins)和 Swiss-prot比对(evalue < 0. 000 1),进
行功能注释和分类处理。再对 unigene 进行 GO
(gene ontology)功能注释和分类,并用 WEGO 软
件对 GO 注释结果分类作图,然后将 unigene 与
KEGG(kyoto encyclopedia of genes and genomes)
数据库进行比对,分析相关的代谢通路。
2 结果与分析
2. 1 草麻黄测序数据质量
草麻黄转录组测序统计共得到 11 654 056
raw reads,7 947 954 clean reads。本次组装的 Q20
值为 84. 72%,Q30 值为 58. 41%,序列碱基 GC
含量为 48. 40%,碱基错误率为 0. 31%,说明草麻
黄转录组测序质量相对较好,测序数据准确度较
高,能够满足后续分析研究的要求。
·016· 浙江农业学报 第 28 卷 第 4 期
2. 2 草麻黄转录本组装情况
从图 1 可以看出:transcript 和 unigene 长度
分布结果一致,长度在 200 ~ 500 bp 的序列数量
最多,分 别 为 10 357 (70. 88%)和 9 720
(72. 60%);长度大于 2 000 bp的数量最少,分别
为 64(0. 44%)和 55(0. 41%)。transcript 和 uni-
gene长度的平均值分别为 465 和 453 bp,N50 /
N90 分别为 553 bp /238 bp 和 525 bp /235 bp(表
1)。N50 /N90 值越大,反映组装得到的长片段越
多,组装效果越好。以上结果表明,组装的结果
较好,可以用于后续分析和信息挖掘工作。
2. 3 基因功能注释结果
2. 3. 1 注释结果统计
将草麻黄全部 13 389 条 unigene序列分别与
7 个数据库进行比对,包括 NR(NCBI官方蛋白序
列数据库,包括了 GenBank 基因的蛋白编码序
列),NT(NCBI 官方核酸序列数据库,包括了
GenBank,EMBL和 DDBJ 的核酸序列,但不包括
EST,STS,GSS,WGS,TSA,PAT,HTG序列),KO
图 1 草麻黄转录组 unigene 和 transcipt 数据长度分
布图
Fig. 1 Unigene and transcipt data length distribution for
transcriptome of Ephedra sinica Stapf
表 1 草麻黄转录组的 unigene和 transcript数据组装质量
统计
Table 1 Data assembly for unigene and transcript in tran-
scriptome of Ephedra sinica Stapf
数据 最大值 平均值 中间值 N50 N90 总核苷酸
Transcript长度 /bp 3224 465 336 553 238 6792993
Unigene长度 /bp 3224 453 327 525 235 6060116
注:N50 /N90 为将拼接转录本按照长度从长到短排序,累加转录
本的长度,到不小于总长 50% /90%的拼接转录本的长度。
(系统分析基因产物和化合物在细胞中的代谢途
径以及这些基因产物功能的数据库),GO(国际
标准化的基因功能描述的分类系统),Swiss-Prot
(搜集了经过有经验的生物学家整理及研究的蛋
白序列),PFAM(最全面的蛋白结构域注释的分
类系统)和 KOG(NCBI的基于基因直系同源关系
的真核生物蛋白数据库)。由表 2 可知:在 NR蛋
白序列数据库获得注释的 unigene 数量为 10 481
条,是获得注释最多的数据库,占全部注释序列
的 78. 28%。值 得 注 意 的 是,有 1 240 条
(9. 26%)unigene 序列在 7 个数据库都获得注
释,至少在一个数据库注释成功的 unigene 数量
为 10 954 条(81%),表明本次注释的结果较好,
注释的成功率较高。将草麻黄序列与其他物种
进行相似性比较,相似性最高的为松科的北美云
杉[Picea sitchensis (Bong.)Carr.](38. 1%) ,其
次为原始被子植物无油樟(Amborella trichopoda
Baill.)(6. 5%)和海枣(Phoenix dactylifera L.)
(2. 9%)等(图 2)。这也说明在进化上麻黄属与
裸子植物云杉属亲缘关系更近些,而与被子植物
亲缘关系则较远。
2. 3. 2 草麻黄转录组 GO分类结果
GO是一套国际标准化的基因功能描述的
分类系统。GO分为 3 大类,分别为 B 生物过程
表 2 Unigene注释结果统计
Table 2 Annotation for unigene of Ephedra sinica Stapf
蛋白数据库 获得注释的 unigene总数 百分比 /%
NR 10481 78. 28
NT 2653 19. 81
KO 5131 38. 32
SwissProt 8039 60. 04
PFAM 6901 51. 54
GO 7121 53. 18
KOG 4533 33. 85
图 2 Nr数据库比对上的物种分布图
Fig. 2 Species distribution of Nr database
·116·马婧,等. 草麻黄高通量转录组分析及黄酮类代谢途径相关基因的鉴定
(biological process),M 分子功能(molecular func-
tion)和 C 细胞组分(cellular component),分别用
来描述基因编码的产物所参与的生物过程、所具
有的分子功能及所处的细胞环境。经过 GO数据
库分析后获得 33 540 个注释结果,其中生物过程
15 527 个,细胞组分 9 703 个,分子功能 8 268
个。图 3 为草麻黄嫩梢基因表达的总体情况,其
中获得注释最多的为生物过程部分,而生物过程
部分获得注释最多的为 B1(代谢过程)3 952 个,
占生物过程总数的 25. 45%。值得注意的是,黄
酮类化合物代谢途径正是 B1(代谢过程)的一部
分。关于黄酮类化合物代谢途径所属的次生代
谢物代谢所占的比例则需要进一步的 KOG 功能
分类。同时,在 B7(刺激响应)和 B9(信号传导)
也获得了较多的 GO注释 unigene,它们可能直接
参与草麻黄的胁迫响应过程,为研究草麻黄抗逆
机制、提高草麻黄抗性奠定基础。
2. 3. 3 草麻黄转录组 KOG功能注释
KOG(eukaryotic ortholog groups)注释系统针
对真核生物的基因产物进行直系同源分类的数
据库,目前共有 4 852 个分类。将 13 389 条 uni-
gene序列进行 KOG 数据库分析后获得 5 090 个
注释结果,包括 4 个功能分类(图 4)。其中 O 类
(蛋白质转译后修饰、蛋白转换、分子伴侣)获得
761 个注释结果,是获得注释最多的部分。黄酮
类代谢途径所属的 Q 类(次生代谢产物生物合
成、运输和分解代谢)共获得了 208 个注释。而
黄酮类化合物又包括黄酮、黄酮醇、黄烷酮、黄烷
酮醇、异黄酮、异黄烷酮、查耳酮等。草麻黄转录
组中涉及的具体次生代谢通路还需要进一步的
B:生物过程 M:分子功能 C:细胞组成
B1 代谢过程 B16 生物附着 M1 结合 C1 细胞
B2 细胞过程 B17 繁殖过程 M2 催化活性 C2 细胞组分
B3 单一生物过程 B18 繁殖 M3 载体活性 C3 细胞器
B4 生物调节 B19 免疫系统过程 M4 结构分子活性 C4 高分子配合物
B5 定位 B20 生长 M5 核酸结合转录因子的活性 C5 膜
B6 生物过程调控 B21 细胞杀伤 M6 分子转导活性 C6 膜组分
B7 刺激响应 B22 生物相 M7 酶调节活性 C7 细胞器组分
B8 细胞组分组织或生物合成 B23 节律性过程 M8 蛋白结合转录因子的活动 C8 膜蛋白
B9 信号传递 M9 受体活性 C9 胞外区
B10 多生物过程 M10 抗氧化活性 C10 病毒
B11 涉及多细胞有机体的过程 M11 通道调节活性 C11 胞外区组分
B12 发育过程 M12 受体调节活性 C12 细胞外基质
B13 生物过程正调控 M13 鸟嘌呤核苷酸交换因子活性 C13 细胞外基质组分
B14 生物过程负调控 M14 金属伴侣蛋白活性 C14 突触
B15 移动 C15 突触组分
图 3 草麻黄转录组的 unigene GO功能分类
Fig. 3 GO function classification of unigene in transcriptome of Ephedra sinica Stapf
·216· 浙江农业学报 第 28 卷 第 4 期
A RNA加工和修改 M 细胞壁 /膜 /包膜生物合成
B 染色体结构及动力系统 O 蛋白质转译后修饰、蛋白转
换、分子伴侣
C 能量生产和转换 P 无机离子运输和代谢
D 细胞周期控制、细胞分裂、
染色体分区
Q 次生代谢产物生物合成、运
输和分解代谢
E 氨基酸运输和代谢 R 一般功能预测
F 核苷酸运输和代谢 S 未知功能
G 碳水化合物运输和代谢 T 信号传导机制
H 辅酶运输和代谢 U 细胞内运输、分泌和膜泡运输
I 脂类运输和代谢 V 防御机制
J 翻译、核糖体结构和生物转化 W 细胞外结构
K 转录 Y 核结构
L 复制、重组和修复 Z 细胞骨架
图 4 草麻黄转录组的 unigene KOG功能分类
Fig. 4 KOG function classification of unigene in transcrip-
tome of Ephedra sinica Stapf
KEGG代谢通路分析。同时在 T 类(信号传导机
制)和 V类(防御机制)分别获得了 354 和 53 个
注释,这些注释到的相关基因可能参与草麻黄的
次生代谢物代谢和胁迫响应过程,为改良麻黄品
质、提高麻黄抗性提供资源。
2. 3. 4 草麻黄转录组 KEGG分类
KEGG数据库涉及系统信息、基因组信息和
化学信息,是系统分析基因产物在细胞中的代谢
途径以及基因产物功能的数据库。利用 KEGG
数据库可以进一步研究基因在生物学上的复杂
行为,有助于进一步研究特定基因的生物功能。
将草麻黄转录组 unigene序列与 KEGG 数据库进
行比对,共获得 5 833 个注释结果,涉及代谢通路
可分为 5 大类:细胞过程(cellular processes)(659
个,11. 30%) ,环境信息处理(environmental infor-
mation processing)(465 个,7. 97%) ,遗传信息处
理(genetic information processing)(1 235 个,
21. 17%) ,代 谢 (metabolism )(2 586 个,
44. 33%) ,生物系统(organismal systems)(888
个,15. 23%) (图 5)。其中,获得注释最多的为
代谢部分的碳水化合物代谢,获得 562 个注释,
最少的为环境信息处理的信号分子和相互作用,
为 5 个注释。在全部 5 833 个注释结果中,涉及
次生代谢物代谢的 unigene 共 288 个,其中黄酮
类化合物代谢相关基因共 70 个,包括类黄酮代
谢相关基因 56 个,异黄酮代谢相关基因 1 个,黄
酮和黄酮醇代谢相关基因 13 个(表 3)。这说明
本研究从草麻黄转录组中发掘到了较丰富的次
生代谢相关基因,其中黄酮类不仅具有重要的药
用价值,还可能参与草麻黄的胁迫响应。这些
unigene序列为今后草麻黄的次生代谢遗传工程
研究提供了遗传资源,也展现出了高通量测序技
术鉴定代谢途径相关基因的实用性。
2. 4 草麻黄转录组中黄酮类化合物代谢相关基
因发掘
植物在长期的进化过程中与其生存环境相
互作用,并根据初生生长的需要产生各种类型的
次生代谢物[21],在这些次生代谢物中,黄酮类化
合物是植物在生态适应过程中为抵御恶劣生态
条件而形成的,并参与植物生态防御、担当生殖
过程的信使[22]。黄酮类化合物种类繁多,主要
分为黄酮醇(flavonols)、黄酮(flavones)、异黄酮
(isoflavones)和花色素苷(anthocyanins)等[23],并
且,这些化合物在细胞内的合成过程发生在不同
位置[24]。从 KEGG 分析可以看出,共获得黄酮
类化合物代谢相关基因 70 个,表 3 列出了获得
的代谢通路相关的 unigene 和注释信息,注释基
因较多的为类黄酮代谢通路,代谢通路中注释的
关键基因的位置和数量如图 6 所示。草麻黄黄
酮类化合物合成的前体是简单酚类,其中 PAL
催化 L-苯丙氨酸形成反式肉桂酸,从而提供了初
生代谢和苯丙烷代谢途径之间的代谢联系。查
尔酮合成酶(CHS)是接下来过程的第一个关键
酶,将苯丙烷代谢途径引向黄酮类化合物的合
成。CHS是苯丙烷系代谢途径中含量最丰富的
酶之一,但该酶的催化效率较低,其转录受到高
浓度肉桂酸的抑制及高浓度香豆酸的促进[25]。
接下来步骤中的关键酶是查尔酮异构化酶
(CHI),催化查尔酮合成柚皮素、二氢黄酮、无花
色素等代谢物。黄酮醇合成酶(FLS)是黄酮醇合
·316·马婧,等. 草麻黄高通量转录组分析及黄酮类代谢途径相关基因的鉴定
G遗传信息处理 C细胞过程 B生物系统 E环境信息处理 M代谢
G1 翻译 C1 运输和代谢 B1 内分泌
系统
B7 排泄系统 E1 信号转导 M1 碳水化合
物代谢
M7 其他氨基
酸的代谢
G2 折叠,分类和
降解
C2 细胞生长和
死亡
B2 神经系

B8 发育 E2 膜转运 M2 能量代谢 M8 核苷酸
代谢
G3 转录 C3 细胞共同体 B3 环境的
适应
B9 感官系统 E3 信号分子和
相互作用
M3 氨基酸
代谢
M9 萜类和酮类
化合物的代谢
G4 复制和
修复
C4 细胞运动 B4 免疫系

M4 脂质代谢
M10 外来物质的
降解和代谢
B5 消化系

M5 辅酶因子和
维生素代谢
M11 多糖的生
物合成与
代谢
B6 循环系

M6 其他次生代
谢产物的生
物合成
图 5 草麻黄转录组的 unigene KEGG代谢途径分类
Fig. 5 KEGG classification of unigene in transcriptome of Ephedra sinica Stapf
表 3 草麻黄转录组黄酮类化合物合成途径中的相关基因
Table 3 Flavonoid biosynthesis related gene in transcriptome of Ephedra sinica Stapf
KO编号 基因名称(英) 基因名称(中) 简写 unigene序列编号
黄酮和黄酮醇代谢通路 ID:ko00944
K05279 Flavonol 3-O-methyltransferase 黄酮醇 3’-O-甲基转移酶 AtOMT1 c10359_g1 /c14996_g1 /c14842_g1 /
K13083 flavonoid 3',5'-hydroxylase 类黄酮 3’,5’-羟化酶 F3’5’H c15359_g1 /c10385_g1 /c14503_g1 /
c12500_g1 / c14398_g1 / c12713_g1 /
K05280 flavonoid 3'-monooxygenase 类黄酮 3’-单加氧酶 F3’M c13173_g1 /c7848_g1 /c12719_g1 /
c5787_g1 /
类黄酮代谢通路 ID:ko00941
K13065 Shikimate O-hydroxycinnamoyltransferase 莽草 /荃宁酸酯转移酶 HCT c7180_g1 /c8816_g1 /c10714_g1 /
c15475_g1 /c8271_g1 /c8791_g1 /
c5331_g1 /c2415_g1 / c11452_g1 /
K08695 anthocyanidin reductase 花青素还原酶 ANR c10675_g1 /c4165_g1 /c13516_g1 /
c15063_g1 / c14552_g1 /
K13083 flavonoid 3',5'-hydroxylase 类黄酮 3’,5’-羟化酶 F3’5’H c15359_g1 /c10385_g1 /c14503_g1 /
c12500_g1 / c14398_g1 / c12713_g1 /
K13082 Bifunctional dihydroflavonol 4-reductase /
flavanone 4-reductase
二氢黄酮醇 4-还原酶 /黄酮 4-还
原酶
DFR c8210_g1 /c11065_g1 /c13223_g1 /
c13781_g1 /c11906_g1 /c2285_g1 /
c13195_g1 /c9960_g1 / c8567_g1 /
K13081 leucoanthocyanidin reductase 无色花青素还原酶 LAR c9454_g1 / c8813_g1 /
·416· 浙江农业学报 第 28 卷 第 4 期
续表 3
KO编号 基因名称(英) 基因名称(中) 简写 unigene序列编号
K01859 chalcone isomerase 查尔酮异构化酶 CHI c5492_g1 /
K00475 naringenin 3-dioxygenase 黄碱酮 3’-二加氧酶 N3D c1850_g1 /c94_g1 /c11438_g1 /
K05277 leucoanthocyanidin dioxygenase 无色花色素双加氧酶 LDOX c12902_g1 /c10253_g1 /c3097_g1 /
c7165_g1 /
K00660 chalcone synthase 查尔酮合酶 CHS c11879_g1 / c9963_g1 /
K09754 coumaroylquinate 3'-monooxygenase 香豆小叶 3’-单加氧酶 C3'H c590_g1 /c11298_g1 / c1580_g1 /
K00588 caffeoyl-CoA O-methyltransferase 咖啡酰辅酶 A-O-甲基转移酶 CCoAOMT c11933_g1 / c10464_g1 /
K05278 flavonol synthase 黄酮醇合成酶 FLS c11493_g1 /
K00487 trans-cinnamate 4-monooxygenase 肉桂酸-4-羟化酶 C4H c3711_g1 /c5971_g1 /c7717_g1 /
c11687_g1 / c12858_g1 /
K05280 flavonoid 3'-monooxygenase 类黄酮 3’-单加氧酶 F3’M c13173_g1 /c7848_g1 /c12719_g1 /
c5787_g1 /
异黄酮代谢通路 ID:ko00943
K13263 isoflavone 7-O-glucosyltransferase 大豆异黄酮 7-O-葡萄糖基转移酶 IF7GT c11536_g1 /
图 6 草麻黄黄酮代谢通路
Fig. 6 Flavonoids metabolic pathway of Ephedra sinica Stapf
成代谢支路的关键酶,由此可合成槲皮素、杨梅
素等具有药用价值的代谢物。本次草麻黄转录
组鉴定阐明了草麻黄黄酮类化合物的生物合成
途径并鉴定了关键酶的基因,为进一步研究次生
代谢调控奠定了基础。这些基因的发现为进一
步克隆其全长、研究其功能提供了基础数据,同
时也为草麻黄黄酮类化合物的生物合成研究奠
定了基础。本研究为应用生物技术方法获取草
麻黄有效成分或其中间体提供了一定的科学
依据。
3 讨论
草麻黄作为麻黄属中重要的药用植物、牧草
品种和荒漠建群物种,其分子遗传方面的研究还
处于空白状态,严重影响草麻黄的研究和利用。
为了弥补这一空白,充分利用数据库中的数据资
源,本研究对 NCBI 中 SRA 数据库中的草麻黄转
录组测序原始数据经组装以及注释,获得了 13
389 条 unigene序列,平均长度为 453 bp,对比麻
黄属中其他物种的转录组组装结果,如中麻黄
(E. intermedin)转录组的 unigene 平均长度为
482 bp,N50 为 612 bp[19],膜果麻黄(E. przewal-
skii)转录组的 unigene平均长度为 517 bp,N50 为
663 bp[26]。说明了本次数据组装的效果较好,获
得了大量的遗传信息,为草麻黄这类基因组图谱
·516·马婧,等. 草麻黄高通量转录组分析及黄酮类代谢途径相关基因的鉴定
尚未完成且遗传数据信息相对匮乏的非模式物
种提供了良好的研究基础。
本研究对草麻黄转录组的鉴定,除了获得了
CHS(查耳酮合成酶)基因、CHI(查耳酮异构酶)
基因、IFS(异黄酮合成酶)基因、F3H(黄烷酮 3
羟化酶)基因、FLS(黄酮醇合成酶)基因、DFR
(二氢黄酮醇还原酶)基因等研究较多且在黄酮
类代谢途径中具有关键作用的基因以外,还获得
了其他重要的基因,如肉桂酸合成关键基因
PAL、槲皮素合成关键基因 F3’5’H、黄酮合成关
键基因 FNS等。并且与中麻黄种子萌发期间黄
酮类化合物合成途径相关基因相比[19],中麻黄
种子萌发期间黄酮类合成涉及的基因家族在本
次草麻黄注释中均获得,但注释的基因数量不
同。IF7G(isoflavone 7-O-glucosyltransferase,异黄
酮 7-O-葡糖基转移酶)和 FMT(flavonol 3-O-meth-
yltransferase,黄酮醇 3-O-甲基转移酶)仅在草麻
黄转录组中有注释,而在中麻黄中并没有注释,
其原因可能是组织特异性引起的,也可能是这 2
个基因具有种间特异性,这还需后续研究进一步
鉴定。其中,IF7G是异黄酮代谢过程所特有的基
因,异黄酮对人体有重要的作用,不仅具有抗氧
化和抗肿瘤活性,还能预防心血管疾病和骨质疏
松症[27 - 29]。但异黄酮在植物体内含量较低,目
前的研究发现,天然的大部分异黄酮仅分布于豆
类中,还远远不能满足人类的需求,通过化学手
段合成异黄酮工艺较复杂、成本高,因此通过基
因和代谢工程手段提高植物异黄酮的含量具有
诱人的前景。虽然目前异黄酮合酶已经在非豆
科植物中转化成功,但是转基因植株累积的异黄
酮含量仅为普通大豆的 20% ~ 40%[30]。本研究
中草麻黄 IF7G 基因的获得为 IF7G 基因的克隆
及异黄酮的代谢遗传工程研究提供了重要的基
因资源。
黄酮类化合物等植物次生代谢机制一直是
十分活跃的前沿研究领域,这也是目前了解的最
为清楚的植物次生代谢产物合成途径。植物药
以其天然低毒的特点倍受青睐,而黄酮类化合物
更是以其药理作用引人瞩目,开发利用植物的天
然黄酮化合物已经成为目前的研究热点。另外,
黄酮类化合物是植物在长期的生态适应过程中
抵御外界恶劣生态条件、动物、微生物的攻击而
产生的次级代谢产物,参与植物生态防御,提高
植物在某些逆境胁迫中的抗性。草麻黄作为生
长在干旱、盐碱地等极端条件下的植物,具有非
常强的抗旱、耐盐碱、抗病等能力,具有较高的研
究价值。本研究获得的草麻黄黄酮类等其他次
生代谢物的相关基因,为克隆草麻黄中的黄酮合
成关键基因提供了基础,为更好地研究其抗逆机
制和药用价值以及开发提供了宝贵的遗传资源。
参考文献:
[1] 孔红,陈荃,马骥. 麻黄属 2 种植物的核型研究[J]. 兰州
大学学报(自然科学版),2001,37(3) :100 - 103.
[2] 沈观冕. 中国麻黄属的地理分布与演化[J]. 植物分类与
资源学报,1995 (1):15 - 20.
[3] 吕霞,郭青,钟文英. 色谱法在麻黄生物碱手性分析中的
研究进展[J]. 现代药物与临床,2011,26(3):181 - 187.
[4] AL-KHALIL S,ALKOFAHI A,EL-EISAWI D,et al. Tran-
storine,a new quinoline alkaloid from Ephedra transitoria[J].
Journal of Natural Products,1998,61(2) :262 - 263.
[5] 陶华明,朱全红,刘永宏. 草麻黄根的黄酮类成分研究
[J]. 中草药,2011,42(9):1678 - 1682.
[6] 诸姮,胡宏友,卢昌义,等. 植物体内的黄酮类化合物代
谢及其调控研究进展[J]. 厦门大学学报(自然科学版),
2007,46(S1) :136 - 143.
[7] BANDELE O J,NEIL O. Bioflavonoids as poisons of human
topoisomerase II alpha and II beta[J]. Biochemistry,2007,
46 (20) :6097 - 6108.
[8] 延玺,刘会青,邹永青,等. 黄酮类化合物生理活性及合
成研究进展[J]. 有机化学,2008,28(9):1534 - 1544.
[9] SAIJA A,SCALESE M,LANZA M,et al. Flavonoids as an-
tioxidant agents:importance of their interaction with biomem-
branes[J]. Free Radical Biology & Medicine,1995,19(4) :
481 - 486.
[10] 邵为民,陈吉军,兰江,等. 吐鲁番地区麻黄草资源分布
及其利用现状[J]. 新疆畜牧业,2001 (1):37 - 38.
[11] 赵娅敏,马好文,孟淑娟. 紫花苜蓿中黄酮类化学成分
及其生物活性研究进展[J]. 中草药,2013,44(22):
3245 - 3252.
[12] PETIT P,GRANIER T,DESTAINTOT B L,et al. Crystal
structure of grape dihydroflavonol 4-reductase,a key enzyme
in flavonoid biosynthesis[J]. Journal of Molecular Biology,
2007,368(5) :1345 - 1357.
[13] 文海涛,赵红英,肖凤霞,等. 化州柚查尔酮合成酶基因
克隆与序列分析[J]. 生物学杂志,2011,28(1):39
- 41.
[14] MEHDY M C,LAMB C J. Chalcone isomerase cDNA clo-
ning and mRNA induction by fungal elicitor,wounding and
infection [J]. Plant Physiology,1987,6 (6) :1527
·616· 浙江农业学报 第 28 卷 第 4 期
- 1533.
[15] 刘春霞,王玥,崔明昆,等. 灯盏花 chi 的克隆及其生物
信息学分析[J]. 武汉植物学研究,2010,28(6):682
- 690.
[16] 刘长英,赵爱春,李军,等. 桑树查尔酮异构酶基因的克
隆与原核表达分析[J]. 林业科学,2013,49(2):39
- 45.
[17] 张丹凤. 蒙古黄芪异黄酮合成酶基因的克隆及序列分析
[D]. 福州:福建农林大学,2004.
[18] GROVES R A,HAGEL J M,YE Z,et al. Transcriptome
profiling of Khat(Catha edulis)and Ephedra sinica reveals
gene candidates potentially involved in amphetamine-type al-
kaloid biosynthesis[J]. Plos One,2015,10(3):e119701.
[19] 邓楠,史胜青,常二梅,等. 基于中麻黄萌发种子转录组
的黄酮类化合物合成途径基因的挖掘[J]. 林业科学研
究,2014,27(6):758 - 763.
[20] GRABHERR M G,HAAS B J,YASSOUR M,et al. Full-
length transcriptome assembly from RNA-Seq data without a
reference genome[J]. Nature Biotechnology,2011,29(7) :
644 - 652.
[21] 陈晓亚. 植物生理与分子生物学[M]. 北京:科学出版
社,1998:390 - 399.
[22] MO Y,NAGEL C,TAYLOR L P. Biochemical complement-
ation of chalcone synthase mutants defines a role for flavonols
in functional pollen[J]. Proceedings of the National Acade-
my of Sciences of the United States of America,1992,89
(15):7213 - 7217.
[23] TAYLOR L P,GROTEWOLD E. Flavonoids as developmen-
tal regulators[J]. Current Opinion in Plant Biology,2005,
8(3) :317 - 323.
[24] HARBORNE J B. 黄酮类化合物[M]. 戴伦凯,译. 北京:
科学出版社,1983.
[25] LOAKE G J,CHOUDHARY A D,HARRISON M J,et al.
Phenylpropanoid pathway intermediates regulate transient ex-
pression of a chalcone synthase gene promoter[J]. The Plant
Cell,1991,3(8):829 - 840.
[26] 邓楠,史胜青,常二梅,等. 膜果麻黄种子不同发育时期
的转录组测序分析[J]. 东北林业大学学报,2015,43
(2):28 - 32.
[27] XU B,CHANG S K C. Characterization of phenolic sub-
stances and antioxidant properties of food soybeans grown in
the North Dakota-Minnesota region[J]. Journal of Agricul-
tural and Food Chemistry,2008,56(19) :9102 - 9113.
[28] PETERSON C A,SCHNELL J D,KUBAS K L,et al.
Effects of soy isoflavone consumption on bone structure and
milk mineral concentration in a rat model of lactation-associ-
ated bone loss[J]. European Journal of Nutrition,2009,48
(2) :84 - 91.
[29] LI S H,LIU X X,BAI Y Y,et al. Effect of oral isoflavone
supplementation on vascular endothelial function in postmeno-
pausal women:a meta-analysis of randomized placebo-con-
trolled trials[J]. The American Journal of Clinical Nutrition,
2010,91(2) :480 - 486.
[30] 陈宣钦,张乐,徐慧妮,等. 大豆异黄酮生物合成关键酶
及其代谢工程研究进展[J]. 中国生物工程杂志,2012,
32(7):133.
(责任编辑 侯春晓)
·716·马婧,等. 草麻黄高通量转录组分析及黄酮类代谢途径相关基因的鉴定