免费文献传递   相关文献

Study on transcriptome characteristic of Angelica Sinensis Radix by Illumina HiSeq 2000 sequencing

基于Illumina HiSeq 2000测序技术对当归根的转录组特性研究



全 文 :中草药 Chinese Traditional and Herbal Drugs 第 46 卷 第 8 期 2015 年 4 月

• 1216 •
基于 Illumina HiSeq 2000 测序技术对当归根的转录组特性研究
杨 杰 1,王金权 2*,丁维俊 3,李炜弘 3,刘宏伟 4
1. 贵州省毕节医学高等专科学校,贵州 毕节 551700
2. 平凉医学高等专科学校,甘肃 平凉 744000
3. 成都中医药大学,四川 成都 610075
4. 上海伯豪生物技术有限公司,上海 201203
摘 要:目的 识别当归 Angelica sinensis 根药用活性物质的基因序列,阐释当归次生代谢产物生物合成的遗传基础。方法 从
当归头、当归尾提取总 RNA,质量鉴定合格后构建测序文库。测序文库检测合格后在 Illumina HiSeq 2000 测序仪上完成双
端测序。采用相关生物信息学方法分析当归根的转录组特性。结果 采用 Illumina HiSeq 2000 高通量测序获得当归根转录组
的 66 431 540 个原始短读序。用生物信息学方法从头组装并注释了 30 432 个功能基因序列(unigene)。应用 Uniprot 蛋白数
据库进行序列相似性比对,当归功能基因序列主要分布于目前研究较深入的 7 种重要经济作物,如葡萄、蓖麻、毛果杨、大
豆、苜蓿、拟南芥和烟草。研究发现,当归根表达的 127、69、70、94 个 unigene 分别映射到类苯基丙烷生物合成、N-聚糖
生物合成、黄酮类化合物生物合成和叶酸生物合成等路径,可能参与药用活性物质阿魏酸、当归多糖、当归总黄酮和叶酸的
生物合成。结论 参与当归根重要药效物质(阿魏酸、当归多糖、当归总黄酮等)生物合成的功能基因序列可能是当归补血、
活血功效的分子生物学基础。
关键词:Illumina HiSeq 2000 高通量测序;采收期;当归根;转录组特性;次生代谢;当归多糖;阿魏酸
中图分类号:R282.12 文献标志码:A 文章编号:0253 - 2670(2015)08 - 1216 - 07
DOI: 10.7501/j.issn.0253-2670.2015.08.022
Study on transcriptome characteristic of Angelica Sinensis Radix by Illumina HiSeq
2000 sequencing
YANG Jie1, WANG Jin-quan2, DING Wei-jun3, LI Wei-hong3, LIU Hong-wei4
1. Bijie Medical College of Guizhou Province, Bijie 551700, China
2. Pingliang Medical College of Gansu Province, Pingliang 744000, China
3. Chengdu University of TCM, Chengdu 610075, China
4. Shanghai Bohao Biotechnology Co., Ltd., Shanghai 201203, China
Abstract: Objective To explore the hereditary basis of secondary metabolic biosynthesis in Angelica Sinensis Radix (the roots of Angelica
Sinensis) and identify the gene sequence of active substance in Angelica Sinensis Radix. Methods The samples of Angelica Sinensis Radix were
collected in Min County of Gansu Province and were identified by relevant experts. Total RNA was extracted from the heads and tails of Angelica
sinensis. Sequencing library was constructed and qualified. Then, Double-ended sequencing was accomplished in Illumina HiSeq 2000 device.
Transcriptome characteristic of Angelica Sinensis Radix was analyzed by relevant bioinformatics. Results We obtained 66 431 540 primitive
sequences of Angelica Sinensis Radix by Illumina HiSeq 2000 high-flux sequencing and annotated 30 432 unigenes by bioinformatics. The
important economic crop distributed in Angelica Sinensis Radix sequences are Vitis vinifera, Ricinus communis, Populus trichocarpa, Glycine max,
Medicago truncatula, Arabidopsis thaliana, and Nicotiana tabacum through comparing with 939 species sequences in Uniprot protein library. It
was suggested that 127, 69, 70, and 94 unigenes expressed in Angelica Sinensis Radix were respectively mapped to the pathway of phenylpropanoid
biosynthesis, N-glycan biosynthesis, flavonoid biosynthesis, and folate biosynthesis. These unigenes are related to the biosynthesis of important
active substances, for example ferulic acid, polysaccharide, flavonoid, and folic acid in Angelica Sinensis Radix. Conclusion Unigenes explored in
the present paper are involved in the biosynthesis of major pharmaceutical substances, suggesting the genetic basis of Angelica Sinensis Radix.
Key words: Illumina HiSeq 2000 high-flux sequencing; harvest period; Angelica Sinensis Radix; transcriptome characteristic;
secondary metabolism; Angelica sinensis polysaccharide; ferulic acid

收稿日期:2014-11-22
作者简介:杨 杰(1976—),男,讲师,研究方向为分子药理学。E-mail: yangjiee2012@sina.cn
*通信作者 王金权(1964—),男,副教授,研究方向为临床药理学。E-mail: 2996044943@qq.com
中草药 Chinese Traditional and Herbal Drugs 第 46 卷 第 8 期 2015 年 4 月

• 1217 •
当归 Angelica sinensis (Oliv.) Diels 属伞形科
(Umbelliferae)多年生草本植物,主产于甘肃、云南
和四川等地。其中,甘肃岷县所产当归,产量大,
质量好,畅销国内,驰名海外,历来被认为是中医
用药的道地药材。岷县古称“秦州”,岷县所产当归,
又有“秦归”之名。当归被视为补血、活血要药,
临床应用十分讲究。当归根中含有大量具有药用活
性的次级代谢产物,如当归多糖、阿魏酸、当归总
黄酮和叶酸等[1]。当归多糖由鼠李糖、阿拉伯糖、甘
露糖、葡萄糖、半乳糖组成,具有保肝、调节免疫、
抗氧化、抗肿瘤、抗血小板聚集和促进骨髓造血等
药理作用,与当归补血、活血功效相关[2-3]。阿魏酸
可减少血栓素 A2(TXA2)的生成,抑制血小板聚集,
具有抗血栓等药理作用,为当归活血的物质基础,
常常作为当归质量评价的标志性化合物[1,4-7]。
当归具有重要的药用价值和经济价值,但其基
因组研究十分缺乏。在当归早期的基因研究中,张
西玲等[8]用DNA测序技术建立岷归的 rRNA基因图
谱;Yu 等[9]用 cDNA-AFLP 分析技术阐释岷归抽薹
的分子调控机制,均有助于当归品种品质鉴定,却
难以阐明当归次生代谢产物生物合成的基因表达调
控机制。近年来,RNA 高通量测序技术的快速发展
促进了植物基因表达研究,并应用于西洋参、丹参、
虎杖和甘草等多种药用植物[10-11]。Illumina HiSeq
2000 第 2 代高通量测序技术平台以高通量、高分辨
率、高精度和价格低廉等优势发挥着巨大作用,已
应用于人类基因组测序[10,12]。本研究首次用 Illumina
HiSeq 2000 技术测序采收期当归根转录组,分析其
转录组特性。本研究还发现了已注释当归基因序列
主要分布于目前研究较深入的 7 种重要经济作物,
并识别了与当归重要药效物质(阿魏酸、当归多糖、
当归总黄酮等)生物合成相关的基因序列,阐释了
当归补血、活血功效的分子生物学基础。
1 材料与方法
1.1 转录组测序
1.1.1 样本采集 在甘肃岷县清水乡当归主要生产
区采收期现场收集 5 个代表性新鲜当归样品,并经
平凉医学高等专科学校药用植物学程亚青教授鉴定
为当归 Angelica sinensis (Oliv.) Diels,分别取归头、
归尾各 0.5 g,共 10 个样本,立即投入液氮中保存,
干冰运输。
1.1.2 RNA 提取与纯化 从当归头、当归尾分别提
取总 RNA[13],所得总 RNA 经 ND-1000 分光光度计
和 Agilent2100 系统电泳质检合格后备用。每个样本
各取 3 μg RNA 混合得到 1 个混合样本,并采用
RNeasy Micro kit 按其操作流程纯化 20 μg 总 RNA,
所得产物用于测序文库构建。
1.1.3 测序文库构建与质检 按照“TruSeq RNA
Sample Preparation Guide”对纯化后的总 RNA 进行
mRNA 的分离、片段化、第一链 cDNA 合成、第二链
cDNA 合成、末端修复、3’末端加 A、连接接头、富
集等步骤,完成测序样本文库构建。所建测序文库经
Qubit®2.0 Fluorometer 和 Agilent 2100 系统检测合格
后,在 Illumina HiSeq 2000 测序仪上完成双端测序。
转录组测序实验委托上海伯豪生物有限公司完成。
1.2 数据预处理
将预处理后测序数据的质量信息进行统计,碱
基测序质量值范围为27~40。测序错误率用E表示,
碱基测序质量值用 sQ 表示,其中 sQ=−10 lgE。
去除总体质量偏低的读序,去除读序中含有的
模糊 N 碱基、去除长度小于 20 bp 的读序以及含有
的接头序列后所得读序为干净读序。
1.3 短读序组装
1.3.1 原始序列组装 将样本测序数据读序,应用
CLC Genomics Workbench(version: 5.5)[14-15]的
scaffolding contig 算法进行从头合成拼接,此阶段拼
接得出的序列称之为初始序列。
1.3.2 最终序列组装 应用 CAP3 EST 拼接软件对
两个样本得到的初始短读序进行混合拼接,得到一
个最终序列集合。采用 CAP3 软件的策略为对初始
序列进行 2 次拼接,第 1 次使用宽松拼接参数进行
初始拼接,第 2 次使用严格拼接参数进行拼接。
1.4 功能基因序列注释、功能分类和代谢路径分析
1.4.1 功能基因序列注释 将最终序列与蛋白质
数据库(UniProt-date:2012.09)进行 Blastx 比对
(将核酸序列翻译为蛋白,再进行比对)[16]。以
trEMBL+swissprot,E<1e−5 为筛选条件。UniProt
数据库是目前对蛋白功能结构注释最为详细且准确
的蛋白数据库,大概包括 22 000 000 个蛋白。
1.4.2 功能基因序列表达分析 以最终序列作为参
考,将样本的读序进行参考映射,从而得到样本在
每个功能基因序列中的一个读序的覆盖度,应用
RPKM 量化标准对读序覆盖度进行表达量计算,公
式为 RPKM=覆盖整个功能基因序列的读序数目/
功能基因序列长度×该样本所有参与拼接的总读序
数目×109。
中草药 Chinese Traditional and Herbal Drugs 第 46 卷 第 8 期 2015 年 4 月

• 1218 •
1.4.3 基因本体(gene ontology,GO)分类 GO
是一个国际标准化的基因功能分类体系,提供了
一套动态更新的标准词汇表来全面描述生物体
中的基因和基因产物的属性。根据 UniProt 蛋白
质数据库的注释结果,应用 Blast2 GO 算法进行
GO 功能分类,得到分子功能、细胞成分、生物
学过程各个层次所占数目,从宏观上认识当归基
因功能分布特征。
1.4.4 代谢路径注释 Kyoto Encyclopedia of
Genes and Genomes(KEGG)是系统分析基因产物
在细胞中的代谢途径以及这些基因产物的功能数据
库。应用 KEGG KEGG Automatic Annotation Server
(KEGG KAAS)在线 pathway 比对分析工具对拼接
得到的功能基因序列进行 KEGG 映射分析,进一步
得到功能基因序列的代谢路径注释。
2 结果与分析
2.1 转录组测序产出及序列组装
由 Illumina HiSeq 2000高通量测序获得66 432 540
个原始读序。经去除总体质量偏低和含有接头序列
的读序后所得到的干净读序为 62 539 584 个。由这
些短读序组装出 110 706 个重叠群(N),平均长度
556 bp,N50 930 bp。因后续注释分析基于功能基因
序列,因此应用 CLC Genomics Workbench(version:
5.5)的 scaffolding contig 算法进行从头合成拼接出
65 674 个功能基因序列(unigene),平均长度 1 004
bp,N50 1 544 bp(表 1)。再应用 CAP3 EST 拼接
软件对 2 个样本得到的功能基因序列进行混合拼
接,得到 63 585 个功能基因序列,平均长度 1 035
bp,N50 1 608 bp(表 1)。从图 1 可知,约 16 000
个功能基因序列长度为 400 nt。
表 1 序列组装统计
Table 1 Sequence assembe statistics
统计数据 计数 总长度/bp N25/bp N50/bp N75/bp 平均长度/bp 最长长度/bp GC/%
重叠群 110 706 61 588 365 1 856 930 387 556 13 783 36.3
初始功能基因序列 65 674 65 924 288 2 542 1 544 786 1 004 13 783 36.3
最终功能基因序列 63 585 65 828 132 2 614 1 608 825 1 035 13 783 36.3


图 1 当归功能基因序列长度分析
Fig. 1 Analysis on unigene sequence length in A. sinensis
2.2 功能基因序列注释
目前无药用植物当归全基因组测序,因此将最
终功能基因序列与 UniProt(date:2012.09)库进行
Blastx比对,注释上的功能基因序列数目为 30 432个,
注释比例为 47.9%。经 Blastx 比对,发现当归功能基
因序列主要分布于目前研究较深入的7种重要经济作
物,如葡萄、蓖麻、毛果杨、大豆、苜蓿、拟南芥和
烟草。在映射到 7 种重要经济作物的当归功能基因序
列中,完全匹配程度大于 40%的功能基因序列见表 2。
其中,RPKM 值最高为 25.84,最低为 0.79,说明
Illumina HiSeq 2000 高通量测序能检测低水平的同源
基因表达。序列分布的同源性以 E<1e−5为筛选条件,
即 E 值越小,同源性越可靠。
2.3 GO 分类
GO 的功能是按照树形结构进行排布的,一般
层数越深,功能越详细,但相应的冗余也随之增加,
目前第二层功能用的比较广泛。从图 2 可知,以生
物学过程、细胞过程和细胞成分过程 3 方面对当归
功能基因序列进行阐释,发现参与代谢过程的功能
基因序列数目为 13 688 个(占已注释序列比例的
44.98%),参与催化活性的功能基因序列数目为
10 684 个(占已注释序列比例的 35.11%)。研究发
现,当归中微量元素量丰富,能激活体内酶的合成
与分泌,与酶催化的细胞代谢过程相关。
0.
4
0.
8
1.
2
1.
6
2.
0
2.
4
2.
8
3.
2
3.
6
4.
0
4.
4
4.
8

5.
0
长度/×103bp
18
16
14
12
10
8
6
4
2









×
10
3
中草药 Chinese Traditional and Herbal Drugs 第 46 卷 第 8 期 2015 年 4 月

• 1219 •
表 2 当归与重要经济作物功能基因序列的匹配程度
Table 2 Unigene identity between A. sinensis and important economic crops
功能基因序列 ID 功能基因序列长度/bp 完全匹配长度/bp 完全匹配程度/% RPKM 同源物种
mix_no_rRNA.1_ (paired)_contig_25301 422 200 47.39 0.90 葡萄
mix_no_rRNA.1_ (paired)_contig_39406 225 92 40.89 0.95 葡萄
mix_no_rRNA.1_ (paired)_contig_33668 293 119 40.61 0.79 葡萄
mix_no_rRNA.1_ (paired)_contig_41597 524 222 42.37 0.88 蓖麻
mix_no_rRNA.1_ (paired)_contig_51685 613 261 42.58 1.08 毛果杨
mix_no_rRNA.1_ (paired)_contig_13342 542 227 41.88 1.77 毛果杨
mix_no_rRNA.1_ (paired)_contig_56147 386 161 41.71 1.07 毛果杨
mix_no_rRNA.1_ (paired)_contig_59872 250 103 41.20 0.79 毛果杨
mix_no_rRNA.1_ (paired)_contig_19874 331 165 49.85 6.78 大豆
mix_no_rRNA.1_ (paired)_contig_24492 290 119 41.03 25.84 大豆
mix_no_rRNA.1_ (paired)_contig_26634 388 157 40.46 0.85 拟南芥


图 2 当归功能基因序列的 GO 功能
Fig. 2 GO functional distribution in A. sinensis unigene sequences
2.4 代谢路径注释
为了识别当归中活性高的代谢路径,将 63 585
个功能基因序列进行 KEGG 映射分析,共映射到
269 条代谢路径。包含功能基因序列最多的是代
谢路径(2 242 个)、次级代谢产物生物合成(1 159
个)、不同环境中的微生物代谢(550 个)。类苯
基丙烷生物合成、黄酮类化合物生物合成、叶酸
生物合成和 N-聚糖生物合成等路径参与当归根重
要药效物质生物合成,如阿魏酸、当归总黄酮、
叶酸和当归多糖(表 3)。阿魏酸源自类苯基丙烷
生物合成路径,当归多糖源自 N-聚糖生物合成路
径,当归总黄酮源自黄酮类化合物生物合成路径,
叶酸源自叶酸生物合成路径。从表 3 可知,分别
有 127、69、70、94 个功能基因序列映射到上述
4 种代谢路径。
在类苯基丙烷生物合成路径中,以苯丙氨酸为
原料,经苯丙氨酸氨裂解酶、桂皮酸-4-羟化酶等酶
合成阿魏酸。阿魏酸可经阿魏酸-5-羟化酶代谢成 5-
羟阿魏酸。类苯基丙烷生物合成路径的中间代谢产
物,如桂皮酸、香豆酸、咖啡酸、阿魏酸可参与黄
63 585
6 358
635
63
0
100
10
1
0.1
0


/%




中草药 Chinese Traditional and Herbal Drugs 第 46 卷 第 8 期 2015 年 4 月

• 1220 •
表 3 与当归重要药效物质相关的次生代谢产物生物合成路径
Table 3 Biosynthetic pathway of secondary metabolites involved in major active substances of A. sinensis
路径 ID 路径名称
覆盖到该通路的
基因数目
该通路中基因的
总数
该通路中覆盖到的
功能基因序列数目
重要药效物质
ko01110 次生代谢产物生物合成 350 720 1 159 —
ko00940 类苯基丙烷生物合成 15 25 127 阿魏酸
ko00790 叶酸生物合成 12 24 94 叶酸
ko00941 黄酮化合物生物合成 11 20 70 当归总黄酮
ko00510 N-聚糖生物合成 32 45 69 当归多糖

酮类化合物生物合成路径的代谢调控;如咖啡酰辅
酶A经咖啡酰辅酶A邻甲基转移酶转化为阿魏酰辅
酶 A,然后再经查耳酮合酶合成四羟基-3-甲氧基查
耳酮,成为当归总黄酮中的一类药效成分。在叶酸
生物合成路径中,叶酰聚谷氨酸合酶和二氢叶酸还
原酶/胸苷酸合酶是叶酸合成的 2 个关键调控酶。
糖基转移酶催化单糖从糖供体转移到糖受体分
子,参与天然产物黄酮类、类苯基丙烷生物合成路
径。经研究证实,当归多糖在补血与止血方面起双
向调节作用,是当归的主要药效活性成分,由鼠李
糖、阿拉伯糖、甘露糖、葡萄糖、半乳糖组成。在
当归转录组数据中,发现糖基转移酶、糖苷酶参与
调控 N-聚糖生物合成路径,如 β-1,4-甘露糖基糖蛋
白 β-1,4-N-乙酰葡糖胺基转移酶、甘露糖基-寡聚糖
α-1,2-甘露糖苷酶、α-1,6-甘露糖基糖蛋白 β-1,2-N-
乙酰葡糖胺基转移酶、α-1,3-葡糖苷酶、α-1,3-葡糖
基转移酶等。其中,RPKM 值最高为 91.99,RPKM
值最低为 0.54。经这些注释提供了有价值的资源,
有助于研究特定过程、功能和路径,也有助于识别
次级代谢产物生物合成路径的新基因。
3 讨论
3.1 Illumina HiSeq 2000 二代高通量测序技术可
识别非模式物种功能注释基因
近年来,随着新一代高通量测序技术的广泛应
用,植物基因组研究得到快速发展[17],但是识别当
归根转录组特性的基因序列研究还比较少。该类研
究有助于开发天然药物,使当归生药研究与生命科
学前沿技术深度融合。本研究首次采用 Illumina
HiSeq 2000 高通量测序平台对当归根转录组进行测
序,获取了 63 585 个当归功能基因序列,并与
UniProt 蛋白数据库进行 blastx 比对,发现已注释当
归基因序列主要分布于目前研究较深入的 7 种重要
经济作物,如葡萄、蓖麻、毛果杨、大豆、苜蓿、
拟南芥和烟草。当归与不同物种序列相似性的比较,
可绘制系统进化树图谱,为阐明栽培当归的起源物
种提供理论依据。本研究提示,Illumina HiSeq 2000
第 2 代高通量测序技术可检测非模式物种大量功能
注释基因,可进一步探测基因组研究缺乏物种功能
基因变化的网络模式[18]。
3.2 次级代谢基因
通过 Uniprot 蛋白质数据库注释并比对了 30 432
个 unigenes,获取基因描述和保守的蛋白质结构
域[19]。应用Blast GO算法对注释序列进行GO分类,
发现当归根的转录组特性主要与酶催化的代谢过程
相关。进一步对当归功能基因序列进行代谢路径注
释,发现参与次生代谢产物生物合成路径的功能基
因序列为 1 159 个,可能参与当归药用活性物质代
谢调控。当归视为补血、活血要药,被称为“血中
之圣药”,对其补血、活血微观物质基础研究,有助
于阐释当归补血、活血的科学内涵。
当归多糖能增加外周血细胞、白细胞、血红蛋
白及骨髓有核细胞数,这种作用特别是在外周血细
胞减少和骨髓受到抑制时尤为明显,可用于治疗各
种原因引起的贫血疾病[20],提示了当归补血的主要
活性成分为当归多糖。当归多糖由鼠李糖、阿拉伯
糖、甘露糖、葡萄糖、半乳糖组成,其形成需糖基
转移酶和糖苷酶的调控。
糖基转移酶在生物体内催化活化的糖连接到不
同的受体分子,如蛋白、核酸、寡糖、脂质和小分
子上[21]。当归多糖可以甘露糖、葡萄糖和乙酰葡糖
胺为原料参与 N-聚糖生物合成路径(69 个功能基因
序列参与)的调控。在 RPKM 值中,以 β-1,4-甘露
糖基糖蛋白 β-1,4-N-乙酰葡糖胺基转移酶为最高。
识别糖基转移酶和糖苷酶相关基因序列,对研究当
归多糖参与的特定代谢路径有重要意义。
叶酸经人体吸收后,将转化为四氢叶酸,并作
中草药 Chinese Traditional and Herbal Drugs 第 46 卷 第 8 期 2015 年 4 月

• 1221 •
为一碳单位的辅酶参与红细胞、血红蛋白 DNA 的
合成,有助于提高机体红细胞、血红蛋白的数量,
可用于治疗贫血疾病。生物体内叶酸含量的高低取
决于叶酸生物合成路径,受叶酰聚谷氨酸合酶[22]和
二氢叶酸还原酶/胸苷酸合酶[23]的调控,其中以叶酰
聚谷氨酸合酶的 RPKM 值为最高。识别叶酸生物合
成路径相关基因,可佐证当归根中叶酸的量,反映
当归补血功效的高低。经上述分析,N-聚糖生物合
成路径及叶酸生物合成路径与当归补血功效相关,
有助于阐释当归补血的分子科学内涵。
阿魏酸次级代谢基因是当归活血化瘀的物质基
础[24],参与类苯基丙烷生物合成路径。在此代谢路
径中,以苯丙氨酸为原料,先后生成桂皮酸和香豆
酸,最后合成阿魏酸,阿魏酸又可代谢成 5-羟阿魏
酸。在当归根中,苯丙氨酸氨裂解酶[25]和桂皮酸-4-
羟化酶[26]可促进阿魏酸合成,阿魏酸-5-羟化酶[27]
可降低阿魏酸的量。识别上述 3 个酶的功能基因序
列,可佐证当归根中阿魏酸量的高低,反映当归活
血化瘀的功效,为当归质量鉴定、分子育种及栽培
提供理论依据。
类苯基丙烷合成路径的中间代谢产物,如咖啡
酸、阿魏酸,可经黄酮化合物生物合成路径生成四羟
基-3-甲氧基查耳酮,属于当归总黄酮的一类药效成
分。桂皮酸-4-羟化酶可共同调控类苯基丙烷生物合成
路径和黄酮类化合物生物合成路径,影响阿魏酸和当
归总黄酮的量。查耳酮合酶[28]是合成四羟基-3-甲氧基
查尔酮的一种关键酶,其活性高低可反映当归总黄酮
的量。因此,类苯基丙烷生物合成路径及黄酮类化合
物生物合成路径与当归活血功效相关。
本研究首次发现了与 5 种重要经济作物序列完
全匹配程度大于 40%的当归功能基因序列。识别了
与当归补血、活血物质基础相关的基因序列及代谢
路径,阐明了当归视为补血、活血要药的分子生物
学基础,为中药生药学研究提供示范。
参考文献
[1] 杨应文 , 王亚丽 , 萨日娜 , 等 . 不同生长期当归
1H-NMR 指纹图谱的研究 [J]. 波谱学杂志, 2013, 3(1):
70-79.
[2] 韦 玮, 龚苏晓, 张铁军, 等. 当归多糖类成分及其药
理作用研究进展 [J]. 药物评价研究 , 2009, 32(2):
130-134.
[3] 汪诺舟. 当归多糖的药理作用与研究进展 [J]. 中国现
代医学杂志, 2012, 22(19): 67-69.
[4] 刘雪东, 李伟东, 蔡宝昌. 当归化学成分及对心脑血管
系统作用研究进展 [J]. 南京中医药大学学报, 2010,
26(2): 155-157.
[5] 萨日娜, 朱书强, 潘新波, 等. 不同生长期当归根挥发
油中 Z-藁苯内酯和正丁烯基酞内酯含量的动态变化研
究 [J]. 中药材, 2012, 35(11): 1738-1742.
[6] 杨英来, 胡 芳, 刘小花, 等. 当归补气活性部位的谱
效关系研究 [J]. 中草药, 2013, 44(23): 3346-3351.
[7] 张 静, 杨义芳, 吴春珍, 等. 当归-川芎药对超临界提
取物配伍红花抗心肌缺血的谱效关系研究 [J]. 中草
药, 2013, 44(14): 1944-1950.
[8] 张西玲, 姬可平, 李应东, 等. DNA 测序技术建立甘肃
当归和大黄种子 rRNA 基因图谱的研究 [J]. 中药材,
2003, 26(7): 481-484.
[9] Yu G, Duan J, Yan H, et al. cDNA-AFLP analysis of gene
expression differences between the flower bud and
sprout-shoot apical meristem of Angelica sinensis [J].
Genet Mol Biol, 2011, 34(2): 274-279.
[10] 郝大程, 马 培, 穆 军, 等. 中药植物虎杖根的高通
量转录组测序及转录组特性分析 [J]. 中国科学: 生命
科学, 2012, 42(5): 398-412.
[11] 吴 琼, 孙 超, 陈士林, 等. 转录组学在药用植物研
究中的应用 [J]. 世界科学技术—中医药现代化, 2010,
12(3): 457-462.
[12] Joy N, Asha S, Mallika V, et al. De novo transcriptome
sequencing reveals a considerable bias in the incidence of
simple sequence repeats towards the downstream of
‘Pre-miRNAs’ of black pepper [J]. PLoS One, 2013, 8(3):
e56694.
[13] 张年辉, 韦振泉, 何军贤, 等. 一种高效经济的高质量
植物 RNA 提取方法 [J]. 生物化学与生物物理进展,
2004: 31(10): 947-949.
[14] Su C L, Chao Y T, Chang Y C, et al. De Novo assembly
of expressed transcripts and global analysis of the
phalaenopsis aphrodite transcriptome [J]. Plant Cell
Physiol, 2011, 52(9): 1501-1514.
[15] Bräutigam A, Mullick T, Schliesky S, et al. Critical
assessment of assembly strategies for non-model species
mRNA-Seq data and application of next-generation
sequencing to the comparison of C3 and C4 species [J]. J
Exp Bot, 2011, 62(9): 3093-3102.
[16] Altschul S F, Gish W, Miller W, et al. Basic local
alignment search tool [J]. J Mol Biol, 1990, 215(3):
403-410.
[17] Zhang L, Jia H, Yin Y, et al. Transcriptome analysis of
leaf tissue of raphanus sativus by RNA sequencing [J].
PLoS One, 2013, 8(11): e80350.
[18] Leung R K, Dong Z Q, Sa F, et al. Quick, sensitive and
中草药 Chinese Traditional and Herbal Drugs 第 46 卷 第 8 期 2015 年 4 月

• 1222 •
specific detection and evaluation of quantification of
minor variants by high-throughput sequencing [J]. Mol
Biosyst, 2013, 10(2): 206-214.
[19] Taylor D, Cawley G, Hayward S. Classification of domain
movements in proteins using dynamic contact graphs [J].
PLoS One, 2013, 8(11): e81224.
[20] Zhao L, Wang Y, Shen H L, et al. Structural
characterization and radioprotection of bone marrow
hematopoiesis of two novel polysaccharides from the root
of Angelica sinensis [J]. Fitoterapia, 2012, 83(8):
1712-1720.
[21] Albesa-Jové D, Giganti D, Jackson M, et al.
Structure-function relationships of membrane associated
GT-B glycosyltransferases [J]. Glycobiology, 2013, 24(2):
108-124.
[22] Jiang L, Liu Y, Sun H, et al. The mitochondrial
folylpolyglutamate synthetase gene is required for
nitrogen utilization during early seedling development in
Arabidopsis [J]. Plant Physiol, 2013, 161(2): 971-989.
[23] Francis K, Stojkovic V, Kohen A. Preservation of protein
dynamics in dihydrofolate reductase evolution [J]. J Biol
Chem, 2013, 288(50): 35961-35968.
[24] Gim S A, Sung J H, Shah F A, et al. Ferulic acid regulates
the AKT/GSK-3β/CRMP-2 signaling pathway in a middle
cerebral artery occlusion animal model [J]. Lab Anim Res,
2013, 29(2): 63-69.
[25] Jaliani H Z, Farajnia S, Mohammadi S A, et al.
Engineering and kinetic stabilization of the therapeutic
enzyme anabeana variabilis phenylalanine ammonia lyase
[J]. Appl Biochem Biotechnol, 2013, 171(7): 1805-1818.
[26] Singh K, Kumar S, Rani A, et al. Phenylalanine
ammonia-lyase (PAL) and cinnamate 4-hydroxylase
(C4H) and catechins (flavan-3-ols) accumulation in tea
[J]. Funct Integr Genomics, 2009, 9(1): 125-134.
[27] Al-Haddad J M, Kang K Y, Mansfield S D, et al.
Chemical responses to modified lignin composition in
tension wood of hybrid poplar (Populus tremula ×
Populus alba) [J]. Tree Physiol, 2013, 33(4): 365-373.
[28] Cho Y B, Jones S I, Vodkin L. The transition from primary
siRNAs to amplified secondary siRNAs that regulate
chalcone synthase during development of Glycine max seed
coats [J]. PLoS One, 2013, 8(10): e76954.