免费文献传递   相关文献

Differential Gene Expression Analysis on Secondary Metabolites and Transcriptome Sequencing to Four Tissues of Pinus koraiensis

红松4个组织的转录组数据分析与次生代谢产物的表达差异初探



全 文 :林业科学研究 2015,28(4):597 603
ForestResearch
  文章编号:10011498(2015)04059707
红松4个组织的转录组数据分析与次生代谢
产物的表达差异初探
张 振,张含国,周 宇,张 磊,于宏影,张 莉
(东北林业大学 林木遗传育种国家重点实验室,黑龙江 哈尔滨 150040)
收稿日期:20131017
项目基金:林业公益性行业科研专项“红松果材兼用林良种选育与定向培育技术研究”(201204320)
作者简介:张 振(1986—),男,在读博士,主要从事林木遗传改良研究.Email:zhenzh19860516@163.com
 通讯作者:教授,博士生导师,主要研究方向:林木遗传育种与改良
关键词:红松;转录组;基因注释;次生代谢途径
中图分类号:S791.245 文献标识码:A
DiferentialGeneExpressionAnalysisonSecondaryMetabolitesand
TranscriptomeSequencingtoFourTissuesofPinuskoraiensis
ZHANGZhen,ZHANGHanguo,ZHOUYu,ZHANGLei,YUHongying,ZHANGLi
(StateKeyLaboratoryofForestGeneticsandTreeBreeding,NortheastForestryUniversity,Harbin 150040,Heilongjiang,China)
Abstract:ThisresearchcomparedthetranscriptomesoffourdiferenttissuesofPinuskoraiensisbyusingRNAseq
techniqueandalotofdiferentialyexpressedunigeneswereobtained.Atotalof21.3GBofdatawasobtainedand
41476expressedunigeneswerereceivedafterassembling.ThroughGOandCOGclassification,thecommentedand
transcribedsequenceswereclassifiedinto24or56functionalcategories,whichreferedtomanybiochemicalproces
sessuchasmaterialandenergymetabolism,signaltransduction,transcriptionalregulationanddefensereaction.
Throughpathwayenrichmentanalysis,thepathwaysassociatedwithgreasesyntheticfatyacidbiosyntheticandter
penoidssynthesiswerefound.TwounigenesofmetabolicpathwaysinKEGGdatabasewerecomparedand16key
enzymegenesoffatyacidsynthesisinotherspecieshomologousand34keyenzymegenesofterpenoidbiosynthetic
pathwaywereobtained.Byhighthroughputsequencingandbioinformaticsresearch,alargenumberofPinusko
raiensistranscriptomeunigeneswasobtained.Thisresearchprovidesreferencesfortheresearchonthegenesrelated
tosecondarymetabolitessynthesisinPinuskoraiensis.
Keywords:Pinuskoraiensis;transcriptome;geneannotation;secondarymetabolitesbiosynthesis
红松(PinusKoraiensis)为松科松属乔木,主要分
布在中国东北东部,俄罗斯远东南部及朝鲜半岛,日
本岛也有零星分布。红松是中国Ⅱ级重点保护野生
植物,既是优良的用材树种,又是珍贵的食用干果和
油料树种[1]。红松树干圆满通直,叶5针一束,球果
两年成熟,花期5—6月,种子在次年9—10月成熟。
红松木材可作建筑、造纸,树皮中含有松树脂,可作
药用,松仁是一种营养价值很高的果品[2-4],含有大
量的粗蛋白,油脂,多糖,粗纤维,除此之外,还富含
维生素、矿物质以及钙、磷、锰、钻、铜、锌等微量元
素[4-5],与意大利石松(P.pinea),西伯利亚红松
(P.sibirica),油松(P.sinensis),瑞士五针松(P.
cembra),克罗拉多果松(P.edulis),单叶果松(P.
monophyla)等松科球果为目前世界松仁商品主要种
类。目前,在红松的遗传育种进程中,主要以可食用
坚果林选育及品质改良为主,但针对红松的分子生
林 业 科 学 研 究 第28卷
物学研究进展较慢,红松的基因组及转录组数据还
比较缺乏,对生长发育及代谢途径、遗传图谱构建等
的研究较少,影响了红松遗传改良的研究进程。
EST技术是开展转录组研究的有效方法[6],已
被广泛应用于动、植物和微生物的基因表达谱分析、
功能基因预测等[7-9]。目前公共数据库中已有松属
多个树种的EST序列,如火炬松、北美短叶松、海岸
松[10-12]。截止2014年5月,从 GenBank查找发现
松属 EST序列有730037条,但红松的 EST序列仅
为65条。随着测序技术的发展,将高通量测序应用
到红松的转录组研究中,不仅可降低测序的成本和
时间,而且可获得的丰富的数据,有利于松属的转录
组和生长发育相关研究。本研究采用 Ilumina公司
开发的HiSeq2000测序技术进行松属树种转录组的
研究,构建红松均一化 cDNA文库、测序,对序列再
做基因功能注释和分类等,以研究红松生长发育过
程中重要基因的表达,获得包括脂肪酸类合成、萜类
化合物合成等的合成相关的生物酶基因及参与植物
次生代谢的基因,获得的 Unigenes为红松及其相近
物种的群体基因组学和功能基因组学提供了有价值
的候选基因,这些基因将有助于开展选择育种和基
因工程研究。
1 材料与方法
1.1 样本材料来源
样本采集于黑龙江省林口县青山林场红松种子
园内,种子园为1979年嫁接营建,株行距4m×6m。
于2013年6月分别采集无性系‘LK15’与无性系
‘LK20’的上部针叶(T1)、嫩梢(T2)、雌花(T3)和球
果(T4)4个组织,液氮速冻后 -80℃保存。每个无
性系的4个组织材料单独提取 RNA后,再将提取的
RNA分组织混合用于转录组测序。
1.2 总RNA的提取和mRNA的分离
T1-T4总RNA提取方法参照TrizolReagent说
明书进行。用1.2%琼脂糖凝胶电泳和Nanodrop纯
度检测,Qubit2.0浓度检测及 Agilent2100质量检
测。确定总RNA完整性和纯度质量后,用NEBNext
Poly(A)mRNAMagneticIsolationModule(NEB,
E7490)富集mRNA。
1.3 cDNA片段合成及测序文库构建
以mRNA为模板,用 NEBNextmRNALibrary
PrepMasterMixSetforIlumina(NEB,E6110)和
NEBNextMultiplexOligosforIlumina(NEB,E7500)
构建上机文库。使用 Qubit2.0进行初步定量,稀释
文库至2ng·μL-1,制备好的文库用1.8%琼脂糖
凝胶电泳进行检测文库插入片段大小(insertsize),
然后用LibraryQuantificationKitIluminaGAUniver
sal(Kapa,KK4824)进行QPCR定量(文库有效浓度
>2nmol·L-1)。检测合格的文库在 iluminacbot
上进行簇的生成,最后用 IluminaHiSeqTM2000进
行测序。
1.4 序列分析
利用Ilumina平台将测序所得的图像数据转化
为相应的核苷酸序列数据,对所产生的原始序列文
件进行质量评估和可信度分析,并去除测序过程中
低质量的序列和不确定的序列(Q<20)。使用Trin
ity[13]软件对样品数据进行混合组装,通过序列之间
的 overlap信息组装得到 contig,再根据序列的
pairedend信息和contig之间的相似性对contig进行
聚类,然后在局部进行组装得到转录本,最后从局部
中挑选最主要的转录本作为Unigene。
1.5 序列注释、功能分类和生物学通路分析
使用BLAST[14]软件将 Unigenes序列与 NR[15]、
SwissProt[16]、GO[17]、COG[18]、KEGG[19]数据库比对,
获得Unigenes的注释信息(Evalue<=1e05),再将
注释上的序列按照不同的功能划分成不同的类别。
最后对 KEGG注释的基因功能信息进行生物学通路
的注释和预测。
1.6 差异表达Unigene的筛选
利用比对软件 Bowtie将各样品测序得到的
reads与Unigene库进行比对,然后根据比对信息并
利用RSEM[20]进行表达量水平估计,我们利用 RP
KM[21]值来反映对应 Unigenes的表达丰度。选择
EBSeq[22]进行差异表达分析,利用 FDR方法分析
Unigene的表达,在差异基因筛选中,我们选取 FDR
<0.01且FoldChange≥2作为标准定义为差异Uni
gene。
1.7 差异 Unigene的GO和pathway分析
GO功能显著性富集分析能确定差异表达基因
行使的主要生物学功能。通过 Pathway显著性富集
能确定差异表达基因参与的最主要生化代谢途径和
信号转导途径。
2 结果与分析
2.1 高通量测序与功能注释
通过对红松的针叶、茎、雌花和球果的转录组进
895
第4期 张 振等:红松4个组织的转录组数据分析与次生代谢产物的表达差异初探
行高通量的测序,总共获得21.3GB的数据,经过序
列拼接,获得4901106个 contig片段,大于300bp
的有 35331个,大于 1kb的有 14661个。通过
Trinity组装共得到 71238条转录本和 41476条
Unigene。
与 BLAST序列比对,最终获得有注释信息的
Unigenes有26849个(占全部Unigene的64.73%)。
将组装得到的41476条红松 Unigene与 Nr数据库
比对,有11837条与云杉(Piceasitchensis)、2830条
与葡萄(Vitisvinifera)等植物的序列同源。
如图1所示,在 COG功能分类体系中,获得的
功能注释涉及 24个 COG功能类别,其中,General
functionpredictiononly转录物的比例最大(2216
条),Nuclearstructure最少(1条),其他种类基因的
表达丰度不尽相同。
图2所示,GO富集性分析将注释的 Unigene序
列分成细胞组分(Celularcomponent)、分子功能(Mo
lecularFunction)、生物过程(Biologicalprocess)3个
大类56个小类,分别包含了16、16、24个功能亚类,
其 中,Celularcomponent中,celpart、cel、organele
基因最多;MolecularFunction中,catalyticactivity、
binding基因最多;BiologicalProcess中,metabolic、
celular基因最多。
图1 红松unigene的COG注释
图2 Unigene的GO功能注释及分类统计结果
2.2 不同组织差异Unigene的GO分析
在转录组测序、组装和注释的基础上,将红松不
同部位进行基因表达对比分析(见表1)。发现嫩茎
(T2)、花(T3)、球果(T4)分别与针叶(T1)相比,分
别有792个、1055个、2668个Unigene上调表达,有
1069个、1516个、3248个 Unigene下调表达;花
(T3)、球果(T4)分别与嫩茎(T2)相比,分别有834
个、2841个 Unigene上调表达,有802个、3016个
Unigene下调表达;球果(T4)与花(T3)相比,有 2
771个 Unigene上调表达,有2850个 Unigene下调
表达。研究发现球果分别与针叶、嫩茎、花的差异
Unigene数量最多,说明球果在形成过程中的各途径
中Unigene表达量丰富。通过GO分类,分别研究不
同部位间差异Unigene的功能(见图3)及不同部位
间差异显著的 UnigeneGO富集。GO功能分类表
明,在所有组织部位间的差异基因,被分为细胞组
分、分子功能、生物过程三大类。而细胞组分中cel、
organele、celpart三个亚类所占比例较高,分子功能
中catalyticactivity、binding两个亚类所占比例较高,
生物过程中 metabolicproces、celularprocess所占比
995
林 业 科 学 研 究 第28卷
例较高,同时,由图3可知,球果(T4)较针叶(T1)、
茎(T2)、花(T3)四个组织部位的转录组差异 Uni
gene在GO功能分类中所占的比例均较高。在此基
础上,分别对不同部位间差异 Unigene进行 GO富
集,我们以叶(T1)VS果(T4)为例(见图4),发现叶
与果在 sequencespecificDNAbindingtranscription
factoractivity(122)、oxidoreductaseactivity(63)、met
abolic process(183)、oxidationreduction process
(298)、carbohydratemetabolicprocess(83)、extracel
lularregion(129)、planttypecelwal(95)、cytoplas
micmembraneboundedvesicle(190)、apoplast(91)等
方面差异显著。
表1 注释的差异基因数量统计
Type Totalnumber Upnumber Downnumber
T1vsT2 1861 792 1069
T1vsT3 2571 1055 1516
T1vsT4 5916 2668 3248
T2vsT3 1636 834 802
T2vsT4 5857 2841 3016
T3vsT4 5621 2771 2850
  注:第一列表示样品组合,前一个样品为对照组,后一个样品为
实验组。
图3 不同部位间差异unigenes的GO功能注释及分类统计
图4 叶(T1)VS果(T4)间的 GO富集分析
2.3 不同组织差异Unigene的pathway注释分析
为了研究差异 Unigene涉及的代谢途径,利用
KEGG数据库分别对其进行了pathway富集分析(见
图5),同样以叶(T1)VS果(T4)为例,发现叶与球
果在Phenylpropanoidbiosynthesis(61)、Phenylalanine
metabolism(43)、Photosynthesis(31)、Circadian
rhythm(17)、Flavonoidbiosynthesis(25)Diterpenoid
biosynthesi(13)、Proteinprocessinginendoplasmicre
ticulum(47)等途径差异显著。研究不同部位间差异
Unigene的pathway富集分析的前3位差异 pathway
数据,表明,(T1)VS(T2)间与(T1)VS(T3)间的差
异 pathway一致,均为 Phenylpropanoidbiosynthesis、
Phenylalaninemetabolism、Photosynthesis;(T1)VS
(T4)间、(T2)VS(T4)间与(T3)VS(T4)间的差异
pathway一致,均为 Phenylpropanoidbiosynthesis、
Phenylalaninemetabolism、Proteinprocessinginendo
plasmicreticulum;(T2)VS(T3)间的差异 pathway为
Phenylpropanoidbiosynthesis、Phenylalaninemetabo
lism、Planthormonesignaltransduction。
2.4 红松次生代谢产物初探
2.4.1 脂肪酸合成途径相关基因 转录组数据库
中注释到次生代谢产物代谢途径的 Unigene基因有
669个,代谢途径有25个不同的分支。对不同部位
的转录组数据进行Pathway富集性分析发现共有48
个Unigene可归类于脂肪酸生物合成途径,脂肪酸合
成是油脂合成的基础,因此对脂肪酸合成途径基因的
研究有助于更深入的认识油脂合成的机理。对每组
两两比较获得的差异表达Unigene分别进行Pathway
006
第4期 张 振等:红松4个组织的转录组数据分析与次生代谢产物的表达差异初探
图5 不同部位差异Unigene的KEGG富集分析
富集性分析后发现,每组差异表达 Unigene中都有
一些被归类于脂肪酸生物合成途径。将48个 Uni
gene序列在 KEGG数据库中比对后获得16个与其
他物种同源的脂肪酸合成相关的关键酶基因,片段
平均长度1397.65bp,其中,KASⅠ片段序列最长,为2
542.5bp;在表达水平上,以FatB和SAD最高,同时,
两个基因均在球果中表达量最高(见图6)。
图6 FATB与SAD基因在不同部位间的表达水平
2.4.2 挥发油、萜类化合物合成途径关键酶基因 
萜类化合物是植物次生代谢物中的一类重要化合
物,被植物用于防御外病虫害,是针叶树的重要防御
物质。萜类化合物在针叶树中通常以复杂的混合物
形式存在,其数量和特性,会影响萜烯类化合物对潜
在的致病菌和植食性昆虫的防御作用[23]。目前,萜
类化合物已成为针叶树研究领域中的热点问题。萜
类合成酶(terpenesynthases,TPS)是萜类化合物生
物合成过程中的关键酶之一。研究发现萜类化合物
生物合成有2条分别独立的途径,即甲羟戊酸途径
(MVA)和丙酮酸途径(DXP)[23]。这2条合成途径
分别在细胞溶质和细胞质体中形成5C单位的异戊
烯基二磷酸(IPP)和二甲丙烯焦磷酸(DMAPP),IPP
与DMAPP结合为?牛儿基焦酸(GPP),GPP去焦酸
后即生成单萜。IPP与GPP头尾相连则产生法尼基
焦酸(FPP)释放出焦
#
酸则可形成倍半萜。FPP以
尾尾方式连接,即合成三萜类。IPP和 FPP相连会
产生?牛儿基?牛儿基焦酸(GGPP),去焦酸后形成
四萜。GGPP可与多个 IPP头尾连接合成多萜类产
物[24]。对不同部位的转录组数据进行Pathway富集
性分析发现共有97个Unigene可归类于萜类化合物
生物合成途径,共注释到34个萜类生物合成途径关
键酶基因,片段平均长度880.6bp,其中,GGPS片段
最长,为2179.5bp,在表达水平上,RPKM值前8位
的基因在不同部位的基因表达量显示,在球果中的
萜类化合物基因表达量最少,除 HDR外,在茎和花
中的表达量较高(见图7)。
图7 RPKM值前8位的基因在不同部位间的表达水平
3 结论与讨论
HiSeq2000高通量测序数据量大,效率高,适合
于进行松属树种转录组的研究。Unigenes及其功能
注释作为计算基因组学的产物,对育种来说就是一
笔宝贵的资源[25]。本研究采用 RNASeq技术对红
松针叶、茎、花和球果4个部位间的转录组进行比较
研究,将红松不同部位间的差异表达的基因进行了
GO和Pathway信号途径分类,初步明确了各个基因
106
林 业 科 学 研 究 第28卷
编码的蛋白质的功能,为研究基因表达变化与油脂
合成之间及与萜类化合物合成之间的关系奠定了研
究基础,将有助于开展选择育种和基因工程研究。
本研究经过序列拼接,获得4901106个 contig
片段,通过 Trinity组装得到41476条 Unigene。通
过对Unigene进行功能注释,最终获得有注释信息
的 Unigenes有 26849个,占 全 部 Unigene的
6473%。COG功能分类将获得的功能注释涉及24
个COG功能类别,GO富集性分析将注释的 Unigene
序列分成Celularcomponent、MolecularFunction、Bio
logicalprocess3个大类56个小类。这一结果表明,
采用高通量测序可以应用于红松不同部位间生长发
育过程中表达的重要基因的研究。Li等[26]采用高
通量测序技术进行人参不同部位间的转录组分析,
挖掘皂苷生物合成基因;李铁柱等[27]完成杜仲果实
与叶片的转录组组装与功能注释。证实高通量测序
应用于研究不同组织间的转录水平的可行性。
Chen[28]等、DawnEHal等[29]、Niu等[30]、王晓峰
等[31]分别采用高通量测序在针叶树中挪威云杉、美
国黑松、油松、马尾松完成转录组测序,并进行基因
资源的挖掘。
通过红松不同部位间的基因表达对比分析,发
现,球果分别与针叶、嫩茎、花的差异unigene数量最
多,说明生长发育期的球果存在着丰富的生化进程,
处于基因高表达水平。由差异基因的 GO分类中,
在细胞组分中的cel(细胞)、organele(细胞器官)等
亚类所占比例较高,分子功能中 catalyticactivity(催
化活性)、binding(拼接)两个亚类所占比例较高,生
物过程中 metabolicproces(代谢过程)、celular
process(细胞过程)所占比例较高,而球果的高表达
水平说明,差异基因的 GO分类中主要体现为球果
中含有大量快速生长相关的基因。不同部位差异
Unigene的pathway注释分析结果与 GO功能分析注
释结果相识。
红松无论作为用材林,还是作为食品以及化工
用品都具有较高的发展前景,目前对红松种仁中脂
肪酸成分研究较多,表明,松仁脂肪酸成分中以不饱
和脂肪酸为主,王振宇等[32]张振[33]等采用气质联
用法检测了经超临界法提取的松仁油,不饱和脂肪
酸的含量在90%以上,其主要成分为油酸、亚油酸、
α亚麻酸和棕榈酸,其中亚油酸和 α亚麻酸的含量
最高。脂酰酰基载体蛋白硫酯酶(acylacylcarier
proteinthioesterase,Fat)是脂肪酸从头合成途径中
的关键酶,其主要功能是将脂酰基ACP水解成游离
脂肪酸和ACP,从而终止脂肪酸从头合成途径中脂
肪酸链的延长[34]。由于底物不同,Fat又被分为 Fa
tA和FatB两大家族,它们共同控制着植物体中饱
和脂肪酸和不饱和脂肪酸的比例[35]。△9硬脂酰
ACP脱氢酶(stearoylACPdesaturase,SAD)在植物质
体中,以硬脂酰 ACP(stearoylACP,C18ACP)为底
物,生成顺式不饱和双键的油酰基 ACP(△9C18∶1
ACP)接着在硫酯酶的作用下解离,转运至内质网进
行三酰甘油的组装或再延长以及去饱和等过程,因
此,SAD是植物脂肪酸合成通路中一个重要的分支
点,是不饱和脂肪酸合成中不可缺少的关键酶,直接
决定饱和脂肪酸与不饱和脂肪酸的比例[36-37],这对
调节油料植物种子中脂肪酸组成具有重要意义。在
表达水平上,以FatB和SAD最高,同时,两个基因均
在球果中表达量最高。
植物体内许多萜烯成分的分布通常具有种属、
器官、组织和生长发育阶段的特异性,表明了萜类合
成酶(TPS)存在表达和调控的时空特异性。目前,
在针叶树中已报道了70多种 TPS,已报道的针叶树
TPS主要集中在松科(Pinaceae)植物中[23]。对萜类
合成酶的深入研究,可以使我们通过 DNA重组技
术来改造萜类合成细胞中的代谢途径,以提高萜类
最终产量或在不含萜类的生物中合成萜类[38]。红
松转录组数据库的建立,获得了大量的转录本信息,
可用于基因的克隆、表达谱分析、发现新基因、QTL
定位等多种用途,红松的研究多以定向培育、生长性
状、化学成分分析等研究为主,其分子生物学研究进
展较为缓慢,而红松转录组数据库的建立,为分子生
物学的研究提供了重要的基础和依据;为红松次生
代谢产物的生物合成与代谢调控提供了候选的基因
资源,为红松活性成分含量指标和优良农艺性状改
良奠定基础。
参考文献:
[1]马建路,庄丽文,陈 动,等.红松的地理分布[J].东北林业大学
学报,1992,20(5):40-47.
[2]WolfRL,PedronoF,PasquierE,etal.Generalcharacteristicsof
Pinusspp.seedfatyacidcompositions,andimportanceofDelta5
olefinicacidsinthetaxonomyandphylogenyofthegenus[J].Lipids
,2000,35:1-22.
[3]YoonTH,ImKJ,KohET,etal.FatyAcidCompositionsofPi
nusKoraiensisSeed[J].NutrRes1989,9:357-361.
[4]NergizC,DonmezI.ChemicalcompositionandnutritivevalueofPi
nuspineaL.seed[J].FoodChem,2004,86:365-368.
206
第4期 张 振等:红松4个组织的转录组数据分析与次生代谢产物的表达差异初探
[5]ZadernowskiR,NaczkM,CzaplickiS.ChemicalcompositionofPi
nussibiricanutoils[J].EurJLipidSciTech,2009,111:698-704.
[6]LiY,SunC,LuoHM,etal.Transcriptomecharacterizationfor
Salviausing454GSFLX[J].Yaoxuexuebao,2010,45(4):524
-529.
[7]AdamsM.D,KeleyJM.GocayneJD,etal.ComplementaryDNA
sequencing:expressedsequencetagsandhumangenomeproject
[J].Science,1991,5013:1651-1656.
[8]BoguskiMS,TolstoshevCM,BassetDE.Genediscoveryin
dbEST[J].Science,1994,265(5181):1993-1994.
[9]BouchezD,HfteH.Functionalgenomicsinplants[J].Plant
Physiol,1998,118(3):725-732.
[10]AlonaI,QuinnM,ShoopE,etal.Analysisofxylemformationin
pinebycDNAsequencing,Proc[J].Natl.Acad.Sci.,USA,
1998,95(16):9693-9698.
[11]ChagnD,ChaumeilP,RamboerA,etal.Crossspeciestransfera
bilityandmappingofgenomicandcDNASSRsinpines[J].The
or.Appl.Genet,2004,109(6):1204-1214.
[12]TemesgenB,BrownGR,HaryDE,etal.Geneticmappingof
expressedsequencetagpolymorphism(ESTP)markersinlobloly
pine(pinustaedaL.)[J].Theor.Appl.Genet.,2001,102
(5):664-675.
[13]ManfredGG,BrianJH,MoranY,etal.Fullengthtranscrip
tomeassemblyfromRNASeqdatawithoutareferencegenome[J].
NatureBiotechnology,2011(29):644-652.
[14]StephenFA,ThomasLM,AlejandroAS,etal.GappedBLAST
andPSIBLAST:ANewGenerationofProteinDatabaseSearch
Programs[J].NucleicAcidsRes,199725(17):3389-3345.
[15]YangyangDENG,JianqiLI,SongfengWU,etal.Integratednr
DatabaseinProteinAnnotationSystemandItsLocalization[J].
ComputerEngineering,200632(5):71-74.
[16]ApweilerR,BairochA,WuCH,etal.UniProt:theUniversal
ProteinKnowledgebase[EB/OL].NucleicAcidsRes.htp://
nar. Oxfordjo urnals. org/cgi/content/ful/32/supp11/d115,
2004,32(DatabaseIssue):115.
[17]MichaelA,CatherineAB,JudithAB,etal.Geneontology:tool
fortheunificationofbiology.TheGeneOntologyConsortium[J].
NatGenet,(25):25-29.
[18]RomanLT,MichaelYG,DarenAN,etal.TheCOGdatabase:
atoolforgenomescaleanalysisofproteinfunctionsandevolution
[J].NucleicAcidsRes,2000,128(1):33-36.
[19]MinoruK,SusumuG,ShuichiK,etal.TheKEGGresourcefor
decipheringthegenome[J].NucleicAcidsRes,2004,(32):277
-280.
[20]BoLi,ColinND.RSEM:accuratetranscriptquantificationfrom
RNASeqdatawithorwithoutareferencegenome[J].BMCBioin
formatics,2011,12:323-326.
[21]AliM,BrianAW,KennethM,etal.Mappingandquantifying
mammaliantranscriptomesbyRNASeq[J].Naturemethods,2008
(5):621-628.
[22]NingL,JohnAD,JamesAT,etal.EBSeq:anempiricalBayes
hierarchicalmodelforinferenceinRNAseqexperiments[J].
Bioinformatics,2013(29):1035-1043.
[23]龚 治,李典谟,张 真,针叶树萜类合成酶基因研究进展[J].
林业科学,2010,46(1):123-130.
[24]申培林,杨铁刹,张小全,等.烟草类萜类生物合成途径中关键
酶基因的克隆与表达调控[J].江苏农业科学,2012,40(1):37
-40.
[25]PavyN,LarocheJ,BousqueJ,etal.Largescalestatisticalanaly
sisofsecondaryxylemESTsinpine[J].PlantMolecularBiology,
2005,57:203-224.
[26]LiC,ZhuY,GuoX.etal.Transcriptomeanalysisrevealsginsen
osidesbiosyntheticgenes,microRNAsandsimplesequencerepeats
inPanaxginsengC.A.Meyer[J].BMCGenomics,2013,14:
245-256.
[27]李铁柱,杜红岩,刘慧敏,等.杜仲果实和叶片转录组数据组装
及基因功能注释[J].中南林业大学学报,2012,32(11):122
-130.
[28]JunChen,SeverinU,NiclasG,etal.Sequencingoftheneedle
transcriptomefromNorwayspruce(PiceaabiesKarstL.)reveals
lowersubstitutionrates,butsimilarselectiveconstraintsingymno
spermsandangiosperms[J].BMCGenomics2012,13:589-604.
[29]DawnEH,MacaireMSY,SharonJ,etal.Transcriptomere
sourcesandfunctionalcharacterizationofmonoterpenesynthasesfor
twohostspeciesofthemountainpinebeetle,lodgepolepine(Pinus
contorta)andjackpine(Pinusbanksiana)[J].BMCPlantBiolo
gy,2013,13:80-94.
[30]ShiHuiNiu,ZheXinLi,HuWeiYuan,etal.Transcriptome
characterisationofPinustabuliformisandevolutionofgenesinthe
Pinusphylogeny[J].BMCGenomics2013,14:263-275.
[31]王晓锋,何卫龙,蔡卫佳,等.马尾松转录组测序和分析[J].分
子植物育种,2013,11(3):385-392.
[32]王振宇,牛之瑞.红松种仁不饱和脂肪酸研究进展[J].油脂工
程,2007,2:58-61.
[33]张 振,张 磊,张含国,等.铁力红松种子园无性系种子形态
及营养成分变异研究[J].植物研究,2014,34(3):356-363.
[34]JonesA,DaviesHM,VoelkerTA.Palmitoylacylcarierprotein
(ACP)thioesteraseandtheevolutionaryoriginofplantacylACP
thioesterases[J].PlantCel,1995,7:359-371.
[35]WuPZ,LiJ,WeiQ,etal.Cloningandfunctionalcharacteriza
tionofanacylacylcarierproteinthioesterase(JcFatB1)fromJat
rophacurcas[J].TreePhysiol,2009,29:1299-1305.
[36]LuoT,PengSM,DengW Y,etal.Characterizationofanew
stearoylacylcarierproteindesaturasegenefromJatrophacurcas
[J].BiotechnologyLeters,2006,28:657-662.
[37]SlocombeSP,CumminsI,JarvisRP,etal.Nucleotidesequence
andtemporalregulationofaseedspecificBrassicanapuscDNAen
codingastearoylacylcarierprotein(ACP)desaturase[J].Plant
MolBiol,1992,20:151-155.
[38]黄 瑛,曾庆平.2006.萜类生物合成的基因操作[J].中国生
物工程杂志,26(1):60-64.
306