全 文 :林业科学研究 2015,28(4):597 603
ForestResearch
文章编号:10011498(2015)04059707
红松4个组织的转录组数据分析与次生代谢
产物的表达差异初探
张 振,张含国,周 宇,张 磊,于宏影,张 莉
(东北林业大学 林木遗传育种国家重点实验室,黑龙江 哈尔滨 150040)
收稿日期:20131017
项目基金:林业公益性行业科研专项“红松果材兼用林良种选育与定向培育技术研究”(201204320)
作者简介:张 振(1986—),男,在读博士,主要从事林木遗传改良研究.Email:zhenzh19860516@163.com
通讯作者:教授,博士生导师,主要研究方向:林木遗传育种与改良
关键词:红松;转录组;基因注释;次生代谢途径
中图分类号:S791.245 文献标识码:A
DiferentialGeneExpressionAnalysisonSecondaryMetabolitesand
TranscriptomeSequencingtoFourTissuesofPinuskoraiensis
ZHANGZhen,ZHANGHanguo,ZHOUYu,ZHANGLei,YUHongying,ZHANGLi
(StateKeyLaboratoryofForestGeneticsandTreeBreeding,NortheastForestryUniversity,Harbin 150040,Heilongjiang,China)
Abstract:ThisresearchcomparedthetranscriptomesoffourdiferenttissuesofPinuskoraiensisbyusingRNAseq
techniqueandalotofdiferentialyexpressedunigeneswereobtained.Atotalof21.3GBofdatawasobtainedand
41476expressedunigeneswerereceivedafterassembling.ThroughGOandCOGclassification,thecommentedand
transcribedsequenceswereclassifiedinto24or56functionalcategories,whichreferedtomanybiochemicalproces
sessuchasmaterialandenergymetabolism,signaltransduction,transcriptionalregulationanddefensereaction.
Throughpathwayenrichmentanalysis,thepathwaysassociatedwithgreasesyntheticfatyacidbiosyntheticandter
penoidssynthesiswerefound.TwounigenesofmetabolicpathwaysinKEGGdatabasewerecomparedand16key
enzymegenesoffatyacidsynthesisinotherspecieshomologousand34keyenzymegenesofterpenoidbiosynthetic
pathwaywereobtained.Byhighthroughputsequencingandbioinformaticsresearch,alargenumberofPinusko
raiensistranscriptomeunigeneswasobtained.Thisresearchprovidesreferencesfortheresearchonthegenesrelated
tosecondarymetabolitessynthesisinPinuskoraiensis.
Keywords:Pinuskoraiensis;transcriptome;geneannotation;secondarymetabolitesbiosynthesis
红松(PinusKoraiensis)为松科松属乔木,主要分
布在中国东北东部,俄罗斯远东南部及朝鲜半岛,日
本岛也有零星分布。红松是中国Ⅱ级重点保护野生
植物,既是优良的用材树种,又是珍贵的食用干果和
油料树种[1]。红松树干圆满通直,叶5针一束,球果
两年成熟,花期5—6月,种子在次年9—10月成熟。
红松木材可作建筑、造纸,树皮中含有松树脂,可作
药用,松仁是一种营养价值很高的果品[2-4],含有大
量的粗蛋白,油脂,多糖,粗纤维,除此之外,还富含
维生素、矿物质以及钙、磷、锰、钻、铜、锌等微量元
素[4-5],与意大利石松(P.pinea),西伯利亚红松
(P.sibirica),油松(P.sinensis),瑞士五针松(P.
cembra),克罗拉多果松(P.edulis),单叶果松(P.
monophyla)等松科球果为目前世界松仁商品主要种
类。目前,在红松的遗传育种进程中,主要以可食用
坚果林选育及品质改良为主,但针对红松的分子生
林 业 科 学 研 究 第28卷
物学研究进展较慢,红松的基因组及转录组数据还
比较缺乏,对生长发育及代谢途径、遗传图谱构建等
的研究较少,影响了红松遗传改良的研究进程。
EST技术是开展转录组研究的有效方法[6],已
被广泛应用于动、植物和微生物的基因表达谱分析、
功能基因预测等[7-9]。目前公共数据库中已有松属
多个树种的EST序列,如火炬松、北美短叶松、海岸
松[10-12]。截止2014年5月,从 GenBank查找发现
松属 EST序列有730037条,但红松的 EST序列仅
为65条。随着测序技术的发展,将高通量测序应用
到红松的转录组研究中,不仅可降低测序的成本和
时间,而且可获得的丰富的数据,有利于松属的转录
组和生长发育相关研究。本研究采用 Ilumina公司
开发的HiSeq2000测序技术进行松属树种转录组的
研究,构建红松均一化 cDNA文库、测序,对序列再
做基因功能注释和分类等,以研究红松生长发育过
程中重要基因的表达,获得包括脂肪酸类合成、萜类
化合物合成等的合成相关的生物酶基因及参与植物
次生代谢的基因,获得的 Unigenes为红松及其相近
物种的群体基因组学和功能基因组学提供了有价值
的候选基因,这些基因将有助于开展选择育种和基
因工程研究。
1 材料与方法
1.1 样本材料来源
样本采集于黑龙江省林口县青山林场红松种子
园内,种子园为1979年嫁接营建,株行距4m×6m。
于2013年6月分别采集无性系‘LK15’与无性系
‘LK20’的上部针叶(T1)、嫩梢(T2)、雌花(T3)和球
果(T4)4个组织,液氮速冻后 -80℃保存。每个无
性系的4个组织材料单独提取 RNA后,再将提取的
RNA分组织混合用于转录组测序。
1.2 总RNA的提取和mRNA的分离
T1-T4总RNA提取方法参照TrizolReagent说
明书进行。用1.2%琼脂糖凝胶电泳和Nanodrop纯
度检测,Qubit2.0浓度检测及 Agilent2100质量检
测。确定总RNA完整性和纯度质量后,用NEBNext
Poly(A)mRNAMagneticIsolationModule(NEB,
E7490)富集mRNA。
1.3 cDNA片段合成及测序文库构建
以mRNA为模板,用 NEBNextmRNALibrary
PrepMasterMixSetforIlumina(NEB,E6110)和
NEBNextMultiplexOligosforIlumina(NEB,E7500)
构建上机文库。使用 Qubit2.0进行初步定量,稀释
文库至2ng·μL-1,制备好的文库用1.8%琼脂糖
凝胶电泳进行检测文库插入片段大小(insertsize),
然后用LibraryQuantificationKitIluminaGAUniver
sal(Kapa,KK4824)进行QPCR定量(文库有效浓度
>2nmol·L-1)。检测合格的文库在 iluminacbot
上进行簇的生成,最后用 IluminaHiSeqTM2000进
行测序。
1.4 序列分析
利用Ilumina平台将测序所得的图像数据转化
为相应的核苷酸序列数据,对所产生的原始序列文
件进行质量评估和可信度分析,并去除测序过程中
低质量的序列和不确定的序列(Q<20)。使用Trin
ity[13]软件对样品数据进行混合组装,通过序列之间
的 overlap信息组装得到 contig,再根据序列的
pairedend信息和contig之间的相似性对contig进行
聚类,然后在局部进行组装得到转录本,最后从局部
中挑选最主要的转录本作为Unigene。
1.5 序列注释、功能分类和生物学通路分析
使用BLAST[14]软件将 Unigenes序列与 NR[15]、
SwissProt[16]、GO[17]、COG[18]、KEGG[19]数据库比对,
获得Unigenes的注释信息(Evalue<=1e05),再将
注释上的序列按照不同的功能划分成不同的类别。
最后对 KEGG注释的基因功能信息进行生物学通路
的注释和预测。
1.6 差异表达Unigene的筛选
利用比对软件 Bowtie将各样品测序得到的
reads与Unigene库进行比对,然后根据比对信息并
利用RSEM[20]进行表达量水平估计,我们利用 RP
KM[21]值来反映对应 Unigenes的表达丰度。选择
EBSeq[22]进行差异表达分析,利用 FDR方法分析
Unigene的表达,在差异基因筛选中,我们选取 FDR
<0.01且FoldChange≥2作为标准定义为差异Uni
gene。
1.7 差异 Unigene的GO和pathway分析
GO功能显著性富集分析能确定差异表达基因
行使的主要生物学功能。通过 Pathway显著性富集
能确定差异表达基因参与的最主要生化代谢途径和
信号转导途径。
2 结果与分析
2.1 高通量测序与功能注释
通过对红松的针叶、茎、雌花和球果的转录组进
895
第4期 张 振等:红松4个组织的转录组数据分析与次生代谢产物的表达差异初探
行高通量的测序,总共获得21.3GB的数据,经过序
列拼接,获得4901106个 contig片段,大于300bp
的有 35331个,大于 1kb的有 14661个。通过
Trinity组装共得到 71238条转录本和 41476条
Unigene。
与 BLAST序列比对,最终获得有注释信息的
Unigenes有26849个(占全部Unigene的64.73%)。
将组装得到的41476条红松 Unigene与 Nr数据库
比对,有11837条与云杉(Piceasitchensis)、2830条
与葡萄(Vitisvinifera)等植物的序列同源。
如图1所示,在 COG功能分类体系中,获得的
功能注释涉及 24个 COG功能类别,其中,General
functionpredictiononly转录物的比例最大(2216
条),Nuclearstructure最少(1条),其他种类基因的
表达丰度不尽相同。
图2所示,GO富集性分析将注释的 Unigene序
列分成细胞组分(Celularcomponent)、分子功能(Mo
lecularFunction)、生物过程(Biologicalprocess)3个
大类56个小类,分别包含了16、16、24个功能亚类,
其 中,Celularcomponent中,celpart、cel、organele
基因最多;MolecularFunction中,catalyticactivity、
binding基因最多;BiologicalProcess中,metabolic、
celular基因最多。
图1 红松unigene的COG注释
图2 Unigene的GO功能注释及分类统计结果
2.2 不同组织差异Unigene的GO分析
在转录组测序、组装和注释的基础上,将红松不
同部位进行基因表达对比分析(见表1)。发现嫩茎
(T2)、花(T3)、球果(T4)分别与针叶(T1)相比,分
别有792个、1055个、2668个Unigene上调表达,有
1069个、1516个、3248个 Unigene下调表达;花
(T3)、球果(T4)分别与嫩茎(T2)相比,分别有834
个、2841个 Unigene上调表达,有802个、3016个
Unigene下调表达;球果(T4)与花(T3)相比,有 2
771个 Unigene上调表达,有2850个 Unigene下调
表达。研究发现球果分别与针叶、嫩茎、花的差异
Unigene数量最多,说明球果在形成过程中的各途径
中Unigene表达量丰富。通过GO分类,分别研究不
同部位间差异Unigene的功能(见图3)及不同部位
间差异显著的 UnigeneGO富集。GO功能分类表
明,在所有组织部位间的差异基因,被分为细胞组
分、分子功能、生物过程三大类。而细胞组分中cel、
organele、celpart三个亚类所占比例较高,分子功能
中catalyticactivity、binding两个亚类所占比例较高,
生物过程中 metabolicproces、celularprocess所占比
995
林 业 科 学 研 究 第28卷
例较高,同时,由图3可知,球果(T4)较针叶(T1)、
茎(T2)、花(T3)四个组织部位的转录组差异 Uni
gene在GO功能分类中所占的比例均较高。在此基
础上,分别对不同部位间差异 Unigene进行 GO富
集,我们以叶(T1)VS果(T4)为例(见图4),发现叶
与果在 sequencespecificDNAbindingtranscription
factoractivity(122)、oxidoreductaseactivity(63)、met
abolic process(183)、oxidationreduction process
(298)、carbohydratemetabolicprocess(83)、extracel
lularregion(129)、planttypecelwal(95)、cytoplas
micmembraneboundedvesicle(190)、apoplast(91)等
方面差异显著。
表1 注释的差异基因数量统计
Type Totalnumber Upnumber Downnumber
T1vsT2 1861 792 1069
T1vsT3 2571 1055 1516
T1vsT4 5916 2668 3248
T2vsT3 1636 834 802
T2vsT4 5857 2841 3016
T3vsT4 5621 2771 2850
注:第一列表示样品组合,前一个样品为对照组,后一个样品为
实验组。
图3 不同部位间差异unigenes的GO功能注释及分类统计
图4 叶(T1)VS果(T4)间的 GO富集分析
2.3 不同组织差异Unigene的pathway注释分析
为了研究差异 Unigene涉及的代谢途径,利用
KEGG数据库分别对其进行了pathway富集分析(见
图5),同样以叶(T1)VS果(T4)为例,发现叶与球
果在Phenylpropanoidbiosynthesis(61)、Phenylalanine
metabolism(43)、Photosynthesis(31)、Circadian
rhythm(17)、Flavonoidbiosynthesis(25)Diterpenoid
biosynthesi(13)、Proteinprocessinginendoplasmicre
ticulum(47)等途径差异显著。研究不同部位间差异
Unigene的pathway富集分析的前3位差异 pathway
数据,表明,(T1)VS(T2)间与(T1)VS(T3)间的差
异 pathway一致,均为 Phenylpropanoidbiosynthesis、
Phenylalaninemetabolism、Photosynthesis;(T1)VS
(T4)间、(T2)VS(T4)间与(T3)VS(T4)间的差异
pathway一致,均为 Phenylpropanoidbiosynthesis、
Phenylalaninemetabolism、Proteinprocessinginendo
plasmicreticulum;(T2)VS(T3)间的差异 pathway为
Phenylpropanoidbiosynthesis、Phenylalaninemetabo
lism、Planthormonesignaltransduction。
2.4 红松次生代谢产物初探
2.4.1 脂肪酸合成途径相关基因 转录组数据库
中注释到次生代谢产物代谢途径的 Unigene基因有
669个,代谢途径有25个不同的分支。对不同部位
的转录组数据进行Pathway富集性分析发现共有48
个Unigene可归类于脂肪酸生物合成途径,脂肪酸合
成是油脂合成的基础,因此对脂肪酸合成途径基因的
研究有助于更深入的认识油脂合成的机理。对每组
两两比较获得的差异表达Unigene分别进行Pathway
006
第4期 张 振等:红松4个组织的转录组数据分析与次生代谢产物的表达差异初探
图5 不同部位差异Unigene的KEGG富集分析
富集性分析后发现,每组差异表达 Unigene中都有
一些被归类于脂肪酸生物合成途径。将48个 Uni
gene序列在 KEGG数据库中比对后获得16个与其
他物种同源的脂肪酸合成相关的关键酶基因,片段
平均长度1397.65bp,其中,KASⅠ片段序列最长,为2
542.5bp;在表达水平上,以FatB和SAD最高,同时,
两个基因均在球果中表达量最高(见图6)。
图6 FATB与SAD基因在不同部位间的表达水平
2.4.2 挥发油、萜类化合物合成途径关键酶基因
萜类化合物是植物次生代谢物中的一类重要化合
物,被植物用于防御外病虫害,是针叶树的重要防御
物质。萜类化合物在针叶树中通常以复杂的混合物
形式存在,其数量和特性,会影响萜烯类化合物对潜
在的致病菌和植食性昆虫的防御作用[23]。目前,萜
类化合物已成为针叶树研究领域中的热点问题。萜
类合成酶(terpenesynthases,TPS)是萜类化合物生
物合成过程中的关键酶之一。研究发现萜类化合物
生物合成有2条分别独立的途径,即甲羟戊酸途径
(MVA)和丙酮酸途径(DXP)[23]。这2条合成途径
分别在细胞溶质和细胞质体中形成5C单位的异戊
烯基二磷酸(IPP)和二甲丙烯焦磷酸(DMAPP),IPP
与DMAPP结合为?牛儿基焦酸(GPP),GPP去焦酸
后即生成单萜。IPP与GPP头尾相连则产生法尼基
焦酸(FPP)释放出焦
#
酸则可形成倍半萜。FPP以
尾尾方式连接,即合成三萜类。IPP和 FPP相连会
产生?牛儿基?牛儿基焦酸(GGPP),去焦酸后形成
四萜。GGPP可与多个 IPP头尾连接合成多萜类产
物[24]。对不同部位的转录组数据进行Pathway富集
性分析发现共有97个Unigene可归类于萜类化合物
生物合成途径,共注释到34个萜类生物合成途径关
键酶基因,片段平均长度880.6bp,其中,GGPS片段
最长,为2179.5bp,在表达水平上,RPKM值前8位
的基因在不同部位的基因表达量显示,在球果中的
萜类化合物基因表达量最少,除 HDR外,在茎和花
中的表达量较高(见图7)。
图7 RPKM值前8位的基因在不同部位间的表达水平
3 结论与讨论
HiSeq2000高通量测序数据量大,效率高,适合
于进行松属树种转录组的研究。Unigenes及其功能
注释作为计算基因组学的产物,对育种来说就是一
笔宝贵的资源[25]。本研究采用 RNASeq技术对红
松针叶、茎、花和球果4个部位间的转录组进行比较
研究,将红松不同部位间的差异表达的基因进行了
GO和Pathway信号途径分类,初步明确了各个基因
106
林 业 科 学 研 究 第28卷
编码的蛋白质的功能,为研究基因表达变化与油脂
合成之间及与萜类化合物合成之间的关系奠定了研
究基础,将有助于开展选择育种和基因工程研究。
本研究经过序列拼接,获得4901106个 contig
片段,通过 Trinity组装得到41476条 Unigene。通
过对Unigene进行功能注释,最终获得有注释信息
的 Unigenes有 26849个,占 全 部 Unigene的
6473%。COG功能分类将获得的功能注释涉及24
个COG功能类别,GO富集性分析将注释的 Unigene
序列分成Celularcomponent、MolecularFunction、Bio
logicalprocess3个大类56个小类。这一结果表明,
采用高通量测序可以应用于红松不同部位间生长发
育过程中表达的重要基因的研究。Li等[26]采用高
通量测序技术进行人参不同部位间的转录组分析,
挖掘皂苷生物合成基因;李铁柱等[27]完成杜仲果实
与叶片的转录组组装与功能注释。证实高通量测序
应用于研究不同组织间的转录水平的可行性。
Chen[28]等、DawnEHal等[29]、Niu等[30]、王晓峰
等[31]分别采用高通量测序在针叶树中挪威云杉、美
国黑松、油松、马尾松完成转录组测序,并进行基因
资源的挖掘。
通过红松不同部位间的基因表达对比分析,发
现,球果分别与针叶、嫩茎、花的差异unigene数量最
多,说明生长发育期的球果存在着丰富的生化进程,
处于基因高表达水平。由差异基因的 GO分类中,
在细胞组分中的cel(细胞)、organele(细胞器官)等
亚类所占比例较高,分子功能中 catalyticactivity(催
化活性)、binding(拼接)两个亚类所占比例较高,生
物过程中 metabolicproces(代谢过程)、celular
process(细胞过程)所占比例较高,而球果的高表达
水平说明,差异基因的 GO分类中主要体现为球果
中含有大量快速生长相关的基因。不同部位差异
Unigene的pathway注释分析结果与 GO功能分析注
释结果相识。
红松无论作为用材林,还是作为食品以及化工
用品都具有较高的发展前景,目前对红松种仁中脂
肪酸成分研究较多,表明,松仁脂肪酸成分中以不饱
和脂肪酸为主,王振宇等[32]张振[33]等采用气质联
用法检测了经超临界法提取的松仁油,不饱和脂肪
酸的含量在90%以上,其主要成分为油酸、亚油酸、
α亚麻酸和棕榈酸,其中亚油酸和 α亚麻酸的含量
最高。脂酰酰基载体蛋白硫酯酶(acylacylcarier
proteinthioesterase,Fat)是脂肪酸从头合成途径中
的关键酶,其主要功能是将脂酰基ACP水解成游离
脂肪酸和ACP,从而终止脂肪酸从头合成途径中脂
肪酸链的延长[34]。由于底物不同,Fat又被分为 Fa
tA和FatB两大家族,它们共同控制着植物体中饱
和脂肪酸和不饱和脂肪酸的比例[35]。△9硬脂酰
ACP脱氢酶(stearoylACPdesaturase,SAD)在植物质
体中,以硬脂酰 ACP(stearoylACP,C18ACP)为底
物,生成顺式不饱和双键的油酰基 ACP(△9C18∶1
ACP)接着在硫酯酶的作用下解离,转运至内质网进
行三酰甘油的组装或再延长以及去饱和等过程,因
此,SAD是植物脂肪酸合成通路中一个重要的分支
点,是不饱和脂肪酸合成中不可缺少的关键酶,直接
决定饱和脂肪酸与不饱和脂肪酸的比例[36-37],这对
调节油料植物种子中脂肪酸组成具有重要意义。在
表达水平上,以FatB和SAD最高,同时,两个基因均
在球果中表达量最高。
植物体内许多萜烯成分的分布通常具有种属、
器官、组织和生长发育阶段的特异性,表明了萜类合
成酶(TPS)存在表达和调控的时空特异性。目前,
在针叶树中已报道了70多种 TPS,已报道的针叶树
TPS主要集中在松科(Pinaceae)植物中[23]。对萜类
合成酶的深入研究,可以使我们通过 DNA重组技
术来改造萜类合成细胞中的代谢途径,以提高萜类
最终产量或在不含萜类的生物中合成萜类[38]。红
松转录组数据库的建立,获得了大量的转录本信息,
可用于基因的克隆、表达谱分析、发现新基因、QTL
定位等多种用途,红松的研究多以定向培育、生长性
状、化学成分分析等研究为主,其分子生物学研究进
展较为缓慢,而红松转录组数据库的建立,为分子生
物学的研究提供了重要的基础和依据;为红松次生
代谢产物的生物合成与代谢调控提供了候选的基因
资源,为红松活性成分含量指标和优良农艺性状改
良奠定基础。
参考文献:
[1]马建路,庄丽文,陈 动,等.红松的地理分布[J].东北林业大学
学报,1992,20(5):40-47.
[2]WolfRL,PedronoF,PasquierE,etal.Generalcharacteristicsof
Pinusspp.seedfatyacidcompositions,andimportanceofDelta5
olefinicacidsinthetaxonomyandphylogenyofthegenus[J].Lipids
,2000,35:1-22.
[3]YoonTH,ImKJ,KohET,etal.FatyAcidCompositionsofPi
nusKoraiensisSeed[J].NutrRes1989,9:357-361.
[4]NergizC,DonmezI.ChemicalcompositionandnutritivevalueofPi
nuspineaL.seed[J].FoodChem,2004,86:365-368.
206
第4期 张 振等:红松4个组织的转录组数据分析与次生代谢产物的表达差异初探
[5]ZadernowskiR,NaczkM,CzaplickiS.ChemicalcompositionofPi
nussibiricanutoils[J].EurJLipidSciTech,2009,111:698-704.
[6]LiY,SunC,LuoHM,etal.Transcriptomecharacterizationfor
Salviausing454GSFLX[J].Yaoxuexuebao,2010,45(4):524
-529.
[7]AdamsM.D,KeleyJM.GocayneJD,etal.ComplementaryDNA
sequencing:expressedsequencetagsandhumangenomeproject
[J].Science,1991,5013:1651-1656.
[8]BoguskiMS,TolstoshevCM,BassetDE.Genediscoveryin
dbEST[J].Science,1994,265(5181):1993-1994.
[9]BouchezD,HfteH.Functionalgenomicsinplants[J].Plant
Physiol,1998,118(3):725-732.
[10]AlonaI,QuinnM,ShoopE,etal.Analysisofxylemformationin
pinebycDNAsequencing,Proc[J].Natl.Acad.Sci.,USA,
1998,95(16):9693-9698.
[11]ChagnD,ChaumeilP,RamboerA,etal.Crossspeciestransfera
bilityandmappingofgenomicandcDNASSRsinpines[J].The
or.Appl.Genet,2004,109(6):1204-1214.
[12]TemesgenB,BrownGR,HaryDE,etal.Geneticmappingof
expressedsequencetagpolymorphism(ESTP)markersinlobloly
pine(pinustaedaL.)[J].Theor.Appl.Genet.,2001,102
(5):664-675.
[13]ManfredGG,BrianJH,MoranY,etal.Fullengthtranscrip
tomeassemblyfromRNASeqdatawithoutareferencegenome[J].
NatureBiotechnology,2011(29):644-652.
[14]StephenFA,ThomasLM,AlejandroAS,etal.GappedBLAST
andPSIBLAST:ANewGenerationofProteinDatabaseSearch
Programs[J].NucleicAcidsRes,199725(17):3389-3345.
[15]YangyangDENG,JianqiLI,SongfengWU,etal.Integratednr
DatabaseinProteinAnnotationSystemandItsLocalization[J].
ComputerEngineering,200632(5):71-74.
[16]ApweilerR,BairochA,WuCH,etal.UniProt:theUniversal
ProteinKnowledgebase[EB/OL].NucleicAcidsRes.htp://
nar. Oxfordjo urnals. org/cgi/content/ful/32/supp11/d115,
2004,32(DatabaseIssue):115.
[17]MichaelA,CatherineAB,JudithAB,etal.Geneontology:tool
fortheunificationofbiology.TheGeneOntologyConsortium[J].
NatGenet,(25):25-29.
[18]RomanLT,MichaelYG,DarenAN,etal.TheCOGdatabase:
atoolforgenomescaleanalysisofproteinfunctionsandevolution
[J].NucleicAcidsRes,2000,128(1):33-36.
[19]MinoruK,SusumuG,ShuichiK,etal.TheKEGGresourcefor
decipheringthegenome[J].NucleicAcidsRes,2004,(32):277
-280.
[20]BoLi,ColinND.RSEM:accuratetranscriptquantificationfrom
RNASeqdatawithorwithoutareferencegenome[J].BMCBioin
formatics,2011,12:323-326.
[21]AliM,BrianAW,KennethM,etal.Mappingandquantifying
mammaliantranscriptomesbyRNASeq[J].Naturemethods,2008
(5):621-628.
[22]NingL,JohnAD,JamesAT,etal.EBSeq:anempiricalBayes
hierarchicalmodelforinferenceinRNAseqexperiments[J].
Bioinformatics,2013(29):1035-1043.
[23]龚 治,李典谟,张 真,针叶树萜类合成酶基因研究进展[J].
林业科学,2010,46(1):123-130.
[24]申培林,杨铁刹,张小全,等.烟草类萜类生物合成途径中关键
酶基因的克隆与表达调控[J].江苏农业科学,2012,40(1):37
-40.
[25]PavyN,LarocheJ,BousqueJ,etal.Largescalestatisticalanaly
sisofsecondaryxylemESTsinpine[J].PlantMolecularBiology,
2005,57:203-224.
[26]LiC,ZhuY,GuoX.etal.Transcriptomeanalysisrevealsginsen
osidesbiosyntheticgenes,microRNAsandsimplesequencerepeats
inPanaxginsengC.A.Meyer[J].BMCGenomics,2013,14:
245-256.
[27]李铁柱,杜红岩,刘慧敏,等.杜仲果实和叶片转录组数据组装
及基因功能注释[J].中南林业大学学报,2012,32(11):122
-130.
[28]JunChen,SeverinU,NiclasG,etal.Sequencingoftheneedle
transcriptomefromNorwayspruce(PiceaabiesKarstL.)reveals
lowersubstitutionrates,butsimilarselectiveconstraintsingymno
spermsandangiosperms[J].BMCGenomics2012,13:589-604.
[29]DawnEH,MacaireMSY,SharonJ,etal.Transcriptomere
sourcesandfunctionalcharacterizationofmonoterpenesynthasesfor
twohostspeciesofthemountainpinebeetle,lodgepolepine(Pinus
contorta)andjackpine(Pinusbanksiana)[J].BMCPlantBiolo
gy,2013,13:80-94.
[30]ShiHuiNiu,ZheXinLi,HuWeiYuan,etal.Transcriptome
characterisationofPinustabuliformisandevolutionofgenesinthe
Pinusphylogeny[J].BMCGenomics2013,14:263-275.
[31]王晓锋,何卫龙,蔡卫佳,等.马尾松转录组测序和分析[J].分
子植物育种,2013,11(3):385-392.
[32]王振宇,牛之瑞.红松种仁不饱和脂肪酸研究进展[J].油脂工
程,2007,2:58-61.
[33]张 振,张 磊,张含国,等.铁力红松种子园无性系种子形态
及营养成分变异研究[J].植物研究,2014,34(3):356-363.
[34]JonesA,DaviesHM,VoelkerTA.Palmitoylacylcarierprotein
(ACP)thioesteraseandtheevolutionaryoriginofplantacylACP
thioesterases[J].PlantCel,1995,7:359-371.
[35]WuPZ,LiJ,WeiQ,etal.Cloningandfunctionalcharacteriza
tionofanacylacylcarierproteinthioesterase(JcFatB1)fromJat
rophacurcas[J].TreePhysiol,2009,29:1299-1305.
[36]LuoT,PengSM,DengW Y,etal.Characterizationofanew
stearoylacylcarierproteindesaturasegenefromJatrophacurcas
[J].BiotechnologyLeters,2006,28:657-662.
[37]SlocombeSP,CumminsI,JarvisRP,etal.Nucleotidesequence
andtemporalregulationofaseedspecificBrassicanapuscDNAen
codingastearoylacylcarierprotein(ACP)desaturase[J].Plant
MolBiol,1992,20:151-155.
[38]黄 瑛,曾庆平.2006.萜类生物合成的基因操作[J].中国生
物工程杂志,26(1):60-64.
306