免费文献传递   相关文献

Transcriptome Analysis for Quercus liaotungensis Koidz. Based on High-throughput Sequencing Technology

基于高通量测序的辽东栎转录组学研究



全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2014年第7期
随着煤、石油、天然气等传统能源的枯竭及燃
烧所带来的生态环境的恶化,燃料乙醇作为新兴的
生物质能源得到越来越多的国家的重视[1,2]。在许
多相对发达的国家,生产燃料乙醇主要是以玉米、
甜高粱等作物为原材料[3,4],而对于我国人均耕地
面积处于世界平均耕地面积以下的现状,利用粮食
生产燃料乙醇明显是不现实的[5]。因此,寻求廉价
易得的“非粮”生物质能源的原材料已成为国内外
学者竞相研究的热点。
收稿日期 :2013-12-10
基金项目 :“十二五”国家科技支撑计划课题(2011BAD22B08),国家林业公益性行业科研专项项目(201004001)
作者简介 :刘玉林,男,博士,研究方向 :能源树种的转录组学 ;E-mail :lyl12504001@126.com
通讯作者 :张志翔,男,教授,研究方向 :植物分类学、分子生物学 ;E-mail :zxzhang@bjfu.edu.cn
基于高通量测序的辽东栎转录组学研究
刘玉林1  李伟1  张志翔2
(1. 北京林业大学生物科学与技术学院,北京 100083 ;2. 北京林业大学自然保护区学院,北京 100083)
摘 要 : 应用 Illumina Solexa Hiseq 2000 高通量测序技术对辽东栎的芽、花、叶及果实的混合样品进行转录组测序,结果
共获得 3.8 Gb 的有效数据。应用 Trinity 软件对有效序列从头拼接去重复后,共获得 95 800 条 unigene,总长度为 73.57 Mb,最大
长度、平均长度和 N50 分别为 11 284 bp、768 bp 和 1 373 bp。利用 Blastx 与公共数据库 Nr 和 Swiss-Prot 的同源性比较(E 值 <1×
10-5)发现,38 163 条 unigene 未发现与公共数据库中的序列具有同源性。通过 KEGG 数据库中参与淀粉合成与代谢的 pathway 分析,
共发掘出 67 条参与淀粉合成的 unigene,编码 9 个关键酶。此外,在 13 380 条 unigene 中共搜索到 15 901 个 SSR 位点,其中二核
苷酸和三核苷酸的重复类型占所有 SSR 位点的 98.16%。
关键词 : 辽东栎 Illumina Solexa 转录组 淀粉 SSR
Transcriptome Analysis for Quercus liaotungensis Koidz. Based on
High-throughput Sequencing Technology
Liu Yulin1 Li Wei1 Zhang Zhixiang2
(1. College of Biological Sciences and Biotechnology,Beijing Forestry University,Beijing 100083 ;2. College of Nature Conservation,
Beijing Forestry University,Beijing 100083)
Abstract:  In this study, Illumina Solexa Hiseq 2000 high-throughput sequencing technology was used to get the comprehensive
transcriptome from mixed samples of buds, flowers, leaves and fruits of Quercus liaotungensis. As a result, 3.8 Gb effective data was obtained.
After de novo assembly by the software of Trinity, a total of 95 800 unigenes were generated, corresponding to a total of 73.57 Mb with a maximum
length, average length and N50 of 11 284 bp, 768 bp and 1 373 bp respectively. Using Blastx against the public databases of Nr and Swiss-
Prot with an E-value cut-off of 10-5, 38 163 unigene were not found in any databases with a high homology. According to the KEGG pathway
assignment, 67 unigene encoding nine key enzymes which may involve in starch synthesis were identified. In addition, 15 901 potential SSR loci
were detected from 13 380 unigene. Of them, dinucleotide repeat and trinucleotide repeat accounted for 98.16% of all.
Key words:  Quercus liaotungensis Illumina Solexa Transcriptome Starch SSR
栎树(橡树或柞树),为壳斗科栎属植物的统称。
全世界约有 300 余种,我国约有 60 余种[6]。栎树种
子富含淀粉,含量可达到 50%-70%,而我国约有栎
树林 1 800 万 hm2,年产约 1 000 万 t 栎树种子,可
生产燃料乙醇约 250 万 t[7],具有巨大的开发潜力。
若利用栎树种子发展燃料乙醇,不仅在不影响国家
粮食安全的情况下发展燃料乙醇产业,同时又能加
大栎树种子的利用率,刺激林业经济的发展[8,9]。
利用淀粉植物生产燃料乙醇,淀粉含量是一重
生物技术通报 Biotechnology Bulletin 2014年第7期120
要指标。目前,国内外对栎属植物中淀粉的研究仅
停留在物理与化学性质的分析上[10,11],还未对栎属
植物中淀粉合成代谢的分子机理进行深入的研究,进
而利用分子手段进一步提高淀粉的含量和产量。虽
然国外学者利用传统的测序方法已对夏栎(Quercus
robur)和无梗花栎(Quercus petraea)进行一定层次
的研究[12-14],但大部分研究和所获得的基因序列来
自于芽和叶等组织,还未包括主要积累淀粉的果实
中的转录数据,因而对栎树中淀粉合成代谢的研究
有一定的局限性。随着高通量测序技术的发展,测
序成本的降低,基于高通量测序技术的转录组分析
越来越成为非模式植物中发掘功能基因的一种有效
的手段。近年来,研究人员已对多种植物进行了转
录组测序和基因的发掘与研究[15]。
本研究利用 Illumina Solexa Hiseq 2000 高通量测
序技术对广泛分布于我国的陕西、宁夏、黑龙江、
河北、河南、吉林、青海、辽宁、山西、四川、甘
肃、内蒙古、山东等地及朝鲜地区的温带、暖温带
森林植被的主要建群种,且种子中淀粉含量高达
62.88% 左右[16]的辽东栎的芽、花、叶和果实的混
合样品进行转录组测序,旨在获得辽东栎更多的转
录本和更为全面的转录组信息,发掘辽东栎中参与
淀粉合成代谢的基因和潜在的 SSR(Simple sequence
Repeat)标记,为进一步研究辽东栎中淀粉的合成
机制,选育优良树种及辽东栎乃至栎属植物的进化
与多样性分析奠定分子基础。
1 材料与方法
1.1 材料
本研究中辽东栎的芽、花、叶与果(5 个阶段 :
开花后 20、40、60、80 和 100 d 均采集)均采集于
北京市门头沟区小龙门国家森林公园(E115 26’,
N39 59’),每份样品至少取自 10 个单株。样品采
集后立即放入液氮中,后存放于 -80℃冰箱备用。
1.2 方法
1.2.1 总 RNA 的提取和 Solexa 测序 总 RNA 的提
取采用 RNeasy Plant Mini Kits(Qiagen,Inc.,Valen-
cia,CA,USA)试剂盒按照实验手册操作步骤提取。
来 自 芽、 花、 叶 和 果 的 等 量 RNA 混 合 后, 取 10
μg 用于 cDNA 文库构建,cDNA 文库的构建参考文
献[17]的方法。利用 Illumina Solexa Hiseq 2000 的
paired-end 测序方法进行转录组测序。
1.2.2 序列的处理与拼接 鉴于 Solexa 数据错误率
对结果的影响,对原始数据进行质量预处理。先利
用滑动窗口法去除低质量片段 :质量阈值 20(错误
率 =1%),窗口大小 5 bp,长度阈值 35 bp ;再切除
reads 中含 N 部分序列 :长度阈值 35 bp ;最后利用
软件 Trinity 对辽东栎有效 reads 进行从头拼接[18]。
1.2.3 功能注释 使用 BLASTx 程序将拼接所得的
unigene 与 核 酸、 蛋 白 质 序 列 数 据 库 比 对(E 值 <
1e-5),并选取最佳注释。蛋白质数据库包括 Swiss-
Prot、GenBank 非冗余蛋白数据库(Nr)、蛋白质直系
同源簇数据库(Clusters of Orthologous Groups of prot-
eins,COGs)、京都基因和基因组百科全书(Kyoto
Encyclopedia of Genes and Genomes,KEGG)及 Gene
Ontology(GO)。 其 中,unigene 通 过 COG、GO 和
KEGG 数据库的分类的参考文献[19]的方法。
1.2.4 SSR 位 点 的 筛 选 利 用 MISA 软 件 在 所 有
unigene 中搜索 SSR 位点,参数设置如下 :二核苷酸
至少重复次数为 6,三核苷酸、四核苷酸、五核苷
酸和六核苷酸至少重复次数均为 5。
2 结果
2.1 Illumina Solexa 测序和序列拼接
采用 Illumina Solexa Hiseq 2000 测序技术对辽
东栎的芽、花、叶和果实的混合样进行转录组测
序,共获得 46 400 862 条原始序列,总长 4.64 Gb。
经过预处理,最终得到了有效序列 40 621 588 条,
数 据 量 为 3.8 Gb, 平 均 长 度 为 94.95 bp。 使 用 软
件 Trinity 对 有 效 reads 进 行 从 头 拼 接 最 终 得 到 了
151 339 个长度大于 200 bp 的 contig,总长度约为
130.92 Mb,最大长度、平均长度以及 N50 分别为
11 284、865 和 1 442 bp。取每个 contig 下最长的转
录本作为 unigene,得到了 95 800 个 unigene,总长
度约为 73.57 Mb,平均长度与 N50 分别为 768 bp 和
1 373 bp。其中,大于 2 000 bp 的序列共有 7 975 条,
占 unigene 总数的 8.32%(图 1-A)。
2.2 序列的比对、功能注释及unigene的特征分析
将所获得的 unigene 与公共数据 Nr 和 Swiss-Prot
进行 Blastx 比对,通过 gene 的相似性进行功能注
2014年第7期 121刘玉林等 :基于高通量测序的辽东栎转录组学研究
释,共有 57 637 条 unigene 获得了基因注释(hit),
占总 unigene 总数的 60.16%,而在其余未得到任何
一个上述数据库的注释(no-hit)38 163 条 unigene
(39.84%)中,有 37 752 条 unigene(98.92%)小于
或等于 1 000 bp(图 1-B)。
2.3 功能分类研究
为进一步研究辽东栎中 unigene 的功能分类,
将所得到的 95 800 条 unigene 在 COG 和 GO 数据库
中进行比对及功能注释与分类。
在 COG 分 类 中, 共 有 36 407 条 unigene( 占
unigene 总数的 38%)被注释到 24 个 COG 类别中。
其中,“一般功能基因”是最大类别,包含 8 330 条
unigene,占被注释到 unigene 总数的 22.88% ;其次
是“蛋白质翻译后修饰与转运,分子伴侣”,包含
4 128 条 unigene ;而“核酸结构”是最小的类别,
仅包含 11 条 unigene。此外,有 2 491 条 unigene 参
与了碳水化合物运输与代谢(图 2)。
利用 GO 对获得辽东栎 unigene 进行功能分类,
共有 43 766 条 unigene 被注释到生物学过程、细胞
组分和分子功能 3 个大类别中。其中,36 372 条
unigene 归入生物学过程,18 876 条 unigene 归入细
胞组分以及 40 358 条 unigene 归入分子功能。3 个
大的类别又被划分为 45 个小的类别(图 3)。代谢
201-4
00
401-6
00
601-8
00
801-1
000
1001
-1200
1201
-1400
1401
-1600
1601
-1800
1801
-2000 >200
0
unigene䮯ᓖ bp 201-400401-600601-800801-10001001-12001201-14001401-16001601-18001801-2000 >2000unigene䮯ᓖ bp 02040Ⲯ࠶∄ %
co
nt
ig
઼unigeneᮠⴞ
60
80
100
0
10000
20000
30000
40000
50000
contig unigene
60000
70000A
B ᰐ⌘䟺 no-hit ᴹ⌘䟺 hit
图 1 contig 和 unigene 的长度分布(A)及有注释和无注
释的 unigene 的分布比例(B)
Z˖㓶㜎僘ᷦ
A˖RNA࣐ᐕо؞侠
B˖ḃ㢢䍘㔃ᶴоਈॆ
C˖㜭䟿ӗ⭏о䖜ॆ
D˖㓶㜎ઘᵏ䈳᧗о࠶㻲ˈḃ㢢փ䟽ᧂ
E˖≘ส䞨䘀䗃оԓ䉒
F˖Ṩ㤧䞨䘀䗃оԓ䉒
G˖⻣≤ॆਸ⢙䘀䗃оԓ䉒
H˖䖵䞦䘀䗃оԓ䉒
I˖㜲㊫䘀䗃оԓ䉒
J˖㘫䈁ˈṨ㌆փ㔃ᶴо⭏⢙ਸᡀ
K˖䖜ᖅ
L˖༽ࡦǃ䟽㓴о؞༽
M˖㜎໱㟌⭏⢙ਁ⭏
N˖㓶㜎䘀ࣘ
O˖㳻ⲭ䍘㘫䈁ਾ؞侠о䖜䘀ˈ࠶ᆀդד
P˖ᰐᵪ⿫ᆀ䘀䗃оԓ䉒
Q˖⅑⭏ӗ⢙ਸᡀˈ䘀䗃৺ԓ䉒
R˖а㡜࣏㜭สഐ
S˖࣏㜭ᵚ⸕
T˖ؑਧՐሬᵪࡦ
U˖㜎޵࠶⋼о㟌⌑䘀䗃
V˖䱢ᗑᵪࡦ
Y˖Ṩ䞨㔃ᶴ
9000 8000 7000 6000 5000
unigeneᮠ ࣏㜭㊫࡛
4000 3000 2000 1000 0
图 2 辽东栎 unigene 的 COG 分类
生物技术通报 Biotechnology Bulletin 2014年第7期122
过程是生物学过程中的最大类别,包含 31 427 条
unigene ;细胞是细胞组分中的最大类别,包含 12
764 条 unigene ;蛋白结合是分子功能中的最大类别,
包含 28 892 条 unigene。
100000
10000
1000
100un
ig
en
eᮠⴞ
10 ⭏⢙ᆖ䗷〻 㓶㜎㓴࠶ ࠶ᆀ࣏㜭1 B01 B02 B03 B04 B05 B06 B07 B08 B09 B10 B11 B12 B13 B14 B15 B16 B17 B18 B19 B20 B21 B22 B23 B24 C01 C02 C03 C04 C05 C06 C07 C08 C09 M01 M02M03 M04 M05M07 M08 M09M10 M11 M12M13
B01 :生物学黏附 ;B02 :生物学调控 ;B03 :碳的利用 ;B04 :细胞杀伤 ;B05 :细胞增殖 ;B06 :细胞组分的起源 ;B07 :细胞过程 ;B08 :凋亡 ;
B09 :发育过程 ;B10 :定位的建立 ;B11 :生长 ;B12 :免疫系统过程 ;B13 :定位 ;B14 :运动力 ;B15 :代谢过程 ;B16 :多 / 有机体过程 ;B17 :
多细胞有机体过程 ;B18 :氮的利用 ;B19 :生物学过程调节 ;B20 :复制 ;B21 :生殖过程 ;B22 :刺激应答 ;B23 :信号 ;B24 :病毒复制 ;C01 :细胞 ;
C02 :细胞连接 ;C03 :细胞外基质 ;C04 :胞外区 ;C05 :大分子复合物 ;C06 :外被 ;C07 :有膜内腔 ;C08 :细胞器 ;C09 :virion 病毒体 ;M01 :
抗氧化活性 ;M02 :蛋白结合 ;M03 :催化活性 ;M04 :电子载体活性 ;M05 :酶调节器活性 ;M07 :分子传感器活性 ;M08 :核酸绑定的转录因子活性 ;
M09 :营养库活性 ;M10 :蛋白结合的转录因子活性 ;M11 :受体活性 ;M12 :结构分子活性 ;M13 :转运活性
图 3 辽东栎 unigene 的 GO 分类
2.4 代谢途径分析和淀粉合成基因的筛选
将辽东栎的 unigene 序列映射到 KEGG 数据库
的参考代谢通路中,共有 11 468 条 unigene 参与到
185 个代谢通路中。其中包含 unigene 最多的是代谢
通 路 是 剪 接 体(ko03010), 共 有 1 161 条 unigene。
其次是内质网上的蛋白加工(ko04141),包含 630
条 unigene。而参与淀粉与蔗糖的代谢通路(ko00500)
的 unigene 共有 434 条(表 1)。
的 unigene,编码 9 个关键酶,其中 5 个 unigene 编
码 α-糖苷酶 ;17 个 unigene 编码 β-呋喃果糖苷酶 ;
9 个 unigene 编码己糖激酶 ;10 个 unigene 编码果糖
激酶 ;4 个 unigene 编码葡萄糖 -6-磷酸异构酶 ;4 个
unigene 编码葡萄糖磷酸变位酶 ;8 个 unigene 编码
葡萄糖 -1-磷酸腺苷酰基转移酶 ;6 个 unigene 编码
淀粉合成酶及 4 个 unigene 编码 1,4-α-葡聚糖分支酶
(表 2)。
表 1 辽东栎中包含 unigene 数目最多的 10 个代谢通路
ko 号 代谢通路 unigene 数
ko03010 核糖体 1161
ko04141 内质网上的蛋白加工 630
ko00190 氧化磷酸化 628
ko03040 剪接体 437
ko00500 淀粉和蔗糖代谢 434
ko03013 RNA 转运 410
ko00010 糖酵解 / 糖质新生 382
ko04075 植物信号转导 377
ko00230 嘌呤代谢 355
ko04144 内吞作用 322
结合 KEGG 数据库中参考 pathway 的关于淀粉
与蔗糖代谢通路中发掘到的 unigene 及在其他公共
数据库中的注释,共统计筛选出 67 条参与淀粉合成
2.5 SSR分析
利 用 MISA 软 件 在 辽 东 栎 的 13 380 条 unigene
中共搜索到 15 901 个 SSR 位点,占 unigene 总序列
表 2 辽东栎中参与淀粉合成的酶
酶 EC 号 unigene 数
α-糖苷酶 EC :3.2.1.20 5
β-呋喃果糖苷酶 EC :3.2.1.26 17
己糖激酶 EC :2.7.1.1 9
果糖激酶 EC :2.7.1.4 10
葡萄糖 -6-磷酸异构酶 EC :5.3.1.9 4
葡萄糖磷酸变位酶 EC :5.4.2.2 4
葡萄糖 -1-磷酸腺苷酰基转移酶 EC :2.7.7.27 8
淀粉合成酶 EC :2.4.1.21 6
1,4-α-葡聚糖分支酶 EC :2.4.1.18 4
2014年第7期 123刘玉林等 :基于高通量测序的辽东栎转录组学研究
数的 13.97%,平均每 1.28 kb 出现 1 个 SSR,其中
包含有两个及两个以上 SSR 的 unigene 共有 2 521 条。
二核苷酸和三核苷酸重复类型分别占 SSR 总数的
60.07% 和 38.09% ;四核苷酸重复类型占 SSR 总数
的 1.57% ;而五核苷酸和六核苷酸重复类型在辽东
栎中转录组序列中含量较少,仅占 SSR 总数的 0.19%
和 0.09%。除此之外,不同核苷酸的重复次数也有
很大的变化(表 3)。
3 讨论
基于高通量测序技术的转录组学研究是一种
非常高效、可靠的发掘功能基因手段,且在淀粉的
合成及代谢中也已得到广泛应用[20,21]。目前,高
通量测序技术主要是 Roche 公司的 454 测序技术、
Illumina 公司和 ABI 公司相继推出的 Solexa 和 SOLid
测序技术。其中,Solexa 测序技术相对于其他两种
技术在测序成本和数据量输出方面更具优势[22]。前
人的研究表明,不同组织的混合取样,可在节约试
表 3 辽东栎中的 SSR 位点的数量与分布
重复类型
重复次数
SSR 数 百分比(%)
5 6 7 8 9 10 >10
二核苷酸 - 2515 1687 1685 1999 1342 323 9551 60.07
三核苷酸 3123 1833 1015 79 - 1 5 6056 38.09
四核苷酸 221 27 1 - - - - 249 1.57
五核苷酸 28 1 - 1 - - - 30 0.19
六核苷酸 7 4 2 1 1 - - 15 0.09
总数 3379 4380 2705 1766 2000 1343 328 15901
验成本的基础上发掘到更多的转录本[23]。因此,本
研究采用辽东栎的芽、花、叶和果实的混合样品进
行转录组测序。栎属植物的基因组大小约为 539-
921 Mb[24],本研究共获得 3.8 Gb 的有效数据量,
约覆盖辽东栎基因组的 4.13-7.05 倍。同时利用在
对 Illumina Solexa Hiseq 2000 测序数据进行拼接过
程中表现非常优异的 Trinity 软件[25]对本研究的数
据进行拼接处理,共获得 95 800 条 unigene,其中
有 38 163 条 unigene 未在 Blastx 同源性搜索中得到
注释,但大多数片段小于 1 000 bp(37 752 条,占
98.92%),因此这些片段可能是由于较短而未与公共
数据库中的序列比对上,也可能是短的非编码序列
或者是新的基因。
COG 和 GO 的功能分类对初步了解基因的功能
起着重要作用,而 KEGG 数据库中的参考 pathway
不仅可以推测基因的功能,而且可以研究基因在不
同代谢通路中所在位置及作用,三者相辅相成,成
为新物种中发掘功能基因的重要手段[19]。本研究通
过 KEGG 数据库中的 pathway 分析筛选与淀粉合成
相关的基因,同时结合所筛选到的 unigene 在本研究
中其他数据库中的功能注释,从而进一步确保了所
获得的基因的可靠性。
鉴于分布广泛和多态性较高的特性,SSR 标记
已被广泛应用于分子标记辅助选择育种(Molecular
marker-assisted selection,MAS)和利用分子标记通
过关联分析(Association mapping)发掘与好的农艺
性状连锁紧密的相关基因[26],尤其是对于多年生的
植物,可大大缩短育种年限[27]。本研究在辽东栎中
发掘到 15 901 个 SSR 位点,其中二核甘酸和三核苷
酸的重复占到总数的 98.16%,为了保证 SSR 位点的
潜在多态性,我们在筛选过程中对于四、五和六核
苷酸的最小重复次数同样设置为 5,一定程度上影
响到了这 3 类核苷酸重复在总 SSR 位点中所占比例。
本研究通过高通量的测序,获得了大量的辽东
栎转录组序列,不仅丰富了辽东栎的基因库,而且
为辽东栎及其他栎类淀粉合成基因的克隆与功能研
究奠定了基础。发掘到的 SSR 位点可通过进一步的
开发为辽东栎的进化与多样性分析及辽东栎的遗传
图谱的构建和 QTL(Quantitative Trait Loci)的定位
提供了数据支持。
4 结论
本研究通过 Solexa Hiseq 2000 高通量测序,获
生物技术通报 Biotechnology Bulletin 2014年第7期124
得 3.8 Gb 的辽东栎转录组序列,拼接获得 95 800 条
unigene,发掘出 67 条参与淀粉合成的 unigene 以及
15 901 个 SSR 位点。
参 考 文 献
[1]Balat M, Balat H. Recent trends in global production and utilization
of bio-ethanol fuel [J]. Applied Energy, 2009, 86 :2273-2282.
[2]Hahn-Hägerdal B, Galbe M, Gorwa-Grauslund MF, et al. Bio-
ethanol-the fuel of tomorrow from the residues of today[J]. Trends
in Biotechnology, 2006, 24(12):549-556.
[3] 谢光辉 , 郭兴强 , 王鑫 , 等 . 能源作物资源现状与发展前景[J].
资源科学 , 2007, 29(5):74-80.
[4]吴创之 , 周肇秋 , 阴秀丽 , 等 . 我国生物质能源发展现状与思
考[J]. 农业机械学报 , 2009, 40(1):91-99.
[5]李碧芳 . 发展生物质能源对能源安全和粮食安全的影响[J].
生态经济 , 2010, 3 :41-42.
[6]方炎明 , 张聪颖 , 虞木奎 , 等 . 栎树繁殖生物技术进展[J]. 生
物技术通报 , 2011(4):60-65.
[7]陈婧 , 马履一 , 段劼 , 等 . 中国林业生物质能源发展现状[J].
林业实用技术 , 2012, 11 :16-19.
[8]田玉峰 , 李安平 , 谢碧霞 , 等 . 橡实淀粉生物乙醇化橡实品种和
菌种的筛选[J]. 食品科学 , 2011, 32(7):207-210.
[9]李安平 , 田玉峰 , 谢碧霞 , 等 . 橡实淀粉生料酒精发酵与传统酒
精发酵的能耗和成分组成比较[J]. 江西农业大学学报 , 2012,
34(5):1032-1038.
[10]Soni PL, Sharma H, Dun D, et al. Physicochemical properties of
Quercus leucotrichophora(Oak)starch [J]. Starch/Stärke, 1993,
45(4):127-130.
[11]Stevenson DG, Jane JL, Inglett GE. Physicochemical properties of
pin oak(Quercus palustris Muenchh.)acorn starch [J]. Starch/
Stärke, 2006, 58(11):553-560.
[12]Derory J, Léger P, Garcia V, et al. Transcriptome analysis of bud
burst in sessile oak(Quercus petraea)[J]. New Phytologist,
2006, 170(4):723-738.
[13]Lesur I, Durand J, Sebastiani F, et al. A sample view of the
pedunculate oak(Quercus robur)genome from the sequencing of
hypomethylated and random genomic libraries [J]. Tree Genetics
& Genomes, 2011, 7(6):1277-1285.
[14]Ueno S, Le Provost G, Léger V, et al. Bioinformatic analysis of ESTs
collected by Sanger and pyrosequencing methods for a keystone
forest tree species :oak [J]. BMC Genomics, 2010, 11 :650.
[15] 刘红亮 , 郑丽明 , 刘青青 , 等 . 非模式生物转录组研究[J].
遗传 , 2013, 35(8):955-970.
[16]罗伟祥 , 郝怀晓 , 薛安平 . 橡树资源-优质林木生物质能源发展
战略研究[J]. 生物质化学工程 , 2006, 40(B12):147-152.
[17]Huang LL, Yang X, Sun P, et al. The first Illumina-based de novo
transcriptome sequencing and analysis of safflower flowers [J].
PloS One, 2012, 7(6):e38653.
[18]Haas BJ, Papanicolaou A, Yassour M, et al. De novo transcript
sequence reconstruction from RNA-seq using the Trinity platform
for reference generation and analysis [J]. Nature Protocols, 2013,
8(8):1494-1512.
[19]Wang R, Xu S, et al. De novo sequence assembly and characteriza-
tion of Lycoris aurea transcriptome using GS FLX Titanium platform
of 454 pyrosequencing [J]. PloS One, 2013, 8(4):e60449.
[20]Tao X, Fang Y, Xiao Y, et al. Comparative transcriptome analysis to
investigate the high starch accumulation of duckweed(Landoltia
punctata)under nutrient starvation [J]. Biotechnology for
Biofuels, 2013, 6(1):72.
[21]Kaminski KP, Petersen AH, Sønderkær M, et al. Transcriptome
analysis suggests that starch synthesis may proceed via multiple
metabolic routes in high yielding potato cultivars [J]. PloS One,
2012, 7(12):e51248.
[22]Shu S, Chen B, et al. De novo sequencing and transcriptome
analysis of Wolfiporia cocos to reveal genes related to biosynthesis
of triterpenoids [J]. PloS One, 2013, 8(8):e71350.
[23]Zhou Y, Gao F, Liu R, et al. De novo sequencing and analysis of root
transcriptome using 454 pyrosequencing to discover putative genes
associated with drought tolerance in Ammopiptanthus mongolicus
[J]. BMC Genomics, 2012, 13 :266.
[24]Kole, Chittaranjan. Fagaceae Trees. //In genome mapping and
molecular breeding in plants[M]. Springer, 2007, 7 :161-184.
[25]Li SW, Yang H, Liu YF, et al. Transcriptome and gene expression
analysis of the rice leaf folder, Cnaphalocrosis medinalis [J]. PloS
One, 2012, 7(11):e47401.
[26]O’Malley DM, McKeand SE. Marker assisted selection for breeding
value in forest trees [J]. Forest Genetics, 1994, 1 :207-218.
[27]Neale DB, Kremer A. Forest tree genomics :growing resources and
applications [J]. Nature Reviews Genetics, 2011, 12 :111-122.
(责任编辑 马鑫)