免费文献传递   相关文献

Sequencing and Characterization of Transcriptome of Sinningia speciosa Sepals and Young Leaves

大岩桐花萼和幼叶转录组研究



全 文 :园艺学报,2015,42 (12):2519–2525.
Acta Horticulturae Sinica
doi:10.16420/j.issn.0513-353x.2015-0105;http://www. ahs. ac. cn 2519
大岩桐花萼和幼叶转录组研究
费 元 1,韩 雪 1,余 红 2,庞基良 1,*
(1 杭州师范大学生命与环境科学学院,杭州 310036;2 杭州市农业科学研究院生物技术研究所,杭州 310024)
摘 要:利用新一代高通量测序技术平台 Illumina Solexa GAⅡx 对大岩桐花萼和幼叶进行转录组测
序和数据从头组装及生物信息学分析,获得了长度大于 100 bp 的转录物 22 821 条;转录本总长度 28.63
Mb,N50 长度 1 548 bp,序列平均长度 953 bp。转录物注释结果显示,15 053 条有同源比对信息;7 768 条
无匹配序列信息,可能为大岩桐特有的基因序列。通过对花萼、幼叶中与激素代谢、信号转导相关的差
异 KEGG 通路比较,推断在花萼中促进生长激素合成基因的表达比幼叶中强,激素信号转导组分基因的
表达也比幼叶中强。
关键词:大岩桐;花萼;幼叶;转录组;生物信息学分析
中图分类号:S 682 文献标志码:A 文章编号:0513-353X(2015)12-2519-07

Sequencing and Characterization of Transcriptome of Sinningia speciosa
Sepals and Young Leaves
FEI Yuan1,HAN Xue1,YU Hong2,and PANG Ji-liang1,*
(1College of Life and Environmental Sciences,Hangzhou Normal University,Hangzhou 310036,China;2Institute of
Biotechnology,Hangzhou Academy of Agricultural Sciences,Hangzhou 310024,China)
Abstract:The transcriptome of Sinningia speciosa sepals and young leaves was sequenced by using
Illumina Solexa GAⅡx,and the functional annotations and metabolic pathway analyses of some unigenes
were conducted in this study. And 22 821 unigenes,longer than 100 bp,were obtained by de novo
assembly method. The total scaffold sequence length reached 28.63 Mb with the 1 548 bp of N50,the
average unigenes length was 953 bp. Annotation analysis of unigene indicated that 15 053 unigenes had
homolog in public protein database;However,7 768 sequences were no hit and might be Sinningia
speciosa specific. The study of different KEGG pathways related to hormone metabolism and signaling in
sepals and young leaves,inferred that the expression of hormone synthesis genes of promoting growth in
sepals is stronger than in leaves,so was the expression of the signal transduction component genes.
Key words:Sinningia speciosa;sepal;young leaf;transcriptome;bioinformation analysis

植物开花机理是植物学科的研究热点。利用拟南芥、金鱼草等模式植物已克隆了上百个与开化
诱导、开花时间、花分生组织形成、花器官形成、花形等相关的基因(Xu & Chong,2002),并提
出了花器官发生的“ABCDE”模型(Krizek & Fletcher,2005)。但仍存在许多需要进一步探索的问

收稿日期:2015–06–02;修回日期:2015–12–11
基金项目:国家自然科学基金项目(31071818);浙江省重点科技创新团队项目(2010R50039)
* 通信作者 Author for correspondence(E-mail:pangrenshuiliang@aliyun.com)
Fei Yuan,Han Xue,Yu Hong,Pang Ji-liang.
Sequencing and characterization of transcriptome of Sinningia speciosa sepals and young leaves.
2520 Acta Horticulturae Sinica,2015,42 (12):2519–2525.
题,如不同植物激素在花芽分化过程中相互作用(crosstalk)的机制等。赤霉素(GA)和细胞分裂
素(CKs)对许多植物的发育过程表现为拮抗效应(Greenboim-Wainberg et al.,2005;Jasinski et al.,
2005)。然而,作者在离体培养大岩桐(Sinningia speciosa)花萼切块或花瓣切块时发现,GA 和 CKs
非常显著地协同促进大岩桐花萼切块或花瓣切块直接再生花芽(Pang et al.,2006,2012),但不能
促进幼叶切块再生花芽。
近年来转录组测序技术(又称 RNA-Seq)可以在没有完整基因组序列的前提下,分析所有的
mRNA 转录本的丰度信息,发掘新的转录本和可变剪接体,为开展不同生物功能基因组学研究提供
了全新的思路和方法(Li et al.,2010)。利用转录组技术可以挖掘重要的功能基因,揭示优良性状
的分子机制,还可以研究不同器官、不同环境胁迫下基因表达的差异。转录组测序技术已被广泛应
用于红豆杉(Hao et al.,2011)、杜仲(李铁柱 等,2012)、蜡梅(杨楠 等,2012)、油松(钮世辉
等,2013)、油桐(孙颖 等,2014)等的研究中。大岩桐基因组还未测序,遗传背景不清楚。本研
究中通过对大岩桐花萼和叶片的转录组测序,比较分析花萼和叶片中基因表达的差异,特别是与激
素代谢、信号转导相关基因表达的差异,以揭示离体培养大岩桐花萼切块直接再生花芽的分子机制,
同时也为了解调控大岩桐生长发育的基因积累信息。
1 材料与方法
1.1 材料
大岩桐(Sinningia speciosa)种植于杭州师范大学玻璃温室。分别切取直径为 10 mm 左右新鲜
花蕾的花萼和幼叶,分装于液氮中保存备用。
1.2 RNA提取、纯化及测序文库的构建
采用 Trizol 法提取大岩桐幼嫩叶片和花萼组织的总 RNA,检测 RNA 的浓度和完整性,用
Dynabeads® mRNA Direct Kits(Life technologies)分离 mRNA。将得到的 mRNA 逆转录成 dsDNA,
加 dA 碱基,连接接头,PCR 富集测序样本。以上操作步骤均按照 mRNA-Seq 24-Sample Prep Kit 试
剂盒说明书进行(Illumina)。
1.3 高通量测序
利用 agilent 2100 DNA 1000 kit 检测建库大小,用 nanodrop 以及 Qubit 检测,得到文库样品的准
确浓度。取 10 μL 2 nmol · L -1 文库样品,用高通量测序平台 Illumina GA xⅡ 进行 DNA 双末端测序,
每一个序列读取片段(read)的读长约 110 bp。
1.4 数据拼接和功能注释
转录组采取从头测序,最初的原始序列是 96 bp,利用 Velvet 和 Oases 软件进行转录组从头拼接
(K-mer = 51)。结合配对未端信息,对已获得的重叠群(contig)序列进行 scaffold 组装。在拼接、
组装过程中,中间未知序列用 N 表示,直至最终的拼接序列不能再拼接延伸为止,得到单基因
(unigene)。
将拼接数据与 nr(NCBI 非冗余蛋白库),Swiss-Prot(去冗余的蛋白数据库),KEGG(基因功
能和代谢途径数据库)等数据库进行 Blastx 比对(E < 1e-5)。根据 nr 注释信息,使用 Blast2GO 软
件得到基因的 GO 注释信息。得到每个基因的 GO 注释后,再用 WEGO 软件对所有基因做 GO 功能
费 元,韩 雪,余 红,庞基良.
大岩桐花萼和幼叶转录组研究.
园艺学报,2015,42 (12):2519–2525. 2521
分类统计。
1.5 花萼和幼叶中差异表达基因的统计方法
花萼和幼叶中各单基因的转录本丰度用标准化转录本数(RPKM)表示,以确定相对转录丰度
的转录水平,RPKM =(unigene reads 数 × 109)/(unigene 长度 × 样本 clean reads 总数),FDR ≤
0.001。并将两样品间 RPKM 的 log2 倍数绝对值大于 2 的单基因确定为差异基因。
2 结果与分析
2.1 测序结果和从头组装
根据测序产生的序列文件,过滤掉低质量的序列后进行统计。两个转录组数据在 1.41 ~ 1.56 Gb
(原始序列 Accession No.为 SRP057784),通过拼接,获得重叠群总长度为 36 645 920 bp,大于 100
bp 的重叠群有 101 834 个,平均长 359 bp,N50 长 501 bp。
对转录组重叠群长度分布特征(图 1)进行分析,在总重叠群中,所占比例最大的是 100 ~ 400
bp,占 75.64%。其中 100 ~ 200 bp 重叠群占 43.13%(43 918 条),200 ~ 300 bp 重叠群占 22.13%
(22 531 条),300 ~ 400 bp 重叠群占 10.38%(10 569 条)。长度大于 2 000 bp 的占 0.92%(933 条)。













图 1 大岩桐转录组重叠群长度的分布
Fig. 1 Distribution of transcriptome contig length in Sinningia speciosa

随后根据重叠群的结果,结合配对未端信息,进行单基因拼接与分析,共获得 22 821 个单基因
(http://www. ncbi. nlm. nih. gov/nuccore/ GCZU00000000,登录号为 GCZU01000001 ~ GCZU01022821),
长度分布统计见表 1。单基因簇总长度约为 28.63 Mb,平均长度为 953 bp,N50 长度为 1 548 bp。
单基因长度主要分布在 100 ~ 3 000 bp 之间,大于 3 000 bp 的序列占 2.31%(1 026 条)。
2.2 功能注释及分类
对 22 821 单基因与 nr、Swiss-Prot 等蛋白数据库进行 Blastx 比对,如果在数据库中找不到同源
基因,在 Annotation 一列显示 No hit。结果显示,在 22 821 单基因序列中,65.96%(15 053 条)有
同源比对信息,34.04%(7 768 条)序列无匹配(表 1)。
根据 nr 注释信息能得到 Gene Ontology(GO)功能注释。根据 nr 注释信息,使用 Blast2GO 软
件得到 Gene 的 GO 注释信息。得到每个 Gene 的 GO 注释后,再用 WEGO 软件对所有 Gene 做 GO

Fei Yuan,Han Xue,Yu Hong,Pang Ji-liang.
Sequencing and characterization of transcriptome of Sinningia speciosa sepals and young leaves.
2522 Acta Horticulturae Sinica,2015,42 (12):2519–2525.
功能分类统计(图 2),从宏观上认识基因功能分布特征。7 340 单基因拥有具体的功能定义,占总
单基因的32.16%。其中具有分子功能的有6 251单基因(44.5%),细胞组分的有2 964单基因(21.1%),
生物学过程的有 4 830 个(34.4%)。细胞、细胞部分、蛋白结合、催化活性、细胞过程、代谢过程
的比例较高,而病毒体、病毒体部分、电子载体、细胞杀伤、免疫系统过程、运动力、复制、复制
过程、节律性过程、病毒复制的比例则较低。
表 1 单基因长度分布
Table 1 Length distribution of unigenes
单基因长度/bp
Unigene length
数量
Number
百分比/%
Percentage
无匹配蛋白序列
No hit sequences
100 ~ 200 2 144 9.39 1 827
201 ~ 300 3 596 15.76 2 688
301 ~ 400 2 585 11.33 1 545
401 ~ 500 1 729 7.58 694
501 ~ 600 1 275 5.59 372
601 ~ 700 1 338 5.42 208
701 ~ 800 1 087 4.76 141
801 ~ 900 886 3.88 95
901 ~ 1 000 880 3.86 52
1 001 ~ 2 000 5 230 22.92 128
2 001 ~ 3 000 1 644 7.20 11
3 001 ~ 10 000 521 2.28 7
> 10 000 6 0.03 0
总单基因数 Total unigene number 22 821 100.00 7 768
总长/bp Total length 28 632 454
N50 长/bp N50 length 1 548
平均长/bp Average length 953
最短单基因 The shortest unigene 101
最长单基因 The longest unigene 15 661

2.3 花萼和幼叶基因表达差异的分析
计算每条 Unigene 在花萼和幼叶的 RPKM 值,并将两样品间 RPKM 的 log2 倍数绝对值大于 2
的 Unigene 确定为差异基因。经分析发现花萼和幼叶的 22 821 个 Unigene 中在花萼中上调的基因有
4 186 个,下调的有 3 569 个基因。表 2 显示了分子功能中差异表达基因(DEGs,differentially expressed
genes)富集最多的前 10 种 GO 注释,主要有核酸结合、催化活性和蛋白激酶活性等分子功能。
表 2 分子功能中差异表达基因富集最多的前 10 种 GO注释
Table 2 Top 10 GO annotations with differentially expressed gene enrichment in molecular functional
序号
Serial No
花萼中上调的差异表达
基因数
DEGs regulated up in sepal
特定 GO 注释中所有基因
All genes in special GO
annotation
GO 登录号
GO Accession No.
分子功能中的 GO 注释
GO annotations in molecular function
1 165 1 011 GO:0032559 腺嘌呤核苷酸结合 Adenyl ribonucleotide binding
2 101 534 GO:0003676 核酸结合 Nucleic acid binding
3 63 428 GO:0003824 催化活性 Catalytic activity
4 59 336 GO:0003824 蛋白激酶活性 Protein kinase activity
5 58 546 GO:0004672 结合 Binding
6 38 280 GO:0046872 金属离子结合 Metal ion binding
7 35 181 GO:0046872 核苷酸结合 Nucleotide binding
8 32 142 GO:0005506 铁离子结合 Iron ion binding
9 27 212 GO:0005515 蛋白结合 Protein binding
10 25 115 GO:0016301 激酶活性 Kinase activity
费 元,韩 雪,余 红,庞基良.
大岩桐花萼和幼叶转录组研究.
园艺学报,2015,42 (12):2519–2525. 2523






























图 2 大岩桐转录组 GO 功能分类
Fig. 2 Gene ontology classification of Sinningia speciosa transcriptome

2.4 代谢通路分析
将 22 821 条 unigene 与 KEGG 库进行比对、注释,涉及到的代谢通路有 289 个。应用超几何检
验(P-value < 1),找到差异表达基因显著富集的代谢通路,主要包括细胞周期、糖代谢、生物合成、
光合作用等。花萼和幼叶中与激素代谢、信号转导相关的差异 KEGG 通路见表 3,花萼中明显上调
的 KEGG 通路有嘌呤代谢、色氨酸代谢、双萜合成、油菜素内酯合成、蛋白激酶、双组分系统、促
分裂原活化蛋白激酶信号途径、钙信号途径和 G 蛋白偶联受体。


Fei Yuan,Han Xue,Yu Hong,Pang Ji-liang.
Sequencing and characterization of transcriptome of Sinningia speciosa sepals and young leaves.
2524 Acta Horticulturae Sinica,2015,42 (12):2519–2525.
表 3 花萼和幼叶中与激素代谢、信号转导相关的差异 KEGG 通路
Table 3 The different KEGG pathways related to hormone metabolism and signaling in sepals and young leaves
通路 ID
Pathway ID
花萼中上调的差异
表达基因数
DEGs regulated up
in sepal
有特定注释通路中的所有基因
All genes in pathway
with special annotation
P-value 代谢通路注释
ko_annotation
ko00230 32 166 0.007222 嘌呤代谢 Purine metabolism
ko00380 8 43 0.096908 色氨酸代谢 Tryptophan metabolism
ko00904 9 15 2.08E-06 双萜合成 Diterpenoid biosynthesis
ko00905 3 12 0.059251 油菜素内脂合成
Brassinosteroid biosynthesis
ko01001 13 85 0.207182 蛋白激酶 Protein kinases
ko02020 1 11 0.428061 双组分系统 Two-component system
ko04010 4 49 0.780944 促分裂原活化蛋白激酶信号途径
MAPK signaling pathway
ko04020 8 57 0.317721 钙信号途径 Calcium signaling pathway
ko04030 2 16 0.345307 G 蛋白偶联受体
G protein-coupled receptors

3 讨论
将测序结果与 nr、Swiss-Prot、GO、KEGG 等蛋白数据库进行 Blastx 比对,共有 30 026 条转录
本被注释。与 nr 数据库比对,65.96%(15 053 条)有同源比对信息。与 GO 数据库进行比对,7 340
个 unigene 拥有具体的功能定义,占总 unigene 的 32.16%。这些被注释过的 unigene 将用于花萼、叶
片差异基因的分析。而大量未被注释过的信息则可能是还未被报道过的基因,这很大程度上丰富了
大岩桐的基因信息资源库。
杨楠等(2012)报道,通过蜡梅转录组分析,发现在 3 条生物碱合成相关的代谢途径中共有 123
个 unigene 参与生物碱合成。李铁柱等(2012)对杜仲果实和叶片进行了转录组分析,显示植物激
素生物合成、玉米素生物合成、双萜生物合成和油菜素内酯生物合成的 DEG 分别有 922、116、48
和 21 个。孙颖等(2014)对油桐两个不同发育时期的花芽进行了转录组分析,显示植物激素信号转
导的 DEG 有 694 个,双萜生物合成的 DEG 有 90 个。作者通过将大岩桐花萼和幼叶中与激素代谢、
激素信号转导相关的 KEGG 通路相比较,发现花萼中明显上调的 KEGG 通路有嘌呤代谢、色氨酸
代谢、双萜合成、油菜素内酯合成、蛋白激酶、双组分系统、促分裂原活化蛋白激酶信号途径、钙
信号途径和 G 蛋白偶联受体,这些通路中前 4 条与细胞分裂素、生长素、赤霉素和油菜素内酯的合
成有关(腺嘌呤、色氨酸分别为细胞分裂素、生长素合成的前体),后 5 条与激素信号转导相关。由
表 3 可见,前 4 条通路在花萼中上调的基因数分别为 32、8、9、3,后 5 条通路在花萼中上调的基
因数分别为 13、1、4、8、2。
从以上结果可以推断在花萼中促进生长激素合成基因的表达比幼叶中强,激素信号转导组分基
因的表达在花萼中也比幼叶中强,这可以解释为什么离体培养大岩桐花萼切块能再生花芽,而离体
培养幼叶切块不能再生花芽,从分子水平上提供了有益的启示。Yamaguchi 和 Kamiga(2000)报道
在同一株植物的不同部位,因其生长速度和发育阶段的不同,赤霉素合成酶基因的表达是有差异的。
这也为本试验结果提供了一些佐证。


费 元,韩 雪,余 红,庞基良.
大岩桐花萼和幼叶转录组研究.
园艺学报,2015,42 (12):2519–2525. 2525

References
Greenboim-Wainberg Y,Maymon I,Borochov R,Alvarez J,Olszewski N,Ori N,Eshed Y,Weiss D,2005. Cross talk between gibberellin and
cytokinin:The Arabidopsis GA response inhibitor SPINDLY plays a positive role in cytokinin signaling. Plant Cell,17:92–102.
Hao D C,Ge G,Xiao P,Zhang Y,Yang L. 2011. The first insight into the tissue specific Taxus transcriptome via Illumina second generation
sequencing. PLoS ONE,6 (6):e21220.
Jasinski S,Piazza P,Craft J,Hay A,Woolley L,Rieu I,Phillips A,Hedden P,Tsiantis M. 2005. KNOX action in Arabidopsis is mediated by
coordinate regulation of cytokinin and gibberellin activities. Curr Biol,15:1560–1565.
Krizek B A,Fletcher J C. 2005. Molecular mechanisms of flower development:An armchair guide. Nature Rev Genet,6:688–698.
Li R,Fan W,Tian G,Zhu H,He L,Cai J,Huang Q,Cai Q,Li B,Bai Y. 2010. The sequence and de novo assembly of the giant panda genome.
Nature,463:311–317.
Li Tie-zhu,Du Hong-yan,Liu Hui-min,Wuyun Ta-na,Wang Lin,Ye Sheng-jing. 2012. Transcriptome data assembly and gene function annotation
of Eucommia fruits and leaves. Journal of Central South University of Forestry & Technology,32 (11):122–130. (in Chinese)
李铁柱,杜红岩,刘慧敏,乌云塔娜,王 淋,叶生晶. 2012. 杜仲果实和叶片转录组数据组装及基因功能注释. 中南林业科技大学学
报,32 (11):122–130.
Niu Shi-hui,Yuan Hu-wei,Chen Xiao-yang,Li Wei. 2013. Microarray analysis of large scale gene expression profiles between male and female
cones of Pinus tabulaeformis. Scientia Silvae Sinicae,49 (9):46–51. (in Chinese)
钮世辉,袁虎威,陈晓阳,李 伟. 2013. 油松雌雄球花高通量基因表达谱芯片分析. 林业科学,49 (9):46–51.
Pang J L,Wang L L,Hu J Q,Xiang T H,Liang H M. 2006. Synergistic promotion of gibberellin and cytokinin on direct regeneration of floral buds
from in vitro cultures of sepal segments in Sinningia speciosa Hiern. In Vitro Cell Dev Biol-Plant,42 (5):450–454.
Pang J L,Wang L L,Xiang T H,Zhong D,Yu H. 2012. High-frequency floral bud regeneration from petal segment cultures of Sinningia speciosa
Hiern. Chinese Journal of Cell Biology,34 (3):279–285.
Sun Ying,Tan Xiao-feng,Luo Min,Li Jian-an. 2014. The sequencing analysis of transcriptome of Vernicia fordii flower buds at two development
stages. Scientia Silvae Sinicae,50 (5):70–74. (in Chinese)
孙 颖,谭晓风,罗 敏,李建安. 2014. 油桐花芽 2 个不同发育时期转录组分析. 林业科学,50 (5):70–74.
Xu Z H,Chong K. 2002. Plant developmental biology:Past,present and future. Acta Bot Sinica,44:1085–1095.
Yamaguchi S,Kamiya Y. 2000. Gibberellin biosynthesis:Its regulation by endogenous and environmental signals. Plant Cell Physiol,41:251–
257.
Yang Nan,Zhao Kai-ge,Chen Long-qing. 2012. Deep sequencing-based transcriptome profiling analysis of Chimonanthus praecox reveals insights
into secondary metabolites biosynthesis. Journal of Beijing Forestry University,34 (Sup 1):104–107. (in Chinese)
杨 楠,赵凯歌,陈龙清. 2012. 蜡梅花转录组数据分析及次生代谢产物合成途径研究. 北京林业大学学报,34 (增刊 1):104–107.