免费文献传递   相关文献

Solexa Sequencing and Bioinformatics Analysis of Small RNA in Winter Wheat

冬小麦小RNA高通量测序及生物信息学分析



全 文 :植物学报 Chinese Bulletin of Botany 2014, 49 (1): 8–18, www.chinbullbotany.com
doi: 10.3724/SP.J.1259.2014.00008
——————————————————
收稿日期: 2013-03-29; 接受日期: 2013-09-29
基金项目: 高等学校博士学科点专项科研基金(No.20112325110003)和国家自然科学基金人才培养能力提高科研训练项目(No.J121-
0069)
* 通讯作者。E-mail: cangjing2003@163.com
冬小麦小RNA高通量测序及生物信息学分析
黄儒1, 苍晶1*, 于晶1, 卢宝伟2, 刘丽杰1, 3, 王健飞1, 郭人铭1, 徐琛1
1东北农业大学生命科学学院, 哈尔滨 150030; 2黑龙江生态工程职业学院, 哈尔滨 150025
3齐齐哈尔大学生命科学与农林学院, 齐齐哈尔 161006
摘要 东农冬麦1号是我国首例可在黑龙江高寒地区种植的强抗寒冬小麦(Triticum aestivum)品种。鉴于分蘖节的耐寒程度
直接影响植株的安全越冬, 且MicroRNAs是一类生物体内普遍存在的非编码内源小分子RNA, 在植物的生长发育和适应胁
迫等过程中具有重要作用, 该文基于HiSeq深度测序原理, 对5°C和–10°C胁迫下的东农冬麦1号分蘖节进行测序, 并开展
生物信息学分析。结果表明, 在5°C文库中有2 229 955条特有小分子RNA序列, 并检测到35条已知miRNA, 属于30个
miRNA家族, 其表达丰度介于1–173 810之间; 在–10°C文库中有3 721 449条特有小分子RNA序列, 并发现29条已知
miRNA, 属于24个miRNA家族, 其表达丰度为1–105 868。靶基因预测结果表明, 5°C文库的30个miRNA家族中共预测到53
个靶基因。功能分析结果显示, 这些基因主要参与转录调节、新陈代谢、胁迫响应和信号转导等过程。已知小麦miRNA的
类型和表达丰度在5°C和–10°C两个文库中均有较大差异。
关键词 冬小麦, 东农冬麦1号, microRNA, 高通量测序, 生物信息学
黄儒, 苍晶, 于晶, 卢宝伟, 刘丽杰, 王健飞, 郭人铭, 徐琛 (2014). 冬小麦小RNA高通量测序及生物信息学分析. 植物学
报 49, 8–18.
MicroRNA(miRNA)是一类从具二级结构特征的
pre-miRNA上形成的非编码单链RNA(Griffiths-Jon-
es et al., 2008), 长度约为21–22 nt。它通过与靶
mRNA结合, 在转录后水平上切割靶基因或抑制靶基
因翻译来调节许多基因的表达(Chen et al., 2005)。自
Lee等(1993)在线虫中首次发现miRNA lin-4以来, 大
量的miRNA及其靶基因在许多物种中被识别出来。目
前, 已有140多个物种的17 000多个成熟miRNA序列
在miRBase(16.0)网站上公布(Kozomara and Grif-
fiths-Jones, 2011), 且数据仍在不断更新。
与rRNA、tRNA和snoRNA等非编码RNA不同,
植物miRNA基因通过RNA polymerase II转录为与
mRNA结构相同的pri-miRNA(Tang et al., 2008)。在
植物细胞核内 , pri-miRNA经DCL-1及其伴侣蛋白
HYL1首先切割出发卡结构pre-miRNA, 然后切割出
21 nt的3′端悬垂2 nt的成熟miRNA及其互补链(标记
为miRNA*或RNA*)。miRNA-miRNA*在细胞内不能
稳定存在 , 需要一个编码甲基转移酶的基因HEN1
(HUAENHANCER1)对其5′端进行甲基化修饰, 阻止
RNA尿嘧啶化降解(Tang et al., 2008)。最后HASTY
蛋白将该双链从细胞核内转移到细胞质中, 形成成熟
的miRNA, miRNA进一步结合到RISC复合体上。许多
物种的大部分miRNA是高度进化保守的, 如植物中
从苔类到开花的双子叶植物(Zhang et al., 2006; Ax-
tell et al., 2007)。据此特性, 研究者可在其它物种中
检测同源的miRNA(Zhang et al., 2005)。Jones-
Rhoades和Bartel (2004)利用该方法已在许多物种中
成功预测出大量的miRNA。
植物在生长发育过程中经常受到多种逆境胁迫,
其中低温胁迫是影响植物生长和作物产量提高的重
要限制性因素之一。在长期的进化过程中, 通过诱导
部分相关基因的表达引起某些物质积累和代谢途径
改变 , 从而使植物做出相应的适应性调整 (Fowler
and Thomashow, 2002; Zhu, 2002)。Zhu(2002)的研
究表明, 逆境胁迫会调控许多基因在转录水平、转录
后水平和翻译水平上的表达, 而转录后水平的调控在
·研究报告·
黄儒等: 冬小麦小 RNA 高通量测序及生物信息学分析 9
基因表达调控中较为普遍。目前, 逆境胁迫下转录后
水平的调控机制尚不明确(Kawaguchi and Bailey,
2002)。Jones-Rhoades和Bartel(2004)的研究表明,
植物逆境胁迫下miRNA的调控机制可能属于此类。此
外 , 包括低温在内的多种逆境胁迫均能够调控mi-
RNA的表达, 部分miRNA还直接参与植物逆境胁迫
应答反应(Chiou et al., 2006; Navarro et al., 2006;
Sunkar et al., 2006)。目前植物逆境miRNA的获得方
法主要有遗传筛选、直接克隆和生物信息学预测等。
其中, 生物信息学预测的主要依据是miRNA具较大
的序列同源性及其前体发卡结构的保守性。该方法对
于一些基因组数据不完整的物种及新miRNA的预测
则比较困难。传统克隆法虽能同时鉴别已知和新的
miRNA, 但其检测效率低、成本高且时间长。近几年
来, 在传统方法基础上发展起来的小分子RNA高通
量测序技术能够快速且高效的发掘miRNA, 构建样
品间小分子RNA的差异表达谱, 为小分子RNA的功
能研究及降解组测序技术发展提供了有力的依据(董
淼等, 2013)。因此, 利用高通量测序技术结合生物信
息学分析及生化实验等方法可高效快速地鉴定和预
测miRNA。基于此, 本研究构建了不同低温下冬小麦
(Triticum aestivum)的小分子RNA文库 , 并利用Hi-
Seq高通量测序技术对两者进行测序及相关生物信息
学分析, 以期为揭示冬小麦抗逆过程中小分子RNA
的调控机制奠定基础。
1 材料与方法
1.1 实验材料及其总RNA的提取
冬小麦(Triticum aestivum L.)东农冬麦1号是我国首
例可在黑龙江省高寒地区种植的冬小麦品种, 其耐受
的最低温度为–35– –30°C, 在雨雪充足的条件下其
返青率大于85%(苍晶等, 2011)。
2010年9月10日于东北农业大学香坊农场(126°
22′E–126°50′E, 45°34′N–45°46′N)大田种植冬小麦。
当天气自然降温至5°C和–10°C并持续5天后, 取小麦
分蘖节, 用去离子水冲洗, 液氮冷冻后于–80°C冰箱
中保存备用。
取50–100 mg分蘖节于液氮中研磨, 加入Trizol
溶液1 mL, 按试剂盒使用说明书所述方法提取总
RNA。将总RNA溶于DEPC水中, 用DNase I(Ta
KaRa, 大连)37°C处理30分钟, 抽提纯化RNA。用
1.2%琼脂糖凝胶电泳检测总RNA的完整性。用
Agilent2100检测总RNA的浓度、片段大小和RNA的
完整性。
1.2 HiSeq高通量测序及小RNA片段长度的统计
分析
将小分子片段分别进行5和3接头连接后, 进行RT-
PCR。之后, 交由华大基因公司利用Hiseq 2000进行
高通量测序。将得到的序列进行去接头、去低质量阅
读框和去污染等处理, 得到干净序列。对序列进行长
度统计分析以保证序列的纯净度。
1.3 序列比对
先将2个数据库序列进行比对, 统计2个数据库之间
的特有序列及公共序列的种类和数目。再采用NC-
BI(http://www.ncbi.nlm.nih.gov/)在线序列比对工具
BLASTn对2组数据库进行GenBank和Rfam(10.1)比
对, 按照rRNAetc>known miRNA>repeat>exon>int-
ron的优先级顺序将小分子RNA遍历, 把没有比上任
何注释信息的小分子RNA用unann表示。由于rRNA-
etc是由NCBI GenBank和Rfam两个数据库比对所得,
我们规定这2个数据库间的优先级为Gen-Bank>
Rfam3。分类注释结果中的rRNA总量可以作为一个样
品的质控标准: 植物样品中的rRNA总量所占比例应
低于60%。
1.4 生物信息学分析
根据BLAST软件启发式比对算法, 通过与miRBase
(17.0)上小麦已知的miRNA前体完全匹配或与mi-
RNA成熟体有16 nt互补序列为原则进行比对, 来注
释已知miRNA。再根据miRNA与靶基因的匹配原则,
利用psRNATarget(http://plantgrn.noble.org/psRNA-
Target/)进行靶基因预测。miRNA与靶基因的匹配原
则有如下5个。(1) miRNA与靶基因间的错配碱基数应
小于4个(G-U配对认为0.5个错配); (2) 在miRNA/靶
基因复合体中相邻位点的错配数应小于2个; (3) 在
miRNA/靶基因复合体中, 从miRNA的5端起第2–12
个位点不得有相邻位点发生错配, 且第10和11个位
点不存在碱基错配; (4) 在miRNA/靶基因复合体中,
从miRNA的5端起第1–12个位点错配碱基数应小于
10 植物学报 49(1) 2014
2.5个; (5) miRNA/靶基因复合体的最低自由能(mini-
mum free energy, MFE)应不小于该miRNA与其最佳
互补体结合时MFE的75%。
1.5 数据处理及分析
对高通量测序得到的已知miRNA进行统计, 判断5°C
和–10°C两文库间(treatment和control)的表达量是否
存在显著性差异, 具体步骤如下:
首先将5°C和–10°C两文库中检测到的已知mi-
RNA归一化到同一数量级, 计算公式如下:
归一化的表达量=(miRNA表达量 /样品小分子
RNA总表达量)×106
将归一化后的结果进行倍数变化值(fold change)
及P值(P-value)统计。
Fold change=log2(treatment/control)
P-value的计算公式如下:

式中, x表示5°C文库中miRNA归一化后的表达量; y
表示–10°C文库中miRNA归一化后的表达量。
归一化后, 如果2个样品的某个miRNA基因的表
达量为0, 则修改为0.01; 如果2个样品的某个miRNA
基因的表达量小于1(表达量过低), 则不参与差异表
达分析。
2 结果与讨论
2.1 小RNA长度的统计分析
对利用HiSeq深度测序所得样品的原始数据进行纯化
处理, 得到干净的序列信息(表1), 并对其进行长度分
布统计(图1)。从表1可以看出 , 深度测序在5°C和
–10°C下分别挖掘出10 024 183和9 448 982条干净
序列, 其长度基本呈正态分布。在两温度下, 24 nt的
小RNA均为主要类型 , 所占比例分别为39.32%和
25.79%。Zhang等(2009)的研究表明, miRNA的序列
长度多集中于20–24 nt。由图1可知, 两温度下20–24
nt的序列均占总序列的绝大部分, 其中5°C和–10°C
下的 20–24 nt的序列所占比例分别为 79.37%和
68.14%。表明深度测序结果中miRNA为主要片段,
这为分析保守候选miRNA提供了有力的依据。




图1 5°C和–10°C下冬小麦小分子RNA长度分布

Figure 1 The length distribution of small RNA of winter wheat at 5°C and –10°C

黄儒等: 冬小麦小RNA高通量测序及生物信息学分析 11
表1 5°C和–10°C下冬小麦测序处理及片段长度统计分析
Table 1 The sequencing treatment and the fragment length statistical analysis of winter wheat at 5°C and –10°C
Number Percent (%) Fragment
5°C –10°C 5°C –10°C
total_reads 10 422 545 10 085 102 – –
high_quality 10 368 873 10 041 598 100 100
3adapter_null 24 123 18 542 0.23 0.18
insert_null 10 246 11 434 0.10 0.11
5adapter_contaminants 17 720 13 077 0.17 0.13
smaller_than_18nt 291 701 549 029 2.81 5.47
polyA 900 534 0.01 0.01
clean_reads 10 024 183 9 448 982 96.68 94.10



表2 5°C (样品1)和–10°C (样品2)下公共及特有序列统计
Table 2 Common and unique sequences statistics at 5°C (sample 1) and –10°C (sample 2)
Type Unique sRNAs Percent (%) Total sRNAs Percent (%)
Total 5 985 025 100.00 19 473 165 100.00
Sample 1 and Sample 2 571 639 9.55 13 521 761 69.44
Sample 1 specific 2 066 162 34.52 2 229 955 11.45
Sample 2 specific 3 347 224 55.93 3 721 449 19.11


2.2 两数据库公共序列和特有序列的统计分析
根据5°C和–10°C两数据库中的统计分析, 得出2样品
小分子RNA种类数总和为5 985 025; 5°C和–10°C两
样品小分子RNA总数为19 473 165。 2样品共有的小
分子RNA种类数为571 639, 其所占百分比为9.55%;
2样品共有的小分子RNA总数为13 521 761, 其所占
百分比为69.44%。5°C样品中特有的小分子RNA种类
数为2 066 162, 其所占百分比为34.52%; 5°C样品中
特有的小分子RNA总数为2 229 955, 其所占百分比
为11.45%。–10°C样品中特有的小分子RNA种类数为
3 347 224, 其所占百分比为55.93%; –10°C样品中
特有的小分子RNA总数为3 721 449, 其所占百分比
为19.11%(表2)。根据统计分析可知在两温度下均出
现大量特异表达的小分子RNA序列, 且其与温度改
变有一定的对应关系。
2.3 重复序列比对
研究表明, 部分小分子RNA来源于高度重复区域和
转座子区域。将测序得到的小分子RNA与重复序列进
行比对, 并对图2进行分析, 发现2个温度下小分子
RNA主要存在于rRNA、LTR/Gypsy、LTR/Copia和
DNA/En-Spm等重复区域。其中与rRNA正链比对后
匹配上的数量和比例最大, 说明重复序列主要集中在
rRNA的正链上。
2.4 小RNA的分类注释
通过在GenBank和Rfam(10.1)中进行比对, 以注释
并尽可能发现及去除其中的rRNA、scRNA、snoRNA、
snRNA和tRNA。为了使每一条小分子RNA序列都有
唯一的注释信息 , 将比对后的结果根据 rRNAetc>
known miRNA>repeat>exon>intron优先级将小分子
RNA进行遍历, 由于rRNAetc是由NCBI GenBank和
Rfam两个数据库比对所得, 我们规定这两个数据库
间的优先级为GenBank>Rfam3。分类注释结果中的
rRNA总量可以作为一个样品的质控标准: 植物样品
中的rRNA总量所占比例应低于60%(表3)。从表3可以
看出, 对应于5°C和–10°C得到的10 024 183和 9
448 982条序列, 分别代表了3 918 863和2 637 801
种类型的小分子RNA。5°C下筛选出的miRNA在种类
和数量上均多于–10°C。同时还发现, –10°C文库中核
糖体RNA(rRNA)的种类和数量略高于5°C文库。此外,
tRNA在–10°C文库中所占比例较高 , 达到25.96%;
而在5°C文库中仅占11.95%。
12 植物学报 49(1) 2014


图2 5°C(A)和–10°C(B)胁迫下小RNA重复序列比对

Figure 2 The repeat sequence alignment of small RNAs at 5°C (A) and –10°C (B)



表3 5°C和–10°C文库中小分子RNA的类型和数量
Table 3 The type and number of small RNAs at 5°C and –10°C
Unique sRNA Percent (%) Total sRNA Percent (%) Type
5°C –10°C 5°C –10°C 5°C –10°C 5°C –10°C
Total 3 918 863 2 637 801 100 100 10 024 183 9 448 982 100 100
miRNA 37 207 27 915 0.95 1.06 1 299 843 1 167 152 12.97 12.35
rRNA 80 627 86 333 2.06 3.27 955 060 1 082 336 9.53 11.45
repeat 68 579 50 484 1.75 1.91 184 717 134 135 1.84 1.42
snRNA 2 318 2 634 0.06 0.10 6 009 8 483 0.06 0.09
snoRNA 999 1 388 0.03 0.05 2 128 4 262 0.02 0.05
tRNA 13 784 13 599 0.35 0.52 1 197 723 2 453 068 11.95 25.96
unann 3 715 349 2 455 448 94.81 93.09 6 378 703 4 599 546 63.63 48.68


黄儒等: 冬小麦小RNA高通量测序及生物信息学分析 13

图3 小麦中已知miRNA的表达丰度(A)及不同表达水平(B)
** 5°C和–10°C文库中归一化后miRNA间差异达极显著水平(P<0.01)。

Figure 3 The expression abundance (A) and differential expression level (B) of the known candidate miRNA families in wheat
** Normalized miRNA between 5°C and –10°C reached to significant differences in the level of 0.01.


2.5 两文库中的保守候选miRNA分析
目前miRBase上共有44个小麦已知miRNA, 它们在
进化上与拟南芥(Arabidopsis thaliana)、玉米(Zea
mays)和水稻(Oryza sativa)等植物一样均存在保守
性。研究结果表明, 在5°C文库中共发现35条已知
miRNA, 分别属于30个miRNA家族; 在–10°C文库中
共发现29条已知miRNA, 分别属于24个miRNA家
族。其中miR1121、miR1123、miR1124、miR1127、
miR1129、miR1133、miR1134、miR1433和miR5085
在两文库中均未检测到。高通量测序不仅可检测出
miRNA的种类, 而且可检测到不同miRNA的表达丰
度(Hoen et al., 2008; Qiu et al., 2009)。两文库中部
分miRNA的表达丰度有显著差异(图3A)。比较5°C和
–10°C两文库可知, miR395、miR398和miR171为上
调表达, miR444、miR1138、miR1139和miR1117则
为下调表达(图3B)。miR156、miR159、miR167和
miR164在两文库中均具较高的表达丰度。miR398在
–10°C文库中的表达丰度是5°C文库中的13倍。其它
如miR156、miR164及miR1117在5°C文库中比在
–10°C文库中有较高的表达水平。
2.6 靶基因分析
利用psRNATarget靶基因在线预测软件对两文库中
发现的保守候选miRNA进行靶基因预测(表4)。以5°C
14 植物学报 49(1) 2014
表4 小麦中已知miRNA靶基因的预测结果
Table 4 Predicted results of known miRNA target genes in wheat
miRNA Target description Function Target accession Species
SBP-domain protein 6 Transcription factor TC459574 Zea mays
SBP domain containing protein Transcription factor TC476734 Gossypium hirsutum
SPL16 Transcription factor AL810223 Oryza sativa
SPL2 Transcription factor CK196549 O. sativa
SPL3 Transcription factor TC384445 O. sativa
Tae-miR156
SPL11 Transcription factor TC412204 O. sativa
TLD family protein Signaling CA671152 O. sativa
NB-ARC domain containing protein Stress response TC388353 O. sativa
Transcription factor Myb3 Transcription factor TC368630 Triticum aestivum
Tae-miR159
Ubiquitin carboxyl-terminal hydrolase Metabolism TC393503 O. sativa
Tae-miR160 Auxin response factor 22
Auxin response factor 8
Signaling
Signaling
TC425315
TC416747
O. sativa
O. sativa
NAC transcription factor
NAC domain protein NAC1
Transcription factor
Transcription factor
TC410195
TC371535
Hordeum vulgare
Phaseolus vulgaris
Tae-miR164
Mitogen-activated protein kinase homolog 1 Transcription factor TC370694 Festuca arundinacea
Tae-miR167 Histone H3.2 TC421169 T. aestivum
Cysteine proteinase-like protein Metabolism TC448847 Arabidopsis thaliana Tae-miR171
Scl1 protein Transcription factor TC490115 O. sativa
Tae-miR319 Histone H2B.2
Transcription factor Myb3
Transcription factor
Transcription factor
CK212140
TC368630
T. aestivum
T. aestivum
Tae-miR395 Sucrose transporter
ATP sulfurylase
Ribosomal protein L19
Transcription factor
Metabolism
Development
CK193704
TC402080
TC370044
Solanum lycopersicum
Z. mays
T. aestivum
Superoxide dismutase [CuZn] Stress response CA663864 Manihot esculenta Tae-miR398
Superoxide dismutase [CuZn] 4A Stress response CA613247 Z. mays
Tae-miR408 ORF1 protein TC395266 H. vulgare
MIKC-type MADS-box transcription
factor WM32B
Transcription factor TC368997 T. aestivum
MIKC-type MADS-box transcription
factor WM30
Transcription factor TC370370 T. aestivum
Tae-miR444
GRAS family transcription factor con-
taining protein
Transcription factor CA624957 O. sativa
Calmodulin TaCaM2-1 Signaling TC370181 T. aestivum
Glutathione S-transferase 2 Stress response TC418995 T. aestivum
Tae-miR1118
Sugar transporter Transcription factor AL821011 H. vulgare
Tae-miR1119 Methylenetetrahydrofolate reductase Metabolism CA610772 Triticum monococcum
Tae-miR1120 Glyceraldehyde-3-phosphate dehydro-
genase, cytosolic
Metabolism TC402657 H. vulgare
Tae-miR1122 Fusarium resistance protein I2C-5-like CD883901 O. sativa
Tae-miR1125 ABC transporter, binding protein Stress response DN829029 Sulfolobus solfataricus
F-box protein family-like Transcription factor CD889246 O. sativa
NADPH-cytochrome P450 reductase Metabolism TC407053 T. aestivum
Tae-miR1126
Hydrolase, alpha/beta fold family protein Metabolism BE418546 A. thaliana
Tae-miR1128 Calreticulin-like protein TC439689 T. aestivum
Tae-miR1130 Cinnamyl-alcohol dehydrogenase-like
protein (CAD)
Metabolism TC381627 A. thaliana
Tae-miR1131 Glutathione S-transferase Metabolism TC378825 A. thaliana
ABC transporter-like protein Stress response TC358614 A. thaliana


黄儒等: 冬小麦小RNA高通量测序及生物信息学分析 15
表4 (续) Table 4 (continued)
miRNA Target description Function Target accession Species
Tae-miR1135 GAD1 Metabolism TC418338 H. vulgare
Expansin-like A1 precursor TC418521 O. sativa Tae-miR1137
HGA1 CK197784 H. vulgare
Ferritin 3 Metabolism TC427420 T. aestivum Tae-miR1138
Glyceraldehyde-3-phosphate dehydro-
genase, cytosolic
Metabolism TC450386 H. vulgare
Tae-miR1139 Transcription factor Myb1 Transcription factor TC397585 T. aestivum
Cytosolic aldehyde dehydrogenase RF2D Metabolism TC389479 Z. mays
Pyruvate dehydrogenase kinase isoform 2 Metabolism CD918033 Z. mays
Tae-miR5084
Serine/threonine protein kinase Stress response CV765794 H. vulgare
Tae-miR5086 Swi2/Snf2-related protein D-DM1 Transcription factor TC360209 A. thaliana



文库中35条保守候选miRNA为例, 共预测到53个靶
基因。通过功能分析, 发现53个靶基因中除Histone
H3.2、ORF1 protein、Fusarium resistance protein
I2C-5-like、Calreticulin-like protein、Expansin-like
A1 precursor和HGA1外, 其余均能推测其功能。这些
靶基因属于不同基因家族, 主要参与编码转录调节、
新陈代谢、胁迫响应和信号转导等相关蛋白。
本研究共发现11个miRNA家族的21条靶基因编
码的转录因子, 占总数的39.6%。其中小麦miR156有
4个靶基因编码Squamosa启动子结合蛋白家族
(SPL)成员, 这类转录因子是植物生长周期转变和诱
导开花及果实发育等过程中重要的调控因子(Wang
et al., 2009; Wu et al., 2009)。小麦miR164的靶基因
编码NAC转录因子, 且该转录因子受miR164负调控
来调节植物生长素信号转导通路 (Mallory et al.,
2004; Raman et al., 2008)。Berger等(2009)的研究
表明, 过表达miR164和编码NAC结构域转录因子的
GOB基因突变体均可导致番茄(Lycopersicon escu-
lintum)的次级小叶不能正常发育, 小叶边缘变光滑。
小麦miR1126的靶基因编码类F-box蛋白, 其通过参
与SCF复合体的形成介导泛素化蛋白底物的特异性
识别, 并在植物多种生物学进程及逆境胁迫应答中发
挥重要作用(秘彩莉等, 2006)。本研究还预测到小麦
miR159、miR319和miR1139的靶基因编码MYB家族
转录因子, miR444的靶基因编码MADS-box家族转录
因子, 这些转录因子在植物生长发育和逆境胁迫应答
过程中均具重要作用。
2.7 讨论
通过对5°C和–10°C两文库中小分子RNA的长度分布
进行统计分析, 发现无论是5°C文库还是–10°C文库,
24 nt的小分子RNA均为主要类型, 这与对番茄的深
度测序结果不同(Moxon et al., 2008), 但与对拟南芥
的研究结果相同(Xie et al., 2005; Rajagopalan et al.,
2006)。小分子RNA长度的差异可能与物种及加工其生
成的酶有关, 如经DCL1和DCL2加工后小分子RNA的
长度分别为21 nt和24 nt(Zhao et al., 2007)。Lippm-
an和Martienssen(2004)的研究表明 , 这些小分子
RNA也有一定的作用, 它们可能通过组蛋白甲基化
和染色质沉默等过程间接调控植物基因的表达。关于
小分子RNA的类型及含量存在物种和组织差异有待
进一步研究。
对两温度下小麦分蘖节高通量测序分别得到了
10 024 183和9 448 982条纯净序列(表1), 代表
3 918 863和2 637 801条特异序列。将纯净序列与已
知所有植物基因进行对比分类注释(表3), 其中种类
和数量最多的为rRNA与miRNA, 与近期小麦基因组
测序中tRNA数量最多、 rRNA次之的结果相比, 稍有
差异(Ling et al., 2013), 说明小分子RNA在植物进化
中具有一定的保守性和品种特异性。通过与miRBase
上小麦已知miRNA比对分析, 发现5°C和–10°C两文
库中分别有35条和29条已知miRNA, 而在六倍体小
麦A染色体祖先乌拉尔图小麦(Triticum urartu)和D染
色体祖先粗山羊草(Aegilops tauschii)基因组测序中

16 植物学报 49(1) 2014
分别发现了32条和41条(Jia et al., 2013; Ling et al.,
2013)。我们从5°C文库中检测到25条已知miRNA与
乌拉尔图小麦的测序结果相一致, 22条与粗山羊草测
序结果相符, 说明miRNA在物种进化过程中的保守
性较高, 同时也证明了乌拉尔图小麦与六倍体小麦相
似度更高(Ling et al., 2013)。目前, 对小麦miRNA的
功能研究相对较少, 但根据其在拟南芥和水稻上的保
守性, 结合本研究中的丰度及靶基因分析, 可推测部
分miRNA在小麦中的功能(陈洁等, 2010)。
本研究中, 将5°C和–10°C两文库中保守miRNA
归一化到同一数量级后, 对倍数变化值及P值进行统
计分析, 结果表明9个miRNA之间的差异达到了极显
著水平(P<0.01)(图3A), 其中miR398、miR1119、
miR1130、miR1131、miR1132和miR5086的倍数变
化值达到3倍以上, 而miR399的倍数变化值达到4倍
以上。两文库中部分保守性较高的miRNA家族在5°C
和–10°C文库中均具较高的表达丰度, 如miR156、
miR159、miR160、miR164、miR167和miR171家族,
这与Glazov等 (2008)的研究结果相一致。其中 ,
miR159和miR167的表达丰度均达到10 000以上 ,
miR156的表达丰度达到100 000以上。miR156是调
控植物生长周期转变的关键因子(Wang et al., 2009;
Wu et al., 2009), 过表达miR156可以延缓植物从营
养生长到生殖生长的转变(Schwab et al., 2005), 表
明低温驯化过程中东农冬麦1号生长周期的转变与抗
寒机制的形成有一定的关系(王晓楠等, 2009)。Mi-
R160和miR164分别通过靶定生长素响应因子(ARF)
和NAC1转录激活子来影响植物激素的信号转导途径
(Guo et al., 2005), 进而在器官形成和胁迫应答中发
挥重要作用(Palme et al.,1991; Woodward and Bar-
tel, 2005)。此外, 有研究发现miR159和miR167也参
与了植物激素的信号转导(Zhang et al., 2005)。
与表达丰度较高的保守miRNA家族相比, 有些
保守miRNA家族的表达丰度较低, 但在5°C和–10°C
文库中的差异极显著(图3), 如miR319、miR395和
miR398。在氧胁迫下, miR398通过靶定Cu-Zn超氧化
物歧化酶(Cu/Zn superoxide dismutase, CSD)基因
来提高拟南芥的抗性(Sunkar et al., 2005), 这与本研
究的预测结果相同。另外, miR398在–10°C文库中的
表达量是5°C文库中的9倍, 表明在低温驯化过程中,
东农冬麦1号通过积累大量的miR398来正调控CSD
基因的表达以清除过多的O2−, 从而实现对逆境胁迫
的应答(Bowler et al., 1991; Sunkar et al., 2006)。
miR319和miR395被证实分别参与植物低温和低磷
胁迫的适应性反应过程(Jones-Rhoades and Bartel,
2004; Sunkar and Zhu, 2004), 二者在5°C和–10°C
文库中均存在差异表达, 说明两者参与了低温胁迫应
答的调节过程。本研究中, 除以上部分保守miRNA家
族外, 还检测到许多研究较少的miRNA家族, 如mi-
R1118、miR1119、miR1120和miR5084等,其中部分
miRNA靶基因在小麦基因组中已被预测(Ling et al.,
2013), 如miR408、miR1120、miR1122和miR1128,
但其具体功能有待进一步的实验验证。
综上所述, 本研究利用高通量测序技术对5°C和
–10°C两温度下冬小麦进行测序, 发现了大量差异表
达的保守miRNA, 通过丰度分析在一定程度上阐释
了这些miRNA在不同温度下的表达情况。以上结果为
今后研究小麦在胁迫过程中miRNA的调控作用, 特
别是低温胁迫下部分保守miRNA的作用奠定了基础。
参考文献
苍晶, 于晶, 崔红, 王军虹, 张达, 刘丽杰, 李卓夫 (2011). 寒
地冬小麦对低温逆境的生理适应 . 核农学报 25, 1017–
1022.
陈洁, 林海建, 潘光堂, 张志明, 张彪, 沈亚欧, 覃成, 张谦,
赵茂俊 (2010). 利用深度测序技术检测玉米根系和叶片中
已知的 microRNAs. 遗传 32, 1175–1186.
董淼, 黄越, 陈文铎, 徐涛, 郎秋蕾 (2013). 降解组测序技术
在植物miRNA研究中的应用. 植物学报 48, 344–353.
秘彩莉, 刘旭, 张学勇 (2006). F-box蛋白质在植物生长发育中
的功能. 遗传 28, 1337–1342.
王晓楠, 付连双, 李卓夫, 孙艳丽, 王玉波, 刘灿, 王金伟, 陈
禹兴 (2009). 低温驯化及封冻后不同抗寒性小麦品种的形
态建成及生理基础分析. 作物学报 35, 1313–1319.
Axtell MJ, Snyder JA, Bartel DP (2007). Common functions
for diverse small RNAs of land plants. Plant Cell 19, 1750–
1769.
Berger Y, Harpaz-Saad S, Brand A, Melnik H, Sirding N,
Alvarez JP, Zinder M, Samach A, Eshed Y, Oril N (2009).
The NAC-domain transcription factor GOBLET specifies
leaflet boundaries in compound tomato leaves. Deve-
lopment 136, 823–832.
Bowler C, Slooten L, Vandenbranden S, de Rycke R,
Botterman J, Sybesma C, Montagu MV, Inzé D (1991).
Manganese superoxide dismutase can reduce cellular
黄儒等: 冬小麦小RNA高通量测序及生物信息学分析 17
damage mediated by oxygen radicals in transgenic plants.
EMBO J 10, 1723–1732.
Chen PY, Manninga H, Slanchev K, Chien M, Russo JJ, Ju
J, Sheridan R, John B, Marks DS, Gaidatzis D, Sander
C, Zavolan M, Tuschl T (2005). The developmental
miRNA profiles of zebrafish as determined by small RNA
cloning. Genes Dev 19, 1288–1293.
Chiou TJ, Aung K, Lin SI, Wu CC, Chiang SF, Su CL
(2006). Regulation of phosphate homeostasis by mi-
croRNA in Arabidopsis. Plant Cell 18, 412–421.
Fowler S, Thomashow MF (2002). Arabidopsis transcrip-
tome profiling indicates that multiple regulatory pathways
are activated during cold acclimation in addition to the CBF
cold response pathway. Plant Cell 14, 1675–1690.
Glazov EA, Cottee PA, Barris WC, Moore RJ, Dalrymple
BP, Tizard ML (2008). A microRNA catalog of the deve-
loping chicken embryo identified by a deep sequencing
approach. Genome Res 18, 957–964.
Griffiths-Jones S, Saini HK, van Dongen S, Enright AJ
(2008). miRBase: tools for microRNA genomics. Nucleic
Acids Res 36, D154–D158.
Guo HS, Xie Q, Fei JF, Chua NH (2005). MicroRNA directs
mRNA cleavage of the transcription factor NAC1 to down-
regulate auxin signals for Arabidopsis lateral root devel-
opment. Plant Cell 17, 1376–1386.
Hoen PA, Ariyurek Y, Thygesen HH, Vreugdenhil E,
Vossen RAM, Menezes RX, Boer JM, Ommen GJ,
Dunnen JT (2008). Deep sequencing-based expression
analysis shows major advances in robustness, resolution
and inter-lab portability over five microarray platforms. Nu-
cleic Acids Res 36, e141.
Jia JZ, Zhao SC, Kong XY, Li YR, Zhao GY, He WM, Ap-
pels R, Pfeifer M, Tao Y, Zhang XY, Jing RL, Zhang C,
Ma TZ, Gao LF, Gao C, Spannagl M, Mayer KFX, Li D,
Pan SK, Zheng FY, Hu Q, Xia XC, Li JW, Liang QS,
Chen J, Wicker T, Gou CY, Kuang HH, He GY, Luo YD,
Keller B, Xia QJ, Lu P, Wang JY, Zou HF, Zhang RZ, Xu
JY, Gao JL, Middleton C, Quan ZW, Liu GM, Wang J,
International Wheat Genome Sequencing Consortium,
Yang HM, Liu X, He ZH, Mao L, Wang J (2013). Aegilops
tauschii draft genome sequence reveals a gene repertoire
for wheat adaptation. Nature 496, 91–95.
Jones-Rhoades MW, Bartel DP (2004). Computational
identification of plant microRNAs and their targets, includ-
ing a stress-induced miRNA. Mol Cell 14, 787–799.
Kawaguchi R, Bailey SJ (2002). Regulation of translational
initiation in plants. Curr Opin Plant Biol 5, 460–465.
Kozomara A, Griffiths-Jones S (2011). miRBase: intergrat-
ing microRNA annotation and deep-sequencing date. Nu-
cleic Acids Res 39, D152–D157.
Lee RC, L Feinbaum R, Ambros V (1993). The C. elegans
heterochronic gene lin-4 encodes small RNAs with an-
tisense complementarity to lin-14. Cell 75, 843–854.
Ling HQ, Zhao SC, Liu DC, Wang JY, Sun H, Zhang C, Fan
HJ, Li D, Dong LL, Tao Y, Gao C, Wu HL, Li YW, Cui Y,
Guo XS, Zheng SS, Wang B, Yu K, Liang QS, Yang WL,
Lou XY, Chen J, Feng MJ, Jian JB, Zhang XF, Luo GB,
Jiang Y, Liu JJ, Wang ZB, Sha YH, Zhang BR, Wu HJ,
Tang DZ, Shen QH, Xue PY, Zou SH, Wang XJ, Liu X,
Wang FM, Yang YP, An XL, Dong ZY, Zhang KP, Zhang
XQ, Luo MC, Dvorak J, Tong YP, Wang J, Yang HM, Li
ZS, Wang DW, Zhang AM, Wang J (2013). Draft genome
of the wheat A-genome progenitor Triticum urartu. Nature
496, 87–90.
Lippman Z, Martienssen R (2004). The role of RNA inter-
ference in heterochromatic silencing. Nature 431, 364–
370.
Mallory AC, Dugas DV, Bartel DP, Bartel B (2004). Mi-
croRNA regulation of NAC-domain targets is required for
proper formation and separation of adjacent embryonic,
vegetative, and floral organs. Curr Biol 14, 1035–1046.
Moxon S, Jing RC, Szittya G, Schwach F, Pilcher RLR,
Moulton V, Dalmay T (2008). Deep sequencing of tomato
short RNAs identifies microRNAs targeting genes involved
in fruit ripening. Genome Res 18, 1602–1609.
Navarro L, Dunoyer P, Jay F, Arnold B, Dharmasiri N,
Estelle M, Voinnet O, Jones JDG (2006). A plant miRNA
contributes to antibacterial resistance by repressing auxin
signaling. Science 312, 436–439.
Palme K, Hesse T, Moore I, Campos N, Feldwisch J,
Garbers C, Hesse F, Schell J (1991). Hormonal modula-
tion of plant growth: the role of auxin perception. Mech Dev
33, 97–106.
Qiu DY, Pan XP, Wilson IW, Li FL, Liu M, Teng WJ, Zhang
BH (2009). High throughput sequencing technology re-
veals that the taxoid elicitor methyl jasmonate regulates
microRNA expression in Chinese yew (Taxus chinensis).
Gene 436, 37–44.
Rajagopalan R, Vaucheret H, Trejo J, Bartel DP (2006). A
diverse and evolutionarily fluid set of microRNAs in Arabi-
dopsis thaliana. Gene Dev 20, 3407–3425.
Raman S, Greb T, Peaucelle A, Blein T, Laufs P, Theres K
(2008). Interplay of miR164, CUP-SHAPED COTYLEDON
genes and LATERAL SUPPRESSOR controls axillary mer-
istem formation in Arabidopsis thaliana. Plant J 55, 65–76.
Schwab R, Palatnik JF, Riester M, Schommer C, Schmid
M, Weigel D (2005). Specific effects of MicroRNAs on the
plant transcriptome. Dev Cell 8, 517–527.
Sunkar R, Girke T, Zhu JK (2005). Identification and char-
acterization of endogenous small interfering RNAs from
rice. Nucleic Acids Res 33, 4443–4454.
Sunkar R, Kapoor A, Zhu JK (2006). Posttranscriptional
18 植物学报 49(1) 2014
induction of two Cu/Zn superoxide dismutase genes in
Arabidopsis is mediated by downregulation of miR398 and
important for oxidative stress tolerance. Plant Cell 18,
2051–2065.
Sunkar R, Zhu JK (2004). Novel and stress-regulated mi-
croRNAs and other small RNAs from Arabidopsis. Plant
Cell 16, 2001–2019.
Tang GL, Tang XQ, Mendu V, Tang XH, Jia XY, Chen QJ,
He LH (2008). The art of microRNA: various strategies
leading to gene silencing via an ancient pathway. Biochim
Biophys Acta 1779, 655–662.
Wang JW, Czech B, Weigel D (2009). miR156-regulated
SPL transcription factors define an endogenous flowering
pathway in Arabidopsis thaliana. Cell 138, 738–749.
Woodward AW, Bartel B (2005). Auxin: regulation, action,
and interaction. Ann Bot 95, 707–735.
Wu G, Park MY, Conway SR, Wang JW, Weigel D, Poethig
RS (2009). The sequential action of miR156 and miR172
regulates developmental timing in Arabidopsis. Cell 138,
750–759.
Xie ZX, Allen E, Fahlgren N, Calamar A, Givanand SA,
Carrington JC (2005). Expression of Arabidopsis miRNA
genes. Plant Physiol 138, 2145–2154.
Zhang BH, Pan XH, Wang QL, Cobb GP, Anderson TA
(2005). Identification and characterization of new plant
microRNAs using EST analysis. Cell Res 15, 336–360.
Zhang BH, Pan XP, Cannon CH, Cobb GP, Anderson TA
(2006). Conservation and divergence of plant microRNA
genes. Plant J 46, 243–259.
Zhang BH, Stellwag EJ, Pan XH (2009). Large-scale ge-
nome analysis reveals unique features of microRNAs.
Gene 443, 100–109.
Zhao T, Li GL, Mi SJ, Li S, Hannon GJ, Wang XJ, Qi YJ
(2007). A complex system of small RNAs in the unicellular
green alga Chlamydomonas reinhardtii. Genes Dev 21,
1190–1203.
Zhu JK (2002). Salt and drought stress signal transduction
in plants. Annu Rev Plant Biol 53, 247–273.
Solexa Sequencing and Bioinformatics Analysis of Small RNA in
Winter Wheat
Ru Huang1, Jing Cang1*, Jing Yu1, Baowei Lu2, Lijie Liu 1, 3, Jianfei Wang1, Renming Guo1, Chen Xu1
1College of Life Sciences, Northeast Agricultural University, Harbin 150030, China; 2Heilongjiang Vocational Institute of
Ecological Engineering, Harbin 150025, China; 3College of Life Sciences and Agriculture and Forestry,
Qiqihar University, Qiqihar 161006, China
Abstract Dongnongdongmai 1 is the first cultivated winter wheat variety that can survive in Heilongjiang province. The
cold tolerance of the tillering nodes directly affects the ability of overwintering. MicroRNAs (miRNAs) are a class of small
non-coding endogenous RNAs with a critical role in development and environmental responses in plants. We analyzed
the small RNAs of tillering nodes of Dongnongdongmai 1 under 5°C and –10°C. Under 5°C condition, we detected 2 229
955 unique sequences and 35 known miRNAs, which can be grouped into 30 miRNA families, with abundance ranging
from 1 to 173 810. Under –10°C condition, we detected 3 721 449 unique sequences and 29 known miRNAs, which can be
grouped into 24 miRNA families, with abundance ranging from 1 to 105 868. Target gene prediction revealed 53 putative
target genes from the 30 miRNAs at 5°C, some of which were involved in transcription regulation, metabolism, stress re-
sponse and signal transduction. Both types and abundance of known miRNAs differed in Dongnongdongmai 1 grown at 5°C
and –10°C.
Key words winter wheat, Dongnongdongmai 1, microRNA, high throughput sequencing, bioinformatics
Huang R, Cang J, Yu J, Lu BW, Liu LJ, Wang JF, Guo RM, Xu C (2014). Solexa sequencing and bioinformatics
analysis of small RNA in winter wheat. Chin Bull Bot 49, 8–18.
———————————————
* Author for correspondence. E-mail: cangjing2003@163.com
(责任编辑: 孙冬花)