全 文 :作物学报 ACTA AGRONOMICA SINICA 2010, 36(8): 13241335 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn
本研究由国家自然科学基金项目(30900901)和教育部高等学校博士学科点专项科研基金项目(20095103120002)资助。
* 通讯作者(Corresponding author): 潘光堂, E-mail: pangt1956@yahoo.com.cn; Tel: 0835-2882714
第一作者联系方式: E-mail: zhangzm1979@yahoo.com.cn
Received(收稿日期): 2009-12-30; Accepted(接受日期): 2010-04-16.
DOI: 10.3724/SP.J.1006.2010.01324
用生物信息学挖掘玉米中的 microRNAs及其靶基因
张志明 宋 锐 彭 华 罗 茂 沈亚欧 刘 丽 赵茂俊 潘光堂*
四川农业大学玉米研究所, 四川雅安 625014
摘 要: microRNA (miRNA)是一类内源性的、19~24碱基长度的小分子非编码 RNA, 通过碱基互补调控靶基因的表
达, 在多细胞生物的基因表达调控过程中扮演着十分重要的角色。植物中的 miRNAs具有高度的保守性, 这为通过同
源比对发现保守的 miRNAs 提供了思路和途径。本研究通过对拟南芥、水稻等植物已知的 miRNAs 与玉米 EST 和
GSS 数据库的比对 , 并设置一系列严格的筛选标准 , 共筛选到 23 条新的玉米 miRNAs; 利用 WMD 3 在线植物
miRNAs 靶基因预测软件, 对新发现的玉米 miRNAs 进行靶基因预测, 总共预测到 89 个靶基因, 进一步功能分析发
现, 这些靶基因参与玉米的生长发育、信号转导、转录调节、新陈代谢及逆境胁迫响应等调控过程。
关键词: microRNA (miRNA); 生物信息学; 预测; 靶基因; 玉米
Bioinformatic Prediction of microRNAs and Their Target Genes in Maize
ZHANG Zhi-Ming, SONG Rui, PENG Hua, LUO Mao, SHEN Ya-Ou, LIU Li, ZHAO Mao-Jun, and PAN
Guang-Tang*
Maize Research Institute, Sichuan Agricultural University, Ya’an 625014, China
Abstract: microRNAs (miRNAs) are an extensive class of endogenous, non-coding, short (19–24 nt) RNA molecules directly
involved in regulating gene expression at the post-transcriptional level and played an important role in gene expression regulation.
Previous reports have noted that plant miRNAs are highly conserved, which provides the foundation for identification of miRNAs
in plant species through homology alignment. With the method of bioinformatic computation, all previously known miRNAs in
Arabidopsis, rice, and other plant species were blasted against maize EST (expressed sequence tags) and GSS (genomic survey
sequence) sequences to select novel miRNAs in maize by a series of filtering criteria. A total of 23 conserved miRNAs were iden-
tified and predicted the target genes by a web-based integrated computing system, WMD 3. Total of 89 miRNA targets were pre-
dicted and verified to be involved in maize growth and development, signal transduction, transcriptional regulation, metabolism,
and stress responses.
Keywords: microRNA; Bioinformatics; Prediction; Target gene; Maize
microRNAs (miRNA)是一大类内源性的、19~24
碱基长度的小分子非编码 RNA, 它可以通过与靶
mRNA分子完全或部分匹配, 指导 mRNA剪切或者
抑止翻译等方式调控动植物的生命过程 [1], 从而在
多细胞生物的基因表达调节和控制中扮演十分重要
的角色, 是以RNA为基础的基因表达调控系统的关
键成员[2-3]。近年来, miRNA的研究已经成为分子生
物学研究的热点领域, 其研究也由最初在模式生物
中只发现一两个小分子 RNA 发展到在不同物种中
大量发现 miRNA, 而随着研究的不断深入以及相关
理论和实验技术的完善, 发现在植物中存在一些序
列高度保守的特异 miRNAs[4], 其数量也在以惊人
的速度增加[5-7]。截至 2009 年 12 月, 被 miRNA 数
据库 miRBase (http://www.mirbase.org/)[8]收录的
miRNA共有 2 170个左右, 主要包括水稻(451个)、
毛果杨(237)、拟南芥(209 个)、葡萄(140 个)、高粱
(140个)、玉米(113个)、苜蓿(108个)、大豆(86个)、
小麦(32个)、卷柏(64个)、油菜(45个)、楼斗菜(45
个)、火炬松(37 个)、二穗短柄草(19 个)、白菜(17
个)、甘蔗(16个)、棉花(13个)、胡杨(8个)、菜豆(8
个)、甘蓝(6个)、豇豆(2个)、百脉根(2个)、苹果(1
个)、番木瓜(1个)等。
第 8期 张志明等: 用生物信息学挖掘玉米中的 microRNAs及其靶基因 1325
目前发现 miRNA的方法主要有遗传筛选[9]、直接
组织克隆及深度测序[6-7,10-11]、传统生物信息学[12-13]、
基于生物信息学基因搜索和同源搜索的表达序列标签
(expressed sequence tag, EST)和基因组概览序列(genonce
survey sequence, GSS)分析[14] 4种。由于 miRNAs具有
表达的低丰度、组织和时序特异性, 直接利用组织克
隆方法来寻找新的 miRNA 具有一定的难度。近年来,
随着测序技术的升级和发展 , 利用如 454 测序、
Illumino/Solexa 技术进行小分子 RNAs 的深度测序虽
具有高通量、高效、准确等特点, 对于一些组织表达
丰度低的 miRNAs 也能有效的检出, 但该技术同时存
在所需样本量大、费用昂贵、后续实验工作量大等缺
点。随着越来越多的物种基因组测序工作的开展和序
列信息的丰富 , 采用生物信息学方法来寻找未知
miRNA 并结合生物化学等方法进行验证是当前发现
和鉴定 miRNA 的快速、简单、高效的策略之一。基
于以上分析, 本研究根据 miRNAs 进化上的序列保守
性, 利用现有miRNA 数据库收录的植物miRNA序列
为探针与玉米的EST和GSS数据库进行比对, 共发现
23条新的玉米 miRNAs, 利用 WMD 3 在线植物靶基
因预测软件总共预测到 89个潜在的靶基因, 一部分为
转录因子, 另一些是在玉米逆境胁迫响应过程中起重
要调控作用的蛋白。
1 材料与方法
1.1 相关序列的来源
从 miRBase 数据库中下载已知的植物 miRNA
及其前体序列, 为发现玉米中的新 miRNA, 首先剔
除与数据库中公布的玉米 miRNA 具有保守的其他
植物的 miRNA 序列, 此外, 为避免 miRNA 的重复
搜索, 将属于同一个家族且具有相同序列的 miRNA
进行去除 , 剩余的 miRNA 序列被当作预测玉米
miRNA 的搜索序列。
因玉米基因组测序尚未最终完成, 现数据库公布
的测序结果中尚存在一些 gap, 即测序结果仅为初步
结果, 同时基于 miRNA 的生物信息学分析的方法和
策略, 我们选择玉米的 EST 和 GSS 序列作为玉米
miRNA 生物信息学预测的模板序列, 玉米的 EST 和
GSS 序列来源于 NCBI (美国国家生物技术信息中心,
http://www.ncbi.nlm.nih.gov/)的 GenBank核酸数据库。
1.2 潜在玉米 miRNA 及其靶基因的生物信息学
预测
潜在玉米 miRNA的预测标准: (1) 预测得到的
miRNA 与已知的 miRNA 序列上只存在小于 4 个碱
基的错配; (2) miRNA 前体能折叠为发夹型二级结
构, 且成熟 miRNAs 的序列必须在发夹结构的一条
臂上; (3) miRNA 前体的二级结构要具有绝对值较
高的最小折叠自由能(negative minimal free energies,
MFEs)以及较高的最小折叠自由能系数 (minimal
free energy index, MFEIs); (4) miRNA中(A+U)含量
必须在 30%~70%之间; (5) 成熟 miRNA与其另一臂
上的互补链之间错配碱基数不超过 6个; (6) 成熟的
miRNA 序列与另一条臂上的互补链之间不能存在
环或者缺口。
WMD 3 (http://wmd3.weigelworld.org/cgi-bin/w-
ebapp.cgi?page=TargetSearch;project=stdwmd)在线
植物 miRNA靶基因预测标准[17]: (1) 错配碱基数小
于 5 个; (2) 2~12 位碱基内错配碱基小于 1 个, 且
10~11 位置不存在错配碱基; (3) 13~21 位错配碱基
数小于 4 个, 且不存在连续 2 个碱基的错配; (4)
miRNA-靶基因复合体具有大于 70%的杂交自由能
系数(实际杂交自由能与完全匹配杂交自由能的百
分比)或大于125.4 kJ mol1的杂交自由能。玉米比
对数据库是 Zea mays EST ZmGI-18.0。
1.3 潜在 miRNA的命名
为更好地将 miRNA 与 siRNA 及其他非编码小
RNA 或 mRNA 片段区分开来, 科学家们对 miRNA
的命名做了如下规定 [18]: (1) miRNA 简写成 miR-
No./miRNo. (前者为动物 , 后者为植物命名方式),
它的基因简写成 mir-No./mirNo., 不同物种中同源
的miRNA最好用同一个名字, 如拟南芥和玉米中序
列同源的 miRNAs (小于 4 个碱基错配的 ) ath-
miR156 和 zea-miR156; (2) 高度同源的 miRNA 在
No.后加英文字母(一般从 a 开始, 小写); (3)多基因
拷贝的在后面加-No. (如 miR-2a-1); (4) 不同物种的
miRNA 以物种拉丁文缩写起始, 如玉米(Zea mays
L.)中的 miRNA 以 zea-miRNo.表示 , 拟南芥
(Arabidopsis thaliana)中的 miRNA 以 ath-miRNo.表
示; (5) 如果一个前体的 2个臂分别产生 1个miRNA,
则根据克隆实验, 看哪个是主要的成熟产物, 次要
的在后面加“*”号, 如 miR168和 miR168* (*表示量
少的); 如果不能区分表达量的多少, 可以如下表达,
如: miR-142-5p (表示在 5′端的臂)和 miR-142-3p (表
示 3′端的臂)。
1.4 潜在 miRNA及靶基因预测流程
首先, 从 miRNA 数据库 miRbase 中下载拟南
1326 作 物 学 报 第 36卷
芥、水稻、大豆、高粱等植物的 miRNA成熟序列及
其前体序列; 利用 DNAstar 序列分析软件去除重复
序列, 将剩余的序列唯一的 miRNA 作为筛选玉米
miRNA 的参照序列与玉米的 EST 和 GSS 数据库进
行 BLAST比对, 获得低于 4个碱基错配的玉米 EST
和GSS序列, 初步获得候选玉米miRNA序列; 将候
选的 EST和 GSS序列进行自身比对, 去除具有相同
序列的 miRNA。随后, 将符合条件的候选 EST 和
GSS与 pfam (http://pfam.sanger.ac.uk/)、rfam (http://
rfam.sanger.ac.uk/)、rRNA (http://bioinformatics.psb.
ugent.be/webtools/rRNA/)及 tRNA(http://lowelab.ucsc.
edu/GtRNAdb/)等数据库进行比对 , 去除蛋白编码
序列、rRNA和 tRNA等序列。采用在线软件 MFold
对剩余的 EST或 GSS序列中目标 miRNA位点上下
游各 200 bp 范围内的序列进行二级结构折叠分析,
获得符合标准的miRNA作为候选的玉米新miRNA。
对候选的 miRNAs 利用植物靶基因在线分析软件
WMD 3进行靶基因预测, 结合 Blastx及 pfam软件
分析靶基因功能, 获得候选miRNAs的靶基因信息。
具体流程见图 1所示。
图 1 miRNA及靶基因预测试验流程
Fig. 1 Experiment technological process for miRNAs and target prediction
1.5 对预测 miRNA真实性的验证
目前对 miRNA 的真实性鉴定的方法主要有两
种, 一种是 Northern杂交检测 miRNA的存在, 另一
种是通过 RT-PCR检测miRNA在具体组织中是否表
达。由于成熟的 miRNA序列较短, 通过直接设计引
物扩增检测很困难, 因此本实验采用 RNA加尾和引
物延伸 RT-PCR法对所预测miRNA的真实性进行表
达鉴定。具体方法参见简略步骤为: 玉米自交系掖
478和 R15苗期叶片、根系及叶鞘小分子 RNA的提
取、加尾和逆转录, PCR引物设计、扩增与电泳检测。
以 5S rRNA为内参基因, 根据预测 zea-miRNA的序
列设计下游引物进行 RT-PCR 验证, 理论上扩增后
的片段大小约为 80 bp。
2 结果与分析
2.1 通过生物信息学分析最新发现的玉米
miRNA
从NCBI网站上的miRNA数据库中下载所有已
知的植物miRNA序列, 去除重复及与玉米同源的序
列后总共获得 1 050条初选的 miRNAs, 包括拟南芥
(185)、水稻(243)、大豆(22)、甘蔗(16)、高粱(72)、
毛果杨(213)、苜蓿(30)和小立碗藓(269)。在这些候
选的成熟 miRNA 中, 有 287 条在与玉米的 GSS 或
EST 数据库比对中错配碱基数小于或等于 4 个。将
这 287 条 GSS 或 EST 序列进行蛋白质、tRNA 和
rRNA 数据库比对, 并选择 miRNA 位点上下游 200
第 8期 张志明等: 用生物信息学挖掘玉米中的 microRNAs及其靶基因 1327
bp 范围的序列进行 Mfold 二级结构分析, 通过设置
的标准进行逐一筛选 , 最终获得 23条玉米的新
miRNA 序列。新预测获得的玉米 miRNA 前体的二
级结构如附图所示。
在 miRNA的预测中, 成熟 miRNA均在 miRNA
的臂上, 但在 miRNA的前体位置既有在 5端的, 也
有在其 3端的。其中, 不同的 miRNA前体长度也有
所不同, 其前体的长度范围在 80~227 bp之间, 平均
长度为 149.74 bp, 与动物的miRNA前体长度(70~80
bp)相比 , 植物 miRNA 的前体长度变化范围较大
(80~227 bp), 本试验获得的结果与此相符。所有预
测的玉米 miRNAs 的前体拥有较典型的茎环二级结
构, 配对的多样性由于前体长度的不同而有所差异,
筛选最具有稳定结构为预测的前体, 即具有最小折
叠自由能(MEF), 以及具有较高的最小折叠自由能
系数(MFEI), MFEI=[(MEF/RNA 长度)×100])/(G%+
C%)。新获得 miRNA 前体二级结构信息见表 1, 从
表 1中可以看出所预测得到的miRNA前体的最小折
叠自由能(MEF)多为149.23~ 455.62 kJ mol1之间,
其平均值为251.22 kJ mol1, 其值基本符合 miRNA
前体自由能的范围(112.86~ 418.00 kJ mol1)。此
外, 有研究表明, miRNA 及其前体的 AU 含量一般
大于 GC 含量, 但并非绝对, 在本研究预测获得的
miRNA前体也有类似趋势, 23个 miRNA中有 12个
AU百分含量大于 50%, 且 zea-miR437, zea- miR819
和 zea-miR830 其含量更是达到了 70%以上。另外,
从表中还可以看出, miRNA 及其前体的来源有的是
单拷贝的, 也有的是多拷贝的, 说明在玉米中这些
新发现的 miRNAs 同样存在一定的家族特性, 同时
zea-miR173 和 zea-miR1155 以及 zea-miR843 和
zea-miR1846 具有相同的基因组定位 , 表明这些
miRNA 具有成簇分布的特点(图 2), 而根据生物信
息学预测的策略, 本研究找到的 23 条 miRNAs 中,
有 22 条 miRNAs 的前体序列均来自于玉米 GSS 数
据库且能定位在玉米基因组上, 仅有 zea-miR854的
前体序列在玉米 GSS 数据库中则找不到同源序列,
所用的序列来自玉米 EST 数据库(序列登录号为
CF041260.1)。
图 2 成簇分布玉米新发现 miRNA的前体结构
Fig. 2 Stem-loop structure analysis of some clustered miRNA
A: zea-miR173/zea-miR1155前体二级结构; B: zea-miR843/zea-miR1846前体二级结构。
A: stem-loop structure of zea-miR173/zea-miR1155; B: stem-loop structure zea-miR843/zea-miR1846.
表 1 miRNA前体结构的相关信息
Table 1 Imformation of pre-miRNA’s structure
碱基组成
Base composition miRNAs 序列
Mature sequence
基因组定位
Genome
起点
Start
终点
End
最小折叠自由能
MFE
最小折叠自
由能系数
MFEI
成熟序
列长度
ML
前体
序列
长度
PL
所在
染色
体臂
Arm A C G U
A+U
含量
A+U
(%)
zea-miR173 agcgcuugcagagugaaaucau AC197329.2 97112 97133 50.7 0.77 22 145 5 7 4 6 5 54.55
AC206259.2 33611 33631 zea-miR390 aagcucaggagggauagcgcc
AC202894.3 126549 126569
109.0 0.83 21 212 5 6 5 8 2 38.10
AC209329.3 160261 160281zea-miR397 ucauugagcgcagcguugaug
AC196994.3 25351 25371
70.1 1.23 21 109 5 4 4 7 6 47.62
zea-miR437 aaagauacagaaguuugacuu AC209957.2 76328 76348 55.0 1.15 21 167 3 9 2 4 6 71.43
zea-miR444 uugcugccucaagcuugcugc AC192263.2 31638 31658 73.0 1.14 21 112 3 2 7 5 7 42.86
zea-miR447 aaagggaugagauguuuuguug AC217963.1 44918 44939 46.5 0.64 22 201 5 6 0 8 8 63.64
zea-miR528 uggaaggggcaugcagaggag AC214047.2 147858 147878 61.8 0.83 21 120 5 6 2 11 2 38.10
AC216854.1 34069 34089 zea-miR529 gagagagagagggcacaugca
AC191058.3 54397 54417
59.7 0.86 21 122 5 8 3 9 1 42.86
AC202018.3 167719 167739zea-miR780 uacgucgugaauaucgggcau
AC187824.3 120013 120033
69.6 0.67 21 219 3 5 4 6 6 52.38
AC194014.2 132975 132995zea-miR810 ucauaagcccacaacauguuc
AC193986.3 148970 148990
40.7 0.61 21 155 5 7 7 2 5 57.14
zea-miR818 uaugccuuauauuaugggacgg AC191455.3 33203 33224 69.9 0.96 22 178 3 5 3 6 8 59.09
AC206219.2 15541 15562 zea-miR818.1 ccgucccauaauauaaggcaua
AC204087.3 141761 141782
64.7 0.81 22 195 5 8 6 3 5 59.09
zea-miR819 ucauauuauaagaauuucuagc BH868690 419 440 55.3 1.92 22 127 3 8 3 2 9 77.27
zea-miR820 ggggccugguggauggaccag AC217303.1 82953 82973 38.7 0.68 21 80 5 3 4 11 3 28.57
zea-miR827 uuagaugaccaucagcaaaca AC212823.2 126764 126784 70.9 1.39 21 134 3 9 5 3 4 61.90
zea-miR830 uaacuauuuugagaagaauuu AC210068.2 85636 85656 40.5 1.04 21 204 3 8 1 3 9 80.95
zea-miR833 caauccgauguaaacaaacaag AC191636.2 36125 36146 59.8 1.28 22 128 3 11 5 3 3 63.64
zea-miR834 ugguaguaguagcgguggugc AC216290.2 104185 104205 35.7 0.62 21 100 5 3 2 10 6 42.86
AC215606.2 5098 5118
AC198592.3 44071 44091
zea-miR843 aggaggucgagcuuccuugga
AC190989.3 66143 66163
57.2 0.97 21 103 5 4 4 8 5 42.86
zea-miR854 ccugaggauagggaggaggag CF041260.1 543 563 67.5 0.74 21 148 3 6 2 11 2 38.10
zea-miR863 uuaugucuuguugaucuguag AC191360.3 67926 67946 39.6 0.81 21 147 5 3 2 5 11 66.67
zea-miR1155 auguccugcacgaggaggugca AC197329.2 96965 96986 75.2 0.56 22 227 3 5 5 8 4 40.91
zea-miR1846 ccguuggcgccgcagggagc AC215606.2 4980 4999 71.1 0.80 20 111 5 2 7 9 2 20.00
MFE: minimal free energy; MFEI: minimal free energy index; ML: mature length; PL: pre-mature length.
第 8期 张志明等: 用生物信息学挖掘玉米中的 microRNAs及其靶基因 1329
2.2 miRNA靶基因的预测与功能分类
大量研究表明, 在植物中, miRNA 主要通过与
靶 mRNA 完全互补或者近乎完全互补(小于 4~5 个
碱基的错配)的方式降解靶 mRNA。基于该原理发展
了一些植物 miRNAs 靶基因预测软件(如 WMD 3),
通过设置一些严格的筛选条件和对应物种的基因 /
EST 数据库进行同源性比对就能很简便地预测
m i R N A s 的靶基因信息 , 而利用该方法预测的
miRNAs 靶基因中有相当一部分已经得到实验方法
的验证。本研究利用在线靶基因预测软件 WMD 3,
按实验方法所述设置严格的筛选标准, 选择玉米的
EST数据库(Zea mays EST ZmGI-18.0)对 23条新发
现的 miRNAs 进行靶基因预测, 将预测结果进行汇
总, 结果发现有 21个 miRNAs 能够预测到靶基因,
靶基因总数为 89个, 另有 2个miRNAs (zea-miR819
和 zea-miR830)未能预测到相关的靶基因信息。所
获得的靶基因与以前的研究结果相似, 预测的玉米
miRNA 的 89 个靶基因涉及玉米的生长发育、蛋
白转运、信号转导、转录因子及逆境胁迫响应等, 并
且 miRNA 倾向于靶定转录因子, 共找到 16 个转录
因子 , 占预测靶基因总数的 17.97%, 此外 , 与胁
迫响应有关的靶基因 15个, 占总数的 16.85%, 与新
陈代谢有关的靶基因为 27 个, 占总数的 30.33%
(表 2)。
表 2 miRNA靶基因的相关信息
Table 2 Imformation about target genes of miRNA
miRNAs GSS/EST 靶定蛋白
Target gene
功能
Function
调控位点
Regulatory site
杂交自由能
Hybridization energy
(kJ mol1)
TC430600 Serine/threonine-protein kinase SNT7 胁迫响应 SR 290–311 160.09 (81.61% a)
TC391640 Leucine rich repeat N-terminal domain 胁迫响应 SR 800–820 193.83 (88.04%)
zea-miR173
TC374339 Auxin response factor 7 转录因子 TF 169–189 169.71 (77.08%)
TC389787 Procollagen-proline, 2-oxoglutarate 4-dioxygenase 新陈代谢M 522–542 169.00 (76.76%) zea-miR390
TC445821 tRNA modification GTPase GTPBP3, mitochon- drial precursor 生长发育 GD 481–501 169.00 (76.76%)
TC376364 Laccase-12/13 precursor 胁迫响应 SR 798–818 173.80 (89.28%)
EB159244 Laccase-4 precursor 胁迫响应 SR 201–221 172.43 (88.58%)
zea-miR397
CO450638 Cytosolic glyceroldehyde-3-phosphate dehydroge- nase GAPC4 新陈代谢M 458–478 139.28 (71.55%)
zea-miR437 TC415813 Carboxyl-terminal proteinase-like 新陈代谢M 448–468 131.34 (86.56%)
TC400139 MADS-box transcription factor 27 转录因子 TF 18–38 177.73 (85.13%) zea-miR444
TC407127 Methyltransferase domain protein 生长发育 GD 238–258 151.65 (72.63%)
CF627849 Pyridoxal-phosphate dependent enzyme 新陈代谢M 627–648 135.77 (78.11%) zea-miR447
EE294097 26S proteasome non-atpase regulatory subunit 13 生长发育 GD 383–404 127.32 (73.26%)
TC372613 Laccase-12/13 precursor 胁迫响应 SR 101–121 173.05 (77.88%)
TC391900 Putative bHLH transcription factor PTF1 转录因子 TF 574–594 155.62 (70.03%)
TC392448 Thiamine monophosphate synthase 新陈代谢M 187–207 166.49 (74.92%)
TC393045 Elongation factor 1-alpha 新陈代谢M 782–802 158.38 (71.28%)
TC449988 Ubiquitin carboxyl-terminal hydrolase 新陈代谢M 309–329 157.00 (70.65%)
TC405453 Glutamyl-tRNA synthetase, cytoplasmic 新陈代谢M 1191–1211 157.75 (70.99%)
zea-miR528
TC372588 Putative laccase 胁迫响应 SR 183–203 174.35 (78.46%)
TC372926 29–49 194.16 (90.14%)
TC400594
Copper chaperone homolog CCH 跨膜运输 TT
182–202 194.16 (90.14%)
TC376898 F-box family protein 转录因子 TF 63–83 177.78 (82.53%)
CO444999 Carbamoyl-phosphate synthase L chain/biotin carboxylase 新陈代谢M 246–266 175.52 (81.49%)
TC414751 Zinc finger CCCH type containing 13 转录因子 TF 399–419 173.26 (80.44%)
TC426977 Ocs element-binding factor 1 生长发育 GD 718–738 173.26 (80.44%)
EC893890 GTPase activating protein-like 跨膜运输 TT 19–39 165.40 (76.79%)
TC377637 Zinc finger, C3HC4 type family protein 转录因子 TF 50–70 162.77 (75.57%)
zea-miR529
TC410998 Zinc finger, C3HC5 type family protein 转录因子 TF 44–64 162.77 (75.57%)
1330 作 物 学 报 第 36卷
(续表 2)
新预测 miRNAs
miRNAs
GSS/EST 靶定蛋白
Target gene
功能
Function
调控位点
Regulatory site
杂交自由能
Hybridization energy
(kJ mol1)
CD966750 Alcohol dehydrogenase ADH3D 新陈代谢M 124–144 162.06 (75.24%)
TC372976 DNA binding protein 转录调控 TR 143–163 160.01 (74.29%)
TC381622 GDSL-like lipase/acylhydrolase 新陈代谢M 1299–1319 159.47 (74.03%)
TC375104 Protein YABBY 6 转录因子 TF 8–28 158.38 (73.53%)
TC376753 SBP-domain protein 3 1852–1872 157.71 (73.22 %)
EE179948 Oligosaccharyl transferase, STT3 subunit precur- sor
转录因子 TF
506–526 157.59 (73.16%)
AI947710 Chlorophyll a/b-binding protein CP29 precursor 生长发育 GD 348–368 157.46 (73.10%)
TC424412 Pathogenesis-related genes transcriptional acti- vator 胁迫响应 SR 368–388 155.33 (72.11%)
TC411121 Lipid phosphate phosphatase 3 新陈代谢M 137–157 155.12 (72.02%)
TC403517 Transcription factor WRKY74 转录因子 TF 817–837 139.07 (64.56%)
zea-miR780 EG097078 Putative integral membrane protein 生长发育 GD 570–590 157.96 (87.52%)
zea-miR810 TC429979 Minichromosome maintenance protein 信号转导 ST 1139–1159 122.60 (67.66%)
DW848332 Eukaryotic translation initiation factor 2 subunit 3 71–92 153.70 (82.33%)
TC398638 Two component, sigma54 specific, transcriptional regulator
新陈代谢M
778–799 152.49 (81.68%)
TC390828 PAP2 superfamily protein 新陈代谢M 751–772 163.19 (87.42%)
TC421142 893–914 154.16 (82.58%)
zea-miR818
TC376662
Abhydrolase domain-containing protein 5 新陈代谢M
1642–1663 147.09 (78.80%)
zea-miR818.1 EE037262 Aluminium resistance protein 胁迫响应 SR 93–114 157.42 (84.33%)
TC391022 SBP-domain protein 6 转录因子 TF 311–331 239.14 (100.00%)zea-miR820
EC876573 Formin homology protein A 生长发育 GD 353–373 172.51 (72.14%)
TC387230 SPX (SYG1/Pho81/XPR1) domain-containing protein-like 跨膜运输 TT 267–287 148.72 (84.92%)
TC372597 1748–1768 127.07 (72.55%)
TC372606 1977–1997 127.07 (72.55%)
zea-miR827
TC452573
VEF family protein 生长发育 GD
1151–1171 127.07 (72.55%)
TC385137 Molybdenum cofactor sulfurase protein-like 信号转导 ST 894–915 147.51 (88.29%)
TC395570 Glycosyltransferase 新陈代谢M 401–422 147.51 (88.29%)
TC455145 Gb protein 信号转导 ST 30–51 147.51 (88.29%)
TC383147 Small nuclear ribonucleoprotein Sm D2 新陈代谢M 529–550 144.88 (86.72%)
TC390979 Plasma membrane-bound peroxidase 2b 新陈代谢M 1301–1322 144.88 (86.72%)
TC405875 Sincerely yours, mall nuclear ribonucleoprotein D2, putative 生长发育 GD 517–538 144.88 (86.72%)
TC430117 Catalytic/ protein phosphatase type 2C 胁迫响应 SR 629–650 144.88 (86.72%)
TC450743 Src homology-3 domain protein 3 信号转导 ST 331–352 144.88 (86.72%)
TC394055 Na
+/H+ antiporter NhaD or related arsenite per-
mease precursor 跨膜运输 TT 525–546 137.06 (82.04%)
TC376540 Probable 6-phosphogluconolactonase 1 新陈代谢M 1293–1314 134.35 (80.41%)
zea-miR833
TC426428 Metallothionein 2a 胁迫响应 SR 617–638 128.95 (77.18%)
zea-miR834 TC380388 Membrane related protein 信号转导 ST 303–323 158.51 (78.70%)
TC406430 Ubiquitin carboxyl-terminal hydrolase 新陈代谢M 26–46 164.44 (78.52%)
TC385042 Signal recognition particle-docking protein FtsY 转录因子 TF 520–540 187.81 (89.68%)
TC396656 P-type R2R3 Myb protein 转录因子 TF 642–662 169.33 (80.86%)
TC405725 Cellulose synthase-4 生长发育 GD 160–180 162.43 (77.56%)
TC380633 Serine/threonine kinase 胁迫响应 SR 841–861 156.12 (74.55%)
TC408420 Single-stranded-DNA-specific exonuclease RecJ 新陈代谢M 101–121 149.52 (71.40%)
第 8期 张志明等: 用生物信息学挖掘玉米中的 microRNAs及其靶基因 1331
(续表 2)
miRNAs GSS/EST 靶定蛋白
Target gene
功能
Function
调控位点
Regulatory site
杂交自由能
Hybridization energy
(kJ mol1)
TC375153 Leucine rich repeat protein 胁迫响应 SR 565–585 172.68 (81.37%)
TC399218 PHD-finger 转录调控 TR 3656–3676 162.89 (76.76%)
zea-miR843
TC377711 Oligomeric golgi complex 7-like 新陈代谢M 1172–1192 151.36 (71.32%)
TC374690 UDP-glucoronosyl and UDP-glucosyl transferase 新陈代谢M 95–115 171.30 (77.06%)
TC373327 Zinc finger, C2H2 type family protein 转录因子 TF 11–31 156.92 (70.59%)
zea-miR854
BE050812 Prokaryotic diacylglycerol kinase 信号转导 ST 80–100 166.32 (74.82%)
zea-miR863 TC377865 Zinc finger, C3HC4 type (RING finger) 转录因子 TF 859–879 120.13 (73.94%)
zea-miR1155 TC395315 Formin homology 2 domain protein 生长发育 GD 112–133 174.18 (76.32%)
TC402971 Protein kinase domain 信号转导 ST 650–669 188.48 (81.55%)
TC382262 Beta-galactosidase 新陈代谢M 133–152 187.56 (81.15%)
BE050667 Methyltransferase PilK 生长发育 GD 166–185 186.89 (80.86%)
TC372653 Protein WRKY1 转录因子 TF 58–77 182.62 (79.02%)
TC440191 Glutelin-2 precursor 生长发育 GD 290–309 172.72 (74.73%)
EE020780 PR-Vbeta1 胁迫响应 SR 194–213 166.87 (72.20%)
TC404770 Protein STRUBBELIG-RECEPTOR FAMILY 8 precursor 胁迫响应 SR 25–44
166.32 (71.97%)
TC381611 ZF-HD protein dimerisation region containing protein 信号转导 ST 891–910
165.15 (71.46%)
EE290143 Protein disulfide-isomerase precursor 新陈代谢M 4–23 162.94 (70.50%)
zea-miR1846
TC421022 9-cis-epoxycarotenoid dioxygenase 1 胁迫响应 SR 286–305 162.77 (70.43%)
a 表示实际杂交自由能与完全匹配杂交自由能的百分比。
a means the free hybridization energy calculated for a perfectly complementary miRNA. SR: stress response; TF: transcription factor; M:
metabolism; GD: growth and development; TT: transmembrane transport; ST: signal transduction; TR: transcriptional regulation.
2.3 对预测 miRNAs真实性的鉴定
根据参考文献提供的试验方法, 采用相应试剂盒
对玉米自交系掖 478和 R15苗期叶片、根系及叶鞘小
分子 RNA的提取、poly(A)末端加尾和逆转录, 利用预
测 miRNA 序列信息进行 PCR 引物设计, 共对预测获
得的 10 个 miRNAs 进行引物设计, 后经 PCR 扩增与
1.5%琼脂糖凝胶电泳进行检测, 电泳结果如图 3 所
示。电泳结果表明, 供选的 7个 miRNA (zea-miR173、
zea-miR397、zea-miR528、zea-miR529、zea-miR833、
zea-miR834和 zea-miR863)均能在 R15和掖 478的不
同部位(叶片、根系和叶鞘)中检出, 且条带单一, 片段
大小恰好在80 bp左右(图3), 此结果证明这7个miRNA
是真实存在的, 且在不同材料/组织中均有表达。另有
3个miRNAs (zea-miR437、zea-miR818.1和 zea-miR810)
未扩增到单一的条带, 可能与引物设计以及 miRNAs
表达的时空、组织特异性等有关。
图 3 miRNA加尾后扩增片段电泳检测图谱
Fig. 3 PCR assay for miRNAs tailed with poly(A)
1: 掖 478叶片; 2: 掖 478根系; 3: 掖 478叶鞘; 4: R15叶片; 5: R15根系; 6: R15叶鞘。
M: 20 bp DNA ladder marker; 1: leaf of Ye 478; 2: root of Ye 478; 3: sheath of Ye 478; 4: leaf of R15; 5: root of R15; 6: sheath of R15.
1332 作 物 学 报 第 36卷
3 讨论
克隆获得 miRNA 的方法虽然可以直接获得新
的 miRNA, 但步骤繁琐、花费庞大、克隆得到大量
的重复片段、效率较低; 且获得的片段中并非全是
miRNA, 还包含着其他的小分子 RNA (如 siRNA、
snoRNA、tRNA和 rRNA等), 其鉴定比较复杂。而
生物信息学预测鉴定 miRNA 主要原理是建立在不
同物种间 miRNA 序列保守性的基础上, 对于已知
miRNA的结构特点可有效进行预测鉴定分析, 过程
简单方便、花费很少, 缺点是必须结合生物学方法
进行鉴定。在本试验中, 通过生物信息学方法获得
23 条成熟 miRNA 及其前体序列, 经 poly(A)末端加
尾延伸和 RT-PCR相结合的方法, 对 10条预测到的
miRNA在玉米自交系材料 R15和掖 478的叶片、根
系和叶鞘组织中进行表达检测 , 最终获得了 7条
miRNA的真实表达, 证明将生物信息学方法和实验
鉴定方法有效地结合起来, 相互取长补短, 是有效
研究 miRNA的有效途径。虽然有部分生物信息学鉴
定的候选玉米 miRNA 未被检测出 , 这可能与
miRNA 的表达具有时空和组织特异性有关。因此,
将剩余的 miRNA 在其他的玉米发育阶段及其胁迫
处理中检测其表达情况, 并通过 RNAi 技术或过量
表达技术验证 miRNA 的靶基因具体功能是下一步
实验的主要内容。
本研究共预测获得 23 条玉米新的 miRNAs, 并
利用靶基因预测软件获得了其中 21个 miRNA靶定
的 89个功能基因, 通过功能分析发现这些靶基因分
别编码与新陈代谢、转录因子、信号转导、跨膜运
输、逆境胁迫响应等有关的蛋白, 说明 miRNA作为
一类调控因子在植物生长发育的多个过程中具有重
要的作用。针对本研究所获得的信息, 我们发现靶
基因与抗病/抗逆机制可能有关的 miRNA共有 9个,
分别为 zea-miR173、zea-miR397、zea-miR528、zea-
miR529、zea-miR818.1、zea-miR833、zea-miR834、
zea-miR863和 zea-miR1846。其中, zea-miR833的靶
基因为蛋白磷酸酶 2C (TC430117, protein phos-
phatase 2C), 有研究表明, PP2C 类蛋白磷酸酶是一
种单体蛋白磷酸酶 , 活力依赖 Mg2+, 它在脱落酸
(ABA)依赖的信号传导通路参与的植物对逆境胁迫
反应中充当负调控因子, 使在胁迫条件下被激活、
放大的一些信号传递回落到较低的水平, 这对于植
物正常生理条件下的代谢以及应付下一次逆境的胁
迫是十分必要的[20-21]。Schweighofer 等[22]新近的研
究表明, 高等真核生物中的 PP2C 类蛋白磷酸酶是
逆境胁迫信号激活的激酶通路中的一种负调控因子,
可能在许多信号转导途径中作为负调控因子。因此,
zea-miR833 调控 PP2C 类蛋白磷酸酶的下调表达,
可能激活众多逆境胁迫信号传导途径, 从而在由环
境胁迫如冷害、干旱、损伤、病害等激活的信号通
路中起至关重要的调节作用。zea-miR528 和 zea-
miR397 的靶基因均与漆酶 (TC376364, Laccase-
12/13 precursor; TC372613, Laccase-12/13 precursor)
有关, 有研究指出高等植物漆酶与细胞壁木质素的
合成、抗病、对环境的适应以及种皮颜色等过程密
切相关[23-26], 这与 Zhang 等[27]的研究结果一致。再
如, zea-miR173 的靶基因为富含亮氨酸重复结构域
蛋白、zea-miR529 的靶基因有病程相关基因转录激
活蛋白、zea-miR843 的靶基因有富含亮氨酸重复蛋
白、zea-miR1846的靶基因有病程相关蛋白等, 这些
靶基因均在植物抗病作用中具有非常重要的作用。
4 结论
共筛选到 23条新的玉米 miRNAs, 预测到 89个
靶基因 , 发现靶基因与抗病 /抗逆机制可能有关的
miRNAs 9个, 其靶基因均在植物抗病作用中具有非
常重要的作用。本研究所获得的一些结果为玉米
miRNAs 数据库进行信息补充的同时也可能对今后
的植物抗病 miRNAs的表达调控提供借鉴。
References
[1] Bartel D P. MicroRNAs: genomics, biogenesis, mechanism, and
function. Cell, 2004, 116: 281297
[2] Jin L-G(金龙国), Wang C(王川), Liu J-Y(刘进元). Plant micro
RNA. Chin J Biochem Mol Biol (中国生物化学与分子生物学
报), 2006, 22(8): 609614 (in Chinese with English abstract)
[3] Jones-Rhoades M W, Bartel D P, Bartel B. MicroRNAs and their
regulatory roles in plants. Annu Rev Plant Biol, 2006, 57: 1953
[4] Zhang B, Pan X, Cannon C H, Cobb G P, Anderson T A.
Conservation and divergence of plant microRNA genes. Plant J,
2006, 46: 243259
[5] Arazi T, Talmor-Neiman M, Stav R, Riese M, Huijser P, Baul-
combe D C. Cloning and characterization of microRNAs from
moss. Plant J, 2005, 43: 837848
[6] Sunkar R, Zhu J K. Novel and stress-regulated microRNAs and
other small RNAs from Arabidopsis. Plant Cell, 2004, 16:
20012019
[7] Sunkar R, Girke T, Jain P K, Zhu J K. Cloning and characteriza-
第 8期 张志明等: 用生物信息学挖掘玉米中的 microRNAs及其靶基因 1333
tion of microRNAs from rice. Plant Cell, 2005, 17: 13971411
[8] Griffiths-Jones S, Grocock R J, van Dongen S, Bateman A, En-
right A J. miRBase: microRNA sequences, targets and gene no-
menclature. Nucl Acids Res, 2006, 34: 140144
[9] Lee R C, Feinbaum R L, Ambros V. The C. elegans heterochronic
gene lin-4 encodes small RNAs with antisense complementarity
to lin-14. Cell, 1993, 75: 843854
[10] Moxon S, Jing R, Szittya G, Schwach F, Rusholme Pilcher R L,
Moulton V, Dalmay T. Deep sequencing of tomato short RNAs
identifies microRNAs targeting genes involved in fruit ripening.
Genome Res, 2008, 18: 16021609
[11] Qiu D Y, Pan X P, Wilson W I, Li F, Liu M, Teng W, Zhang B.
High throughput sequencing technology reveals that the taxoid
elicitor methyl jasmonate regulates microRNA expression in
Chinese yew (Taxus chinensis). Gene, 2009, 436: 3744
[12] Jones-Rhoades M W, Bartel D P. Computational identification of
plant microRNAs and their targets, including a stress-induced
miRNA. Mol Cell, 2004, 14: 787799
[13] Bonnet E, Wuyts J, Rouzé P, Van de Peer Y. Detection of 91
potential conserved plant microRNAs in Arabidopsis thaliana
and Oryza sativa identifies important targets. Proc Natl Acad Sci
USA, 2004, 101: 1151111516
[14] Zhang B H, Pan X P, Wang Q L, Cobb G P, Anderson T A. Iden-
tification and characterization of new plant microRNAs using
EST analysis. Cell Res, 2005, 15: 336360
[15] Llave C, Xie Z, Kasschau K D, Carrington J C. Cleavage of
scarecrow-like mRNA targets directed by a class of Arabidopsis
miRNA. Science, 2002, 297: 20532056
[16] Ye M(叶茂), Chen Y-L(陈跃磊), Ming Z-H(明镇寰). Progress in
the research of miRNAs (microRNAs) family. Prog Biochem
Biophys (生物化学与生物物理进展), 2003, 30(3): 370374 (in
Chinese with English abstract)
[17] Ossowski S, Schwab R, Weigel D. Gene silencing in plants using
artificial microRNAs and other small RNAs. Plant J, 2008, 53:
674690
[18] Ambros V. A uniform system for microRNA annotation. RNA,
2003, 9: 277279
[19] Zhang Q(张旗), He X-J(何湘君), Pan X-Y(潘秀英). Real-time
quantification of microRNAs by RNA-tailing and primer-
extension RT-PCR. J Peking Univ (Health Sci), 2007, 39(1):
8791
[20] Hu X-L(胡晓丽), Li D-Q(李德全). Protein phosphatase 2C in
plants and its functions of signal transduction. Plant Physiol
Commun (植物生理学通讯), 2007, 43(3): 407410 (in Chinese
with English abstract)
[21] Hu X-B(胡学博), Song F-M(宋凤鸣), Zheng Z(郑重). The
structure and function of protein phosphatase 2Cs in higher
plants. Chin J Cell Biol (细胞生物学杂志), 2005, 27(): 2934
(in Chinese with English abstract)
[22] Schweighofer A, Hirt H, Meskiene I. Plant PP2C phosphatases:
emerging functions in stress signaling. Trends Plant Sci, 2004, 9:
236243
[23] Demarco A, Roubelakis-Angelakis K A. Laccase activity could
contribute to cell wall reconstitution of regenerating protoplasts.
Phytochemistry, 1997, 46: 421425
[24] Li L, Steffen S J C. Overexpression of polyphenol oxidase in
transgenic tomato plants results in enhanced bacterial disease re-
sistance. Planta, 2002, 215: 239247
[25] Pourcel L, Routaboul J M, Kerhoas L, Caboche M, Lepiniec L,
Debeaujon I. Transparent TESTA 10 encodes a laccase-like en-
zyme involved in oxidative polymerization of flavonoids in
arabidopsis seed coat. Plant Cell, 2005, 17: 29662980
[26] Wang G-D(王国栋 ), Chen X-Y(陈晓亚 ). The properties,
functions, catalytic mechanism and applicability of laccase. Chin
Bull Bat (植物学通报), 2003, 20(4): 469475 (in Chinese with
English abstract)
[27] Zhang L F, Chia J, Kumari S, Stein J C, Liu Z J, Narechania A,
Maher C A, Guill K, McMullen M D, Ware D. A genome-wide
characterization of microRNA genes in maize. PLoS Genet, 2009,
5(11): e1000716
附图: miRNA前体的二级结构图(黑体部分为 miRNAs的成熟序列)
Appendix: miRNAs hairpin structure prediction (Bold part stands for the mature miRNAs)
zea-miR173
zea-miR390
1334 作 物 学 报 第 36卷
zea-miR397
zea-miR437
zea-miR444
zea-miR447
zea-miR528
zea-miR529
zea-miR780
zea-miR810
zea-miR818
zea-miR818.1
zea-miR819
第 8期 张志明等: 用生物信息学挖掘玉米中的 microRNAs及其靶基因 1335
zea-miR820
zea-miR827
zea-miR830
zea-miR833
zea-miR834
zea-miR843
zea-miR854
zea-miR863
zea-miR1155
zea-miR1846