全 文 :园 艺 学 报 2010,37(6):869–879
Acta Horticulturae Sinica
32种果树 microRNA的生物信息学预测与分析
宋长年 1,贾启东 2,王 晨 1,李 飞 2,章 镇 1,房经贵 1,*
(1南京农业大学园艺学院,南京 210095;2南京农业大学植物保护学院,南京 210095)
摘 要:通过生物信息学预测 miRNA的方法,采用基于生物信息学的基因搜索和同源搜索的方法成
功地从 NCBI数据库中登录的 32种果树的 EST中寻找 miRNAs。从 32种果树的 774 400条 ESTs中找到
了 110条 miRNA前体序列,编码 116条成熟体序列。利用 miRbase数据库进一步分析,结果表明 116个
miRNAs属于 45个miRNA家族,其中有 7个保守的miRNA家族中的miRNA个数在 5以上,20 个 miRNA
家族的 miRNA个数在 2 ~ 4,有 18个 miRNA家族的 miRNA数量为 1个。在柑橘、苹果、香蕉、猕猴
桃和桃等果树中分别发现 28、16、13、11和 10个 miRNAs。果树中 miRNA的序列比较发现,相同家族
的 miRNA的序列存在一定水平的差异,其中碱基的变化包括相似频率的颠换与转换。
关键词:microRNA;生物信息学预测;果树;EST
中图分类号:S 66 文献标识码:A 文章编号:0513-353X(2010)06-0869-11
Computational Identification and Analysis of the Putative microRNAs in 32
Fruit Crops
SONG Chang-nian1,JIA Qi-dong2,WANG Chen1,LI Fei2,ZHANG Zhen1,and FANG Jing-gui1, *
(1College of Horticulture,Nanjing Agricultural University,Nanjing 210095,China;2College of Plant Protection,Nanjing
Agricultural University,Nanjing 210095,China)
Abstract: Here we present a study of bioinformatics identification of microRNA precursors in fruit
crops by blasting ESTs of 32 fruit crops in NCBI using bioinformatics-based gene search and homology
search method to look for miRNAs in fruit crops. A total of 110 miRNA precursors,encoding 116 unique
miRNA sequences,were identified in these fruit crops. Further analysis through the miRbase database
showed the 116 miRNAs belonged to 45 miRNA families,of which 7 were predicted with miRNA number
more than 5,20 between 2–4,and the other 18 with only 1 miRNA. miRNAs were identified in Citrus,
apple,bananas,kiwifruit and peach,and the numbers of miRNAs found in them were 28,16,13,11,
and 10,respectively. The results of the alignment of 6 miRNA families showed the nucleotide sequences of
the miRNAs in same family were variable,and the variation between the nucleotides of same locus could
be of transversion and transition.
Key words:microRNA;bioinformatics prediction;fruit crop;EST
microRNA(miRNA)是近年来新发现的一类不编码蛋白质的 18 ~ 25 nt单链小分子 RNA,它通
过互补配对原则作用于靶基因 mRNA,使基因沉默。miRNAs在植物生长和发育的调控、激素信号
收稿日期:2009–12–30;修回日期:2010–04–29
基金项目:教育部科学技术研究重点项目(109084)
﹡ 通信作者 Author for correspondence ( E-mail:fanggg@njau.edu.cn)
870 园 艺 学 报 37卷
的影响以及对环境与营养信号的反馈反应等方面起着重要的作用(Chen,2005;Berezikov et al.,2006;
Carthew & Sontheimer,2009)。有关植物miRNAs及其对其靶基因的调控已经成为植物学研究的重
要课题。自从2002年第一个植物的miRNA在拟南芥上被鉴定以来(Reinhart et al.,2002),已经有
多达上千条植物miRNAs在miRBase序列数据库中登录(Griffiths-Jones et al.,2008)。由于受基因组
序列信息量的影响,大量miRNA表达水平低或存在表达时空性以及大量测序费用高等因素的制约,
直接克隆法分离miRNA存在一定的问题(Berezikov et al.,2006)。由于生物信息学对miRNA进行
预测和鉴定有着试验生物学无法比拟的快速和方便的优势,因此备受研究者的青睐(Zhang et al.,
2008)。可以利用主要的3种基因组序列数据库作为潜在miRNA的搜索的数据库,包括基因组
(Jones-Rhoades & Bartel,2004),DNA数据库(如GSS等)(Zhang et al.,2006b)以及EST数据
库(Zhang et al.,2005;Qiu et al.,2007)。迄今通过各种计算机软件或其他计算工具已经成功地预
测和鉴定了大豆(Zhang et al.,2008)、玉米(Zhang et al.,2006a)、番茄(Yin et al.,2008;Zhang
et al.,2008)、棉花(Qiu et al.,2007;Zhang et al.,2007)、柑橘(Song et al.,2009,2010)、
葡萄(Carra et al.,2009)等多种植物中已知的大多数miRNA。
事实上,对植物miRNA的生物信息学预测研究也多集中于一些模式植物或重要大田作物,对果
树相关研究还鲜有报道。Sunkar和Jagadeeswaran(2008)应用生物信息学从包括多种果树在内的155
种植物的ESTs中进行了miRNAs的预测,并且找到682条miRNAs,但是该研究的策略是有目的地选
择出一些模式植物中被认为高保守的miRNAs对其它植物的ESTs序列进行BLAST分析的结果,并不
是根据预测miRNAs设置的一系列严格的筛选标准而进行随机筛选,表现出一定的局限性。Song等
(2009)也是根据高保守的miRNAs在柑橘上做了类似的研究。迄今,关于利用果树ESTs序列进行
广泛预测miRNAs的研究主要局限于葡萄、草莓和柑橘等几种果树。其中,在柑橘miRNAs的预测研
究中(Song et al.,2010),对来自柑橘中的枳(Poncirus trifoliata)、克菜门柑(Citrus clementine)、
宽皮橘(Citrus reticulata)和甜橙(Citrus sinensis)等的miRNA进行了生物信息学预测和表达分析。
本研究中则是利用相同的研究措施进一步从GenBank上下载苹果、柑橘、葡萄、香蕉、猕猴桃、桃、
杏等32种果树774 400条ESTs采用基于生物信息学同源搜索来寻找果树同源miRNA。这对于深入研
究miRNA在果树的生长发育的作用以及促进果树表观遗传学的研究有着一定的意义。
1 材料与方法
1.1 miRNA和 ESTs序列
在miRNA数据库(http://microrna.sanger.ac.uk/sequcences/index.shtml)中下载已知的1 328条植物
miRNA及其前体序列。这些miRNA 序列分别来源于拟南芥(187)、水稻(377)、杨树(234)、
大豆(78)、苜蓿(38)、高粱(72)、玉米(96)、甘蔗(16)及小立碗藓(230)等植物。为了
避免miRNA的重复,首先删除上述不同植物中的重复序列,剩余序列为筛选果树miRNA的参照序列。
32个物种果树的774 400条ESTs由美国国家生物技术信息中心(National Center for Biotechnology
Information,NCBI)的GenBank核酸数据库网站上(http://www.ncbi.nlm.nih. gov)下载得到(截至
到2009年3月)。
鉴于对果树中miRNA生物信息学研究已有报道(蔡斌 等,2008;Song et al.,2009,2010),
为避免研究重复,在葡萄与柑橘两种果树上的miRNA预测中分别选用了葡萄中的沙地葡萄,柑橘中
的酸橙(Citrus aurantium)、酸橘(Citrus sunki)、温州蜜柑(Citrus unshiu)、八朔(Citrus hassaku)
和酸来檬(Citrus latifolia)等10个种。其它果树如苹果(Malus domestica)、桃(Prunus persica)、
6期 宋长年等:32种果树 microRNA的生物信息学预测与分析 871
杏(Prunus armeniaca)和香蕉中的粉蕉(Musa acuminata ABB Group)、香牙蕉(Musa acuminata AAA
Group)等果树的EST全部用于其miRNA的预测的研究。
1.2 应用的软件
比对软件BLAST-2.2.21由NCBI的GenBank下载,核酸序列编码蛋白质在NCBI的BLASTX
(http://www.ncbi.nlm.nih.gov/BLAST/)中进行(Mathews et al.,1999;Zuker,2003)。二级结构
分析用MFold3.2程序进行(Zuker,2003)(http://www.bioinfo.rpi.edu/applications/mfold/rna/form1. cgi)。
1.3 果树 miRNA生物信息学分析和靶基因预测
鉴于多数果树的基因组信息知之甚少,我们选用EST数据库作为32种果树miRNA预测的载体序
列。预测miRNA以及其靶基因的过程参照Zhang等(2006a)预测玉米以及Song等(2010)预测柑橘
的miRNA的流程,其预测标准参数以文献(Ambros et al.,2003;Zuker,2003)为基础:(1)预测
得到的miRNA与已知的miRNA的序列只存在小于或等于3个碱基错配;(2)miRNA 前体能折叠为
发夹型二级结构;(3)成熟miRNA的候选序列位于发夹结构的一条臂上,而对应的miRNA*位于另
一条臂上;(4)成熟miRNA和miRNA*的非匹配碱基数不能超过6个,miRNA*区不能形成发夹环;
(5)预测的miRNA前体二级结构的自由能小于–20 kcal · mol-1;(6)miRNA中(A + U)含量必
须在30% ~ 70%之间。
1.4 果树 miRNA成熟体序列分析
根据miRNA预测的结果,选择预测数量多的6个家族miRNA的成熟体序列采用ClustalX1.8进行
多序列比对,并通过邻接算法(N-J法)完成多序列对齐。
2 结果与分析
2.1 果树中 miRNA的预测
2.1.1 果树miRNA筛选依据
根据绝大多数不同植物中相同家族内的miRNA序列具有高度的保守性的特性(Zhang et al.,
2006b),利用拟南芥、水稻、杨树、葡萄等植物中已公布的miRNA序列,从果树EST数据库中挖掘
出相应的miRNA基因序列。在下载所有植物miRNA序列时,有许多序列是类同的。首先对从拟南芥、
水稻、杨树等数据库中得到的miRNA序列进行相互间比对,去掉重复序列。将剩余不重复的miRNA
序列与32种果树的774 400条ESTs数据库进行BLAST,得到果树候选miRNA序列。将果树候选miRNA
序列进行一次自身BLAST,去除重复序列。经过上述几步筛选后得到的果树miRNA序列与NCBI收
录的编码蛋白质的RNA序列再进行一次BLASTX比对,去除编码蛋白质的RNA序列。其次,将得到
的候选miRNA用“MFold 3.2”进行折叠分析,得到具有发夹结构的miRNA。最后,只有含19 ~ 24
个碱基序列的并具有发夹结构的侯选成熟miRNA被保留下来,并且保留下来的序列必须具有最低能
量状态。经过上述一系列筛选步骤后,最终在32种果树中得到116个miRNAs,对miRNA和其前体序
列的长度、A + U含量作统计分析,结果见表1,116条miRNAs的长度为19 ~ 22 nt,(A + U)含量在
32% ~ 70%之间。
在果树miRNA预测鉴定中,本研究计算了候选miRNA(A + U)的含量,其中(A + U)含量为
32% ~ 49%的果树miRNAs有30个,其余均在50% ~ 70%之间,符合miRNA前体以及miRNA(A + U)
含量一般要大于(G + C)含量的原则(Zhang et al.,2006b)。茎环发夹结构的形成是miRNA成熟
872 园 艺 学 报 37卷
过程中的一个重要步骤,也是miRNA 前体的一个重要特征。但是发夹结构并不是miRNA所特有的,
这是因为其他的一些RNAs也可能形成相似的发夹结构(如mRNA,rRNA,tRNA)(Ambros et al.,
2003)。为避免将其他类型的RNAs或RNA片段误认为是miRNA,最小折叠自由能(minimal free
energies,MFE)是一个衡量miRNA的重要标准(Zhang et al.,2006b),就MFE这项指标来看,所
有果树中的miRNA的MFE值均低于–20 kcal · mol-1(表1)。上述结果表明,本研究鉴定出的果树
miRNAs是按严格标准筛选而得到的。
表 1 32种不同果树中新发现的 miRNAs
Table 1 Newly identified miRNAs from EST of 32 different fruit trees
物种
Species
新的 miRNA
New miRNA
成熟体序列
Mature sequence
LM/
nt
登录号
Accession
LP/
bp
位置
Location
(A+U)/%
MFEs/
(kcal·mol-1)
软枣猕猴桃
Actinidia arguta
aar-miR2104 GCGGCGAGGGGAUGCCGGCGUU 22 195215626 91 3 33 -75.40
中华猕猴桃 ach-miR1535 CUUGUUUGUGGUGGUUUCC 19 195244351 71 5 55 -36.60
Actinidia chinensi ach-miR414 UCAUCUUCUUCCUCAUCUUCA 21 195277454 108 5 55 -43.91
ach-miR530 UGCAUUUGCACCUACAACCU 20 195194764 61 5 51 -24.80
美味猕猴桃 ade-miR414 UCAUCCUCAUCCUCAUCCUCG 21 195294201 62 5 50 -33.20
Actinidia deliciosa ade-miR477a UUCUCCCUCAAGGGCUUCCG 20 195226665 87 5 45 -65.20
ade-miR535a UCUCCCUCAAGGGCUUCCG 21 195299134 119 5 55 -66.94
ade-miR902 ACGAAGAUCUGCAUCUUGAG 20 195253994 81 5 48 -63.60
ade-miR948 ACAGGCUGUUUGGCAUCCGG 20 195279395 101 5 45 -68.00
ade-miR1028 ACUUAGAUCUACAAUGUUAAA 21 195225315 101 5 67 -48.53
毛花猕猴桃
Actinidia eriantha
aer-miR948 ACAGGCUGUUUGGCAUCCGG 20 195217624 68 5 41 -66.92
番木瓜 cpa-miR159 UUUGGAUUAAAGGGUGCUGCU 21 186868414 90 3 48 -59.20
Carica papaya cpa-miR390a AAGCUCAGGAGGGAUAGCGCC 21 186711717 71 3 49 -59.59
cpa-miR390b CGCUAUCCCUCCUGAGUUUC 20 186711717 93 3 52 -68.69
cpa-miR535a UGACAACGAGAGAGAGCACGC 21 186742933 109 3 55 -66.80
cpa-miR854 GAUGAGGAGAAGGAGGUGGAG 21 186819517 171 3 61 -44.43
cpa-miR902 UGGAGGAUCUGGAUAGAAAAC 21 186708861 147 3 58 -50.62
墨西哥青柠 caua-miR162a UCGAUAAACCUCUGCAUCCA 20 188277369 131 3 60 -63.50
Citrus aurantiifolia caua-miR414 UCAUCUUCAUCGUCGUCGUCA 21 188244452 64 5 53 -49.80
caua-miR1222 AUGAAGGAGUUCAAUGGUUUA 21 188365941 54 5 59 -61.80
caua-miR1514 UUCAUUUUCAAGUUAGACAUU 21 188425174 141 3 66 -48.89
caua-miR2093 GUGCAUUAAUUGCAAGAAAU 20 188348563 60 5 65 -48.20
酸橙 caum-miR482a UCUUCCCUACUCCACCCAUGCC 22 188333313 145 3 68 -71.80
Citrus aurantium caum-miR1514 UUCAUUUUGAAAACUGGCAUU 21 188426082 61 3 62 -22.06
caum-miR1535 UUUGUUUGUGGGGAUGUCA 19 188377875 68 5 62 -39.00
caum-miR2093 GUGCAUUAAUUGCAAGAAAU 20 63071179 60 5 65 -47.50
八朔
Citrus hassaku
cha-miR397 AUUGAGUGAAGAGUUGAAGA 20 166988723 75 5 59 -39.62
酸来檬 cla-miR413 AUAGUUUCUUUUGUUCUUUAC 21 188257122 89 3 66 -19.60
Citrus latifolia cla-miR1535 CUUGUUUGUGGCAAUCUCU 19 188285961 84 5 45 -90.00
Citrus limettioides cli-miR166a UCGGACCAGGCUUCAUUCCC 20 188229047 161 3 58 -67.85
cli-miR1533a AUAAUAAAAGUAAUAAUCU 19 188229166 110 5 66 -36.57
cli-miR1533b UUAAUAAAAAUAAAAAUAA 19 188245914 85 5 68 -40.99
6期 宋长年等:32种果树 microRNA的生物信息学预测与分析 873
续表 1
物种
Speecies
新的 miRNA
New miRNA
成熟体序列
Mature sequence
LM/
nt
登录号
Accession
LP/
bp
位置
Location
(A+U)/%
MFEs/
(kcal·mol-1)
Citrus × limonia clim-miR397 AUUGAGUGCAGGGUUGAUUU 20 188245962 88 5 57 -35.34
clim-miR482a UCUUCCCUACUCCACCCAUGCC 22 188220627 145 3 67 -78.60
clim-miR905 AAGGUGCCAUUUCCAGAGACA 21 188223998 126 5 61 -27.79
clim-miR1533 AUAAUAAACAGAAGAAUGA 19 188274463 68 5 32 -29.90
clim-miR2093a GUGCAUUAAUUGAAUGAAAA 20 188236729 136 5 68 -32.84
clim-miR2093b GUGCAUUAAUUGCAAGAAAU 20 188221551 60 5 64 -47.50
Citrus × paradisi cpa-miR171a UAUUGGUGCGGUUCAAUAAGA 21 63106712 88 3 53 -85.10
cpa-miR171b UGAGCCGCGCCAAUAUCACGU| 21 63106712 123 3 52 -85.30
Citrus × paradisi ×
Poncirus trifoliata
cpp-miR156a CUGACAGAAGAGAGUGAGCAC 21 57921753 81 3 53 -68.92
酸橘 Citrus sunki csu-miR482a UCUUCCCUACUCCACCCAUGCC 22 188267348 145 3 67 -62.92
csu-miR1522 UUUAUUGCUGAAAAUGAAGA 20 188358030 57 5 68 -34.26
蜜柑 Citrus unshiu cun-miR159 AUUGGAGUGAAGGGAGCUCCA 21 209932513 187 3 49 -92.00
cun-miR530 UGCAUUUGCACCUGCACCUU 20 2103967 108 3 53 -61.59
柿 Diospyros kaki dka-miR159a UUUGGAUUGAAGGGAGCUCUG 21 179686990 182 3 49 -87.80
dka-miR414 UCAUCUUCAUCGUUAUCUUCA 21 179682357 108 5 65 -31.00
野生草莓 fve-miR156a UGACAGAAGAUAGAGAGCAC 20 89547189 79 3 57 -69.35
Fragaria vesca fve-miR159a UUUGGAUUGAAGGGAGCUCUA 21 89542937 188 3 56 -85.20
fve-miR408a AUGCACUGCCUCUUCCCUGGC 21 89555570 91 3 46 -79.30
fve-miR398 CGUGUUCUCAGGUCGCCCCUG 21 89541205 119 3 45 -61.40
fve-miR858 UUUCGUUGUCUGUUCGACCUG 21 89545399 69 3 60 -46.20
银杏 Ginkgo biloba gbi-miR398 CGUGUUCUCAGGUCACCCCUG 21 158987547 78 3 49 -23.80
Juglans hindsii × jju-miR167a UGAAGCUGCCAGCAUGAUCUAA 22 133868010 108 3 55 -63.60
Juglans regia jju-miR414a UCAUCCUCAUCCUCAUCUUCC 21 186928127 159 5 50 -52.30
jju-miR414b UCAUCUUCCUCGUCAUCUUCA 21 133867659 99 5 57 -31.90
jju-miR482a UCUUCCCUACUCCGCCCAUGCC 22 133860911 98 3 52 -74.90
胡桃 Juglans regia jre-miR167a UGAAGCUGCCAGCAUGAUCUAA 22 52126128 117 3 58 -70.86
jre-miR482a UCUUCCCUACUCCGCCCAUGCC 22 52124935 86 3 50 -79.60
苹果 md-miR156a UGACAGAAGAUAGAGAGCAC 20 91036425 98 3 54 -67.90
Malus× domestica mdm-miR162a UCGAUAAACCUCUGCAUCCA 20 117949350 120 3 51 -69.90
mdm-miR167a UGAAGCUGCCAGCAUGAUCUUA 22 117949347 106 3 55 -74.60
mdm-miR167b UGAAGCUGGCAGCAUGAUCUUA 21 91024156 119 3 51 -59.90
mdm-miR172a AGAAUCUUGAUGAUGCUGCAU 21 91010237 106 3 59 -65.80
mdm-miR172b UGAAUCUUGAUGAUGCCACGC 21 91010237 78 5 58 -57.00
mdm-miR393a UCCAAAGGGAUCGCAUUGAUC 21 48377300 106 5 54 -65.63
mdm-miR394 UUGGCAUUGCGUCCUCCUCC 20 48282832 123 5 54 -57.03
mdm-miR398 UGUGUUCUCAGGUCGCCCCUG 21 91039118 100 3 45 -66.90
mdm-miR399 CUUGCCAAAGGAGAUUUGCCC 21 48406741 75 5 60 -39.09
mdm-miR477a CUCUCCCUCAAGGGCUUCGA 20 48395594 91 3 51 -61.40
mdm-miR482 UCUUCCCAAGCCCGCCCAUUCC 22 48381875 124 3 52 -71.06
mdm-miR828 UCUUGCUCAAAUGAGUGCUACA 22 46606683 59 5 59 -35.50
mdm-miR845 AGGCUCUGAUACCACUUGUUG 21 91040186 51 5 59 -36.10
mdm-miR1535 CUUGUUUGUGACGAAGUCU 19 48939258 105 3 60 -24.92
mdm-miR2101 AUUUAACUCAAAUGUGCAAUGU 22 48257120 108 5 69 -36.60
Malus hybrid rootstock mro-miR414 UCAUCUUCAUCAUCAUCAUCA 21 226745609 81 5 56 -64.96
粉蕉 mag-miR160 UGCCUGGCUCCCUGCAUGCCA 21 197653670 123 3 45 -73.30
Musa ABB Group mag-miR169 AAGCCAAGAACGACAUGCCUG 21 197647843 62 3 48 -18.70
mag-miR477a CUCUCCCUCAAAGGUUUCUC 20 197650283 97 3 56 -59.94
mag-miR477b CUCUCCCUCUAAGGCUAACA 20 197649193 58 5 58 -36.20
mag-miR530a UGCAUUUGCACCUGCACCUA 20 197646639 97 3 46 -66.30
mag-miR530b UGCAUUUGCCGCUGCACCUA 20 197646639 97 5 46 -45.20
mag-miR399a UGCCAAAGGAGAAUUGCCCUG 21 197654832 90 3 44 -48.99
mag-miR528 UGGAAGGGGCAUGCAGAGGAG 21 197656024 115 3 39 -82.14
874 园 艺 学 报 37卷
续表 1
物种
Speecies
新的 miRNA
New miRNA
成熟体序列
Mature sequence
LM/
nt
登录号
Accession
LP/
bp
位置
Location
(A+U)/%
MFEs/
(kcal·mol-1)
mag-miR1026 UGAGAAAGACUCUUGAGGACA 21 197655988 182 5 46 -62.20
mag-miR1448a UUUUCCAAUGCCUCCCAUGC 20 197649108 120 3 44 -74.10
mag-miR1448b CUUUCCAAUACCUCCCAUGC 20 197653592 115 3 44 -58.10
芭蕉 mau-miR477a CUCUCCCUCAAAGGUUUCUC 20 182665826 94 3 56 -59.94
Musa acuminata mau-miR530 UGCAUUUGCACCCGCACCUA 20 182667029 117 3 52 -65.10
mau-miR870 UAAUUUGGUGUUUCUAUGGUC 21 182663837 70 3 70 -44.60
mau-miR902 CAUGAUGCAGUUUCUUCAUCU 21 182665998 83 3 60 -29.34
Musa acuminata
subsp.
burmannicoides
maag-miR156a UGACAGAAGAGAGUGAGCAC 20 146226345 90 3 43 -81.60
野芭蕉 masb-miR1448 CUUUCCAAUACCUCCCAUGC 20 70795811 97 3 47 -67.90
Musa balbisiana mba-miR169a AAGCCAAGAAUGAGUUGCCAA 21 197635633 75 3 56 -76.60
mba-miR169b UAGCCAAGGAGACUGCCCAGU 21 197637388 140 5 45 -72.05
mba-miR169c UAGCCAAGGAUGACUUGCCUG 21 197634790 135 3 46 -89.50
mba-miR1448 UUUUCCAAUGCCUCCCAUGC 20 197639059 120 3 44 -89.61
鳄梨 pam-miR156 UGACAGAAGAGAAGAAGCAA 20 51362098 92 5 62 -41.54
Persea americana pam-miR854 GAUGAGGAGGAGGAGGAGGAG 21 165962684 74 5 58 -43.26
pam-miR1029 UCUCUCUCAUCCAUCCAUAA 20 42646775 77 3 65 -47.60
阿月浑子
Pistacia vera
pve-miR167a UGAAGCUGCCAGCAUGAUCUUA 22 218137397 105 3 52 -64.10
杏 par-miR473 GCUCUCCCUGACGGCUUCAA 20 29954686 119 3 50 -32.30
Prunus armeniaca par-miR482 UCUUUCCUACUCCACCCAUUCC 22 29952510 121 5 55 -69.60
桃 Prunus persica ppe-miR156a UGACAGAAGAAAGAGAGCAC 20 89483681 89 3 51 -69.85
ppe-miR159 AUUGGAUUGAAAGGGGGUCUU 21 89496879 85 5 64 -51.90
ppe-miR171a UGAUUGAGCCGUGCCAAUAUC 21 51919746 117 3 62 -67.90
ppe-miR171b UGAUUGAGCCACGCCAACAUC 21 51919746 107 5 62 -62.80
ppe-miR399a AUGCCAAAGGAGAUUUGCUC 20 84627805 118 3 55 -57.50
ppe-miR414a UCAUCCUCAUCGUCUUCGUCA 21 89486181 136 5 42 -34.62
ppe-miR414b UCAUCUUCCUCAUAAUCCUCA 21 89479995 152 5 59 -33.40
ppe-miR902la AGAAGGAUCUGCAAGAUAUGG 21 84630956 113 5 56 -40.60
ppe-miR902lb AGAAGGAUCUGCAAGAUAUGG 21 84569402 85 5 56 -38.10
ppe-miR408a AUGCACUGCCUCUUCCCUGGC 21 59930853 114 3 49 -68.00
沙地葡萄 vsh-miR172a GGAAUCUUGAUGAUGCUGCAG 21 51575591 148 3 52 -69.60
Vitis shuttleworthii vsh-miR172b UGAAUCUUGAUGAUGCUCCAU 21 51575591 117 3 53 -62.52
vsh-miR394 UUGGCAUUCUGUCCACCUCC 20 51581623 102 3 53 -61.50
注:LM:成熟体长度;LP:前体长度;MFEs:最低自由能。
Note:LM:Length of mature miRNAs;LP:Length of precursor;MFEs:Minimal folding free energies.
2.1.2 预测的果树miRNAs
筛选得到的116个miRNAs成员代表了45个家族(表2),但这116个成员并不是均匀地分布在45
个家族里。由表1和表2可以看出,miR414家族最多,共在9种果树中预测到;miR482次之,有7个成
员;miR156有6个成员;miR159,miR167,miR477和miR530各有5个成员等。进一步分析后发现,
其中有7个保守的miRNA家族中的miRNA如miR156等预测到个数在5以上,miR162等20个miRNA家
族的miRNA个数在2 ~ 4,miR160等18个miRNA家族的miRNA仅有一个。不同树种中发现的miRNA
数量也存在明显差异(表1,表2)。其中,发现miRNA数量最多为柑橘类,在温州蜜柑、酸橙、酸
橘等十种柑橘中共发现28个,苹果次之,发现16个。在银杏(Ginkgo biloba)和阿月浑子(Pistacia
vera)等树种中仅预测到1个miRNA。
6期 宋长年等:32种果树 microRNA的生物信息学预测与分析 875
表 2 从32种果树中新发现不同家族的miRNA的个数及其功能
Table 2 The newly identified miRNAs with the different number and family size in 32 different fruit trees and function
miRNA
数量
Number
靶基因
Target gene
靶蛋白
Targeted protein
靶基因功能
Target function
miR156 6 TC50229,
TC41161
Squamosa 启动子结合蛋白
Squamosa promoter binding protein-like
转录因子
Transcription factor(TF)
mirR159 5 CO866470 MYB转录因子MYBTranscription factor 转录因子 TF
miR160 1 CB911970 生长素反应因子 Auxin Response Factor 转录因子 TF
miR162 2 TC48511 Dipeptidyl peptidase IV-like protein 细胞生长 Cell growth
miR166 1 AAX19054 HD-Zip 蛋白 HD-Zip protein 转录因子 TF
miR167 5 TC43080 生长素反应因子 Auxin Response Factor 转录因子 TF
miR169 4 CN856230 异戊烯基转移酶 CBFB-NFYA 转录因子 TF
miR171 4 DT570097 GRAS转录因子 GRAS transcription factor 转录因子 TF
miR172 4 TC42225 APETALA2类似蛋白 APETALA2-like protein 转录因子 TF
miR390 2 TC44826 富含亮氨酸重复蛋白 Leucine-rich repeat protein 信号转导
Signal-transduction(ST)
TC50736 受体类丝氨酸/苏氨酸激酶
Receptor-like serine/threonine kinase
信号转导 ST
mirR393 1 TC39419 运输抑制剂应答 1Transport inhibitor response 1 转录因子 TF
miR394 2 CN863644 F-box 蛋白 F-box protein 转录因子 TF
miR397 2 NP187533 铜离子结合蛋白 IRX12 copper ion binding/oxidoreductase 代谢Metabolism
miR398 3 TC45588 超氧化物歧化酶 Superoxide dismutase 逆境诱导 Stress response(SR)
miR399 3 TC38152 E2类泛素结合蛋白 E2 ubiquitin-conjugating protein 代谢Metabolism
miR408 2 TC46451 环 H2指蛋白 RHC1a RING-H2 finger protein RHC1a 信号转导 ST
miR413 1 - - -
miR414 9 - DNA结合转录因子 DNA binding / transcription factor 转录因子 TF
DY006576 转录因子 B3 家族蛋白 Transcriptional factor B3 family
protein
转录因子 TF
CN830845,
CX192090
类细胞周期蛋白 F-box;半乳糖氧化酶
Cyclin-like F-box;Serine/threonine protein phosphatase
转录因子 TF
CX278819 NAC类蛋白 NAC-alpha-like protein 转录因子 TF
CD828177 泛素结合/激活酶
Ubiquitin conjugating/activating enzyme
转录因子 TF
CD822227 高迁移率族蛋白 High mobility group B1 (HMG B1) 转录因子 TF
CN736439 锌铁结合转录因子 Transcription factor/zinc ion binding 转录因子 TF
DU108472 RNA结合/核苷酸结合 RNA binding/nucleic acid binding 转录因子 TF
AF06977 钙结合蛋白 Calcium-binding protein 信号转导 ST
AF105139 抗病 1A同源基因 Disease resistance gene homolog 1A 信号转导 ST
BQ704202 DDR48逆境蛋白 Stress protein DDR48 信号转导 ST
CN732888 叶绿体羧基转移酶 Chloroplast carboxyl transferase 代谢Metabolism
CD821476 假定 AAA级型 ATP酶 Putative AAA-type ATPase 代谢Metabolism
DU108770 膜蛋白分泌载体 Secretory carrier membrane protein 代谢Metabolism
CX188742 多聚半乳糖;果胶酶 Polygalacturonase;Pectinase 代谢Metabolism
CD822903 离子通道 Ion channel 转运 Transport
miR473 1 GSVIVT00035l1501 SCARECROW-like(SCL) 转录因子 TF
miR477 5 GSVIVT0001047600l SCARECROW-like(SCL) 转录因子 TF
miR482 7 AJ511991 bHLH转录因子 bHLH transcription factor 转录因子 TF
DU100750 假定逆转录聚合酶蛋白
Putative retroelement pol polyprotein
代谢Metabolism
876 园 艺 学 报 37卷
续表 2
miRNA
数量
Number
靶基因
Target gene
靶蛋白
Targeted protein
靶基因功能
Target function
DU107252 非重复序列逆转录酶类
Non-LTR retroelement reverse transcriptase-like
代谢Metabolism
DY012593 调控 G蛋白信号 Regulatory G-protein signaling 信号转导 ST
CD836846 热激蛋白结合 Heat shock protein binding 逆境诱导 SR
CD824280 过氧化物酶 Peroxidase 逆境诱导 SR
CD815836 未折叠蛋白结合元件
Unfolded protein binding components
代谢Metabolism
miR528 1 - - -
miR530 5 - - -
miR535 2 - - -
miR828 1 CN490819 MYB蛋白MYB protein 转录因子 TF
miR845 1 SVIVT00022861001 信号肽酶亚基蛋白 Signal peptidase subunit protein 信号转导 ST
miR854 2 - - -
miR858 1 - - -
miR870 1 - - -
miR902 3 - - -
miR905 1 - - -
miR948 2 - - -
miR1026 1 - - -
miR1028 1 - - -
miR1029 1 - - -
miR1222 1 - - -
miR1448 4 - - -
miR1514 2 - - -
miR1522 1 - - -
miR1533 3 - - -
miR1535 4 - - -
miR2093 4 - - -
miR2101 1 - - -
miR2104 1 - - -
miR9021 2 - - -
注:“-”表示未知基因、蛋白和功能。
Note:“-”Unknown gene,protein and function.
2.2 果树 miRNA的特性分析
2.2.1 果树 miRNA的多样性
通常情况下,动物细胞中的 miRNA前体(premiRNA)长度在 70 ~ 80个碱基之间,而植物中
的 miRNA 前体在结构和长度上则存在多样性。
从表 1可以看出,果树中 miRNA前体的长度在 51 ~ 188个碱基之间,表现出多样性高的特点。
不同家族以及同一家族不同 miRNA成员前体的长度也不相同,表明这些 miRNA的形成以及在基因
表达的调控中所起到的作用也不尽相同(Zhang et al.,2006b)。
果树 miRNA 的多样性还表现为其成熟序列在前体中所处位置上的多样性(表 2),其中
ach-miR414,ach-miR530,ach-miR1535;ade-miR414,ade-miR477,ade-miR535等 49条都处在它
6期 宋长年等:32种果树 microRNA的生物信息学预测与分析 877
们前体的 5′ 端,而更多的则定位于其前体的 3′ 端上。
2.2.2 果树miRNA序列的保守性
由于各miRNA家族在这些果树中预测到的数量不同,针对在5种以上果树中同时能够预测到的6
个miRNAs进行序列的保守性进行分析。结果(图 1)表明,不同果树间相同家族的miRNA的序列
存在差异,并且以3′末端序列变化更为明显,保守性低。除了miR159家族中的cun-miR159和
ppe-miR159,以及miR477家族中的ade-miR477a,其余所有miRNA的5′ 末端的前4个碱基在各自的家
族中都完全相同,表现出了很高的保守性。在miRNA碱基的变化中,转换与颠换的情况都存在,而
且出现一定数量的3个碱基变换的情况,如miRNA414的7个碱基变换位点中有5个是三碱基的变换。
从这6个miRNA家族的碱基序列情况看,miRNA167和miRNA156的保守程度最高,分别出现2个与3
个碱基位点的碱基变换,是高保守miRNA家族,而同样被报道为植物保守miRNA的miRNA159,出
现9个碱基位点的变化,而且存在3碱基间变化的情况,应该看作是保守性低的植物miRNA家族。值
得注意的是,虽然miRNA482的序列上有6个位点上的碱基变化,但是都集中于md-miR482、
par-miR482与其它几个同源miRNA之间的差异,因此miRNA482是果树中保守性很高的一个miRNA
家族。
从这6个miRNA家族序列的分析情况看,植物中miRNA的保守性是相对的,不同miRNA家族的
miRNA碱基序列存在不同水平的变异,已经被报道为保守性miRNA的家族的miRNA碱基序列的一致
性相对较高。
图 1 果树中6个miRNA家族的成熟体序列的多序列比对
Fig. 1 Alignments of 6 previously known fruit tree mature miRNAs
2.3 果树 miRNA靶基因的预测和主要功能分析
用本研究中新预测得到的果树miRNA序列与其mRNA序列进行BLAST,筛选出与miRNA互补的
序列,其主要流程和标准参照Zhang等(2006a)和Song 等(2010)。在去除了不符合标准以及重
复序列之后,最后得到了46个miRNA的靶基因序列(表2)。
这些靶基因按其功能可分为 4 类:(1)编码转录因子;(2)编码与植物代谢有关的酶蛋白;
878 园 艺 学 报 37卷
(3)编码与信号转导和胁迫有关的蛋白质;(4)编码未知功能及功能不清楚的蛋白质序列(未列
出)。在预测得到的靶基因中有23条序列编码转录因子,这些转录因子调控植物的生长、发育以及
其他生理代谢过程。
SQUA启动子结合蛋白 (SBPs)是植物特有的转录因子,它最初在金鱼草中发现,能够与花分
生组织基因SQUAMOSA的启动子结合(Qu & Zhu,2006)。在拟南芥中,受miRNA156/157 调控的
靶基因中有超过10个基因编码该蛋白(Qu & Zhu,2006)。果树miRNA156的靶标中也有两个靶基
因编码SBPs,表明在果树中SQUAMOSA基因也可能被miRNA156 所调控。果树miRNA靶基因编码
的产物以及一些转录因子及重要代谢酶类等蛋白,它们调控着植物的生长发育,信号转导及各种胁
迫反应(Zhang et al.,2006b;Song et al.,2009),由于文章篇幅所限其它miRNAs参与植物的生长
发育,请参看Chen(2005)以及Carthew和Sontheimer(2009)所描述。
3 讨论
miRNA在生物的不同部位和不同发育阶段对生物体的转录后基因调控起着非常重要的作用。
Lewis等(2005)研究发现人类有1/3的基因由miRNA 所调控。植物中miRNA及其对植物生长发育
的影响为植物生物学的研究提供了新的研究思路,而在重要经济植物上开展miRNA的研究,为从表
观遗传学方面解释更多的重要生命现象,达到有效调控与利用重要功能基因的目的,具有重要意
义。
近一年以来,果树miRNA的克隆与预测研究也受到了重视,先后有关于柑橘、葡萄、苹果以及
草莓miRNA的研究报道(Gleave et al.,2008;Carra et al.,2009;李贺 等,2009;Song et al.,2009,
2010)。基于利用果树基因组以及ESTs序列的生物信息学预测miRNA的研究已经备受重视(蔡斌 等,
2008;Sunkar & Jagadeeswaran,2008)。作者根据前人在模式植物上的研究策略与方法进行了柑橘
miRNA的生物信息学预测,通过Northern杂交验证了该研究结果的可靠性(Song et al.,2009,2010)。
为进一步了解更多果树miRNA的特征以及促进果树表观遗传的研究,本研究中利用相同的策略对32
种果树的成熟miRNAs进行了较全面的预测。由于受不同miRNAs的表达时空性、ESTs测序所用cDNA
文库的组织来源、ESTs数量等因素的影响,不同果树中预测到的miRNA的数量以及家族类型存在差
异。
尽管植物界的miRNA具有高度保守性,但是不同miRNA家族的保守性差异很大。本研究中,从
6个miRNA家族的保守性来看,miRNA序列的保守性是相对的,存在明显的碱基序列差异。已经报
道为植物中保守的miRNA也可能在果树间出现较高的变异,如果树的miRNA159家族是保守性较低
的一个家族。反之,先前没有发现为高保守的miRNA在果树中呈现很高的保守性,如miRNA482家
族就是这种类型。预测miRNA及其靶基因仅是相关研究的开始,关于不同miRNA家族的表达特征以
及其调控靶基因的功能分析等有待进一步研究。
References
Ambros V,Bartel B,Bartel D P,Burge C B,Carrington J C,Chen X,Dreyfuss G,Eddy S R,Griffiths-Jones S,Marshall M,Matzke M,
Ruvkun G,Tuschl T. 2003. A uniform system for microRNA annotation. RNA,9:277–279.
Berezikov E,Cuppen E,Plasterk R H. 2006. Approaches to microRNA discovery. Nature Genetics,38:S2–S7.
Cai Bin,Li Cheng-hui,Peng Ri-he,Xiong Ai-sheng,Gao Feng,Yao Quan-hong,Zhang Zhen. 2008. Computational identification of novel
microRNAs in grape. Acta Agriculturae Boreali-Sinica,23:213–216.(in Chinese)
蔡 斌,李成慧,彭日荷,熊爱生,高 峰,姚泉洪,章 镇. 2008. 葡萄microRNA的计算识别. 华北农学报,23:213–216.
6期 宋长年等:32种果树 microRNA的生物信息学预测与分析 879
Carra A,Mica E,Gambino G,Pindo M,Moser C,Enrico M P,Schubert A. 2009. Cloning and characterization of small non-coding RNAs from
grape. Plant Journal,59:750–763.
Carthew R W,Sontheimer E J. 2009. Origins and mechanisms of miRNAs and siRNAs. Cell,136(4):642–655.
Chen X. 2005. MicroRNA biogenesis and function in plants. FEBS Lett,579(26):5923–5931.
Gleave A P,Ampomah-Dwamena C,Berthold S,Dejnoprat S,Karunairetnam S,Nain B,Wang Y Y,Crowhurst R N,MacDiarmid R M. 2008.
Identification and characterization of primary microRNAs from apple (Malus domestica cv. Royal Gala)expressed sequence tags. Tree Genet
Genomes,4:343–358.
Griffiths-Jones S,Saini H K,Dongen S V,Enrigh A J. 2008. miRBase:Tools for microRNA genomics. Nucleic Acids Research,D154 – D158.
Jones-Rhoades M W,Bartel D P. 2004. Computational identification of plant microRNAs and their targets,including a stress-induced miRNA. Mol
Cell,14(6):787–799.
Lewis B P,Burgf C B,Bartel D P. 2005. Conserved seed pairing,often flanked by adenosines,indicates that thousands of human genes are
microRNA targets. Cell,120:15–20.
Li He,Zhang Zhi-hong,Gao Xiu-yan,Liu Yue-xue,Huang Fei-fei. 2009. Identification of microRNA in strawberry by RT-PCR. Scientia Agricultra
Sinica,42(4):1465–1472.(in Chinese)
李 贺,张志宏,高秀岩,刘月学,黄飞飞. 2009. 草莓microRNA的RT-PCR鉴定. 中国农业科学,42(4):1465–1472.
Mathews D H,Sabina J,Zuker M,Turner D H. 1999. Expanded sequence dependence of thermodynamic parameters improves prediction of RNA
secondary structure. Journal of Molecular Biology,288:911–940.
Qiu C X,Xie F L,Zhu Y Y,Guo K,Huang S Q,Nie L,Yang Z M. 2007. Computational identification of microRNAs and their targets in Gossypium
hirsutum expressed sequence tags. Gene,395:49–61
Qu L J,Zhu Y X. 2006. Transcription factor families in Arabidopsis:Major progress and outstanding issues for future research. Curr Opin Plant Biol,
9:544–549
Reinhart B J,Weinstein E G,Rhoades M W,Bartel B,Bartel D P. 2002. MicroRNAs in plants. Gene & Development,16:1616–1626.
Song C,Fang J,Li X,Liu H,Chao T C. 2009. Identification and characterization of 27 conserved microRNAs in citrus. Planta,230:671–685.
Song C,Jia Q,Fang J,Li F,Wang C,Zhang Z. 2010. Computational identification of citrus microRNAs and target analysis in citrus expressed
sequence tags. Plant Biology,doi:10.1111/j.1438-8677.2009.00300.x.
Sunkar R,Jagadeeswaran G. 2008. In silico identification of conserved microRNAs in large number of diverse plant species. BMC Plant Biology,8:
37.
Yin Z,Li C,Han X,Shen F. 2008. Identification of conserved microRNAs and their target genes in tomato(Lycopersicon esculentum). Gene,
414:60–66.
Zhang B H,Pan X P,Anderson T A. 2006a. Identification of 188 conserved maize microRNAs and their targets. FEBS Lett,580:3753–3762.
Zhang B H,Pan X,Cannon C H,Cobb G P,Anderson T A. 2006b. Conservation and divergence of plant microRNA genes. Plant Journal,46:
243–259.
Zhang B H,Pan X P,Wang Q L,Cobb G P,Anderson T A. 2005. Identification and characterization of new plant microRNAs using EST analysis.
Cell Research,15:336–360.
Zhang B H,Pan X P,Stellwag E J. 2008. Identification of soybean microRNAs and their targets. Planta,229:161–182.
Zhang B H,Wang Q L,Wang K B,Pan X P,Liu F,Guo T L,Cobb G P,Anderson T A. 2007. Identification of cotton microRNAs and their targets.
Gene,397:26–37.
Zhang J,Zeng R,Chen,J,Liu X,Liao Q. 2008. Identification of conserved microRNAs and their targets from Solanum lycopersicum Mill. Gene,
423:1–7.
Zuker M. 2003. Mfold web server for nucleic acid folding and hybridization prediction. Nucleic Acids Research,31:3406–3415.