全 文 :麻风树 EST-SSR的筛选和分析
林元震 1 ,郭海 2 ,刘纯鑫 1 ,黄少伟1 ,彭昌操 1 ,陈晓阳 1*
(1.华南农业大学热带亚热带林业生物技术实验室 , 广东广州 510642;2.水利部水土保持植物中心 ,北京 100038)
摘要 [目的 ]开发麻风树 EST-SSR标记 ,为遗传多样性分析、种质资源鉴定等研究提供理论依据。 [方法]以麻风树EST序列为材料 ,
运用CAP3软件对EST序列进行组装后 ,再运用SSRIT软件进行EST-SSR标记的预测。 [结果]麻风树 13 193条EST序列经组装后获得
6 281个UniGene,其中 1 367个 Contig, 4 914个Singleton。利用SSRIT在线软件对UniGene分析得到 206条EST-SSR。拼接后的Unigene
含有SSR位点的频率为 3.28%,麻风树EST-SSR的发生频率为 1/29kb。这些 EST重复基元中 ,三核苷酸重复和二核苷酸重复最多 ,分
别占 24.76%和 21.84%;五 、六核苷酸重复次之 ,分别占 16.50%、20.39%;单、四核苷酸的重复基序最少 ,分别占 9.71%和 6.80%。在所
有的核苷酸重复基序中 ,二核苷酸重复序列AG所占比例最高 ,约占 12.62%;三核苷酸重复序列中 ,所占比例最高的是 AAT和 AAG,各
占 6.80%、6.31%。 [结论]上述结果对于开展麻风树分子辅助育种研究具有一定的指导意义。
关键词 麻风树;EST-SSR
中图分类号 S718.46 文献标识码 A 文章编号 0517-6611(2010)11-05551-02
ScreeningandanalysisofEST-SSRinJatrophacurcas
LINYuan-zhenetal (LaboratoryforBiotechnologyinTropical&subtropicalForestScience, SouthChinaAgriculturalUniversity)
Abstract [ Objection] TheaimwastodevelopEST-SSRofJatrophacurcasandprovidtheoreticbasisforgeneticdiversityanalysisandgerm-
plasmresourceidentificationofJ.curcas.[ Method] ESTsequencesofJ.curcaswereassembledwithsoftwareCAP3andpredictedforEST-SSR
withsoftwareSSRIT.[ Result] 13 193ESTswereasembledintoatotalof6 281non-redundantUnigenesincluding1 367Contigsand4 914Sin-
gletons.Thesenon-redundantUnigeneswereusdedforsearchingSSRthroughthesoftwareSSRITandatotalof206SSRlociwerefound, withthe
frequencyof3.28%inUnigeneandl/29kbofEST-SSRoccurrencetrequenoywereidentified.Trinueleotidesanddinueleotideswereobservedat
thehighestfrequencies, whichaccountedfor24.76%and21.84%, respectively.Andthenpentanueleotides, hexanueleotidesfolowed,which
accountedfor16.50%and20.39%, respectively.whilemononueleotideandtetranueleotiedswerethelowest, whichaceocuntedfor9.71%and
6.80%, respectively.AG(12.62%)wasthemostfrequentrepeatinalTrinucleotiderepeatmotifs, AATandAAG(6.80%and6.31%, re-
spectively)wasthemostfrequeneemotifsintrinucleotides.[ Conclusion] Theseobtainedresultsandconclusionsmightprovideimportantinforma-
tionforthemolecularassistedselectioninJ.curcas.
Keywords Jatrophacurcasheatstress, cDNAlibrary, EST-SSR
基金项目 国家自然科学基金项目资助课题(30271093、 30771759);华
南农业大学校长基金(2009X014)。
作者简介 林元震(1979-),男 ,福建仙游人 ,博士 ,讲师 ,从事林木抗
逆分子遗传与生物信息学研究。
收稿日期 2010-01-18
随着我国经济社会的快速发展 ,能源需求的巨大缺口已
成为我国经济社会可持续发展的 “瓶颈 ”。生物质能源是 21
世纪农业科技革命的新亮点 ,也是当今能源开发的国际性热
点 。因此 ,加快生物质能源发展 ,缓解资源与环境的压力 ,是
当前我国政府亟待解决的重大问题。其中 ,开发林业生物质
资源 ,形成新的能源产业 ,是解决我国能源问题的一条重要
途径。
麻风树(Jatrophacurcas)又名小桐子 、珊瑚树 、青桐木 、假
花生 、臭油桐 ,为大戟科麻疯树属植物 ,是世界上最主要的
“生物柴油 ”树种 ,属于环境友好型的可再生的资源 ,其能源
效益在生物质能源利用地位中举足轻重 [ 1] 。麻疯树一般高 2
~5 m,属于灌木或小乔木 ,用途广泛 ,其种子可以入药 ,有清
热解毒 、消肿散瘀等作用。近年来发现麻疯树的种子可以用
来提炼生物柴油 ,成为一种新的能源植物 ,具有广阔的开发
利用前景。在当前能源短缺的情况下 ,如何尽快筛选 、培育
出种植范围广 、适应性强 、产油量高的优良种源成为育种工
作者的首要任务。
了解生物个体间详尽的遗传关系特别是 DNA序列差
异 ,有利于推动种质创新研究。 DNA标记是评价材料间遗传
差异的好方法 。简单序列重复 (simplesequencerepeat,
SSR),也称微卫星(microsatelite),是指以 1 ~ 6个核苷酸为
单位在基因组中多次串联重复的 DNA序列 [ 2] 。SSR标记与
其他分子标记技术相比 ,具有易检测 、共显性遗传 、重复性
好 、数量丰富 、多态性高以及遍布整个基因组等优点 ,因此在
植物遗传研究的众多方面受到重视 [ 3] 。以往 SSR标记的开
发 ,多采用传统方法 ,不仅费时费力 ,而且效率低。随着国际
公共数据库中的 EST序列呈指数增长趋势的发展 ,从表达序
列标签(ExpressedsequenceTaqs, ESTs)中开发 SSR标记逐渐
成为新标记开发的焦点。迄今 ,人们已在葡萄 、甘蔗 、小麦 、
黑麦 、大麦 、杏 、火炬松 、桉树 、柑橘和橡胶树等 20多种植物
中开发 EST-SSR标记 ,并广泛应用于遗传多样性分析 、遗传
连锁图谱构建 、比较作图以及种质资源鉴定等研究中 [ 3] 。
目前 ,国内外对麻风树的研究主要集中在常规育种与一
些分子标记方面 [ 4-5] ,关于麻风树 EST-SSRS标记方面的报
道还比较少 ,尤其是 EST-SSR标记的预测与开发 。为此 ,笔
者以麻风树 EST序列为材料 ,进行聚类 、拼接等处理和 EST-
SSR标记的预测分析 ,为今后开发 EST-SSR标记及其运用于
麻风树分子辅助育种的研究奠定基础。
1 材料与方法
1.1 材料 麻风树所有原始 ESTs序列均来自 NCBI数据库
(htp//:www.ncbi.nlm.nil.gov/sites/entrez)。
1.2 方法
1.2.1 ESTs序列组装。利用 CAP3软件(htp://bioweb.
pasteur.fr/seqanal/interfaces/cap3.html)对 EST序列进行组
装 [ 6] 。CAP3的参数设置为默认值 ,其中 ,重叠一致百分比域
值(Overlappercentidentitycutof)N>80,重叠长度域值(O-
verlaplengthcutof)N>40,经过组装就可以得到相应的 Uni-
genes(Contig和 Singleton)。
安徽农业科学 , JournalofAnhuiAgri.Sci.2010, 38(11):5551-5552 责任编辑 马树梅 责任校对 况玲玲
1.2.2 EST-SSR位点的搜索 。利用 SSRIT(htp://www.
gramene.org/db/searches/srtool)对 Unigenes搜寻 SSR位
点 [ 8] 。搜索标准为:重复单位长度为 1、2、3、4、5和 6bp,最少
重复次数分别为 18、7、5、4和 3次 。得到 SSR位点后进行统
计分析。
2 结果与分析
2.1 ESTs的聚类分析 利用 CAP3软件对麻风树 13 193
条 EST序列进行组装。组装后产生了 6 281个 Unigene,其中
包括 1 367个 Contig和 4 914个 Singleton。由 SET的冗余率
公式总序列数量 -总 Unigene数量总序列数量 ×100%,计算得到麻风树
EST的冗余率为 51.40%。麻风树 Unigene总的覆盖长度约
为 6.0Mb,平均长度为 955 bp。
2.2 EST-SSR的分布 、频率和特点
2.2.1 EST-SRR的分布和频率 。在麻风树 Unigene上共搜
寻到 206个 SSR位点 ,表现为 86种不同的重复类型。这些
SSR位点分布在 203个 Unigene上 ,其中 3个 Unigene含有 2
个 SSR位点。拼接后的 Unigene和原始 EST含有 SSR位点
的频率分别为 3.28%和 1.56%。就 Unigene总长度 6.0 Mb
而言 ,麻风树 EST-SSR的发生频率为 1/29kb。
2.2.2 EST-SRR重复基序的特点。
(1)长度特点。在麻风树 EST-SSR中 ,三核苷酸长度的
重复基序是最多的 ,有 51个 ,占整个 SSR位点总数的
24.76%;其次是二核苷酸重复基序 ,有 45个 ,占整个 SSR位
点总数的 21.84%;再者是五核苷酸和六核苷酸重复基序 ,分
别占整个 SSR位点总数的 16.50%(34个)和 20.39%(42
个);单 、四核苷酸重复基序占整个 SSR位点总数的比例较
小 ,分别为 9.71%(20个)和 6.80%(14个)(图 1)。
图 1 火炬松EST-SSR重复基序长度的分布
Fig.1 ThemotiflengthdistributionofEST-SSRofTaeda
(2)类型特点。在所有的核苷酸重复基序中 ,二核苷酸
和三核苷酸重复基序类型出现次数的分布并不均匀(图 2)。
对于二核苷酸而言 ,出现次数最多的基序类型是 AG(26
次),占火炬松 EST-SSR总数的 12.62%;其次是 AT基序类
型 ,占总数的 7.28%。对于三核苷酸重复基序来说 ,出现次
数最多的基序类型是 AAT和 AAG,各占总数的 6.80%和
6.31%。
3 结论与讨论
EST序列开发的 EST-SSR标记与传统的基因组 SSR标
记相比有很多优点。如:EST-SSR标记在物种间具有高通用
性 ,通常代表某种基因功能 ,开发过程简单 、成本低 ,还可反
映出转录区的差异 。此外 ,随着植物基因组学与功能基因组
学的不断发展和深入研究 , NCBI等公共数据库中 EST的数
量也与日俱增。因此 ,从大量 EST序列中发掘 SSR并应用于
植物遗传研究 ,已成为近些年植物研究的热点之一。
图 2 火炬松 EST-SSR重复基序类型的分布
Fig.2 ThemotiftypedistributionofEST-SSRofTaeda
据报道 ,虽然 2%以上的植物 EST序列中均含有 SSR,但
不同植物 SSR分布的频率差异很大。该研究在 2.08%的火
炬松 EST中搜索到 206个 SSR,平均分布频率是 1/29 kb,明
显低于小麦 、番茄 、棉花 、拟南芥和杨树等植物 [ 8] 。不同植物
EST-SSR的分布频率差异 ,可能与不同物种的基因组大小 、
重复 DNA序列所占的比例以及基因组中转录部分的比例 、
低拷贝序列出现的频率有关 [ 9] 。麻风树 EST-SSR以二 、三核
苷酸重复为主 , 2者含量差异不大 ,与油菜和近缘白菜相一
致 ,但有别于其他大多数植物的 EST-SSR[ 8] 。麻风树 EST-
SSR中二核苷酸重复基序以 AG、AT重复为主 ,三核苷酸重
复基序以 AAT、AAG重复为主 ,与已报道的多种植物如大
豆 、拟南芥 、茶树一致 [ 8] ,进一步验证了 Gao[ 10]等认为在双子
叶植物中 AAG重复丰度很高的推测。
参考文献
[ 1] 欧文军 ,王文泉 ,李开绵.能源植物小桐子及其发展战略探讨 [ J].中国农学通报, 2008, 24(9):496-499.
[ 2] AKKAYAM, BHAGWATAA, CREGANB.Lengthpolymorphismsofsim-
plerepeatDNAinsoybean[J].Genet, 1992, 132:1131-1139.
[ 3] 林元震 ,郭海,黄少伟,等.EST-SSR标记在木本植物中的开发和应用
[ J].植物生理学通讯 , 2009, 45(12):1-5.
[ 4] 杨清,彭代平,段柱标,等.小桐子传粉生物学研究 [ J].华南农业大学
学报, 2007, 28(3):62-66.
[ 5] 欧文军 ,王文泉,李开绵.120份小桐子种质的分子遗传多样性分析
[ J].热带作物学报, 2009, 30(3):284-292.[ 6] HUANGX, MADANA.CAP3:ADNASequenceAssemblyProgram[ J].
GenomeResearch, 1999, 9:868-877.
[ 7] TEMNYKHS, DECLERCKG, LUKASHOVAA, etal.Computationaland
experimentalanalysisofmicrosatelitesinrice(OryzasativaL.):frequen-
cy, lengthvariation, transposonassociations, andgeneticmarkerpotential
[J].GenomeResearch, 2001, 11:1441-1452.
[ 8] 李永强 ,李宏伟,高丽锋 ,等.基于表达序列标签的微卫星标记(EST-
SSRs)研究进展 [ J].植物遗传资源学报 , 2004, 5(1):91-95.
[ 9] MORGANTEM,HANAFEYM,POWELLW.Microsatellitesareprefertialy
associatedwithnonrepetitiveDNAinplantgenomes[ J].Natgenet, 2000,
30:194-200.
[ 10] GAOLF, TANGJF, LIHW, etal.Analysisofmicrosatelitesinmajor
cropsassessedbycomputationalandexperimentalapproaches[ J].Mol
Breed, 2003, 12:245-261.
5552 安徽农业科学 2010年