免费文献传递   相关文献

Analysis of SSR information in EST resource of saffron crocus(Crocus sativus)

番红花EST资源的SSR信息分析



全 文 :广 西 植 物 Guihaia 31(1):43— 46 2011年 1月
DOI:10.3969/j.issn.1000—3142。2011.01.010
番红花 EST资源的 SSR信息分析
陈国庆
(湖北师范学院 生命科学学院,湖北 黄石 435002)
摘 要 :从 NCBI公共数据库下载得到 6745条番红花 EST,通过前处理得到全长为 612.01 kb的无冗余 EST
1431条 。在这些序列中搜索出 108个 SSR,分布于 103条 EST中,出现频率为 7.55 。这些 EST—SSR的平
均分布距离是 5.67 kb。二核苷酸重复和三核 苷酸重复是 番红花主要的重复类 型,分别 占总 EST—SSR的
30.56%和 37.96 。AG/CT和 AAG/CTT是二 、三核苷酸重复 中的优势基元 ,分别 占二 、三核苷酸重复的
66.67 和 29.27 。本研究为番红花 EST-SSR标记的建立和进一步应用奠定了基础。
关键词:番红花;药用植物 ;EST;EST-SSR;微卫星
中图分类号:Q75 文献标识码 :A 文章编号:1000—3142(2011)01-0043-04
Analysis 0f SSR information in EST res0lJ.ce
n n n , 1 . ● \
0t Sat tI.0n Cr0CUS L DC . ttVUS
CHEN Gu0-Qing
(College 0_厂 fe Science,Hubei Normal University,Huangshi 435002,China)
Abstract:6745 ESTs of saffron crocus in the public database of NCB1 were downloaded and analysed,resulting in
1431 non-redundant ESTs with total length about 612.01 kb.A total of 108 SSRs distrihuted in 103 ESTs were de—
tected,accouting for 7.55% of the non—redundant ESTs.The average distribution distance of these EST-SSRs was a—
bout 5.67 kb.Dinucleotide and trinucleotide repeats were the main types in Crocus sativus,accouting for 30.56% and
37.96% of all the SSRs,respectively.AG/CT and AAG/CTT are the most frequent motifs,accounting for 66.67V0
and 29.27 in dinucleotide and trinucleotide repeats,respectively.The present study provides a base for the develop—
ment and further applification of EST-SSR markers in saffron crocus.
Key words:saffron crocus;medicinal plants;EST;EST-SSR;microsatelite
简 单 序 列 重 复 (Simple Sequence Repeats,
SSRs),又叫微 卫星 (Microsatelite)或短 串联重 复
(Short Tandem Repeats),通常是指由 l~6个碱基
组成的核苷酸重复基元。SSRs广泛分布于真核生
物基因组中,具有共显性表达、多态性高等优点,因
而得到 了越 来越 多 的应 用 (Powel等 ,1996;Toth
等 ,2000)。然而 ,SSR标记 的开发需 时长、花费高 ,
大大限制了该分子标记的使用;即使采用 SSR富集
方法可以提高产 出、减低成本 ,仍然需要投入大量的
人力和财力 (Kumpatla等,2004)。近年来,随着功
能基因组学 的发展 ,表 达序 列标 签 (expressed se—
quence tags,ESTs)已成 为开发新型分子标记 的重
要资源。EST—SSR的开发建立在生物信息学方法
的基础上,不但省肘,而且大大降低成本。相对于传
统的基因组 SSR(genomic SSR),基于 EST的微卫
星标记(EST—SSR)具有独特的优越性:第一,序列
保守性高,通用性强,能在近缘属种间获得较好扩
增;第二,由于其本身来 自基因表达序列,可能与功
收稿日期:2010—04-19 修回日期 :2010—10—29
基金项 目:国家自然科学基金(30900157);湖北省教育厅青年项目(Q20082201);湖北师范学院人才引进项 目(2007F13)[Supported by the National
Natural Science Foundation of China(3O900157);the Youth Foundation of Hubei Educational Committee(Q20082201);the Talent Introduction Funds of
Hubei Normal university(2O07F13)]
作者简介:陈国庆(1979一),女 ,河北邯郸人,博士 ,研究方向为分子生态学 ,(E—mail)gqchenl001@yahoo.corn.cn。
44 广 西 植 物 31卷
能基 因表达有着直接或间接 的关系,可作为一种功
能性分子标记,因此也称基因 SSR(genic SSR)
(Varshney等,2O05)。
番红花 (Crocus sativus)又名藏红 花、西红花 ,
为鸢尾科番红花属植物,原产西班牙、希腊和伊朗等
国,引入我国已有 600多年历史。它是一种珍贵的
药用植物,具有镇静、祛痰、刺激、解痉、活血化瘀等
功效 ,用于胃痛、痛经,可治疗痢疾、麻疹、发热黄疸、
肝脾肿大、泌尿道感染及糖尿病等多种疾病(陈书安
等,2001)。由于仅以柱头人药,资源极其有限,故价
格昂贵,被誉为“植物黄金”。为充分合理地利用这
一 珍贵药用植物,开展番红花资源多样性研究势在
必行 。目前尚未见有关番红花基 因组 SSR标记 的
报道 ,而公共数据库中已积累了大量的番红花 EST
序列,为 EST—SSR标记的开发提供了契机。本研
究对现有番红花 EST中的 SSR信息进行了全面分
析,以明确其 EST—SSR的发生频率和特点,为进一
步筛选番红花 EST—ssR标记和探索其在遗传育
种、图谱构建中的应用奠定基础。
1 材料与方法
1.1番红花 EST序列的来源
番红花 EST来自美国国家生物技术信息中心
(National Center for Biotechnology Information,NC—
BI)(http://www.ncbi.nlm.nih.gov/entrez/query.fc—
gi)的GenBank数据库,共计 6 745条序列。
1.2 EST的前处理与片段重叠群(contig)分析
用 EST-trimmer软件(htp://pgrc.ipk-gatersle—
ben.de/misa/download/est—trimmer.p1)除去 5 端或
3 端5O bp内重复次数达 5次和 5次以上的polyT或
polyA;除去长度小于 100 bp的 EST序列;对于长度
大于 700 bp的 EST,则保 留其 5 端 的 700 bp。用
DNAStar软件(LASERGENE,DNASTAR,lnc.)对每
个物种的EST序列分别进行片段重叠群分析和聚
类。装配参数设置为:在至少 4O个核苷酸的重复区
域中,最小匹配百分比大于 95 9/6的 EST序列可以
进行拼接与延伸 。
1.3 EST-SSR的发掘
用 MISA 程 序 (htp://pgrc.ipk—gatersleben.
de/misa/)对经过前处理的无冗余 EST进行 SSR
查找。筛选标准为单核苷酸重复次数不小于12次,
二核苷酸重复次数不小于 6次,三至六核苷酸重复
次数不小于 5次。同时筛选和记录被少数碱基 (间
隔小于1O或等于10 bp)打断的不完全重复的SSR。
2 结果与分析
2.1番红花 EST-SSR出现的频率
从 NCBI公共数据库下载得到 6 745条来 自番
红花的 EST,总长度 约为 2.64 Mb,经过处理后得
到全长为 612.01 kb的无冗余 EST序列 1 431条,
可见数据库中存在大量的番红花冗余 EST序列。
对所得的无冗余 EST进行搜索,共检出 103条含有
SSR的EST序列,发生频率(含有 SSR的 EST数
目与 EST数 目的比值)为 7.2O (表 1)。其中只含
有 1个 SSR的 EST有 98条 ,含有 2个或 2个 以上
SSR的有5条,共计 108个 SSR,占无冗余 EST的
7.55 ,即为EST—SSR的出现频率。在5条含 2个
以上 SSR的EST中,相邻 SSR之间的距离均大于
1O bp。从分布情况来看 ,平均每 5.67 kb就 出现 1
个 SSR,但不同重复类型问差异很大(表 1)。
表 1 番红花不同重复类型的 EST-SSR分布
Table l Percentage of EST—SSR of different
repeat types in Crocus sativus
在不同核苷酸重复类型 中,最常见 的是二核苷
酸和三核苷酸重复,分别占总 EST—SSR的3O.56
和37.96 ;单核苷酸 SSR所占比例不足 2o%;四
至六核苷酸SSR总计约占13 ,所占比例随着重复
基元核苷酸数目的增大而降低(表 1)。
2.2番红花 EST—SSR的特性
在搜索出的番红花 EST—SSR中,共观察到 23
种不同的重复基元,其中单核苷酸重复仅 1种,二核
苷酸重复3种,三、四、五、六核苷酸重复分别 1O、4、
3、2种(表 2)。单核苷酸重复只检测到 A/T重复
基元 ,没有发现 C/G重复类型。二核苷酸重复 中,
AG/CT出现的频率最高,占所有二核苷酸重复的
l期 陈国庆 :红花 EST资源的 SSR信息分析 45
AG/CT
66 67%
图 1 二核苷酸重复中不 同重复基元的比例
Fig.1 Percentage of different motifs in
dinucleotide repeats
66.67%,其次是 AT 重 复基 元 ,但是 没 有检 测 到
CG重复基元 (图 1)。三核苷酸重复 中,AAG/CTT
出现 12次,所占比例达29.27 ;其次是CCG/CGG
和 AGC/CGT,所 占比例均 为 12.2O%,仅次 于
AAG/CTT重复基元(图 2)。四、五、六核苷酸重复
的各种重复类型的 出现次数均 小于 5(表 2)。就所
有重 复基元 来看,所 占 比例最 高 的是 AG/CT
(20.37Vo),其 次 是 A/T(18.52 )和 AAG/CTT
(11.11 9/6)(图 3)。
图 2 三核苷酸重复中不同重复基元的比例
Fig.2 Percentage of different motifs in
trinucleotide repeats
3 讨论
本研究对 GenBank中现有的番红花 EST进行
分析,结果表明 EST—SSR的出现频率为 7.55 ,
SSR—EST的发生频率为 7.2O 。分析得到的番红
花 SSR—EST发生频率高于 Kumpatla Mukho—
padhyay(2OO5)对 番红 花 553条 EST 的研究结果
(5.79 )。造成差别的原因可能有:(1)所分析的
46 广 西 植 物 31卷
EST数量过少,可能 导致结果 的偏差 。Kumpatla
Mukhopadhyay(2OO5)的分析仅针对 当时 Gen—
Bank中为数不多的 500多条番红花 EST。(2)数据
分析方法 的不 同造 成结 果 的差异 。Kumpatla&
Mukhopadhyay(2005)首先在 ESTs中查找 SSR,再
对含有 SSR的 EST进行拼接 聚类来排 除冗余 的
SSR~EST;而本研究则先进行 EST拼接聚类 、去冗
余 ,再进行 SSR筛选 ,这样在片段重叠群聚类分析
中,可以将一些被打断的 SSR拼接起来,从而增加
SSR检出频率。葛佳等(2005)在对大 白菜 (Brassi—
ca campestris ssp.pekinensis)进行 EST~SSR分析
时发现,非冗余 EST中SSR总数比排除冗余前还
要高 ,证实了片段重叠群分析可 以拼接一些被打断
的SSR。(3)筛选 SSR的参数设置不同,也会造成
结果的差异 。Kumpatla& Mukhopadhyay(2005)
筛选 SSR的标准为单核苷酸重复次数不小于 15
次,二至四核苷酸重复次数不小于 5次;而本分析采
用标准为单核苷酸重复次数不小于 12次,二核苷酸
重复次数不小于 6次,三至六核苷酸重复次数不小
于 5次。我 们 采用 Kumpatla& Mukhopadhyay
(2005)的筛选标准进行重新分析,结果发现 133个
SSR分布于 125条无冗余 EST序列中,含有 SSR
的 EST 发生频 率是 8.74 ,SSR 的 出现频 率为
9.29 。这也 同时 表 明,SSR 筛 选 标 准 改变 时,
EST~SSR的分布频率和 SSR—EST的发生频率都会
随之改变。因此,将不同研究结果加以比较时,应当
采用同一标准。
25
, 、
20

lo
5
0
卜 i-.-卜 i-.- 1.- 0 I---i-- b.- l-- 0 0 b- b-- 卜- 卜- a 0
∞ \ 卜- 《 0 0 0 0 i-- l-- i---I.- b--0 I.-- 0 0 1.--b-
\ 《 0 \ 0 0 \ 0 0 《 0 《 《 0 i-- 卜- 0 《 I--
口 \ F- \ \ 0 \ \ \ \ \ 《 \ 0 《 I-- \ 《
《 0 《 0 0 《 0 0 I--0 \ 0 \ \ 《 1.- \
《 0 0 0 《 《 0 0 i--0 0 卜_ \ 0 卜_
《 《 0 《 《 《 < 《 1.--《 《 《 卜 《 0
《 《 0 《 《
《 《 《 0 《
0

重复基元类型
图 3 基于重复基元类型的番红花 EST—SSR比例分布
Fig.3 Percentage of different motifs in
EST—SSRs of Crocus sativus
大多数植物的 EST—SSR以三核苷酸重复占主
导地位,其次是二核苷酸重复 (李永强等,2004;
Varshney等 ,2005)。番红花也表现出类似情况 ,筛
选出的 ESr_SSR 中三核 苷酸重 复所 占 比例最大
(37.96 ),二核苷酸重复也较多 (3O.56 )。番红
花二核苷酸重复中,AG/CT出现频率最高 ,与多数
植物中已报道的情况相同(李永强等,2004);在三核
苷酸重复中,则 以 AAG/CTT重复为主,与拟南芥
(Arabidopsis thaliana)、柑橘 (Citrus)、大豆(Gly—
cinemax)等 植 物 类 似 (Cardle等,2000;Gao等,
2003;Chen等,2006)。CCG/CGG重复基元在番红
花三核苷酸重复类型 中所 占比例也较高(图 2),这
种重 复 基 元 在 单 子 叶 植 物 大 麦 (Hordeurn vul—
gare)、玉米 (Zea mays)、水稻 (Oryza sativa)和高
梁(Sorghurn bicolor)中是 占据主导地位 的三核苷
酸重复类型 。这些 占优势的核苷酸重复基元可能与
其编码相应蛋白质的使用频率较高有关,这一点在
拟南芥中得到证实(范三红等,2003)。
番红花 EST数据的不断积累为 EST—SSR标记
的开发提供 了宝贵资源。当前分析表明番红花
EST—SSR出现频率较高、类型较丰富,因此,本研究
结果为进一步开发和筛选番红花 EST—SSR标记奠
定了基础,有助于该物种的遗传资源多样性评价、遗
传图谱绘制、分子标记辅助育种和比较基因组学等
相关研究。
参考文献 :
Cardle L,Ramsay L,Milboume D,et a1.2000.Computational and
experimental characterizati0n of physicaly clustered simple se—
quenee repeats in plants[J].Genetics,156:847-854
Chen CX,Zhou P,Choi YA,el a1. 2006. M ining and charac—
terizing microsateIlites from Citrus EsTs gJ].Theor Appl
Oenet,112:1 248— 1 257
Chen sA(陈书安),Wang XIX王晓东),Zhao B(赵兵),et a1.2001.
Advances in studies on Crocus sativus(藏红花的研究进展)[J].
Ghin Trad Herb Drugs(中草药),52(12):1 137—1 139
Fan sH(范三红),Guo AG(郭蔼光),Shah Lw(单 丽伟),et z.
2003.Analysis of genetic code preference in Arabidopsis thali—
nM(拟南芥基因密码子偏爱性分析)[J].Prog Biochem Bio—
phys(生物化学与生物物理进展),30(2):221—225
Gao LF,Tang JF,Li HW ,et a1.2003.An alysis of microsatelites
in major crops assessed by computational and experimental ap—
proaches rJ_.Mol Breed,12:245—261
Ge J(葛佳),Xie H(谢华),Cui CS(崔崇士),eta1.2005.Analysis
of expressed sequences tags(ESTs)derived SSR markers in Chi—
nese cabbage(Brassica campestris ssp.pekinensis)(3V白菜表达
序列标签 SSR标记分析)[J].J Agric Bioteeh(农业生物技术
学报),13(4):423—428
Kumpatla SP,Manley MK,Horne EC,et a1.2004.An improved
(下转第 96页 Continue o12 page 96)
-L J_0 J_00\∞《00《<
.L J-J-00\00《《《《
_L J.卜00\00《《《
J.J_.L0\0《《vv
96 广 西 植 物 3l卷
Feng JC(冯建灿),Hu XL(胡 秀丽),Mao XJ(毛训 甲).2002.
Application of chlorophyll fluorescence dynamics to plant physi—
ology in adverse circumstance(叶绿素荧 光动力学在研 究植物
逆境生理 中的应用)EJ].EconomFore Res(经济林研究),20
(4):14—18
HuXH(胡学华),Pu GL(蒲光兰),Xiao QW(肖千文),et a1.
2007.Effects of water stress on chlorophyl fluorescence in lear—
as of plum(Prunus salicina Lind1.)(水分胁迫下李树叶绿素荧
光动力学特性研究)EJ].Chine J Eco-Agri(中国生态农业学
报),15(1):75—77
Jiang CD,Gao HY,Zou Q 2003.Changes of donor and acceptor side
in photosystem 2 complex induced by iron deficiency in atached
soybearl and maize leaves[J].Photosynthetica,41:267—271
Krause GH,Weis E.1988.Applications of chlorophyl fluorescence in
photosynthesis research[J].Physiol Plant,74:566—577
Mommer L,Visser EJW. 2005. Underwater photosynthesis in
flooded terrestrial plants:a matter of leaf plasticity I-J].Ann
B0£,96:581—589
Panda D,Rao DN,Sharlna SG,eta1.2006.Submergence effect on
rice genotypea during seedling stage:probing of submergence
driven changes of photosystem Ⅱby chlorophyl a fluorescence
induction()_J—I_P transientsD].Photosynthetica,44:69—75
Rohdeek K,Bartdk M.1999.Technique of the modulated chloro—
phyl fluorescence:Basic concepts,useful parameters,and some
applications[J].Photosynthetica,37:339—363
Vyal YA,Dynkova GR,Leonova NA,et a1.2007.Adaptation of
the photosynthetic apparatus of the immature broadleaf trees to
the floodplain conditionsl,J].RussJ Plant Physiol,54:58—62
Wang KF(王可玢),Xu CH(许春辉),Zhao FH(赵福洪),et a1.
1997.The efects of water stress on some in vi7)0 chlorophyl a
fluorescenc parameters of wheat flag leaves(水分胁迫对小麦旗
叶某些体内叶绿素 a荧光参数 的影 响)[J].Acta Biophysica
Sin(iV物物理学报),13(2):273—278
Wilbur KM ,Anderson NG.1948.日ectrometric and colorimetric de—
termination of carbonic anhydrase[J].JBiol Chem,176:147—154
wei Y(魏媛),Yu LF(喻理飞),Zhang JC(张金池).2007.Study
on biomass construction of Broussonetia papyri tem sprouting
population with diferent disturbed conditions in karst region(喀
斯特地区不同干扰条件下构树 萌株种群生物量构成)[J].J
Na ing Fore Univ:NatSci Edi(南京林业大学学报 ·自然科
学版),31:58—66
Wu YY(吴沿友),Li XT(李西腾),Hao JC(郝建朝),eta1.2006.
Study on the difference of the activities of carbonic anhydrase in
diferent plants(不 同植 物 的碳 酸酐 酶活力 差异研 究)[J].
Guihaia(广西植物),26(4):366—369
W u YY,Li PP,Zhao YG,et a1. 2007. Study on photosynthetic
characteristics of Orychophragmus violaceus related to shade
tolerancel,J].Sci Horti,113:173—176
Wu YY,Liu CQ,Li PP,et a1.2009.Photosynthetic characteristics
involved in adaptability to karst soil and alien invasion of paper
mulberry(Broussonetia papyri ra)in comparison with mul—
berry(Morroalba)I-J].Photosynthetica,47(1):155—160
W uYY,W uXM ,LiPP,eta1.2005.Comparisonof photosynthet,
ic activity of Orychophragmus violaceus and oil-seed rapeEJ].
Photossmthetica,43(2):299—302
Wu YY,Zhao XZ,Li PP,et a1.2006. A study on the activities of
carbonic anhydrase of two species of bryophytes,Tortula sinensis
and Barbula convolnta,Cryptogamie Bryologie,27(3):349-355
Yang XQ(杨晓青),Zhang sq(张岁岐),Liang ZS(梁宗锁),eta1.
2004.Effects of water stress on chlorophyll fluorescence param —
eters of different drought resistance winter wheat cultivars seed—
lings(水分胁迫对不同抗旱类型冬小麦幼苗叶绿素荧光参数
的影响)rJ].Acta Bot Boreal-Occident Sin(西北植物学报),
24(5):812—816
Yu LF(喻理飞),Zhu SQ(朱守谦),Ye JZ(叶镜中),et a1.2003.
A study on evaluation of natural restoration for degraded karst
forest(退化喀斯特森林自然恢复评价研究)[J].Sci Silv Sin
(林业科学),36(6):12—19
Zhang SR(张守仁).1999.A discussion on chlorophyl fluores—
cence kinetics parameters and their significance(叶绿素荧光动
力学参数的意义及讨论)[J].Chin Bull Bot(植物学通报),16
(4):444—448
(上接第 46页 Continue from page 46)
enrichment procedtare to develop multiple repeat classes of cotton
microsatelite markers[J].Plant Mol Biol,22:85a一85i
Kumpatla SP,Mukhopadhyay S.2005.Mining and survey of sire-
pie sequence repeats in expressed sequence tags of dicotyledonous
r门.Genome,48:985—998
Li YQ(李永强),Li Hw(李宏伟),Gao LF(高立峰),et a1.2004.
Progress of simple sequence repeats derived from exp ressed se—
quence tags(基于表达序列标签的微卫星标记(EST-SSRs)研究
进展)[J].J Plant Genet Res(植物遗传资源学报)5(1):91—95
Powel W ,Machray GC,Provan J.1996.Polymorphism revealed
by simple sequence repeats[J].Trends Plant Sci,1:215-222
Toth G,Gaspari Z,Jurka J.2000.Microsatellites in different
eukaryotic genomes:survey and analysis[J].Genome Res,
10:967— 981
Varshney RK,Graner A,Sorrells ME.2005.Genic microsatel-
lite markers in plants:features and appIicati0ns[J].Trends
Biotechnol,23:48— 55