全 文 :园 艺 学 报 2008,35(7):1069—1074
Aeta Horticulturae Sinica
基于 EST信息的百合 SSR标记的建立
杨素丽 一,明 军 ,刘 春 ,穆 鼎 ,李名扬
( 中国农业科学院蔬菜花卉研究所,北京 100081; 西南大学园艺园林学院,重庆 400715)
摘 要:依据已知的百合EST(expressed sequence tags)序列信息,开发新的SSR(simple sequence re—
peats)标记,在 NCBI的EST数据库 1 688条 EST中检索到98条含有 101个 SSR的序列,SSR的检出率为
5.98%,其中三核苷酸重复类型占主导地位,出现频率为2.84%。EST—SSR的重复基元共搜索到47种,其
中三核苷酸重复基元类型最为丰富,大约占重复基元类型总数的一半。利用部分 EST—SSRs序列共设计 23
对 SSR引物,以铁炮百合 ‘Snow Queen’DNA为模板 ,对引物进行筛选,其中18对引物有扩增产物,占所
设计引物总数的78.26%;进一步用这些引物在5个杂种系列 13个百合品种进行多态性测试,显示多态性
的引物占可扩增引物的66.7%。本研究结果证明了基于百合 EST信息建立 SSR标记是一种有效而又可行的
方法。
关键词 :百合;EST;SSR;引物设计
中图分类号:S 682.2 文献标识码:A 文章编号:0513-353X (2008)07—1069-06
Data M ining for Simple Sequence Repeats M arker Development in Expressed
Sequence Tags from Lifium L.
YANG Su—li 一,MING Jun ,LIU Chun ,MU Ding ,and LI Ming.yang
( Institute of Vegetables and Flowers,Chinese Academy ofAgricultural Sciences,Beijing 100081,China; Colege ofHorticulture
and Landscape,Southwest Unive~i@,Chongqing 400715,China )
Abstract:The growing availability of EST sequences from Lilium L.provides a potential valuable source
of new SSR markers.In this study,101 SSR—ESTs from 1 688 ESTs in the NatiOnal Center for Biotechnology
Information(NCBI)database,representing 5.98% of the total number of ESTs were identified.Among them,
the trinucleotide repeat is the dominant type with repeat motifs being the most common,accounting for 2.84%
of ESTs.Forty—seven kinds of repeat motifs were mined out from all SSRs.Twenty—three SSR primers were de—
signed to sequence flanking SSRs,the primer pairs designed were screened against genomic DNA of‘Snow
Queen’from which most EST—SSRs were derived,and 1 8 primer pairs showed the amplifcation,accounting
for 78.26% of total primers.Then the primers showing amplifcation were subjected to PCR for DNA from 13
Lilium L.cuhivars of 5 hybridism series and 12 primer pairs showed polymorphisms.accounting for 66.7% of
primers available.Results proved that it is an effective and feasible approach to develop SSR markers based on
ESTs in Lilium L.
Key words:Lilium L.;EST (expressed sequence tags);SSR (simple sequence repeats);primer
design
EST(expresed sequence tags)是一段 cDNA 5 或3 端的序列,长度一般为 150~500 bp,大约
有 1%~5%的EST含有可建立标记的SSR(simple sequence repeats)(Kantety et a1.,2002)。SSR标记
收稿日期:2008—03—25;修回日期:2008—05—23
基金项目:国家社会公益研究专项项 目 (2005DIB3J022);国家 ‘863’计划项目 (2006AA100109);国家科技支撑计划项 目
(2006BAD01A18);北京市花卉重点项目 (YLHH2006001;YLHH2006002)
}通讯作者 Author for corespondence(E·mail:mingjunmail@yahoo.COB.en)
维普资讯 http://www.cqvip.com
园 艺 学 报 35卷
数量丰富、等位基因变异多、信息含量高,尤其是表现为共显性遗传等优势,已被证明是最有利用价
值的功能性分子标记,随着EST数量急剧增加,多种植物已经建立了EST—SSR标记 (Varshney et a1.,
2005),但未检索到有关百合 SSR标记的报道。截止2008年4月 11日,在 NCBI的EST数据库中已
登录1 688条百合EST,本研究基于这些百合EST资源,分析其EST中的SSR信息,设计、验证和筛
选 SSR引物,首次建立百合 EST—SSR标记,为百合属植物的分子标记相关研究提供参考。
1 材料与方法
1.1 试验材料和基因组 DNA的提取
试验材料为中国农业科学院蔬菜花卉研究所百合课题组收集保存的东方百合品种 ‘Tiber’、‘Tia—
ra ’
、 ‘Constanta’、‘Legend’、‘Starfighter’、‘Calvados’;铁炮百合与亚洲百合杂交品种 ‘Ceb Daz—
zle’、‘Royal Sunset’;喇叭百合品种 ‘Manissa’;亚洲百合品种 ‘Vermeer’、‘Polyanna’、‘Bmnel—
l0’和铁炮百合品种 ‘Snow Queen’。采用常规 CTAB法提取百合基因组 DNA。
1.2 含 SSR百合 EST序列的检索
从美国国家生物技术信息中心 (National Center for Bioteehnology Information,NCBI)EST数据库
搜索获得 1 688条百合 EST,主要为百合花的 eDNA文库测序的产物。利用 SSRIT (htp://www.
gramene.org/gremene/searehes/srtoo1)软件结合人工搜索含有 SSR的 EST序列,搜索的标准为:单核
苷酸的重复次数≥16,二核苷酸的重复次数≥8,三核苷酸的重复次数/>5,四核苷酸的重复次数/>4,
五核苷酸的重复次数/>3,六核苷酸的重复次数/>3。
1.3 SSR引物设计
为进一步利用百合 EST建立SSR标记,在剔除SSR旁邻序列小于20 bp的EST后,对余下的
EST—SSR用软件 Primer3(htp:/!Frodo.wi.mit edu/egi—bin/primer3/primer3一www.c )设计了23对百
合 SSR引物。引物长度18~24 bp,GC含量40% ~70%,理论退火温度 (Tm)55.0~65.0 oC,预计
产物长度控制在 150~350 bp之间。
1.4 SSR扩增反应体系
PCR反应体系 (15 txL)包括 10×PCR bufer(含 15 mmol·L~MgC12)1.5 txL、0.5 U Taq聚合
酶、140 p~mol·L~dNTPs、上下游引物各 0.2 p~mol·L~、模板 DNA约 30 ng。整个反应在 Gene
Amp~PCR System 9700上进行,循环条件是:94 cI=预变性 5 min,35个循环 (94 oC变性 30 s,合适
退火温度退火30 S,72 oC延伸45 S),72 cI=延伸5 min。各引物对的最适退火温度通过梯度 PCR试验
确定。
1.5 凝胶电泳及银染
SSR扩增产物在8%的聚丙烯酰胺凝胶上电泳,160 V,400 mA,2 h,银染。
2 结果与分析
2.1 百合 EST-SSR的信息分析
利用 SSRIT软件,在百合现有的 EST序列中共搜到了分布于98条 EST中的 101个 SSR,出现频
率是 5.98%。百合的EST—SSR种类较为丰富,二至六核苷酸重复类型都能看到,但频率各不相同,
其中,三核苷酸占主导地位 (表 1)。
检索出含三核苷酸重复类型 SSR的 EST 48条,在全部 EST中出现频率为 2.84%,占总 SSR的
47.53%;其次是六核苷酸和二核苷酸,二者出现频率分别为 1.54%和0.89%;而四核苷酸出现频率
最低,仅 1条含此类型 SSR的 EST。
维普资讯 http://www.cqvip.com
7期 杨素丽等:基于 EST信息的百合 SSR标记的建立
表1 百合 EST中SSR的出现频率
Table 1 Frequency of SSRs occurred in ESTs of lily
百合 EST.SSR的重复基元种类很多,共搜索到47种重复基元。其中,单核苷酸的重复基元只有
A/T,未见G/C重复,三核苷酸重复基元类型最为丰富,大约占重复基元类型总数的一半,并且其出
现频率最高。各种不同的重复基元出现次数最多的是 ACCAAC,共出现了 13次;其次是 TAA和 GA,
大多数重复基元都出现 1次,特别是五核苷酸和六核苷酸的重复基元,而且五核苷酸重复基元的重复
次数都是 3,六核苷酸重复基元的重复次数只有一个为4,其余的都为3(表2)。
表2 百合EST-SSR中不同重复基元
Table 2 Repeat motifs in EST-SSR of lily
百合 EST-SSR平均长度为 18.98 bp,但不同的SSR的长度却有很大差异,最短为 15 bp,最长
138 bp。五核苷酸重复基元的SSR都为 15 bp,六核苷酸重复基元的SSR大多数都是18 bp,二核苷酸
重复基元的SSR比较长,如 (GT)69、(GT)4。、(AT)32、(AT)2。
2.2 EST-SSR引物设计和筛选
利用软件 Primer3,选取了22条含 SSR (大于 18 bp)的EST序列,设计了23对引物 (表 3)。
维普资讯 http://www.cqvip.com
1072 园 艺 学 报 35卷
ES01 (ACCAAC)3 DW718134 178
ES02 (CACGGC)3 DW718090 296
(GAAGAG)3 BP177492 317
(TAGGGT)3 BP177448 171
ES05 (GGAAGA)3 BP177521 203
ES06 (TCCTCT)3 BP177230 245
ES07 (GCCGGC)4 BP177444 238
(GAATrG)3 BP177191 227
ES09 (rITI1℃1T)3 BP177174 168
ES10 (TGAAGA)3 BP176961 231
ES1 1 (GGAAGA) BP176850 203
ES12 (TGCTAT)3 BP176769 168
ES13 (GCA)6 DW718057 215
ES14 (GGT)6 BP177572 217
ES15 (GGA)6 BP177547 181
ES16 (CAC)8 BP177542 187
ES17 (CAC)6 BP177270 218
ES18 (GGC)10 BP177457 177
ES19 (CGC)6 BP177143 214
ES20 (TAA)6 CF651172 225
ES22
ES23
(TC)10
(GA)31
(TA)9
DY6390o6 236
BE034671 215
BE034671 223
59.99
60.00
59.80
60.59
57.70
57.30
60.04
59.85
59.97
61.11
60.07
60.33
60.04
59.49
60.11
60.20
60.30
57.00
59.99
59.93
59.97
61.11
60.24
59.96
59.96
59.82
59.83
59.30
60.07
59.76
59.18
59.95
60.21
59.83
58.85
59.60
59.99
59.40
59.79
59.60
59.79
59.60
62.91
60.06
59.87
60.09
60.00
55.00
52.63
55.00
57.90
50.00
40.00
55.00
55.00
55.00
34.78
50.00
50.00
50.00
50.00
50.00
55.00
47.40
50.00
50.00
55.00
55.00
50.00
50.00
50.00
55.00
50.00
55.00
60.00
55.00
60.00
55.00
50.00
50.00
52.63
55.00
50.00
50.00
54.50
56.00
50.00
50.00
61.11
50.00
55.00
55.00
GCTCTTCCTCGTCTGTGGTC
GACATCAGTTACGCCCCTGT
CATCATCTI℃GTCCGCACT
CGTGACCGTGACTATGACCA
CACCGAGGATGACGGAGTT
GAAGAGTCCCCTCATCTATTGC
CTCAAT1’rCCGCATCGATI℃
GGCTrCTTCGTGTTGGTGAC
AGAGGTGGAACACGGACATC
GCCCGGATCAC I ITrCTrCTC
TCACCATAATCACATGGAATCAA
TGGAGGAGATGGACATGGTT
GGCATCGATGATGAGGACTT
ACAAGTAGGGCAACGGGTTA
CGATGACTGTCGAAGGGTITr
AAGCAAGTCCAGCAAGCACT
TGCTrGAGATGTGCGACGAG
CAAGAGAATGCGACAAAGC
TGGCTCGAACCTTCTGAG1T
CCTCGGATrGTrGATCCTGT
AGAGGTGGAACACGGACATC
GCCCGGATCAC|r兀℃TTCTC
CCGGCACTrCCAACTCTAAA
ATCCGGTAATrCCACAGCAG
GCTGGAGCAAGAGAAATrGG
ACA 兀TrGTTGGTCCCTCCTG
TCTrGGATCAGTTGGTGCTG
CTCTTCCTTCTTCGGCTAG
GGAACCCCTAGGAGACGAAG
CTCATCCTCCTCTTGCATCC
AACCTACCTCCACCCCTACC
CAGAATCAGAGAGGCGGAAC
GGCTCA
TCTTGGATCAGTTGG1 CTG
CACCCAGGCGTAAGAAGAAG
GCACCTGTGTCAACACCCTA
TGCCAGTCAATCTGTGAAGC
CAACACAACAGGGTGATCGT
CGCTCTGTAGTGTGTI℃CATCC
ATGTAACCGAAGATCAGCCCTC
TCTrCGTCGTCGTCATCATC
GAGCTACCAGAGCTGGCAAT
GCAGGAATrCGGCACGAG
GCCACATTGGACCATAAACC
AGAGAGGGAGCGGAAAAGAG
维普资讯 http://www.cqvip.com
7 期 杨素丽 等 : 基于 E S T 信息 的百 合 S S R 标记 的建立 1073
以铁炮百 合 ‘ S now Q ueen ’ 为模板 , 对设计 的 23 对 引物进行扩增 。 在合适 的退 火温 度下 , 只有
E S 02 、 E S 05 、 E S 06 、 E S l9 、 E S 21 这 5 对引物不 能产生 扩增 , 其它 18 对 引物均有扩增 产物 出现 , 可
用引物数 占设计引物总数 的 78. 26% (表 4 )。
表 4 18 对 引物在 8 个百 合的扩 增情况 及 多态性
T able 4 A m plifications and polym o~ hism s show ed in diferentlily cultivars by 18 prim er pairs
注 : A : 预期大小 片段 ; B : 非 预期大小 片段 ; A B : 同时 出现 预 期大小片段 和非 预期大小片段 ; P : 有多态性 ; NP : 无 多态性 。
N ote : A : E xpected size fragm ent; B : U n expected size fragm en t; A B : A ppearan ce ofboth A and B ; P : P olym orphism ; NP : None polym or
-
phism .
2. 3 E S T . S S R 标记 的多态性
利用筛选 出来的 18 对百 合 E S T — S S R 引物 , 对 13 种不 同的百 合 品种进 行 多态 性试 验 。 结果 有 12
对引物揭示 出多态性 , 占可扩增 出的 66. 7 % , 占设计引物总数 的 52. 2% , 呈现 出较高的多态性 。
图 1 中的 A 和 B 分别为引物 E S 01 和 E S 04 多态性 扩增情况 , 结果显 示 , 基 于 E S T 信息建立 百 合
多态性 S S R 标记 是可行 的 。
其它不 同引物的扩增及其显 示 的多态性情况列 于表 4 。
300 bp
M l 2 3 4 5 6 7 8
200 bp
M l 2 3 4 5 6 7 8
图 1 引物 E S 01 (A ) 和 E S 04 (B ) 在不 同百 合 品种 间的 多态性
F ig. 1 P olym orphism s show ed in differentlily cultivars by prim ers E S 01 (A )and E S 04 (B )
F rom left to n ght in A : M arker ,
‘ B runello ’ ,
‘ C eb D azzle ’ ,
‘ V erm eer
’
,
‘ C onstanta ’ ,
‘ L egend
’
,
‘ S tarfightr
’
.
‘ C alvados ’ ,
‘ S now Q u een
’
; F rom leftto fight in B :
M arker ,
‘ R oyalS un set
’
,
‘ M an issa ’ ,
‘ P ollyan n a
’
.
‘ V erm eer ’ ,
‘ T iber’ ,
‘ C eb D azzle ’ ,
‘ T iar a ’ ,
‘ S now Q ueen
’
.
维普资讯 http://www.cqvip.com
园 艺 学 报
3 讨论
现有文献报道的SSR出现频率各不相同,百合 SSR出现频率为5.98%,而甘蔗为2.9% (Corde-
iro et a1.,2001)、水稻为4.7% (Kantety et a1.,2002)、白菜为 10.34% (忻雅 等,2006),油菜为
15.58% (李小白 等,2007),可能是搜索 SSR的标准不同造成的,更可能是各物种现有的EST数量
不足于覆盖全基因组引起的,只有在取得各自覆盖基因组全序列信息,并采用同一搜索标准后才能够
获得可比数据。
从目前的报道来看,大多数植物的 EST.SSR主要属于二、三核苷酸重复类型,但不同的物种间
主导重复基元的类型有所差异。如果 EST数足够大且无偏倚性,则4种不同的碱基随机组合将产生
单核苷酸2种、二核苷酸4种、三核苷酸 l0种,四核苷酸 33种,五核苷酸 102种和六核苷酸350种
基本重复类型 (Rota et a1.,2005)。百合 EST.SSR分析的结果显示 ,不同重复基元出现与否及其频率
高低表现出明显的偏倚性。这显然与百合现有的 EST数较少、覆盖度不足有关。
在已知的高等植物中,百合的基因组最大,约为 3.2×10 一4.0×10 kb(吴祝华 等,2006),
而目前已在 NCBI的 EST数据库中登录的百合 EST序列有限,仅约有 1.72×10 kb,与全基因组的序
列相比相差甚远,本研究仅能依据现有的 EST开发出部分 SSR引物,因此,急需开发出更多的 EST
资源以满足百合 SSR标记的需要。
本试验表明从百合 EST序列中开发 SSR标记是可行和高效的,对于加速百合 EST资源的开发利
用、丰富其分子标记类型、遗传资源评价、绘制遗传图谱、实现特定性状的辅助选择和进行比较基因
组学研究都具有重要的意义。
Refefences
Cordeiro G M,Casu R,Mclntyre C L,Manners J M,Henry R J.2001.Microsatelite markers from sugarcane(Saccharum spp.)ESTs cross
transferable to erianthus and sorghum.Plant Sci,160:1115—1123.
Kantety R V,Rota M L,Matthews D E,Sorrells M E.2002.Data mining for simple sequence repeats in expressed sequence tags from barley
maize,rice,sorghum and wheat.Plant Mol Bio1.48:501—5lO.
Li Xiao—bai.Zhang Ming-long.Cui Hai-rui.2007.Analysis of SSR information in EST resource of oilseed rape.Chinese Joumal of Oil Crop Sci-
ences,29 (1):20—25.(in Chinese)
李小白,张明龙,崔海瑞.2007.油菜 EST资源的SSR信息分析.中国油料作物学报,29(1):加 一25.
Rota L R,Kantety R V,Yu J K.2005.Nonran dom distribution and frequencies of genomic and EST-derived microsatelite markers in rice,wheat
and barley.BMC Genomics,6 (1):23.
Varshney R K,Graner A,Sorrells M.2005.Genie microsatellite markers in plants: Features an d applications.Trends in Biotechnology.23
(1):48—55.
Wu Zhu-hua,Shi ji-sen,Chi Jian,Xi Meng-li,Hu Feng-rong.Jiang Fu-xing.2006.Research advances on resources and breeding of omamental
lily.Joumal of Naming Forestry University:Natural Science Edition,3O(2):113—118.(in Chinese)
吴祝华,施季森,池 坚,席梦利,胡凤荣,姜福星.2006.观赏百合资源与育种研究进展.南京林业大学学报:自然科学版,
3O(2):113—118. .
Xin Ya,Cui Hal-rui,Lu Mei-zhen,Yao Yan-ling.Jin ji-qiang.Lin Rong-shao,Cui Shui-lian.2006.Data mining for SSRs in ESTs an d EST-
SSR marker development in Chinese cabbage.Acta Horticuhurae Sinica,33 (3):549—554.(in Chinese)
忻 雅,崔海瑞,卢美贞,姚艳玲,金基强,林容杓,崔水莲.2006.白菜 EST.SSR信息分析与标记的建立.园艺学报,33
(3):549—554.
维普资讯 http://www.cqvip.com