全 文 :蝴蝶兰 EST 资源的 SSR信息分析
李冬梅1, 吕复兵1, 朱根发1, 洪彦彬2, 陈小平2, 梁炫强2, 操君喜1, 孙映波1
(1.广东省农科院花卉研究所/广东省园林花卉种质创新综合利用重点实验室,广东 广州 510640;
2.广东省农科院作物研究所, 广东 广州 510640)
摘 要:对 5 472 条蝴蝶兰无冗余 EST 序列进行了 SSR 搜索,共检索出 376 条 EST 含有 419 个 SSR 位点,平均每 7.4 kb EST
序列出现 1 个 SSR。 共有 60 种 SSR 的重复基元, 其中二核苷酸和三核苷酸重复基元占主导地位, 分别占 SSR 总数的 67.1%和
30.3%;AG/CT 在 SSR 基元中出现频率最高(46.1%),AT/AT 次之(18.6%)。 根据搜索结果设计了 100 对蝴蝶兰 EST-SSR 引物,并随
机合成了 20 对引物。 以 2 个蝴蝶兰品种的 DNA 为模板,对引物进行了筛选和评价,有 16 对引物扩增出稳定且清晰的目标产物,
其中 12 对引物扩增的产物存在多态性。
关键词:蝴蝶兰; EST; SSR 信息
中图分类号:S682.31 文献标识码:A 文章编号:1004-874X(2011)03-0117-04
Analysis of SSR information in EST resource of Phalaenopsis spp.
LI Dong-mei1, LV Fu-bing1, ZHU Gen-fa1, HONG Yan-bin2, CHEN Xiao-ping2,
LIANG Xuan-qiang2, CAO Jun-xi1, SUN Ying-bo1
(1. Floricultural Research Institute, Guangdong Academy of Agricultural Sciences/Guangdong Key Lab of
Ornamental Plant Germplasm Innovation and Utilization, Guangzhou 510640, China;
2. Crops Research Institute, Guangdong Academy of Agricultural Sciences, Guangzhou 510640, China)
Abstract:Simple sequence repeats (SSRs) were searched in 5 472 qualified and non-redundant expressed sequence tags (ESTs) of
Phalaenopsis. A total of 376 ESTs of Phalaenopsis contained 419 SSRs with 60 kinds of repeat motifs and 1 SSR in 7.4 kb EST. Among
them, the dinucleotide and trinucleotide repeats were dominant SSR types, accounting for 67.1% and 30.3%, respectively. AG/CT was
most frequent SSR motif accounting for 46.1%, and then AT/AT accounted for 18.6%. Moreover, 100 ESTs of Phalaenopsis were selected
and designed 100 primer pairs for EST-SSR markers. Twenty of the 100 primer pairs were randomly selected and synthesized. These
primers were selected and performed with two cultivars of Phalaenopsis. Sixteen of the 20 primer pairs produced stable and clear product
bands, of which 12 primer pairs showed genetic polymorphic bands.
Key words:Phalaenopsis spp; EST; SSR information
蝴蝶兰(Phalaenopsis spp.)属兰科(Orchidaceae)蝴蝶
兰属(Phalaenopsis)植物,其体态轻盈,花色艳丽,色泽丰
富,具有极高的观赏和经济价值。 蝴蝶兰在被大规模商品
化生产的同时,其新品种也层出不穷[1-3]。 目前,在 DNA水
平上进行的蝴蝶兰的相关研究, 主要集中在用 RAPD、
ISSR 和 SSR 分子标记分析蝴蝶兰的种质资源遗传多样
性、辐射育种和品种亲缘关系 [4-12]。 然而,鲜见利用 EST-
SSR 分子标记技术构建蝴蝶兰的遗传图谱或物理图谱的
相关报道。 EST-SSR是一种新型的有功能的 SSR标记,其
基于表达基因的 cDNA序列,可直接用于基因作图和新基
因的发掘。 NCBI 数据库中大量收录的 EST 序列为 EST-
SSR的开发提供了重要的来源途径。 目前,EST-SSR 已经
在许多植物上得到了应用[13-15]。蝴蝶兰 EST-SSR已有部分
发掘并成功应用在中国兰花上, 已开发了一些可用的
EST-SSR标记[13]。迄今为止,NCBI数据库中共收录蝴蝶兰
EST序列 7 963条,虽已有报道利用部分 EST进行了 SSR
的开发研究, 但并未对蝴蝶兰的这些 EST-SSR 数据信息
进行全面的分析和总结。 本研究拟对 NCBI数据库中所有
蝴蝶兰的 EST序列进行 SSR 检索, 并全面深入分析蝴蝶
兰的 EST-SSR 分布的频率和碱基串联重复的特点, 为蝴
蝶兰 EST-SSR 的遗传分布规律提供一个基础认识, 同时
也为建立蝴蝶兰 EST-SSR 标记并探索其在蝴蝶兰研究中
的应用奠定基础。
1 材料与方法
1.1 试验材料
供试蝴蝶兰品种红龙和聚宝红玫瑰采自广东省农科
院花卉研究所蝴蝶兰资源圃。
1.2 试验方法
1.2.1 蝴蝶兰 EST 来源及 EST-SSR 的筛选 从 NCBI
(http://www.ncbi.nlm.nih.gov/)数据库中下载蝴蝶兰的表达
序列标签(EST),删除冗余部分,将同一基因的 EST 序列
组装在一起。 利用 MIcroSAtellite (MISA, http://pgrc.ipk-
gatersleben.de/misa/)搜索 SSR 位点。 筛选设置的参数是:
最大基序长度设为 10,最小重复次数设为 5,然后对已找
到的 SSR位点的特征进行分析。
1.2.2 蝴蝶兰 EST-SSR 引物的设计 选取具有 SSR 位
点、串联重复序列长度大于 14 bp,而且 SSR 位点距序列
收稿日期:2010-07-12
基金项目:广东省农业攻关项目(2009B020305009);广东省农
业科学院支撑计划项目(07-支撑-39)
作者简介 :李冬梅 (1980- ),女 ,博士 ,助理研究员 ,E-mail:
biology.li2008@163.com
通讯作者:吕复兵(1971-),男,博士,研究员,E-mail:lvfub@yahoo.
com.cn
广东农业科学 2011 年第 3 期 117
DOI:10.16768/j.issn.1004-874x.2011.03.075
重复基元
AC、AG、AT、CA、CT、GA、GC、GT、TA、TC、TG
AAG、ACC、ACG、AGC、AGG、ATG、ATT、CAA、CAC、CAG、
CAT、CCG、CCT、CGC、CGG、CTC、CTG、CTT、GAA、GAT、
GCA、GCC、GCG、GCT、GGA、GGC、GTC、TAA、TAT、TCA、
TCC、TCT、TGA、TGC、TGG、TGT、TTA、TTC、TTG
CTGG、TATT、TCCC
CCACC
CCCAAA、AGAAGG
CCGATGC、TCTCCTC、GCGAGCT
GCTTCTTCG
总计
5472
3089399
419
376
38
28
281(67.1%)
127(30.3%)
3(0.7%)
1(0.2%)
2(0.5%)
3(0.7%)
2(0.5%)
单一序列
4657
2534973
346
315
28
23
237
101
3
1
1
1
2
叠连群
815
554426
73
61
10
5
44
26
1
2
类 型
无冗余 ESTs 数量(个)
无冗余 ESTs 总长度(bp)
检测到的 SSR 数量(个)
含 SSR 的 ESTs 数量(个)
含 1 个以上 SSR 的 ESTs 数量(个)
复合型 SSR 数量(个)
二核苷酸数量(个)
三核苷酸数量(个)
四核苷酸数量(个)
五核苷酸数量(个)
六核苷酸数量(个)
七核苷酸数量(个)
九核苷酸数量(个)
表 1 蝴蝶兰 EST-SSR 基序特征
50
45
40
35
30
25
20
15
10
5
0
1.7
6.27.4
2.42.62.13.3
7.6
1.20.7
18.6
46.1
AC
/G
T
其
他
CC
G/
CG
G
AG
G/
CC
T
AC
T/
AT
G
AC
C/
GG
T
AA
T/
AT
A
AA
G/
CT
T
AA
C/
GT
T
CG
/C
G
AT
/A
T
AG
/C
T
基序类型
图 1 蝴蝶兰 EST-SSR 的基序类型分布
频
率
( %
)
两末端均在 50 bp 以上的 EST, 然后根据 SSR 的侧翼区
域,利用在线软件 Primer 3.0 (http://redb.ncpgr.cn/modules/
redbtools/primer3.php)设计引物,命名为“FRI××”(FRI 是花
卉研究所的英文缩写)。
1.2.3 蝴蝶兰 SSR 引物评价分析 采用改良 CTAB 法提
取蝴蝶兰的基因组 DNA,参考大花蕙兰的提取方法[16]。
设计出的 SSR 引物序列由上海英俊生物有限公司合
成。 EST-SSR的 PCR扩增体系为:25 μL反应体系含 50~
100 ng模板 DNA,正反向引物各 0.2 μmol/L,10×PCR反应
缓冲液 2.5 μL,dNTPs 0.2 μmol/L,MgCl2 2.0 mmol/L,Taq
DNA 聚合酶 1.0 U。 PCR 反应扩增程序为:94℃预变性 4
min;94℃变性 0.5 min, 退火 (不同引物退火温度不同)1
min,72℃延伸 1min,35个循环;72℃延伸 5 min。 PCR产物
在 1.5%琼脂糖凝胶中电泳,采用凝胶成像系统观察拍照。
2 结果与分析
2.1 蝴蝶兰 EST-SSR特点
截至 2010年 6月 30日,在 NCBI数据库中共搜索到蝴
蝶兰 EST序列 7 963条,利用拼接软件进行处理后,共得到
5 472条无冗余的 EST序列,总长度为 3×106 bp,平均长度
为 564 bp。 用 MISA对 5 472条蝴蝶兰无冗余 EST序列进
行 SSR位点搜索, 发现分布于 376条 EST中的 419个 SSR
位点表现为 60种 SSR的重复基元 (表 1)。 平均每 7.4 kb
EST出现 1个 SSR。 在 376条含有 SSR的 EST中,一般 1条
EST含有 1~3个 SSR位点;只含有 1个 SSR的有 338条,含
有 1个以上 SSR的有 38条。 SSR重复类型以二核苷酸和三
核苷酸为主,所占比例分别达到 67.1%和 30.3%,总计占所有
类型的 97.4%;四核苷酸、五核苷酸、六核苷酸、七核苷酸、九
核苷酸重复类型很少,合计占所有类型的 2.6%(表 1)。
在蝴蝶兰全部 EST-SSR 的 60 种重复基元中,其中二
核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸、七核苷
酸、 九核苷酸重复基元分别有 11、39、3、1、2、3、1 种 (表
1)。二核苷酸重复基元以 AG/CT和 AT/AT为主,分别占所
有重复基元类型的 46.1%和 18.6%;三核苷酸重复基元以
AAG/CTT 和 CCG/CGG 为主,分别占所有重复基元类型的
7.6%和 7.4%(图1)。
2.2 蝴蝶兰 EST-SSR不同长度基序的比较
SSR 分析发现, 蝴蝶兰 EST-SSR 的基序长度主要集
中在 10~32 bp 之间(图 2)。 10 bp的基序长度最多,有 88
个,为 5 次重复的二核苷酸基元;其次是 15 bp 的基序长
度、 数量为 72个, 为 5 次重复的三核苷酸基元; 再次是
18、12、16 bp 的基序长度, 数量分别为 47、37、35 个 (图
2)。 基序长度在 10 bp 的 SSR 占全部 SSR 的 21.0%,12~
20 bp的占 56.3%,21~30 bp 的占 10.7%,大于 30 bp 的占
11.9%。
2.3 蝴蝶兰 EST-SSR不同基序总重复次数的分析
从表 2 可以看出,74 种基序在不同重复次数范围内
的比例。 重复次数在 5~10 以内的有 58 种, 占总数的
78.4%; 重复次数在 11~20 以内的有 10 种 , 占总数的
13.5%。 重复次数在 21~30、31~40、41~50 的分别有 3、2、1
种,合计占总数的 8.1%。 从这些结果来看,重复次数主要
集中在 5~20以内,占总数的 91%以上。
2.4 蝴蝶兰 EST-SSR引物设计
在 376 条含有 SSR 位点的蝴蝶兰 EST 序列中, 挑选
重复序列长度大于 10 bp、远离两末端(大于 50 bp)而且
保守性的 EST 序列设计引物, 最后设计出 100 对 EST-
SSR 引物。 从表 3 可以看出设计引物的部分结果。 利用
Primer 3.0 设计出的所有引物的退火温度在 58~61℃之
间, 引物长度在 18~24 bp 之间,GC 含量在 40%~60%之
118
百分率(%)
78.4
13.5
0.4
0.3
0.1
100.0
基序种类数
58
10
3
2
1
74
SSR 总重复次数
5~10
11~20
21~30
31~40
41~50
总计
表 2 蝴蝶兰 EST-SSR 不同基序重复次数
重复基元
(AAG)5
(TA)5
(CCG)6
(CGG)5
(CTT)6
(GCTTCTTCG)5
(AT)5
(TTG)6
(ATT)10
(CCG)5
(GA)9
(CAC)5
(CT)5
(TC)5
(TTC)5
(TC)8
(AGAAGG)5
(GGC)5
(AT)31
(TAT)5
(TA)8
(TGA)6
产物大小(bp)
432
489
501
390
360
480
414
485
481
551
496
384
484
504
507
507
493
483
466
490
GC 含量(%)
47.62
50.00
57.89
45.00
45.00
50.00
55.00
40.91
47.62
50.00
50.00
39.13
50.00
50.00
50.00
45.45
50.00
45.00
50.00
50.00
45.00
50.00
45.00
33.33
40.00
50.00
42.86
55.00
50.00
50.00
55.00
43.48
45.00
45.00
52.38
45.45
45.00
43.48
50.00
45.00
退火温度(℃)
59.04
59.07
58.52
58.88
60.81
60.73
61.02
60.72
59.99
59.64
59.34
57.95
59.00
59.14
60.43
59.80
61.21
59.26
60.23
60.52
59.67
59.81
59.07
58.63
59.57
60.10
59.43
60.10
60.07
60.48
60.71
59.79
59.60
60.15
59.81
59.17
58.62
60.04
59.98
59.41
引物序列(5→3)
F: TGCTGAATGGAGATGCTACAG
R: GCCTTGAAAAGAGCATAGCC
F: GCAGAAGAGGTCGTCAAGG
R: ACACACAACAAACCCAAGGA
F: TCCTTCATTGCCATCATTCC
R: GCACACGTGAGAATGGAACA
F: CCAACGACCAACCACACTCT
R: TGGATTTTCTATTGTCGGTCGT
F: CCTAATCTGCTTCGGCTTCTT
R: TGGATTGTGGCATCAGTCTC
F: GGATGCGCAGTTACTTTCCT
R: CAAGACATATTTTCTCAGGTTGC
F: GGCACGAGGATTCCCTATAA
R: AAGCAACCAATCACCTCCTC
F: ACATCTTTGCCAGGTGGTGT
R: TTCCAACACTAGCCGCTATACA
F: ATTCCATGGCAGCAGTTGAG
R: AGGTGAACATCCCACGAAAT
F: TGAACCTTTGGAAGCTCACC
R: TCTTCGGTTCTCTTCGTTGC
F: AAAGATCCCCAGCACAGAAA
R: GCTCCTTATCGCCATTGAAG
F: AAATCTTCCTCAGCGCCTTA
R:TTTCACAGATCTTATTGATGTCCA
F: ATGGCAGCCAAAACATTCTT
R: CGTCGAAGGGTTTTGTAGGA
F: TGGTGAAGCATGTGAAGAAGA
R: GTACCGGGAAGTATCGAGCA
F: GGTTCCGGAGCTTGTTGATA
R: ACCAAAAAGGCCCTCTTCAC
F: CCAAAGACCCTCCGGTAAAC
R:CCAACCCATAAGAAACATACAGC
F: AGCAAAAATGGCAGAAGAGC
R: CGCACAACCACAAAGAAATG
F: CCATCTCTCTCTCGGTTGATG
R: CAGAACTCAACAGCTTGAAAGG
F: GTCTCGGAAAAGGAAAATGG
R:CAACACATAGACGAACTCCATCA
F: ATCGCGAGAGACCGAGTAAA
R: TTGAGCCTTCAGTTTGGACA
编号
FRI01
FRI02
FRI03
FRI04
FRI05
FRI06
FRI07
FRI08
FRI09
FRI10
FRI11
FRI12
FRI13
FRI14
FRI15
FRI16
FRI17
FRI18
FRI19
FRI20
表 3 引物设计序列
100
90
80
70
60
50
40
30
20
10
0
3213244112111233123226
75221
94
15
21
47
35
72
24
37
88
82787466646260585654525049464542403836353432302827262524222120181615141210
SS
R
数
量
(个
)
基序长度(bp)
图 2 蝴蝶兰 EST-SSR 的基元长度分布
间。 此外, 本试验设计的引物扩增出的产物大小在 350~
550 bp之间,有利于电泳检测和引物筛选。
2.5 蝴蝶兰 EST-SSR引物评价分析
从 100对设计的引物中, 随机选出 20 对引物进行合
成,并以 2个蝴蝶兰品种的 DNA为模板,通过对反应体系进
行优化,建立了合适的 EST-SSR引物的 PCR反应体系。 结
果表明,20对引物中有 16对引物扩增出稳定的 DNA条带,
达到 80%;其中有 12对引物扩增出的产物存在多态性。 从
部分 EST-SSR引物扩增的 PCR产物的电泳结果(图 3)可以
看出,本试验设计的引物约 60%可用于 EST-SSR分析。
119
(4):49-52.
[2] McIntosh R A,Lagudah E S.Gene Yr24 for resistance to stripe
rust[J]. Plant breed,2000,119:81-83.
[3] AL I M, W Q JI,Y G HU. Molecular implications from SSR
markers for stripe rust (puccinia striiformis F.SP. Tritici)
resistance gene in bread wheat line N95175 [J].Pak J Bot,
2010,42 (1):383-390.
[4] Allan R E, Purdy L H.Single gene control of stripe rust
resistance in wheat[J].Plant Dis Rep,1967,51:1041-1043.
[5] 李根桥. 川麦 42 抗条锈病基因 YrCH42 的定位及其与 Yr24 和
Yr26 的等位性检测[D].乌鲁木齐:新疆农业大学,2006.
[6] 章振宇,沈丽,刘泰国,等.不同小麦抗条锈基因及小麦品种在四
川的有效性[J].西南农业学报,2010,23(1):16-21.
[7] 黄萱,高丽美,张永彦,等.一种优化的植物总 DNA 提取方法[J].西
北植物学报,2004,24(6):1103-1106.
[8] 张海泉,贾继增,杨虹,等.来自粗山羊草抗条锈病基因的 SSR 标
记[J].遗传,.2008,30(4): 491-494.
[9] 董淑静,许为钢.小麦条锈病抗性基因研究进展及分子标记辅助
聚合育种[J].中国农业通报,2009,25(13):190-196.
[10] 夏先全,姚革,蒋文平.不同小麦材料成株期抗条锈病评价及变
异分析[J].西南农业学报,2010,23(4):1111-1115.
[11] 张妍,章振宇,沈丽,等.四川省阿坝州小麦条锈病遗传多样性分
析[J].西南农业学报,2009,22(6):1589-1595.
M 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
M:DL2000 DNA marker; 泳道 1、3、5、7、9、11、13、15
模板为红龙;泳道 2、4、6、8、10、12、14、16 模板为聚宝红
玫瑰;泳道 1 和 2、3 和 4、5 和 6、7 和 8、9 和 10、11 和 12、
13 和 14、15和 16 分别为相同引物对扩增的产物。
图 3 EST-SSR 引物在蝴蝶兰品种中的扩增结果
3 结论与讨论
3.1 蝴蝶兰 EST-SSR分布特征
本研究较系统地分析了蝴蝶兰 EST 序列中 SSR 分布
和重复基元的特点。 从 5 472 条蝴蝶兰无冗余 EST 序列
中检索到 376条 EST含有 419个 SSR位点,即 NCBI 数据
库中有 6.87%的蝴蝶兰 EST 能够检索到 SSR 位点。 在所
有的重复基元中, 二核苷酸重复占所有 SSR 的 67.1%,其
次是三核苷酸重复、占 30.3%,这与海岛棉和西瓜等农作
物的研究结果不一致[15-16]。这些农作物的 EST-SSR重复基
元以三核苷酸重复为最多,其次是二核苷酸重复。 此外,
在蝴蝶兰中, 二核苷酸和三核苷酸重复基元中出现最多
的重复基序分别为 AG/CT 和 AAG/CTT; 而在海岛棉中,
AT和 AAG为最多[15];在西瓜中,AT和 GAA为最多[16]。 这
些结果表明, 不同物种的 SSR 重复基元各有其自身的特
性。
3.2 EST-SSR标记在蝴蝶兰研究中的应用前景
目前,应用于蝴蝶兰种质资源遗传多样性分析、辐射
育种和亲源关系研究中的分子标记主要有 RAPD、ISSR
和 SSR[4-12]。由于基因组 SSR标记的开发耗力又费时,而且
效率低,限制了其应用。 本研究对 NCBI 数据库中蝴蝶兰
的 EST序列进行了 SSR 的分布、构成和数量等特性分析,
为在蝴蝶兰遗传育种中进一步开发利用蝴蝶兰的 EST-
SSR标记奠定了基础。
参考文献:
[1] 朱根发 ,王碧青 ,蒋明殿 ,等 .蝴蝶兰新品种‘红霞’[J].园艺学报 ,
2008,35(6):933.
[2] 朱根发,游文东,李泳志,等.蝴蝶兰新品种‘红珍珠’[J].园艺学报,
2008,35(8):1246.
[3] 许大熊,洪生标,李军,等.蝴蝶兰新品种‘汕农凤凰’[J].园艺学报,
2008,35(9):1402.
[4] Goh M W K,Kumar P P,Lim SH,et al.Random amplified
polymorphic DNA analysis of the moth orchids, Phalaenopsis
(Epidendroideae: Orchidaceae) [J].Euphytica,2005,141:11-22.
[5] Rodrigues K F,Kumar S V.Isolation and characterization of
microsatellite loci in Phalaenopsis gigantea [J].Conservation
Genetics, 2009,10:559-562.
[6] 明凤 ,董玉光 ,娄玉霞 ,等 .蝴蝶兰不同花色品种遗传多样性的
RAPD 分析[J].上海农业学报,2003,19(2):44-47.
[7] 章宁 ,苏明华 ,徐夙侠 ,等 .应用 RAPD 技术辅助蝴蝶兰辐射育
种[J].亚热带植物科学,2007,36(3):19-22.
[8] 赵谦,庄东红,杜虹,等.ISSR 在蝴蝶兰亲缘关系分析中的初步应
用[J].汕头大学学报(自然科学版),2007,22(4):66-70.
[9] 赵谦, 杜虹, 庄东红, 等.14 个蝴蝶兰品种遗传关系的 ISSR 分
析[J].植物研究,2008,28(2):227-231.
[10] 孙晓莉,章铁,刘秀清.蝴蝶兰 60Coγ 射线辐照材料的 RAPD 分
子标记研究[J].中国农学通报,2009,25(1):156-159.
[11] 张淑红,范永山,翟凤顺.蝴蝶兰不同花色遗传多样性的 ISSR 分
析[J].江苏农业科学,2009(2):77-78.
[12] 李敏,王尧峰,明凤.用 ISSR 分子标记技术分析 16 个蝴蝶兰品种
的亲缘关系研究[J].中国农业科技导报,2010,12(1):60-65.
[13] Huang Y, Li F,Chen K.Analysis of diversity and relationships
among Chinese orchid cultivars using EST -SSR markers [J].
Biochemical Systematics and Ecology,2010,38:93-102.
[14] 张艳欣,林忠旭,李武,等.海岛棉 EST-SSR 引物的开发与应用研
究[J].科学通报,2007,52(15):1779-1787.
[15] 赵胜杰,刘文革,阎志红,等.西瓜 EST 资源的 SSR 信息分析[J].中
国蔬菜,2009(24):47-51.
[16] Li D,Ye Q,Zhu G.Analysis of the germplasm resources and
genetic relationships among hybrid Cymbidium cultivars and
native species with RAPD markers [J].Agricultural Sciences in
China,2007,6(8):922-929.
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
(上接第 116页)
120