全 文 :作物学报 ACTA AGRONOMICA SINICA 2009, 35(2): 246−254 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn
本研究由国家高技术研究发展计划(863计划)项目(2006AA10Z156), 广东省自然科学基金项目(06025389, 07117967)资助。
第一作者联系方式: E-mail: Liang804@yahoo.com
Received(收稿日期): 2008-04-21; Accepted(接受日期): 2008-09-11.
DOI: 10.3724/SP.J.1006.2009.00246
花生栽培种 EST-SSRs分布特征及应用研究
梁炫强 洪彦彬 陈小平 刘海燕 周桂元 李少雄 温世杰
广东省农业科学院作物研究所, 广东广州 510640
摘 要: 利用自行开发的 20 160条花生栽培种荚果 EST, 通过序列拼接, 获得 8 289条无冗余 EST。经搜索, 共检测
出 740个 SSR位点, 分布于 651条 EST中, 发生频率为 7.8%, 平均每 6.8 kb EST序列含一个 SSR位点。功能注释结
果表明具生物过程、分子功能和细胞组分的 EST 分别为 73、111 和 56 条。在花生荚果 EST-SSR 中, 三核苷酸重复
类型出现频率最高, 占总 SSR的 62.8%, 其次是二核苷酸重复类型, 占总 SSR的 33.6%。在出现的 26类重复基序中,
AG/TC重复基序出现频率最高, AAG/TTC次之。利用 Primer premier 5从 651条含有 SSR的 EST中共设计引物 233
对, 从中随机选取 100对引物检测 EST-SSR在花生栽培种中的多态性及在野生种中的可转移性。结果表明, 有 86对
引物在供试的 22个花生栽培品种中得到有效扩增, 其中 10对在栽培种中具有多态性, 每对引物检测出的等位基因数
2~3个, 平均 2.2个。可扩增引物在野生种中的可转移率为 12.5%~100.0%, 平均 96.0%。在野生种间检测出多态性的
引物 76对, 每对引物检测出等位基因 2~9个, 平均 4.06个。
关键词: 花生栽培种; EST; SSR; 开发
Characterization and Application of EST-SSRs in Peanut (Arachis hypogaea L.)
LIANG Xuan-Qiang, HONG Yan-Bin, CHEN Xiao-Ping, LIU Hai-Yan, ZHOU Gui-Yuan, LI Shao-Xiong,
and WEN Shi-Jie
Crops Research Institute, Guangdong Academy of Agricultural Sciences, Guangzhou 510640, China
Abstract: Peanut (Arachis hypogaea L.) is one of the most important oilseed crops in China. Although there is a great difference
in growth habit, growth stage, and agronomic traits for peanuts, there is little polymorphism on the molecular level of RFLP,
RAPD, and AFLP. With development of peanut EST, a vast amount of available EST sequence has been documented. The objec-
tive of this study was to investigate distribution characteristics of EST-SSRs. Developed with a total of 20 160 EST from cDNA
library of two peanut cultivars, there were 651 SSR-containing EST identified, on average, one SSR had 6.8 kb of EST sequence
with tri-nucleotide motif (62.8%) as the most abundant motif types followed by di- (33.6%), tetra- (1.9%), hexa- (0.8%) and
penta-nucleotide (0.8%). The top six motif types with high frequency included AG/TC (25.8%), AAG/TTC (19.1%), AAT/TTA
(10.1%), ACC/TGG (7.4%), ACT/TGA (7.0%), and AT/TA (6.1%). Based on the 651 SSR-EST, a total of 233 primer pairs were
successfully designed and a subset (100 pairs) were synthesized to test the amplification and polymorphism in 22 peanut cultivars,
and to assess the transferability among 16 different wild species. The results showed that 86 primer pairs were amplified effec-
tively in peanut cultivars, 10 primer pairs of which exhibited polymorphism with 2–3 alleles, with an average of 2.2 alleles, were
detected. The cross-transferability of cultivated peanut EST-SSR markers to peanut wild species was very high, ranging from 12.5
to 100.0% with an average of 96.0%. Seventy-six markers exhibited polymorphism in wild species with 2–9 alleles, and an aver-
age of 4.06 alleles. The results indicated that peanut EST could be a resource for developing SSR. The high level of transferability
to wild species also implied that EST-SSR is a potentially useful marker for genetic studies in wild species.
Keywords: Peanut (Arachis hypogaea L.); EST; Mining; SSR
花生栽培种(Arachis hypogaea L.)属落花生属
(Arachis)花生区组 (Arachis section)异源四倍体
(2n=4x=40, AABB)。目前国内外征集的花生栽培种
种质资源近万份, 根据形态和生长习性等可将花生
栽培种分为 2 个亚种 6 个变种[1]。虽然花生栽培种
间在生长习性、生育期以及农艺性状存在很大差异,
但在 RFLP、RAPD、AFLP 等分子标记上存在极低的
遗传多态性[2-4], 仅在 SSR存在相对丰富的多态性[5]。
第 2期 梁炫强等: 花生栽培种 EST-SSRs分布特征及应用研究 247
由于花生基因组来源的 SSR开发投入较大且费时费
力, 目前国际上已开发的花生栽培种全基因组 SSR
引物序列仅千余条, 难于满足花生分子标记及相关
研究的需求, 开发花生栽培种 SSR 引物被列为国际
花生基因组计划的重要内容。
近年来, 大量快速增长的 EST数据成为 SSR的
重要来源, 并为 SSR标记的开发提供了新的途径[6]。
EST-SSR 除具一般 SSR 分子标记特点外, 还有以下
特殊优势: (1) 信息量大, 如果发现一个 EST标记和
某一性状连锁, 则该 EST 就可能与控制此性状的基
因相关[7-8]; (2) 通用性好, 由于 EST来自转录区, 其
保守性较高, 具有较好的通用性, 这在亲缘物种之
间校正基因组连锁图谱和比较作图方面有很高的利
用价值[9-11]; (3) 开发简单、快捷、费用低, 尤其是以
PCR为基础的 EST标记。目前许多作物如小麦[12]、
玉米[13]、葡萄[14]、甘蔗[15]已开发大量的 EST-SSR, 并
应用于遗传作图[16]、遗传多样性[17]等研究上, 但在
花生栽培种上至今尚未见从 EST中开发 SSR的相关
报道。
本文首次开发花生栽培种 EST-SSR标记, 并对
其在栽培种的遗传多态性, 以及在花生野生种的可
转移性进行系统分析和评价。
1 材料与方法
1.1 材料
花生品种粤油 20 和 Tifrunner 荚果 cDNA 文库
测序获得的 20 160条 ESTs。用于 EST-SSRs检测的
花生栽培种品种 22个, 野生种 16个, 由广东省旱地
作物资源库提供(表 1)。
1.2 基因组 DNA提取
每个品种取灌浆期的荚果 200 mg, 采用 CTAB
法提取基因组 DNA[18], 用 0.8%的琼脂糖凝胶电泳
检测DNA质量, 并根据对照 λDNA的亮度估计花生
基因组 DNA的浓度。
1.3 EST序列拼接
采用 TIGR基因指数聚类工具(TIGR Gene Indices
Clustering Tools, 简称 TGICL, http://compbio. dfci.harvard.
edu/tgi/software/)对花生栽培种粤油 20 和 Tifrunner 荚
果 EST序列进行拼接。当 EST序列重叠超过 50个核
苷酸且相似度达到 90%, 同时序列不匹配长度不超过
20个核苷酸时被认为符合拼接要求。
1.4 SSR位点搜索
采用自动搜索 SSR 位点的 Perl 脚本 Micro-
SAtellite (MISA, http://pgrc.ipk-gatersleben.de/ misa/)
在拼接后的 Uni-ESTs 序列中搜索 SSR 位点。SSR
位点搜索的限制因子为最短 14 bp, 二核苷酸最少重
复 7次 , 三核苷酸、四核苷酸、五核苷酸、六核苷
酸至少重复 5次, 设定MISA配置文件(misa.ini)中代
表 SSR 基序(motif)长度和最小重复次数的数据对在
为 2~7、3~5、4~5、5~5 和 6~5(不包含单核苷酸类
型)。
1.5 SSR-ESTs的功能注释
用 Blastx (http://www.ncbi.nlm.nih.gov/BLAST/)
对所获得的 SSR-ESTs进行功能注释, 其中序列比对
分值(score)大于 80, 序列同一性(identity)大于 35%。
1.6 SSR引物设计
根据 SSR位点两端的保守区域 , 采用 Primer
premier 5软件设计引物。引物设计原则基于: (1) 溶
解温度(Tm) 50~60 , ℃ 最适复性温度55 ; (2)℃ 扩增
产物大小100~500 bp; (3) 引物长度18~24 bp, 扩增
率大于80%; (4) 引物GC含量40%~60%。在PE9700
热循环仪(美国ABI公司)上进行PCR。
1.7 PCR扩增
PCR体系(20 μL)含 1×PCR buffer (50 mmol L−1
KCl, 10 mmol L−1 Tris-HCl, pH 8.3, 1.5 mmol L−1
MgCl2, 0.1%明胶), 1 U Taq DNA聚合酶, 50~100 ng
模板 DNA, 0.15 μmol L−1引物, 0.2 mmol L−1 dNTP。
反应程序为 94 5℃ min; 94 1 min, 55 30 s, 72 ℃ ℃ ℃
1 min, 35个循环; 72 5 min℃ 。扩增产物经 6.0%非变
性聚丙烯酰胺凝胶电泳(电泳缓冲液 1×TBE, 电压
75 V, 时间 2.5 h), 用 0.1% AgNO3染色, BIORAD凝
胶成像系统观察、照相、读带。
2 结果与分析
2.1 EST序列拼接
为了减少冗余序列, 提高 EST 序列的质量, 获
得比单个 EST序列更长的、来自同一特定基因的共
有序列, 采用 TGICL工具对花生栽培种荚果 EST进
行序列拼接。20 160条 EST经拼接后共获得 8 289
条 Uni-EST, 其中 contigs 1 434条和 singletons 6 855
条。
2.2 EST-SSR分布频率及特点
从 8 289 条 Uni-ESTs 序列中共搜索到 740 个
SSR 位点, 分布在 651 条 EST 序列中, 其中含有一
个 SSR以上的 ESTs 76条, 平均每 6.88 kb EST序列
含 1个 SSR位点(表 2)。
248 作 物 学 报 第 35卷
表 1 用于 EST-SSRs多态性检测的花生栽培种和野生种
Table 1 Cultivars and wild peanut species used in polymorphism test
编号
No.
品种名称
Name
类型
Species
倍性
Ploidy
来源
Source
1 PI 393531 栽培种, 连续开花亚种 Cultivar, ssp. fastigiata 2n=40 美国 America
2 PI 390693 栽培种, 连续开花亚种 Cultivar, ssp. fastigiata 2n=40 美国 America
3 琼山花生 Qiongshanhuasheng 栽培种, 连续开花亚种 Cultivar, ssp. fastigiata 2n=40 中国 China
4 辽宁四粒红 Liaoningsilihong 栽培种, 连续开花亚种 Cultivar, ssp. fastigiata 2n=40 中国 China
5 德豆 Dedou 栽培种, 连续开花亚种 Cultivar, ssp. fastigiata 2n=40 中国 China
6 广柳 Guangliu 栽培种, 连续开花亚种 Cultivar, ssp. fastigiata 2n=40 中国 China
7 三月拧 Sanyuening 栽培种, 连续开花亚种 Cultivar, ssp. fastigiata 2n=40 中国 China
8 粤油 20 Yueyou 20 栽培种, 连续开花亚种 Cultivar, ssp. fastigiata 2n=40 中国 China
9 Spancross 栽培种, 连续开花亚种 Cultivar, ssp. fastigiata 2n=40 美国 America
10 Tennessee Red 栽培种, 连续开花亚种 Cultivar, ssp. fastigiata 2n=40 美国 America
11 小硫球 Xiaoliuqiu 栽培种, 交替开花亚种 Cultivar, ssp. hypogaea 2n=40 中国 China
12 阳江铺地毡 Yangjiangpudizan 栽培种, 交替开花亚种 Cultivar, ssp. hypogaea 2n=40 中国 China
13 细花勾豆 Xihuagoudo 栽培种, 交替开花亚种 Cultivar, ssp. hypogaea 2n=40 中国 China
14 耙豆 Padou 栽培种, 交替开花亚种 Cultivar, ssp. hypogaea 2n=40 中国 China
15 Bo-50 栽培种, 交替开花亚种 Cultivar, ssp. hypogaea 2n=40 中国 China
16 英德鸡豆仔 Yingdejidouzai 栽培种, 交替开花亚种 Cultivar, ssp. hypogaea 2n=40 中国 China
17 河源半蔓 Heyuanbanman 栽培种, 交替开花亚种 Cultivar, ssp. hypogaea 2n=40 中国 China
18 托克逊小花生 Tuokexunxiaohuasheng 栽培种, 交替开花亚种 Cultivar, ssp. hypogaea 2n=40 中国 China
19 Sun Oleic 97R 栽培种, 交替开花亚种 Cultivar, ssp. hypogaea 2n=40 美国 America
20 Tifrunner 栽培种, 交替开花亚种 Cultivar, ssp. hypogaea 2n=40 美国 America
21 Georgia Green 栽培种, 交替开花亚种 Cultivar, ssp. hypogaea 2n=40 美国 America
22 NC0940-22 栽培种, 交替开花亚种 Cultivar, ssp. hypogaea 2n=40 美国 America
23 A. villosa 野生种, 花生区组 Wild species, Arachis section 2n=20 巴西 Brazil
24 A. stenosperma 野生种, 花生区组 Wild species, Arachis section 2n=20 巴西 Brazil
25 A. correntina 野生种, 花生区组 Wild species, Arachis section 2n=20 巴西 Brazil
26 A. cardenasii 野生种, 花生区组 Wild species, Arachis section 2n=20 巴西 Brazil
27 A. magna 野生种, 花生区组 Wild species, Arachis section 2n=20 巴西 Brazil
28 A. duranensis 野生种, 花生区组 Wild species, Arachis section 2n=20 阿根廷 Argentina
29 A. chacoensis 野生种, 花生区组 Wild species, Arachis section 2n=20 巴西 Brazil
30 A. batizocoi 野生种, 花生区组 Wild species, Arachis section 2n=20 玻利维亚 Bolivia
31 A. helodes 野生种, 花生区组 Wild species, Arachis section 2n=20 巴西 Brazil
32 A. monticola 野生种, 花生区组 Wild species, Arachis section 2n=40 阿根廷 Argentina
33 A. pintoi 野生种, 大根区组 Wild species, Caulorrhizae section 2n=20 巴西 Brazil
34 A. paraguariensis 野生种, 拟直立区组 Wild species, Erectoides section 2n=20 巴西 Brazil
35 A. pusilla 野生种, 异形花区组 Wild species, Heteranthae section 2n=20 巴西 Brazil
36 A. rigonii 野生种, 匍匐区组 Wild species, Procumbentes section 2n=20 巴西 Brazil
37 A. appressipila 野生种, 匍匐区组 Wild species, Procumbentes section 2n=20 巴西 Brazil
38 A. glabrata 野生种, 根茎区组 Wild species, Rhizomatosae section 2n=40 巴西 Brazil
表 2 花生栽培种荚果无冗余 ESTs中 SSR搜索结果
Table 2 Summary of mining SSR in peanut pod Uni-ESTs
查询项目 Searching item Contigs (kb) Singletons (kb) 合计 Total (kb)
无冗余 ESTs数目 Number of uni-ESTs 1434 (1237) 6855 (3857) 8289 (5095)
检测的 SSR数目 Number of identified SSRs 180 560 740
含 SSR的 ESTs数目 Number of SSR containing ESTs 156 495 651
含 1个以上 SSR的 ESTs数目 Number of ESTs containing over 1 SSR 19 57 76
复合型 SSR的数目 Number of SSRs present in compound formation 16 39 55
二核苷酸 Di-nucleotide 73 176 249
三核苷酸 Tri-nucleotide 98 367 465
四核苷酸 Tetra-nucleotide 7 7 14
五核苷酸 Penta-nucleotide 1 5 6
六核苷酸 Hexa-nucleotide 1 5 6
第 2期 梁炫强等: 花生栽培种 EST-SSRs分布特征及应用研究 249
花生栽培种 EST-SSR 种类较为丰富, 二至六核
苷酸重复类型均存在 , 但出现的频率差异较大(表
2)。三核苷酸重复类型出现频率最高, 共 465个, 占
总 SSR的 62.8%, 其次是二核苷酸重复类型(249个,
33.6%), 四核苷酸重复类型(14个, 1.9%), 五核苷酸
(6个, 0.8%)和六核苷酸重复类型(6个, 0.8%)。所有
重复类型平均 SSR长度为 20 bp, 其中二核苷酸, 三
核苷酸、四核苷酸、五核苷酸和六核苷酸平均 SSR
长度分别为 23、18、22、25和 37 bp。
在搜索出的花生栽培种 EST-SSR 中, 共观察到
26种重复基序类型(motif sequence type), 其中二、
三、四、五和六核苷酸重复基序分别为 3、10、5、
3和 5种。出现频率最高的 6种重复基序包括 AG/TC
(25.7%)、 AAG/TTG(19.1%)、 AAT/TTA(10.1%)、
ACC/TGG(7.4%)、AT/TA(7.0%)和 ACT/TGA(6.1%),
其他 22种重复基序出现频率为 24.6%(图 1)。
图 1 花生栽培种 SSR重复基序类型分布图
Fig. 1 Frequency distribution of EST-SSRs based on motif
sequence type
2.3 SSR-EST的功能注释
来源于基因转录部分的 EST-SSR最大特点是其
可能具有某些特定功能。为了探讨所开发的
EST-SSR 在花生功能基因组中的可能作用 , 运用
BlastX 程序(E-value Le-5), 在 Uniprot 数据库中对
651 条 SSR-EST 进行同源比对。基于 Uniprot 的基
因功能分类体系数据库注释(Gene Ontology Annota-
tion, 简称GOA)系统进行功能分类, 651条含 SSR位
点的 EST中有 240条可被划分为 3大功能类, 18个
功能亚类 , 涉及 377项功能 , 其余 411条因未能在
Uniprot 数据库中找到与之匹配的序列, 最终未能被
功能注释(表 3)。本研究中功能注释涉及的功能(377
项)比被注释的 EST数(240条)多, 这是功能注释时
单个 EST可能同时被注释多项功能造成的。在与生
物过程相关的 73 条 SSR-EST 所涉及的 123 项功能
中, 多数(67项)与细胞过程有关 , 其次是与生物调
节、区域定位、代谢过程、应激反应和发育过程相
关。与分子功能相关的 111 条 SSR-ESTs 所涉及的
166项功能中, 52.4%与结合因子有关, 31.3%与催化
反应相关。与细胞组分相关的 56 条 SSR-EST 所涉
及的 88 项功能中, 与细胞相关的占了 96.6%, 与大
分子复合物相关的占 2.3%, 与细胞外区域相关的占
1.1%。
2.4 EST-SSR引物设计及多态性检测
采用 Primer premier 5软件对 651条含 SSR的
EST设计引物 233对, 418条 ESTs由于 SSR位点侧
翼序列太短或者结构复杂而未能设计出引物。这些
表 3 SSR-EST的 GO功能注释
Table 3 GO functional categories of SSR-EST
功能大类
Broad categories
GO功能亚类
GO subset
GO ID GO功能项
Number of GO term
含 SSR的 ESTs
SSR-containing ESTs
应激反应 Response to stimulus GO: 0050896 4 7
代谢过程 Metabolic process GO: 0008152 5 8
区域定位 Establishment of localization GO: 0051234 11 19
发育过程 Developmental process GO: 0032502 1 2
细胞过程 Cellular process GO: 0009987 40 67
生物过程
Biological process
生物调节 Biological regulation GO: 0065007 12 20
转运因子 Transporter GO: 0005215 6 9
转录调节因子 Transcription regulator GO: 0030528 2 3
结构分子 Structural molecule GO: 0005198 5 7
分子传导因子 Molecular transducer GO: 0060089 1 1
酶调节因子 Enzyme regulator GO: 0030234 2 3
催化反应 Catalytic GO: 0003824 35 52
结合因子 Binding factor GO: 0005488 58 87
分子功能
Molecular function
抗氧化 Antioxidant GO: 0016209 3 4
大分子复合物 Macromolecular complex GO: 0032991 1 1
细胞外区域 Extracellular region GO: 0005576 1 2
细胞组分
Cellular component
细胞 Cell GO: 0005623 54 85
250 作 物 学 报 第 35卷
引物包含了花生栽培种 EST-SSR 的 5 种重复类型,
其中二、三、四、五和六核苷酸重复类型分别为 48、
173、5、3和 4条。
随机挑取 100 对引物检测 EST-SSRs 在花生栽
培种的多态性以及在野生种的可转移性(表 4)结果,
发现供试引物中有 86对在栽培种中能扩增出清晰
条带, 14对均无扩增产物。在可扩增的引物中, 61对
扩增产物与预期长度相近, 25对明显大于预期长度。
在栽培种中能产生有效扩增的 86对引物在野生种
中同样能产生有效扩增 ,在野生种中的可转移率为
12.5%~100.0%, 平均 96.0%, 花生栽培种 EST-SSR
在野生种中具有很高的可转移性。
在可扩增的 86对引物中只有 10对在 22个花生
栽培种间检测出多态性, 占扩增引物的 11.6%。每对
多态性引物检测出的等位基因数为 2~3个(图 2), 平
均 2.2个。相反, EST-SSR引物在野生种间检测的多
态性明显高于栽培种, 在野生种间检测出多态性的
引物多达 76 对, 占扩增引物的 88.3%。检测出等位
基因 309 个, 每对多态性引物检测出的等位基因为
2~9个, 平均 4.06个。
在可扩增的 86对引物中, R位于 5-UTR、3-UTR
和 CDS的引物分别有 19%、25%和 7%在栽培种中检
测出多态性, 检测出的等位基因数为 0.43、0.5和 0.158
个。显然, R位于 5′-UTR和 3′-UTR的引物在栽培种中
的多态性比位于 CDS的高。而在野生种间 3种引物的
多态性却相近, 有 90.0%、75.0%和 89.4%检测出多态
性, 检测出的等位基因数为 4.53、3.12和 3.47个。
图 2 引物 EM29在 22个花生栽培种品种间的扩增带型
Fig. 2 Amplification of EM29 in 22 cultivated peanut
M: markers; 1: PI 393531; 2: PI390693; 3: 琼山花生; 4: 辽宁四粒红; 5: Bo-50; 6: 英德鸡豆仔; 7: 河源半蔓; 8: 托克逊小花生; 9: 小硫
球; 10: 阳江铺地毡; 11: 细花勾豆; 12: 耙豆; 13: 德豆; 14: 广柳; 15: 三月拧; 16: 粤油 20; 17: Sunoleic; 18: Tifrunner; 19: GaG; 20:
Spancross; 21: NC0940-22; 22: Tennesse Red.
M: Markers; 1: PI393531; 2: PI390693; 3: Qiongshanhuasheng; 4: Liaoningsilihong; 5: Bo-50; 6: Yingdengjidouzai; 7: Heyuanbanman; 8:
Tuokexunxiaohuasheng; 9: Xiaoliuqiu; 10: Yangjiangpudizhan; 11: Xihuagoudou; 12: Padou; 13: Dedou;14: Guangliu; 15: Sanyuening; 16: Yueyou 20.
3 讨论
Proite 等[19]报道了花生属野生种 EST-SSR 标记
的开发, 但对花生栽培种至今尚未见相关报道。本
文利用测序的 20 160条花生栽培种EST, 检索出 740
个 SSR位点, 651条 ESTs(7.8%)含 SSR, 高于野生种
花生(5.9%)[19], 也高于玉米(1.4%)、大麦(3.4%)、小
麦(3.2%)和水稻(4.7%)[20]等其他作物 , 表明花生栽
培种 EST中含较为丰富的 SSR。
大多数植物的 EST-SSR以三核苷酸和二核苷酸
重复类型为主[21-22], 但主要的重复基序类型有所差
异。多数单子叶和双子叶植物以三核苷酸重复为主,
但一些木本植物如茶树和猕猴桃则以二核苷酸为
主。Proite 等[19]认为花生野生种的二核苷酸比三核
苷酸重复类型多 , 而本研究表明花生栽培种
EST-SSR 以三核苷酸重复类型为主(62.8%), 可能与
花生栽培种荚果 SSR特性有关。
本研究中花生栽培种 EST-SSR的二核苷酸重复
基序以 AG/TC(25.7%)和 AT/TA(6.1%)为主, 与野生
花生一致。三核苷酸基序以 AAG/TTC为主(19.1%),
与大豆[23]和拟南芥[24]相似, 这也是双子叶植物中最
丰富的重复类型。
本实验供试的 100 对 EST-SSR 引物中有 14 对
不能扩增, 其原因可能是上下游引物位点间有一个
或多个内含子, 或者扩增区段存在比较复杂的高级
结构造成。在可扩增的 86对引物中, 25对扩增的产
物片段大于预期长度, 这可能与扩增产物含有内含
子, 或者发生较大的 DNA 片刻插入有关。此外, 在
引物扩增时, 存在一些扩增产物显示多条带的现象,
由于本研究采用的退火温度较高, 这种现象可能是
花生栽培种基因组中存在多个与引物同源的序列或
复等位基因造成的[25]。
表 4 100个花生栽培种 EST-SSR基本特征及在栽培种和野生种中的等位基因数
Table 4 Characteristics of EST-SSR in 100 peanut cultivars and alleles numbers in cutivated and wild species
等位基因数 Allele No. 等位基因数 Allele No. 标记
Marker
基序
Motif
位置
Position
长度
Length
(bp)
扩增
Amplification
扩增长度
Amplified length
(bp)
栽培种
Cultivar
野生种
Wild species
标记
Marker
基序
Motif
位置
Position
长度
Length
(bp)
扩增
Amplification
扩增长度
Amplified length
(bp)
栽培种
Cultivar
野生种
Wild species
EM-1 (AAAT)5 3′-UTR 370 YES 480 2 EM-26 (TCCAGC)5 CDS 314 YES 300 2
EM-2 (GGT)6 CDS 148 YES 300 3 EM-27 (TC)14 5′-UTR 243 NO
EM-3 (GA)7 CDS 324 YES 310 3 EM-28 (TTC)18, (CTG)6 CDS 316 YES 310
EM-4 (ATG)7 CDS 247 YES 1000 2 EM-29 (GAT)7 CDS 257 YES 240 2 7
EM-5 (TCA)7 CDS 216 YES 210 4 EM-30 (CT)7 3′-UTR 199 YES 200 2 5
EM-6 (TGA)7 CDS 244 YES 240 2 EM-31 (CTT)10 5′-UTR 123 YES 90 3 9
EM-7 (CCA)6 CDS 129 NO EM-32 (TGG)6 5′-UTR 215 YES 210 5
EM-8 (AG)7 CDS 102 YES 100 2 EM-33 (CCG)6, (CAG)7 CDS 228 YES 220 4
EM-9 (AAT)6 CDS 206 YES 210 6 EM-34 (CGAAGA)5 CDS 282 YES 350 2 3
EM-10 (AAG)6, (CAT)5 5′-UTR 320 YES 320 4 EM-35 (CT)6, (CT)6 CDS 347 YES 350 2 3
EM-11 (CTT)8 CDS 368 YES 450 EM-36 (CAG)6 5′-UTR 158 YES 280 4
EM-12 (ATG)6 CDS 319 YES 300 5 EM-37 (AC)10 5′-UTR 115 YES 150 2 6
EM-13 (CCA)6 CDS 222 YES 450 2 EM-38 (GGT)7 CDS 274 YES 280 5
EM-14 (GAA)6 5′-UTR 251 YES 1000 3 EM-39 (CAC)6 CDS 326 YES 330 3
EM-15 (GGC)6 CDS 180 YES 180 4 EM-40 (GAA)11 CDS 375 YES 1000 2
EM-16 (TC)5, (ACC)6 5′-UTR 201 YES 210 5 EM-41 (AAT)6 CDS 145 YES 140 5
EM-17 (TG)9 CDS 207 NO EM-42 (AG)6, (AG)6 3′-UTR 340 YES 770 2 3
EM-18 (AAG)8 5′-UTR 289 YES 290 2 5 EM-43 (TTC)7 CDS 286 NO
EM-19 (AAG)7 5′-UTR 289 YES 500 5 EM-44 (ATG)6 CDS 239 YES 230 5
EM-20 (GGA)8 CDS 375 NO EM-45 (AG)10, (AG)6 5′-UTR 478 YES 770 2
EM-21 (GAG)6 CDS 374 YES 374 2 EM-46 (AGG)5, (AAT)5 CDS 313 YES 290 5
EM-22 (CT)12 3′-UTR 123 YES 100 5 EM-47 (TCT)6 CDS 541 NO
EM-23 (CCG)8 5′-UTR 189 YES 190 4 EM-48 (GAA)7 CDS 223 YES 770 3
EM-24 (AG)7, (GAA)5 5′-UTR 279 YES 450 EM-49 (TAT)12 5′-UTR 338 NO
EM-25 (CT)11 3′-UTR 298 NO 290 EM-50 (TTG)6 5′-UTR 204 YES 200
(续表4 Table 4 continued)
等位基因数 Allele No. 等位基因数 Allele No. 标记
Marker
基序
Motif
位置
Position
长度
Length
(bp)
扩增
Amplification
扩增长度
Amplified length
(bp)
栽培种
Cultivar
野生种
Wild species
标记
Marker
基序
Motif
位置
Position
长度
Length
(bp)
扩增
Amplification
扩增长度
Amplified length
(bp)
栽培种
Cultivar
野生种
Wild species
EE-1 (CT)7 5′-UTR 105 NO EE-26 (ATC)5 CDS 487 YES 420 6
EE-2 (TA)7 3′-UTR 309 YES 470 EE-27 (ACG)5 5′-UTR 208 YES 220 3
EE-3 (CAG)5 CDS 185 YES 180 2 EE-28 (ACC)5 CDS 232 YES 230 4
EE-4 (TCC)5 CDS 196 YES 190 EE-29 (GAA)5 CDS 140 YES 130 4
EE-5 (ACC)5 CDS 123 YES 100 2 EE-30 (AG)8 CDS 150 YES 150 5
EE-6 (CAA)5 5′-UTR 202 NO EE-31 (ACA)5 CDS 135 YES 135 5
EE-7 (AGA)5 CDS 215 NO EE-32 (AAG)5 CDS 119 YES 120
EE-8 (CTC)5 5′-UTR 138 YES 150 3 EE-33 (AGA)5 CDS 90 YES 100 4
EE-9 (CAG)5 CDS 280 YES 240 5 EE-34 (AAG)5 CDS 177 YES 250 2
EE-10 (TGA)5 CDS 281 YES 700 2 EE-35 (TCC)5 5′-UTR 191 YES 180 5
EE-11 (CTT)5 CDS 167 YES 160 3 EE-36 (TC)7 3′-UTR 223 YES 230 6
EE-12 (AAC)5 5′-UTR 129 YES 120 4 EE-37 (CTC)5 CDS 256 YES 1000 2
EE-13 (CAT)5 CDS 217 YES 210 3 EE-38 (CTC)5 CDS 147 YES 150 5
EE-14 (TC)7 3-UTR 172 YES 450 EE-39 (TCT)5 CDS 119 YES 110 3
EE-15 (CAC)5 5′-UTR 331 YES 320 2 EE-40 (CAT)5 CDS 135 YES 130 5
EE-16 (TGC)5 CDS 218 YES 450 3 4 EE-41 (TGT)5 CDS 134 NO
EE-17 (TCT)5 CDS 199 YES 200 3 EE-42 (AAG)5 CDS 227 YES 230 5
EE-18 (TCT)5 CDS 166 YES 160 3 EE-43 (CCA)5 CDS 175 YES 160 8
EE-19 (TAT)5 5′-UTR 227 YES 230 7 EE-44 (AGC)5 CDS 501 NO
EE-20 (CTT)5 CDS 368 YES 1100 3 EE-45 (GAT)5 CDS 274 YES 2000
EE-21 (ATC)5 CDS 314 NO EE-46 (CTT)5 CDS 278 YES 500 7
EE-22 (AG)7 5′-UTR 112 YES 100 2 6 EE-47 (TCG)5 CDS 191 YES 450 6
EE-23 (GAA)5 5′-UTR 191 YES 190 4 EE-48 (GAT)5 CDS 198 YES 210 4
EE-24 (CTT)5 CDS 406 YES 450 4 EE-49 (ATT)5 3′-UTR 97 YES 100 4
EE-25 (AAG)5 CDS 178 YES 180 7 EE-50 (AAC)5 CDS 117 YES 110
第 2期 梁炫强等: 花生栽培种 EST-SSRs分布特征及应用研究 253
虽然 EST-SSR存在信息量大、通用性好、开发
简单快捷等优点, 但与其他作物一样 [29-31], 它在花
生栽培种中同时也存在低多态性的缺点。 在本研究
可扩增的 86 对引物中只有 10 对在栽培种中检测出
多态性, 而且每对多态性引物检测出的等位基因只
有 2~3 个, 低于花生基因组 SSR[28]。这与 EST-SSR
基序重复次数有关[31]。通常 EST-SSR基序的重复次数
比 genomic-SSR的少, 因此相应的多态性也较低[32-34]。
此外, 基因编码区序列的保守性也是 EST-SSR 多态
性偏低的原因之一。
4 结论
利用花生栽培种 EST 开发 SSR 标记是可行的,
EST-SSR 分子标记在花生栽培种中具可扩增性, 在
野生种中具可转移性, 这对丰富花生栽培种 SSR 标
记具有积极的意义。与基因组 SSR 相比, EST-SSR
检测的多态性偏低, 但 EST-SSR 来源于表达基因,
作为有功能的分子标记, 可直接用于基因挖掘和基
因作图。
References
[1] Krapovickas A, Gregory W C. Taxonomia del genero Arachis
(Leguminosae). Bonplandia, 1994, 8: 1−186
[2] Kochert G, Halward T, Branch W D, Simpson C E. RFLP vari-
ability in peanut (Arachis hypogaea L.) cultivars and wild species.
Theor Appl Genet, 1991, 81: 565−570
[3] Subramanian V, Gurtu S, Rao R C N, Nigam S N. Identification
of DNA polymorphism in cultivated groundnut using random
amplified polymorphic DNA (PAPD) assay. Genome, 2000, 43:
656−660
[4] Milla S R, Isleib T G, Stalker H T. Taxonomic relationships
among Arachis sect: Arachis species as revealed by AFLP mark-
ers. Genome, 2005, 8: 1−11
[5] Ferguson M E, Burow M D, Schulze S R, Bramel P J, Paterson A
H, Kresovich S, Mitchell S. Microsatellite identification and
characterization in peanut (A. hypogaea L.). Theor Appl Genet,
2004, 108: 1064−1070
[6] Kantety R V, La Rota M, Matthews D E. Data mining for simple
sequence repeats in expressed sequence tags from barley, maize,
rice, sorghum and wheat. Plant Mol Biol, 2002, 48: 501−510
[7] Bozhko M, Riegel R, Schubert R, Muller-Starck G. A cyclophilin
gene marker confirming geographical differentiation of Norway
spruce populations and indicating viability response on excess
soil-born salinity. Mol Ecol, 2003, 12: 3147−3155
[8] Schubert R, Starck G M, Riegel R. Development of EST-PCR
markers and monitoring their intrapopulational genetic variation
in Picea abies L. Karst. Theor Appl Genet, 2001, 103: 1223−1231
[9] Brown G R, Kadel E E, Bassoni D L, Kiehne K L, Temesgen B,
van Buijtenen J P, Sewell M M, Marshall K A, Neale D B. An-
chored reference loci in loblolly pine (Pinus taeda L.) for inte-
grating pine genomics. Genetics, 2001, 159: 799−809
[10] Cordeiro G M, Casu R, McIntyre C L, Manners J M, Henry R J.
Microsatellite markers from sugarcane (Saccharum spp.) ESTs
cross transferable to erianthus and sorghum. Plant Sci, 2001, 160:
1115−1123
[11] Varshney P K, Sigmund R, Borner A, Korzun V, Stein N, Sorrells
M E, Langridge P, Grane A. Interspecific transferability and
comparative mapping of barley EST-SSR markers in wheat, rye
and rice. Plant Sci, 2005, 168: 195−202
[12] Gadaleta A, Mangini G, Mulè G, Blanco A. Characterization of
dinucleotide and trinucleotide EST-derived microsatellites in the
wheat genome. Euphytica, 2007, 153: 73−85
[13] Kantety R V, La Rota M, Matthews D E, Sorrells M E. Data
mining for simple sequence repeats in expressed sequence tags
from barley, maize, rice, sorghum and wheat. Plant Mol Biol,
2002, 48: 501−510
[14] Scott K D, Eggler P, Seaton G, Rossetto M, Ablett E M, Lee L S,
Henny R J. Analysis of SSRs derived from grape ESTs. Theor
Appl Genet, 2000, 100: 723−726
[15] Cordeiro G M, Casu R, McIntyre C L, Manners J M, Henry R J.
Microsatellite markers from sugarcane (Saccharum spp.) ESTs
cross transferable to erianthus and sorghum. Plant Sci, 2001, 160:
1115−1123
[16] Gupta P K, Rustgi S, Sharma S, Singh R, Kumar N, Balyan H S.
Transferable EST-SSR markers for the study of polymorphism
and genetic diversity in bread wheat. Mol Genet Genom, 2003,
270: 315−323
[17] Graham J, Smith K, MacKenzie K, Jorgenson L, Hackett C,
Powell W. The construction of a genetic linkage map of red rasp-
berry (Rubus idaeus subsp. idaeus) based on AFLPs, ge-
nomic-SSR and EST-SSR markers. Theor Appl Genet, 2004, 109:
740−749
[18] Lu S-D(卢圣栋). Current Protocols for Molecular Biology (现代
分子生物学实验技术). Beijing: Chinese Academy of Medical
Sciences & Peking Union Medical College Press, 1999. pp
101−136 (in Chinese)
[19] Proite K, Leal-Bertioli S C, Bertioli D J. ESTs from a wild Ara-
chis species for gene discovery and marker development. BMC
Plant Biol, 2007, 7: 7
[20] Kantety R V, La Rota M, Matthews D E. Data mining for simple
sequence repeats in expressed sequence tags from barley, maize,
rice, sorghum and wheat. Plant Mol Biol, 2002, 48: 501−510
[21] Varshney R K, Graner A, Sorrells M E. Genomic microsatellite
markers in plants: Features and applications. Trends Biotechnol,
2005, 23: 48−55
[22] Eujayl I, Sledge M K, Wang L. Medicago truncatula EST-SSRs
reveals cross-species genetic markers for Medicago spp. Theor
254 作 物 学 报 第 35卷
Appl Genet, 2004, 108: 414−422
[23] Gao L, Tang J, Li H, Jia J. Analysis of microsatellites in major
crops assessed by computational and experimental approaches.
Mol Breed, 2003, 12: 245−261
[24] Cardle L, Ramsay L, Milbourne D, Macaulay M, Marshall D,
Waugh R. Computational and experimental characterization of
physically clustered simple sequence repeats in plants. Genetics,
2000, 156: 847−854
[25] Li X-B((李小白), Cui H-R(崔海瑞), Zhang M-L(张明龙). De-
tecting the genetic diversity of Brassica napus by EST-SSRs. J
Agric Biotechnol (农业生物技术学报), 2007, 15(4): 661−667(in
Chinese with English abstract)
[26] Aggarwal R K, Hendre P S, Varshney R K. Identification, char-
acterization and utilization of EST-derived genic microsatellite
markers for genome analyses of coffee and related species. Theor
Appl Genet, 2007, 114: 359−372
[27] Guo W, Wang W, Zhou B. Cross-species transferability of Gar-
boreum-derived EST-SSRs in the diploid species of Gossypium.
Theor Appl Genet, 2006, 112: 1573−1581
[28] Ferguson M E, Burow M D, Schulze S R, Bramel P J, Paterson A
H, Kresovich S, Mitchell S. Microsatellite identification and
characterization in peanut (A. hypogaea L.). Theor Appl Genet,
2004, 108: 1064−1070
[29] Cho Y G, Ishii T, Temnykh S, Chen X, Lipovich L, McCouch S R,
Park W D, Ayres N, Cartinhour S. Diversity of microsatellites de-
rived from genomic libraries and GenBank sequences in rice
(Oryza sativa L.). Theor Appl Genet, 2000, 100: 713−722
[30] Cordeiro G M, Casu R, McIntyre C L, Manners J M, Henry R J.
Microsatellite markers from sugarcane (Saccharum spp.) ESTs
cross transferable to erianthus and sorghum. Plant Sci, 2001, 160:
1115−1123
[31] Nicot N, Chiquet V, Gandon B, Amilhat L, Legeai F, Leroy P,
Bernard M, Sourdille P. Study of simple sequence repeat (SSR)
markers from wheat expressed sequences tags (ESTs). Theor
Appl Genet, 2004, 109: 800−805
[32] Areshchenkova T, Ganal M W. Comparative analysis of poly-
morphism and chromosomal location of tomato microsatellite
markers isolated from different sources. Theor Appl Genet, 2002,
104: 229−235
[33] Cordeiro G M, Casu R, McIntyre C L, Manners J M, Henry R J.
Microsatellite markers from sugarcane (Saccharum spp.) ESTs
cross transferable to erianthus and sorghum. Plant Sci, 2001, 160:
1115−1123
[34] Ramsay L, Macaulay M, Ivanissivich S, MacLean K, Cardle L,
Fuller J, Edwards K, Tuvesson S, Morgante M, Massari A, Maes-
tri E, Marniorlin N, Sjakste T, Ganal M, Powell W, Powell W,
Waugh R. A simple sequence repeat-based linkage map of barley.
Genetics, 2000, 156: 1997−2005