免费文献传递   相关文献

Development and Utilization of EST-derived Microsatellites in Sesame (Sesamum indicum L.)

芝麻EST-SSR标记的开发和初步研究



全 文 :作物学报 ACTA AGRONOMICA SINICA 2008, 34(12): 2077−2084  http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn

基金项目: 国家自然科学基金项目(30471104); 国家重大基础研究前期研究专项(2003CCAO0700); 教育部 111工程项目(B08025)
作者简介: 魏利斌(1980−), 男, 山西大同人, 博士研究生, 主要从事分子遗传育种研究。E-mail: liwang206 @yahoo.com.cn
*
通讯作者(Corresponding authors): 郭旺珍(1970−), E-mail: moelab@njau.edu.cn; 张海洋(1963−), E-mail: zhy@hnagri.org.cn
两个完成单位具有同等贡献。
Received(收稿日期): 2008-05-04; Accepted(接受日期): 2008-07-15.
DOI: 10.3724/SP.J.1006.2008.02077
芝麻 EST-SSR标记的开发和初步研究
魏利斌 1 张海洋 2,* 郑永战 2 郭旺珍 1,* 张天真 1
(1 南京农业大学作物遗传与种质创新国家重点实验室, 江苏南京 210095; 2 河南省农作物新品种重点实验室, 河南郑州 450002)
摘 要: 为加速分子标记在芝麻研究中的应用, 利用网上现有的芝麻 EST(expressed sequence tags)数据信息, 开展了
芝麻 EST-SSR功能性标记的开发和利用研究。 在所有的 3 328条芝麻 EST序列中共确认得到 1 785条非冗余 EST
序列。其中, 在含有微卫星重复的 148条序列中共检测有 155个 EST-SSR。非冗余 EST序列总长为 774.27 kb, 平均
每 4.99 kb含有一个 EST-SSR。EST-SSR的分布频率和特征分析表明, 以 AG/TC为重复基元(motif)的 SSR出现最多,
占总 SSR 的 37.42%。利用这些序列, 设计开发了 50 对 EST-SSR 引物, 并分别选用 36个芝麻、2个棉花、2个大豆
和 2个油葵进行多态性和通用性研究。其中 44对引物在供试芝麻材料中扩增出条带, 共产生 108个位点, 平均每对
引物产生 2.45个位点, 多态信息含量(polymorphism information content, PIC)平均值为 0.390。根据遗传相似性系数进
行聚类, 有 26个芝麻材料聚类在两个大的亚类(III和 IV)中, 聚类结果表明芝麻的基因型与地理来源之间没有必然的
联系。此外, 分别有 2对、3对和 4对引物可以在棉花、大豆和油葵中进行通用性扩增。本研究证实这种全新开发的
芝麻 EST-SSR标记在芝麻遗传多样性分析、遗传图谱构建以及比较基因组等研究方面有广阔的利用前景。
关键词: 芝麻; 表达序列标签(EST); 简单重复序列(SSR); 多态信息含量(PIC); 遗传多样性
Development and Utilization of EST-derived Microsatellites in Sesame
(Sesamum indicum L.)
WEI Li-Bin1, ZHANG Hai-Yang2,*, ZHENG Yong-Zhan2, GUO Wang-Zhen1,*, and ZHANG Tian-Zhen1
(1 National Key Laboratory of Crop Genetics & Germplasm Enhancement, Cotton Research Institute, Nanjing Agricultural University, Nanjing
210095, Jiangsu; 2 Henan Key Laboratory of Crop Improvement, Zhengzhou 450002, Henan, China)
Abstract: The deficiencies of markers in Sesamum indicum L. that can be used at home and aboard seriously restrict its studies in
molecular field. To accelerate the application of molecular markers in sesame, EST-SSR markers development and utilization
using publicly available sesame EST data were performed. A total of 1 785 non-redundant EST sets were assembled among the
3 328 identified sesame EST. 148 microsatellites sequences containing 155 EST-SSR were detected from these EST. The total
length of the non-redundant EST sequences was 774.27 kb, on average one EST-SSR each 4.99 kb. The distribution characteris-
tics of the EST-SSR markers was analyzed. Among the SSR, dinucleotide AG/TC was the most abundant (occurring 58 times),
with frequency of 37.42%. According to these EST sequences containing SSR, 50 primer pairs were designed and tested on 36
sesame accessions, 2 cotton accessions, 2 soybean accessions, and 2 oil sunflower accessions to detect polymorphisms and trans-
ferability. With 44 EST-SSR, 108 loci were successfully amplified in sesame, with an average of 2.45 loci per primer pair. Of the
44 amplified primer pairs, 27(61.4%) primer pairs revealed polymorphisms in the 36 sesame accessions. The PIC (polymorphism
information content) ranged from 0.105 to 0.844, with an average of 0.390. Based on genetic similarity coefficient, the UPGMA
dendrogram grouped 26 of 36 accessions in to two sub-clusters (III and IV), but it revealed no association between genotypes and
geographical sources. In addition, 2, 3, and 4 SSR markers could be transferred to the PCR of cotton, soybean and oil sunflower
2078 作 物 学 报 第 34卷

respectively. This study effectively proved that EST-SSR from sesame is valuable for genetic analysis, linkage mapping and
transferability study among oil plants.
Keywords: Sesame (Sesamum indicum L.); EST; SSR; PIC; Genetic diversity
近几年, 国内外在芝麻(Sesamum indicum L.)分
子领域的研究已悄然兴起, 但可利用标记的匮乏严
重制约着其发展。目前, 在芝麻研究中应用到的分
子标记十分有限, 仅有少数关于 RAPD[1-2]、ISSR[3]、
AFLP[4]和 SSR[5]标记的初步报道, 尚未开展利用分
子标记技术进行芝麻品种改良及遗传图谱构建等研
究。加快芝麻的基因组研究, 需要开发更多有效的
分子标记。生物信息学和新标记技术的不断发展为
芝麻分子标记的开发提供了新手段。
在表达序列标签(expressed sequence tag, EST)
中存在一定数量的微卫星或简单重复序列
(EST-SSR), 因此 , EST-SSR 反映基因的编码部分 ,
可直接获得基因表达的信息, 并有可能对重要性状
的等位基因进行直接鉴定。利用 GenBank 上
(http://www.ncbi.nlm.nih.gov/dbEST/dbEST_summary
.html)公布的芝麻 EST 数据开发其功能性的
EST-SSR 标记, 不仅可降低引物开发的成本, 而且
能大大提高现有测序数据的利用效率。自 2000年起,
已有许多作物开展了 EST-SSR 标记的开发, 并已用
于基因组和分子育种研究等方面[6-9]。本文利用生物
信息学软件对网上公布的芝麻 EST-SSR的分布特征
进行了分析, 在此基础上开发 50对芝麻 EST-SSR标
记并初步研究了这些标记在芝麻和其他油料作物间
的可利用性。该结果将为芝麻 EST-SSRs标记的后续
开发以及应用于遗传多样性、遗传图谱构建和比较
基因组研究等方面奠定基础。
1 材料与方法
1.1 EST序列来源及 EST-SSR的检测
从 dbEST/GenBank (http://www.ncbi.nlm.nih/entrez)
中以 FASTA 格式下载芝麻中所有的来源于开花后
5~25 d种子形成过程的 EST序列, 共 3 328条。利
用 Blastclust (v.2.2.10; http://www.ncbi.nih.gov/web/
newsltr/spring04/blastlab.htm)软件, 对 3 328条 EST
序列进行冗余性查找, 再用文本文件中的查找功能
在非冗余的 1 785 条序列中查找以单核苷酸为重复
基元(motif)的 SSR; 并用在线软件 SSRIT (http://arsge-
nome.cornell.edu/cgi-bin/rice/ssrtool.pl)查找以 2、3、
4、5、6个核苷酸为重复基元的其余 5种类型 SSR。
种类型 SSR。SSR的查找标准为不同重复基元的 SSR
其总重复序列长度不低于 18个核苷酸。
1.2 EST-SSR的引物开发
利用 Primer 3.0(http://frodo.wi.mit.edu/cgi-bin/
primer3/primer3_www.cgi)对包含 155个 EST-SSR的
148条EST进行引物设计, 得到 50对EST-SSR引物。
引物设计的主要参数是, 引物长度 20~26 bp; 退火
温度 Tm值 48℃~65℃; (G+C)含量 30%~70%; PCR扩
增产物长度大于 150 bp; 引物由上海英骏生物技术
有限公司合成。采用 Blastn 和 Blastx (http://www.
ncbi.nlm.nih.gov)对 EST序列的相关信息和功能进行
预测(数据略)。
1.3 植物材料
选取 36个芝麻材料, 包括 18个国内品种, 16个
国外品种和 2个野生种(表 1), 用于检测所设计 EST-
SSR 引物的扩增效果和多态信息含量(PIC); 同时选
取 2个棉花材料(海 7124和 TM-1)、2个大豆品种(南
农 9416和科丰-1)、2个油葵品种(康地 1033和新葵
扎 1207-8), 用于检测芝麻 EST-SSR标记在这些作物
中的通用性。
1.4 DNA提取、PCR扩增和电泳检测
供试材料的 DNA 主要参照 Paterson 等[10]的方
法提取, 在美国MJ Research公司的 PTC-225上完成
SSR-PCR扩增。反应总体系为 10 μL, 其中含 1倍的
buffer, 2.0 mmol L−1的MgCl2, 0.1 mmol L−1的 dNTPs,
1 μmol L−1的引物, 0.5 U的 Taq 聚合酶和 80 ng的
模板 DNA。为避免和减少非特异性扩增的发生, 所
设退火温度均不低于 58℃。参照张军等[11]方法将扩
增产物在 6%聚丙烯酰胺凝胶中电泳, 银染, 检测多
态性。以 1、0记录扩增带型的有无。
1.5 多态信息含量和遗传相似性分析
多态信息含量被用来评估所设计引物的潜在利
用率。本实验的每个 EST-SSR引物的多态信息含量
按 Park 等[12]提供的公式计算, 即 PIC=1−∑
=
n
i 1
Pi2, 其
中 Pi为 i 位点的基因频率, n 为等位基因数。利用
NTSYS-pc Ver.2.10 [13]软件中的 SIMQUAL 程序对
36 个供试芝麻品种进行遗传相似性分析, 按 SHAN
程序和 UPGMA方法进行聚类分析生成聚类图[14-15]。
第 12期 魏利斌等: 芝麻 EST-SSR标记的开发和初步研究 2079


表 1 本实验所用 36个芝麻材料
Table 1 Description of 36 sesame accessions used in this study
编号
No.
材料名称
Accession
缩写
Abbreviation
来源
Source
驯化程度
Domestication
1 白芝麻 White sesame WS 山东 Shandong, China 栽培种 Cultivated
2 黄芝麻 Yellow sesame YS 辽宁 Liaoning, China 栽培种 Cultivated
3 河北霸王鞭 Hebei bawangbian HBBWB 河北 Hebei, China 栽培种 Cultivated
4 吐鲁番白芝麻 Tulufan white sesame TLFWS 新疆 Xinjiang, China 栽培种 Cultivated
5 巧家美字 Qiaojiameizi 1 QJMZ 云南 Yunnan, China 栽培种 Cultivated
6 中油所 1134 Zhongyousuo 1134 ZYS1134 湖北 Hubei, China 栽培种 Cultivated
7 荣县黑芝麻 Rongxian black sesame RXBS 四川 Sichuan, China 栽培种 Cultivated
8 湖南芝麻 Hunan sesame HNS 湖南 Hunan, China 栽培种 Cultivated
9 武乡芝麻 Wuxiang sesame WXS 山西 Shanxi, China 栽培种 Cultivated
10 五撮鞭 Wucuobian WCL 陕西 Shaanxi, China 栽培种 Cultivated
11 风台 1号 Fengtai 1 FT 安徽 An’hui, China 栽培种 Cultivated
12 广东黑芝麻 Guangdong black sesame GDBS 广东 Guangdong, China 栽培种 Cultivated
13 武宁黑芝麻 Wuning black sesame WNBS 江西 Jiangxi, China 栽培种 Cultivated
14 北京霸王鞭 Beijing bawangbian BJBWB 北京 Beijing, China 栽培种 Cultivated
15 豫芝 1号 Yuzhi 1 YZ 河南 Henan, China 栽培种 Cultivated
16 芩巩芝麻 Qingong sesame QGS 贵州 Guizhou, China 栽培种 Cultivated
17 崖州黑芝麻 Yazhou black sesame YZBS 海南 Hainan, China 栽培种 Cultivated
18 通榆芝麻 Tongyu sesame TYS 吉林 Jilin, China 栽培种 Cultivated
19 Tashengan 122 TSG122 苏联 Russia 栽培种 Cultivated
20 Japan sesame 301 JS301 日本 Japan 栽培种 Cultivated
21 Japan sesame 25 JS25 日本 Japan 栽培种 Cultivated
22 India sesame 3 IS3 印度 India 栽培种 Cultivated
23 India sesame 6 IS6 印度 India 栽培种 Cultivated
24 Turkey sesame TS 土耳其 Turkey 栽培种 Cultivated
25 Sesame 23-1 S23-1 阿联酋 United Arab Emirates 栽培种 Cultivated
26 Sesame 24-12 S24-12 阿联酋 United Arab Emirates 栽培种 Cultivated
27 Gaochanzhe GCZ 缅甸 Burma 栽培种 Cultivated
28 Black sesame B BSB 缅甸 Burma 栽培种 Cultivated
29 Liano27 Liano27 墨西哥 Mexico 栽培种 Cultivated
30 Venezuela sesame VZLAS 委内瑞拉 Venezuela 栽培种 Cultivated
31 Ethiopia sesame ETHS 埃塞俄比亚 Ethiopia 栽培种 Cultivated
32 Guinea K2-1 GUIK2-1 几内亚 Guinea 栽培种 Cultivated
33 Oro short-2 ORO-2 莫桑比克 Mozambique 栽培种 Cultivated
34 Ciano27 Ciano27 美国 America 栽培种 Cultivated
35 Wild sesame 1 WILD1 印度 India 野生种 Wild
36 Congo wide sesame CWILD 刚果 Congo 野生种 Wild
1~18为国内芝麻品种; 19~36 为国外芝麻品种。
1–18 are Chinese sesame accessions; 19–36 are exotic sesame accessions.

2 结果与分析
2.1 源于芝麻 EST的 SSR发掘及其特征分析
2.1.1 EST-SSR 的发掘 用 Blastclust (ver.2.2.10)和
ClastalX1.81软件对 3 328条 EST序列进行冗余性查找,
得到非冗余序列 1 785条。然后利用在线软件 SSRIT和
文本文件中的查找功能在非冗余序列中查找, 共获得
符合标准的EST-SSR 155个, 分布于148条EST序列中,
占被调查 EST的 8.68%。1 785条非冗余 EST序列拼接
总长度为 774.27 kb, 平均每 4.99 kb出现一个 SSR。
2080 作 物 学 报 第 34卷

参照 Weber[16]的分类标准把 155个 EST-SSR分
为精密型 (perfect)、非精密型 (imperfect)和复合型
(compound) 3种类型, 其中精密型SSR有125个(80.65%),
非精密型 SSR有 11个(7.10%), 复合型 SSR有 19个
(12.26%)(表 2)。在精密型 SSR中二核苷酸重复基元
类型的 SSR出现频率最多, 为 65个, 占整个精密型
SSR的 52.00%; 在非精密型 SSR中单核苷酸重复基
元类型的 SSR 出现频率最多, 为 8 个, 占整个非精
密型 SSR 的 72.73%。复合型 SSR 又分成精密复合
型 (perfect compound)和非精密复合型 (imperfect
compound)两类, 分别含 5个和 14个 SSR, 且全为二
核苷酸重复基元类型。

表 2 芝麻 EST-SSR的类型和频率
Table 2 Types and frequencies of EST-SSR in sesame
重复基元类型
Repeat motif type
数量
Number
频率
Frequency (%)
单核苷酸 Mono-nucleotide 9 7.2
二核苷酸 Di-nucleotide 65 52.0
三核苷酸 Tri-nucleotide 13 10.4
四核苷酸 Tetra-nucleotide 4 3.2
五核苷酸 Penta-nucleotide 3 2.4
六核苷酸 Hexa-nucleotide 31 24.8
精密型 Perfect
总数 Total 125 80.7

单核苷酸 Mono-nucleotide 8 72.7
二核苷酸 Di-nucleotide 3 27.3
非精密型 Imperfect
总数 Total 11 7.1

精密型 Perfect 5 26.3
非精密型 Imperfect 14 73.7
复合型 Compound
总数 Total 19 12.3

2.1.2 EST-SSR重复基元的类型特征 在精密型和
非精密型 SSR 中, 按照重复基元的种类, 可将 136 个
SSR分为 52种重复基元。 其中单、二、三和六碱基
重复基元中出现频率最多的重复基元分别是(A/T)n、
(AG/TC)n、(CCA/GGT)n 和(CGGCAA/GCCGTT)n (表
3)。它们在各自重复基元类型中的比例分别是 100%、
85.29%、23.08%和 29.03%(因四、五碱基重复基元类
型较少, 故未做统计)。在所有类型的重复基元中, 二
核苷酸重复基元出现的频率最高为 50.0%, 其次分别
为六、单、三、四和五核苷酸重复基元(表 3)。

表 3 精密型和非精密型 SSR中不同重复基元出现的频率
Table 3 Frequency of different repeat motifs in perfect and imperfect SSR
频率 Frequency (%) 最多的重复基元 The highest motif 重复基元类型
Motif type
数量
Number 非复合型 SSR
In perfect and imperfect SSR
总 SSR
In all SSR
类型
Type
数量
Number
频率
Frequency in all SSR(%)
Mono-nucleotide 17 12.5 11.0 (A/T)n 17 11.0
Di-nucleotide 68 50.0 43.9 (AG/TC)n 58 37.4
Tri-nucleotide 13 9.6 8.4 (CCA/GGT)n 3 1.9
Tetra-nucleotide 4 2.9 2.6 — — —
Penta-nucleotide 3 2.2 1.9 — — —
Hexa-nucleotide 31 22.8 20.0 (CGGCAA/GCCGTT)n 9 5.8

在检测到的 52种 SSR重复基元中, 所占比例最
大的是(AG/TC)n, 为 37.42%, 其次是(A/T)n, 为 10.97%
和(CGGCAA/GCCGTT)n, 为 5.81%等(图 1)。在复合
型 SSR 中, 所有的 19 个复合型 SSR 均为两核苷酸
和两核苷酸重复基元串联, 且每一串联重复基元的
长度大于 8 bp, 总长度不低于 18 bp。
第 12期 魏利斌等: 芝麻 EST-SSR标记的开发和初步研究 2081



图 1 芝麻 EST-SSR的分布频率
Fig. 1 Frequency distribution of sesame EST-derived SSR
based on motif numbers
本图仅列出 SSR基元频率大于 1.5%的类型。
SSR motifs frequency >1.5% in the figure.
2.2 芝麻 EST-SSR的有效扩增率和多态性分析
利用 Primer 3.0, 本文共设计 50对 EST-SSR引物,
并选取 36个芝麻品种对新合成引物进行扩增能力和
多态性分析。其中 44对(88%)引物扩增出特异性条带、
4对(8%)扩增出非特异性条带、2对(4%)无扩增产物。
44对引物共产生 108个位点, 平均每对引物产生 2.45
个位点。在可利用的 44对引物中有 27对(61.4%)在 36
个芝麻材料间扩增出多态, 共产生 91个多态性位点。
其中引物 Y1994检测到的位点最多为 7个(图 2)。
2.3 36个芝麻品种的遗传相似性分析
根据 27 对多态引物在 36 个芝麻材料中所获的
多态性位点数据, 得到 0.105~0.844的 PIC值, 平均
为 0.390。引物 Y1994显示最高的 PIC值(0.844)。聚
类分析(图 3)表明供试芝麻材料的聚类结果与地理

图 2 EST-SSR引物 Y1994对 36个芝麻材料扩增的聚丙烯酰胺凝胶电泳图
Fig. 2 Electrophoregram displaying the marker landing patterns of 36 sesame accessions with Y1994 EST-SSR primer
M: 分子量 marker; 01~36: 36个芝麻材料; 序号同表 1。
M: DNA ladders; 01–36: 36 sesame accessions. The numbers for each lane correspond with the numbers for accessions given in Table 1.

图 3 基于 91个 EST-SSR多态位点的 Jaccard相似性系数构建的 36个芝麻材料的聚类树状图
Fig. 3 UPGMA dendrogram of genetic relationships of sesame varieties based on the Jaccard similarity coefficient from the 91 am-
plified EST-SSR loci
2082 作 物 学 报 第 34卷

来源不存在相关性, 不同来源的品种交错分布在所
聚类的分支中; 2 个野生芝麻种(WILD1 和 CWILD)
作为第一分支(I)在相似性系数为 0.199 时和其余的
34个栽培种分开; 在相似性系数为 0.451时, 国内品
种河北霸王鞭(HBBWB)与其余的 33个栽培种分开。
当相似性系数为 0.675 时有两个大的亚支(III 和 IV)
被分开, 共包括 36个品种中的 26个, 其中在分支 IV
内聚类有 6 个国外和 12 个国内品种; 在分支 III 内
聚类有 2个国内和 6个国外品种。
2.4 芝麻 EST-SSR 标记在不同油料作物间的通
用性
利用所设计的 50对引物在棉花、大豆、油葵 3个
异属油料作物中进行 PCR扩增(退火温度不低于 62℃),
分别有 2对(Y1988和 Y1995)、3对(Y1966, Y1981,
Y2015)、4对(Y1984, Y2001, Y2005, Y2007)引物能扩增
出清晰条带, 可用于进一步的比较基因组学研究(图 4)。

图 4 芝麻 EST-SSR引物在不同油料作物中通用性的聚丙烯酰胺凝胶电泳图
Fig. 4 Electrophoregram displaying transferability of the sesame EST-SSR in different oil crops
M1~M4: 分子量 marker; 1~4: 棉花品种(1, 3: TM-1; 2, 4: 海 7124); 5~10: 大豆品种(5, 7, 9: 南农 9416; 6, 8, 10: 科丰-1); 11~18: 油葵
品种(11, 13, 15, 17: 康地 1033; 12, 14, 16, 18: 新葵扎 1207-8)
M1-M4: DNA ladders; 1–4: cotton accessions (1, 3: TM-1; 2, 4: H7124); 5–10: soybean accessions (5, 7, 9: Nannong 9416; 6, 8, 10: Ke-
feng-1); 11–18: oil sunflower accessions (11, 13, 15, 17: Kangdi 1033; 12, 14, 16, 18: Xinkuiza 1207-8).

3 讨论
对于 EST-SSR 的分布特征, 不同学者利用不同
的材料以及不同的 EST-SSR搜索标准导致了不同的
结果。在拟南芥中, 按照 Cardle等[17]的统计标准, 平
均 13.8 kb 出现一个 SSR; 按照 Morgante 等[18]的统
计标准, 平均 2.1 kb出现一个 SSR; 在水稻中, 按照
Cardle等[17]的统计标准, 平均 3.4 kb出现一个 SSR;
若按照 Gao 等[19]的统计标准, 将不同重复基元的最
小长度定为 18 bp, 则平均 11.8 kb出现一个 SSR。
本文按照 Gao等[19]的统计标准, 将不同(单、二、三、
四、五、六)重复基元的最小长度定为 18 bp, 结果显
示在芝麻中平均 4.99 kb出现一个 SSR。这明显高于
Gao等[19]小麦中平均 17.42 kb、水稻中平均 11.81 kb、
玉米中平均 28.32 kb、大豆中平均 23.80 kb出现一
个 SSR的研究结果。
与 EST-SSR 的分布特征相同, EST 中不同基元
类型 SSR 的出现频率, 不同研究者得出的结果也不
尽相同。在棉花[8]中, 按单核苷酸重复≥25 bp, 二核
苷酸重复≥14 bp, 三核苷酸重复≥15 bp的标准, 三
核苷酸重复出现的频率最高(38.31%), 其次是二核
苷酸(24.09%)和单核苷酸(23.35%); 在白菜[20]中, 按
单核苷酸重复≥15 bp; 二核苷酸重复≥14 bp; 三核
苷酸重复≥18 bp标准查找得出: 单核苷酸重复出现
的频率最高 (35.51%), 其次是三核苷酸 (33.15%)和
二核苷酸(30.67%); 但总的说来, 若按照 Kantety等[21]
对大麦、小麦、玉米、高粱和水稻查找 EST-SSR的
标准, 即所有重复基元总长度≥18 bp, 则上述各作
物均以三核苷酸重复出现的频率最高。然而, Sook
等[22]对杏、桃等蔷薇科植物的 EST-SSR分布特点的
研究表明, 二核苷酸重复出现的频率最高, 且均超
过总 EST-SSR个数的 50%。出现这种差异的原因可
能是各作物 EST 的组织来源不同。在对棉花
EST-SSR 分布特征的研究中, Wang等[8]和 Li等[23]用
不同组织来源的 EST 进行分析, 得出的结果相差较
大, 其中三核苷酸重复出现的频率分别为 38.31%和
54.80%; 本文中, 可能由于芝麻 EST-SSR数量较少,
二核苷酸重复出现的频率最高(56.13%), 与 Sook等[22]
的研究结果相似。此外, 在芝麻二核苷酸重复基元
中, (AG/TC)n基元类型出现频率最高(58/87, 66.67%),
这与上述各作物报道的二核苷酸重复基元结果相似
[9,17,21]。就 AG/TC基元类型出现频率较高这一现象,
第 12期 魏利斌等: 芝麻 EST-SSR标记的开发和初步研究 2083


Kantety等[21]做了详细的描述, 他们根据阅读框推测
AG/TC基元可被翻译为 Glu、Arg、Leu和 Ala等氨
基酸, 且Arg和 Leu在蛋白质中所占比例较高, 分别
为 8%和 10% [24]。
在 EST-SSR 标记的有效扩增率研究方面, 许多
报道 [19-20,22,25]均指出 , 所设计引物的有效扩增率应
在 60%~90%之间, 且可能会因所设引物跨越 mRNA
剪切位点以及扩增产物包含的内含子太大, 造成一
部分引物不能扩增出产物。本文所设计的引物 88%
均可扩增出清晰的条带, 扩增率较高, 这可能是所
设计引物中仅有少数跨越 mRNA剪切位点所致。
一般来说, EST-SSR 标记在揭示作物多态性方
面要低于基因组 SSR标记[25-28], 但也有不同的报道,
Saha等[29]用高杆酥油草开发的EST-SSR标记对黑麦
草和高秆酥油草两亲本进行多态筛选 , 多态率为
66%; Wang等[8]用雷蒙德氏棉 EST-SSR标记检测海、
陆四倍体栽培棉种间的多态性 , 多态率为 43%。
Gupta等[30]报道其合成的 EST-SSR标记在 18个外源
种中检测到 81.25%的多态性。相比较而言, 本实验
利用芝麻 EST开发的 EST-SSR标记在芝麻品种间得
到的多态性较高 (54%)。此外 , 有学者 [31-33]指出
EST-SSR 标记揭示的多态性会随着重复基元的长度
和类型的变化而变化。Yi等[34]指出重复基元大于 18
bp的 EST-SSR比小于 18 bp的 EST-SSR揭示的多态
水平要高(42.9%/17.7%), 并且二核苷酸重复基元的
EST-SSR 揭示的多态水平高于其他类型的重复基
元。本文较高的多态水平可能与实验中相对严谨的
搜寻标准(≥18 bp)和存在较多的二核苷酸重复基元
类型有关(25/50)。
用多态信息含量(PIC)来描述 EST-SSR 位点的
变异程度, PIC值越高, 说明该标记可提供的信息越
多。一般来说, EST-SSR标记的 PIC值会随着物种、
标记数目以及供试材料的不同而变化。本研究得到
的 PIC 平均值为 0.390(0.105~0.844), 这些标记将在
芝麻遗传多样性分析、遗传图谱构建、分子标记辅
助育种等方面的发挥作用。
根据遗传相似性聚类结果分析, 36个芝麻材料在
地理来源和聚类结果之间相关性较小。这与前人[1-4]
的研究结果一致。他们基于 RAPD、ISSR 和 AFLP
标记均发现不同地理来源的芝麻品种交错分布在整
个聚类树中。本研究中, 国内芝麻品种代表了供试
材料的多样性也可能是这个原因。我们认为在芝麻
进化方面 , 生态和地理因素并没有产生关键作用 ,
因此建议芝麻的种质收集策略应集中在大量材料的
收集方面, 一味追求收集不同地理来源的芝麻品种
不可取。
芝麻 EST-SSR标记在不同油料作物间可能因为
供试材料与芝麻不属于同一科, 致使本文所设标记
的可转移性较低, 但其可作为通用性标记在这些作
物中应用。
4 结论
开发了芝麻的 EST-SSR标记并初步证明其可利
用性。从 EST中开发 EST-SSR标记不仅速度快、成
本低, 而且理论上可为功能基因提供“绝对”的标记。
本文中的 EST-SSR 源于芝麻种子形成过程中的
cDNA 序列, 所以还可进一步用于种子油分合成的
基因组和分子育种等研究。
References
[1] Bhat K V, Babrekar P P, Lakhanpaul S. Study of genetic di-
versity in Indian and exotic sesame (Sesamum indicum L.)
germplasm using random amplified polymorphic DNA
(RAPD) markers. Euphytica, 1999, 110: 21−33
[2] Ercan A G, Taskin M, Turgut K. Analysis of genetic diversity
in Turkish sesame (Sesamum indicum L.) populations using
RAPD markers. Genet Res Crop Evol, 2004, 51: 599−607
[3] Kim D H, Zur G, Danin-Poleg Y, Lee S, Shim K, Kang C,
Kashi Y. Genetic relationships of sesame germplasm collec-
tion as revealed by inter-simple sequence repeats. Plant Breed,
2002, 121: 259−262
[4] Hernan E L, Petr K. Genetic relationship and diversity in a
sesame (Sesamum indicum L.) germplasm collection using
amplified fragment length polymorphism (AFLP). BMC
Genet, 2006, 7: 10
[5] Dixit A A, Jin M H, Chung J W, Yu J W, Chung H K, Ma K H,
Park Y J, Cho E G. Development of polymorphic microsatel-
lite markers in sesame (Sesamum indicum L.). Mol Ecol Notes,
2005, 5: 736−738
[6] Yu J K, LaRota M, Kantety R V, Sorrells M E. EST derived
SSR markers for comparative mapping in wheat and rice. Mol
Gen Genet, 2004, 271: 742−751
[7] Varshney R K, Sigmund R, Borner A, Korzun V, Stein N,
Sorrells M E, Langridge P, Graner A. Interspecific transfer-
ability and comparative mapping of barley EST-SSR markers
in wheat, rye and rice. Plant Sci, 2005, 168: 195−202
[8] Wang C-B(王长彪), Guo W-Z(郭旺珍), Cai C-P(蔡彩平),
Zhang T-Z(张天真). Characterization, development and ex-
ploitation of EST-derived microsatellites in Gossypium rai-
mondii Ulbrich. Chin Sci Bull (科学通报 ), 2006, 51(3):
316−320(in Chinese)
2084 作 物 学 报 第 34卷

[9] Jia X P, Shi Y S, Song Y C. Development of EST-SSR in
foxtail millet (Setaria italica). Genet Resour Crop Evol, 2007,
54: 233−236
[10] Paterson A H, Brubaker C, Wendel J F. A rapid method for
extraction of cotton (Gossypium spp.) genomic DNA suitable
for RFLP or PCR analysis. Plant Mol Biol, 1999, 11: 122−127
[11] Zhang J (张军), Wu Y-T(武耀廷), Guo W-Z(郭旺珍), Zhang
T-Z(张天真). Fast screening of microsatellite markers in cot-
ton with PAGE/silver staining. Acta Gossypii Sin (棉花学报),
2000, 12(5): 267−269 (in Chinese with English abstract)
[12] Park Y H, Alabady M S, Ulloa M. Genetic mapping of new
cotton fiber loci using EST-derived microsatellites in an in-
terspecific recombinant inbred (RIL) cotton population. Mol
Genet Genom, 2005, 274: 428−441
[13] Rohlf F J. NTSYS-pc: Numerical Taxonomy and Multivariate
Analysis System, Version 2.1, User Guide. New York: Exeter
Software, 2000
[14] Sokal R R, Michener C D. A statistical method for evaluating
systematic relationships. Univ Kansas Sci Bull, 1958, 28:
1409−1438
[15] Sneath P H, Sokal R R. Numerical Taxonomy: The Principal
and Practice of Numerical Classification. San Francisco: W.
H. Freeman and Company, 1973
[16] Weber J L. Informativeness of human (dC-dA)n·(dG-dT)n
polymorphisms. Genomics, 1990, 7: 524−530
[17] Cardle L, Ramsay L, Milbourne D. Computational and ex-
perimental characterization of physically clustered simple
sequence repeats in plants. Genetics, 2000, 156: 847−854
[18] Morgante M, Hanafey M, Powell W. Microsatellites are pref-
erentially associated with nonrepetitive DNA in plant ge-
nomes. Nat Genet, 2002, 30: 194−200
[19] Gao L F, Tang J F, Li H W. Analysis of microsatellites in
major crops assessed by computational and experimental ap-
proaches. Mol Breed, 2003, 12: 245−261
[20] Xin Y(忻雅), Cui H-R(崔海瑞), Zhang M-L(张明龙), Lim
Y-P(林容杓), Choi S-R(崔水莲). Development of EST (ex-
pressed sequence tags) marker in Chinese cabbage and its
transferability to rapeseed. Hereditas (遗传), 2005, 27(3):
410−416 (in Chinese with English abstract)
[21] Kantety R V, Rota M L, Matthews D E. Data mining for simple
sequence repeats in expressed sequence tags from barley, maize,
rice, sorghum and wheat. Plant Mol Biol, 2002, 48: 501−510
[22] Sook J, Abbott A, Jesudurai C. Frequency, type, distribution
and annotation of simple sequence repeats in Rosaceae EST.
Funct Integr Genom, 2005, 5: 136−143
[23] Li H-S(李华盛 ), Fan S-L(范术丽 ), Shen F-F(沈法富 ).
Screening of microsatellite markers from cotton EST. Acta
Gossypii Sin (棉花学报), 2005, 17(4): 211−216(in Chinese
with English abstract)
[24] Lewin B, Genes V. New York: Oxford University Press, 1994
[25] Chabane K, Ablett G A, Cordeiro G M. EST versus genomic
derived microsatellite markers for genotyping wild and culti-
vated barley. Genet Resour Crop Evol, 2005, 52: 903−909
[26] Cho Y G, Ishii T, Temnykh S, Chen X, Lipovich L, McCouch
S R, Park W D, Ayres N, Cartinhour S. Diversity of microsa-
tellites derived from genomic libraries and GenBank se-
quences in rice (Oryza sativa L.). Theor Appl Genet, 2000,
100: 713−722
[27] Scott K D, Eggler P, Seaton G, Rossetto M, Ablett E M, Lee
L S, Henry R J. Analysis of SSR derived from grape EST.
Theor Appl Genet, 2000, 100: 723−726
[28] Cordeiro G M, Casu R, McIntyre C L, Manners J M, Henry R
J. Microsatellite markers from sugarcane (Saccharum spp.)
EST cross transferable to erianthus and sorghum. Plant Sci,
2001, 160: 1115−1123
[29] Saha M C, Rouf Mian M A, Eujayl I, John C Z, Wang L J,
May G D. Tall fescue EST-SSR markers with transferability
across several grass species. Theor Appl Genet, 2004, 109:
783−791
[30] Gupta P K, Rustgi S, Sharma S, Singh R, Kumar N, Balyan H
S. Transferable EST-SSR markers for the study of polymor-
phism and genetic diversity in bread wheat. Mol Gen Genet,
2003, 270: 315−323
[31] Ellegren H. Microsatellites: Simple sequences with complex
evolution. Nat Rev Genet, 2004, 5: 435−445
[32] Sharopova N, McMullen M D, Schultz L, Schroeder S, San-
chez-Villeda H, Gardiner J, Bergstrom D, Houchins K,
Melia-Hancock S, Musket T, Duru N, Polacoo M. Develop-
ment and mapping of SSR markers for maize. Plant Mol Biol,
2002, 48: 463−481
[33] Temnykh S, DeClerck G, Lukashova A, Lipovich L, Cartin-
hour S, McCouch S. Computational and experimental analysis
of microsatellites in rice (Oryza sativa L.): Frequency, length
variation, transposon associations, and genetic marker poten-
tial. Genome Res, 2001, 11: 1441−1452
[34] Yi G, Lee J M, Lee S, Choi D, Kim B D. Exploitation of
pepper EST-SSR and an SSR-based linkage map. Theor Appl
Genet, 2006, 114: 113−130