全 文 :作物学报 ACTA AGRONOMICA SINICA 2012, 38(10): 1810−1817 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn
本研究由农业部农产品质量安全监管(种子管理)项目资助。
* 通讯作者(Corresponding author): 郭旺珍, E-mail: moelab@njau.edu.cn
Received(收稿日期): 2011-12-08; Accepted(接受日期): 2012-06-10; Published online(网络出版日期): 2012-07-27.
URL: http://www.cnki.net/kcms/detail/11.1809.S.20120727.0843.007.html
DOI: 10.3724/SP.J.1006.2012.01810
用于区别不同棉花品种基因组特征的微卫星位点筛选
赵 亮 蔡彩平 梅鸿献 郭旺珍*
南京农业大学 / 作物遗传与种质创新国家重点实验室 / 教育部杂交棉创制工程研究中心, 江苏南京 210095
摘 要: 保守性强、重复性好、多态性高的微卫星位点可被有效用于构建作物 DNA条形码。选取目前生产上主要推
广种植、代表不同来源系统的 12个棉花品种作为微卫星位点筛选材料, 参考已构建的四倍体栽培棉种种间高密度遗
传图谱信息, 从 376对覆盖全基因组的 SSR引物中, 筛选出 51对引物可扩增出带型清晰且多态性高的微卫星位点。
这些引物在 12个供试品种中共产生 155个等位位点, 每对引物揭示的等位基因位点在 2~7之间, 平均值为 3.04。参
照微卫星位点的染色体定位和多态信息, 在每条染色体上选择一个多态性相对高的 SSR 位点, 其相应的 26 对 SSR
引物被推荐为构建棉花品种 DNA条形码的一套首选引物, 并初步应用于 12个品种的 DNA条形码编制。其余 25对
引物作为候选引物。使用该套引物扩增出的微卫星位点可用于大量棉花品种 DNA条形码构建, 为棉花品种真实性和
纯度的分子鉴定奠定基础。
关键词: 棉花; 品种; 微卫星位点; DNA条形码
Screening of Microsatellite Loci for Identifying Genome Barcoding of Cotton
Cultivars
ZHAO Liang, CAI Cai-Ping, MEI Hong-Xian, and GUO Wang-Zhen*
State Key Laboratory of Crop Genetics and Germplasm Enhancement / Hybrid Cotton R&D Engineering Research Center, Ministry of Educatio /
Nanjing Agricultural University, Nanjing 210095, China
Abstract: Microsatellites or simple sequence repeats (SSRs) loci with high information content, reproducibility and locus speci-
ficity can be used effectively to construct DNA barcode in plant. In this study, 12 cotton cultivars derived from different germ-
plasm pedigrees and planted widely in three ecological cotton growing areas were selected to screen the SSR loci with high poly-
morphism. Based on our newly updated high-density genetic linkage map from G. hirsutum × G. barbadense BC1 mapping popu-
lation, we selected 51 primer pairs with clear amplification products and high polymorphism from 376 genome-wide SSR primer
pairs. In total, 155 polymorphic loci in 12 cultivars were produced by using the selected 51 primer pairs. Alleles ranging from two
to seven with an average of 3.04 were detected by each SSR primer pair. Of them, 26 SSR primer pairs, which amplified SSR loci
were tagged on corresponding 26 chromosomes in cultivated tetraploid cotton species, were recommended as first selected primer
pairs to establish DNA barcode of cotton cultivars, and other 25 SSR primer pairs could be used as candidate primer pairs. DNA
barcodes of 12 cultivars were further constructed effectively using these microsatellite loci with high polymorphism. In the future,
these microsatellite loci can be used to construct DNA barcode for a large number of cotton varieties, and applied effectively in
the identification of genuineness and purity in cotton cultivar seeds.
Keywords: Cotton; Cultivars; Microsatellite loci; DNA barcode
棉花(Gossypium spp.)是重要的经济作物, 棉纤
维是优良的天然纤维, 是重要的纺织工业原料。近
年来, 随着我国培育和审定棉花新品种的速度加快,
棉花品种数量逐年递增。而在新品种培育过程中 ,
由于少数骨干亲本的重复使用, 使棉花品种间的遗
传多样性越来越窄, 新育成品种的鉴定难度逐渐加
大。同时, 随着转基因等新技术在棉花育种中的应
用, 在原品种基础上仅改良少数甚至单个性状(基因)
的品种大量增加; 加之一些单位受商业利益的驱动
掩盖或篡改品种名称, 导致一些品种名称混乱, 仅
第 10期 赵 亮等: 用于区别不同棉花品种基因组特征的微卫星位点筛选 1811
靠表型性状已难于准确区分。急需建立一套客观、
可靠、易操作的鉴别技术为不同的棉花品种编制对
应的指纹身份证号。这是司法鉴定品种真实性和纯度的
迫切要求, 也是对棉花新品种权保护的重要保证[1-2]。
DNA 条形码(DNA barcode)是指生物体内能够
代表该物种, 可标准化、有足够变异、易扩增且相
对较短的 DNA片段。SSR标记具多态性高、稳定重
复性好、共显性遗传、扩增产物短、分布广泛等优
点[3-5], 被广泛应用到不同作物的遗传图谱构建、重
要农艺性状辅助选择、品种鉴定及遗传资源分析等
研究中。SSR 标记是构建作物 DNA 条形码(分子身
份证)的优选标记之一。近年来, 已在水稻、花生、
甘蔗、樱桃等作物中相继开展 SSR标记分子身份证
的构建工作[1,6-8], 但棉花上还未见该类相关报道。随
着 SSR 技术的产生及应用, 现已建成数张棉花种间
高密度遗传图谱 [9-12], 并相继开展了指纹图谱构建
和遗传多样性分析等研究[2,13-15]。创建不同品种特有
的 DNA 条形码, 是开展棉花品种 DNA 指纹特征数
据库构建研究的基础。
目前, 生产上大面积推广的棉花品种是陆地棉,
其不同品种间遗传多态性水平较低。为了创建不同
陆地棉品种特有的DNA条形码, 高多态性标记位点
的筛选和确定是前提和重要步骤[16]。本研究选用源
于不同棉花系统, 且近年来在三大棉花生态区生产
上大面积推广的 12个棉花品种, 基于我室构建的四
倍体栽培棉种种间高密度遗传图谱信息 [9], 筛选适
于棉花品种 DNA条形码构建的高多态性 SSR位点。
通过覆盖四倍体全基因组的 SSR 分子标记扩增分析,
成功筛选出一套共 26对 SSR引物, 其扩增的微卫星
位点涉及棉花 26 条染色体, 多态性高, 等位基因位
点清晰, 可用于区别不同棉花品种基因组特征。这
些位点已初步用于供试棉花品种的 DNA 条形码构
建。研究结果为今后棉花新品种的 DNA条形码构建
提供了高多态性微卫星位点, 为棉花品种真实性和
纯度的分子鉴定奠定了基础。
1 材料与方法
1.1 试验材料
选用 12个目前生产上三大生态区主要推广种植
的棉花品种, 其种子全部来自农业部征集的标准品
种, 由中国农业科学院棉花研究所提供(表 1)。包括
长江流域棉区 4 个(鄂杂棉 10 号、苏杂 3 号、湘杂
棉 10号和中棉所 63); 黄河流域棉区 5个(中棉所 70、
鲁棉研 21、鲁棉研 28、中植棉 2号和中棉所 50); 新
疆棉区 3个(中棉所 49、新陆早 33和新陆早 42)。12
个品种的系谱来源涉及斯字棉(苏杂 3号、中棉所 63、
鲁棉研 21 和鲁棉研 28)、福字棉(湘杂棉 10 号和鲁
棉研 21)、金字棉(鲁棉研 28)、黑山棉(中棉所 50)、
岱字棉(中棉所 49)等系统[17-18]。
1.2 DNA提取及数据处理
将试验种子播于土制的营养钵中, 每钵 1 粒, 待
棉株长到二叶一心时 , 取叶片混合 , 参考 Paterson
等[19]的方法提取基因组 DNA。在美国 MJ Research
公司的 PTC-225热循环仪上完成 PCR。参照前人相
关报道[20-21]电泳, 并检测扩增产物。
基于本实验室构建的四倍体栽培棉种种间高密度
遗传图谱信息[9], 每隔 10 cM 选取一个标记位点, 所选
位点相应的引物信息可从 CMD 数据库(http://www.
cottonmarker.org/)网站下载。调查每一引物在 12 个品
种中的扩增带型, 相同带型(相同的基因型)代号相同,
不同带型(不同的基因型), 依次记做 1, 2, 3, ……。
利用 PowerMarker V3.25 软件, 计算不同引物
的基因多样性指数及多态信息含量(PIC)值。
1.3 不同棉花品种 DNA条形码的初步构建
参考颜静宛等[6]对水稻分子身份证数据库的构
建方法, 在每条染色体上选取产生高多态性 SSR 位
点的 1对引物作为构建 DNA条形码的首选引物, 对
四倍体陆地棉共选择 26 对 SSR 引物。以其中一个
供试种为对照种, 获得其他供试棉花品种 26对 SSR
引物扩增产物的基因型代码。将对照种的扩增带型
记为 1, 后续泳道中遇到与其带型一致的记为 1, 不
一致的记为 2, 遇到与带型 2 不一致的记为 3, 依次
类推。获得供试品种通过 26 对 SSR 引物扩增的微
卫星位点基因型代码后, 按染色体号从小到大, 先
At亚组后Dt亚组的顺序依次排列, 构建给定棉花品
种 DNA条形码。
2 结果与分析
2.1 高多态性 SSR位点的筛选及评价
基于本实验室构建的四倍体栽培棉种种间高
密度遗传图谱信息[9], 每隔 10 cM 选取一个标记位
点, 共 376个位点, 利用相应的 SSR引物对 12份供
试材料 DNA 进行 PCR 检测和多态性鉴定。经重复
确定, 共选出 51对代表性强的 SSR引物, 其扩增的
微卫星位点带型清晰、多态信息含量高、扩增产物
覆盖 26个连锁群(表 2和表 3)。进一步对这 51对 SSR
引物在 12个棉花品种中的微卫星位点分析, 共得到
表 1 供试品种来源及基本信息
Table 1 Origin and basic information of 12 tested cultivars
序号
No.
品种
Cultivar
系谱
Pedigree
推广生态区
Ecological area
引进或审定年份
Introduced or
released year
选育单位
Institute of crop breeding
1 鄂杂棉 10号
Ezamian 10
太 96167×太 D-3
Tai 96167×Tai D-3
长江
The Yangtze River
2005 湖北惠民种业有限公司、中国农业科学院生物技术
研究所
SILCHH, BRICAAS
2 苏杂 3号
Suza 3
TB005×sGK321 长江
The Yangtze River
2005 江苏省农科院经济作物研究所、中国农业科学院生
物技术研究所 IICJAAS, BRICAAS
3 湘杂棉 10号
Xiangzamian 10
鄂抗棉 7号的选系×X309
Ekangmian 7 line×X309
长江
The Yangtze River
2006 湖南省棉花科学研究所、中国农业科学院生物技术
研究所
ICRHP, BRICAAS
4 中棉所 63
Zhongmiansuo 63
9053×中棉所 41选系 P4
9053×P4 line from Zhongmiansuo 41
长江
The Yangtze River
2007 中国农业科学院棉花研究所、中国农业科学院生物
技术研究所 ICRCAAS, BRICAAS
5 中棉所 70
Zhongmiansuo 70
sGK中 156×901-001
sGK Zhong 156 × 901-001
黄河
The Yellow River
2008 中国农业科学院棉花研究所、中国农业科学院生物
技术研究所 ICRCAAS, BRICAAS
6 鲁棉研 21
Lumianyan 21
石远 321选系×泗棉 3号转基因抗虫棉选系鲁 55系
Shiyuan 321×Simian 3-transgenic Lu 55
黄河
The Yellow River
2005 山东棉花研究中心、中国农业科学院生物技术研究
所 SCRC, BRICAAS
7 鲁棉研 28
Lumianyan 28
(鲁棉 14×石远 321)F1×5186、豫棉 19、中棉所 12、中棉
所 19、秦远 142、鲁 8784等品种的混合花粉
(Lumian 14 ×Shiyuan 321) F1 crossed by mixed pollen from
5186, Yumian 19, Zhongmiansuo 12, Zhongmiansuo 19,
Zhenyuan 142, and Lu 8784
黄河
The Yellow River
2006 山东棉花研究中心、中国农业科学院生物技术研究
所 SCRC, BRICAAS
8 中植棉 2号
Zhongzhimian 2
中植 372导入 Bt杀虫基因后,在病圃中选育而成
Bred from Zhongzhi 372 with Bt planted in disease nursery
黄河
The Yellow River
2006 中国农业科学院植物保护研究所、新乡县七里营新
植原种场、中国农业科学院生物技术研究所
IPPCAAS, XSFXC, BRICAAS
9 中棉所 50
Zhongmiansuo 50
H109×662 黄河
The Yellow River
2007 中国农业科学院棉花研究所、中国农业科学院生物
技术研究所 ICRCAAS, BRICAAS
10 中棉所 49
Zhongmiansuo 49
中棉所 35×中 51504
Zhongmiansuo 35 ×Zhong 51504
新疆
Xinjiang
2004 中国农业科学院棉花研究所 ICRCAAS
11 新陆早 33
Xinluzao 33
石选 87在天然重病地中的变异单株定向选择培育而成
Bred from Shixuan 87 planted in natural disease nursery
新疆
Xinjiang
2007 新疆农垦科学院棉花研究所 CRIXAARS
12 新陆早 42
Xinluzao 42
新陆早 10号×97-6-9
Xinluzao 10×97-6-9
新疆
Xinjiang
2009 新疆农垦科学院棉花研究所、新疆惠远农业科技发
展有限公司 CRIXAARS, ASTDLCHX
SILCHH: Seed Industry Limited Company in Huimin, Hubei; BRICAAS: Biotechnology Research Institute, Chinese Academy of Agricultural Sciences (CAAS); IICJAAS: Institute of Industrial
Crops, Jiangsu Academy of Agricultural Sciences; ICRHP: Institute of Cotton Research in Hunan Province; ICRCAAS: Institute of Cotton Research, CAAS; SCRC: Shandong Cotton Research
Center; IPPCAAS: Institute of Plant Protection, CAAS; XSFXC: Xinzhi Stock Field in Xinxiang County; CRIXAARS: Cotton Research Institute of Xinjiang Academy of Agricultural and
Reclamation Science; ASTDLCHX: Agricultural Science and Technology Development Limited Company in Huiyuan, Xinjiang.
表 2 用于构建棉花品种 DNA条形码的 26个首选引物信息
Table 2 Information of 26 preferred primer pairs for constructing DNA barcodes of cotton cultivars
引物
Primer
染色体
Chromosome
正向引物序列
Primer sequence (5′–3′)
反向引物序列
Primer sequence (5′–3′)
基因型数
Allele No.
基因多样性
Gene diversity
多态信息含量
PIC
NAU4073 A01 (Chr.01) CCCACCCTTTTCTTCTTTTT GCTGCCAAATTTCATCTCTT 4 0.7222 0.6713
NAU2277 A02 (Chr.02) GAACTAGCCACATGATGCAC TTGTTGAGGCATTAGTTTGC 3 0.5000 0.4491
NAU3839 A03 (Chr.03) GGGTAGGGGAAAAGTTTGTT CGTGAATTCCATCTCTCACA 3 0.4028 0.3633
NAU3592 A04 (Chr.04) CATCTTCAATTTCACCCACA TGAAAGGCAACTCCACAATA 4 0.7083 0.6519
NAU0797 A05 (Chr.05) AGAGAGCAAAAGCACGAGAC CTAACAGGGGTGACATAGGG 3 0.5694 0.5045
dPL0811 A06 (Chr.06) CCGCTAGGCTTGAGTAAGAATAGA GGCTGTCTTTGTTGTTGTGAGTTA 3 0.5694 0.5045
NAU1043 A07 (Chr.07) GTATCCGCCCACAAATAAAG GCATCGTGAGAGAAAGTGAA 4 0.5833 0.5295
NAU3793 A08 (Chr.08) TTGCAACAGCTCTGATGTTT TTTTGCCCTCTCTTTTATCC 3 0.6250 0.5454
NAU0462 A09 (Chr.09) CGATTTCCATTCCACACCTC GCATTGCAATCGAAACACAT 4 0.6806 0.6218
STV031 A10 (Chr.10) TTGGAAACTAATCTAAGGTCCCTCAA CTTGCTTCAACCTCTCATTCGTG 2 0.5000 0.3750
NAU5418 A11 (Chr.11) GTGACTGAGGAGCCAGAAGT AGCTGGTCCTCTTCTTCCTT 3 0.6528 0.5786
NAU4926 A12 (Chr.12) CGCCTCTGTATTCGATTCTC GCGTAAATAAAGCGAAAACC 4 0.7361 0.6874
NAU3398 A13 (Chr.13) TCCTTCATGTTCTCAAACGA CGTCTTCTTCAAGGTTGGAT 2 0.1528 0.1411
dPL0542 D01 (Chr.15) GTTCGAAAGTCCTTACAACCCTATT CAAGTCAAACAACCTAGGTACATGC 7 0.7639 0.7393
NAU2173 D02 (Chr.14) GCCAAATAGGTCACACACAA AGCGAGAAGGAGACAGAAAA 3 0.5694 0.5045
NAU1028 D03 (Chr.17) CCGCCTAAGACTAATTGGAA CAAATTGTAAGTGGCTGAGA 3 0.5000 0.4491
cgr6410 D04 (Chr.22) GAGTTCGGACCTCAATCGAC AAGCCGTCATCCAACAACAG 3 0.6250 0.5547
NAU1221 D05 (Chr.19) CATGCAAATCCATGCTAGAG AGGTTTCTTTGGTGGTGAAA 3 0.5694 0.5045
dPL0702 D06 (Chr.25) GATCTCTCTATCAACGACCAGGTT CAACCGTCCGTCATTAGTGTAATA 3 0.6528 0.5786
NAU3424 D07 (Chr.16) GTCAGGAAAAGCTGAAAGGA AAGAGGGCATTTCCATGATA 2 0.1528 0.1411
NAU3515 D08 (Chr.24) GTTGGTGCCATTGTTGAATA CCTTCCAATGTGCTCTTCTT 3 0.6667 0.5926
NAU3100 D09 (Chr.23) GCAATCAGCTCATCTTGCTT TGACGAAAATTTGTTGGATG 3 0.6111 0.5355
NAU6601 D10 (Chr.20) TCTATTTTACAACGCGACCA TGGCAAAGTGGTAAATGTTG 3 0.6111 0.5355
cgr5148 D11 (Chr.21) AGCAACTTTCAAGCTTTCTGTG TTCTGGTTTGTTGGCTCCAT 2 0.2778 0.2392
NAU2251 D12 (Chr.26) TTCTCCAGTAACCAACAAAGG AAAATATCATCCCCGTCAAA 2 0.1528 0.1411
CIR096 D13 (Chr.18) ACCCATCACCGTATCTT GATCTCATATTTGGCTCTG 2 0.5000 0.3750
Mean of 26 3.12 0.5406 0.4813
表 3 用于构建棉花品种 DNA条形码的候选 25个引物信息
Table 3 Information of 25 candidate primer pairs for constructing DNA barcode of cotton cultivars
引物
Primer
染色体
Chromosome
正向引物序列
Primer sequence (5′–3′)
反向引物序列
Primer sequence (5′–3′)
基因型数
Allele No.
基因多样性
Gene diversity
多态信息含量
PIC
NAU2265 A02 (Chr.02) CAATCACATTGATGCCAACT CGGTTAAGCTTCCAGACATT 2 0.2778 0.2392
NAU3419 A02 (Chr.02) AGAATCTGCAACCACATTGA CGGTTAAGCTTCCAGACATT 3 0.5000 0.4491
NAU6960 A05 (Chr.05) CAAATCCATGCTAGAGAGTA ATAGGGTTCATAGGTTTCTT 3 0.5694 0.5045
NAU3212 A05 (Chr.05) GAAAACAGTAGGAGCGATGG GGAGTTTGGGAAACCCTATC 4 0.5139 0.4760
NAU6094 A05 (Chr.05) ACTGCCTTCTGAACATAGCC ATCTTGAGTGCAAGGGAAAC 3 0.5694 0.5045
cgr5590 A05 (Chr.05) TCAACCGATCTCCAATCTCC AACCCAGCGAATCAGAATTG 2 0.4861 0.3680
NAU1085 A07 (Chr.07) AGTCGCCCCTTCTCTAATTT TGTAAACCGAACTCGTTGTG 3 0.6250 0.5547
NAU3467 A10 (Chr.10) AGCTAAGCGCTTCAAGTTGT ACGCATCCTAGAGGTCAGAA 2 0.2778 0.2392
cgr5565 A10 (Chr.10) GCCATTAACCCATTAGGCAA GCCATTGGAGCTTATAAGGATG 5 0.6944 0.6437
cgr5106 D01 (Chr.15) TGAACATGGTACTAGGGTGGC GCCAGAGCCATAGGAACTTG 3 0.6528 0.5786
NAU2343 D01 (Chr.15) GCTTTGCTTTGGAATGAGAT ATACTGCAACCCCTCACACT 3 0.4861 0.4235
NAU1070 D02 (Chr.14) CCCTCCATAACCAAAAGTTG ACCAACAATGGTGACCTCTT 3 0.5000 0.4491
NAU5467 D02 (Chr.14) TTCTTGGCTTCTTTCTTGCT CACCCTTCACCTTCAAAACT 3 0.6111 0.5355
NAU6634 D03 (Chr.17) TGCCTTATATACCCCATTTTTC CAGACTTCAAAATAGGCTTATGG 3 0.6250 0.5547
NAU7024 D03 (Chr.17) ACATAAGACACAAAGAGAGG AAGGAGGAGAGATTAAAGAA 3 0.5694 0.4768
NAU3110 D05 (Chr.19) CCAAGGATATGAACCAAAGG CGTGAACACCATGTCAGTCT 3 0.6250 0.5454
cgr6932 D06 (Chr.25) CACTAATGACGGACGGTTGA TTGATCATCCTCTTCCTTTGC 3 0.6528 0.5786
NAU3675 D08 (Chr.24) GGCTTTGCCTGTGAATCTAT AGGTTTGAGGCTGAGAGTGT 3 0.6250 0.5454
NAU0478 D08 (Chr.24) TGCATCTGATCTAATTGTTGGTG TGTTCCTCACAGCAAGAGCA 2 0.1528 0.1411
MUCS317 D09 (Chr.23) TTGACCGATCCAAGAAATGG GTATGTGCCTGTTGGGAAGG 3 0.6528 0.5786
TML05 D10 (Chr.20) AAGTTGCAGGTCTTTCTC ACCATCCATACCATCATC 2 0.5000 0.3750
Gh277 D10 (Chr.20) TACTAAAACCAAGGCAATAAAGTGA CACCACCTTCCATATATCTTGCTC 4 0.5972 0.5524
NAU5262 D13 (Chr.18) CGGCGAGCATTTTTATATCT GTCGATGGGGTGTTGTTATT 3 0.6250 0.5547
Gh501 D13 (Chr.18) CACAAATTGAAAGATACCCAGATCTTC TTCCTCATTCCCGTTCGATTTCAG 3 0.6528 0.5786
dPL0894 D13 (Chr.18) CGAGTAGCGTCTCACAAGAAA ATCCATTGCATTGAGCTTCC 3 0.6250 0.5547
第 10期 赵 亮等: 用于区别不同棉花品种基因组特征的微卫星位点筛选 1815
155 个等位位点, 每对引物揭示的等位基因位点在
2~7 之间, 平均值为 3.04。基因多样性指数变幅为
0.1528~0.7639, 平均值为 0.5436; PIC变幅为 0.1411~
0.7393, 平均值为 0.4807。
尽管陆地棉品种间多态性较低, 但参照染色体
定位和多态信息, 可在每条染色体上选择一个多态
性相对高的 SSR位点。针对棉花 26条染色体, 共选
择 26 对引物, 推荐为构建棉花品种 DNA 条形码即
分子身份证数据库的首选引物。26对首选引物在 12
个棉花品种中共扩增产生 81个微卫星等位位点, 平
均每对引物产生 3.12 个等位位点, 基因多样性指数
变幅为 0.1528~0.7639, 平均值为 0.5406; PIC变幅为
0.1411~0.7393, 平均值为 0.4813 (表 2)。26 对首选
引物中, 有 6 对引物检测到 2 个等位变异的微卫星
位点, 14对引物检测到 3个等位变异, 5对引物检测
到 4个等位变异, 1个引物对检测到 7个等位变异。
推荐其他 25 对引物作为棉花品种 DNA 条形码构建
的候选引物(表 3), 可通过组合不同引物获得不同微
卫星位点以确定某一品种的DNA条形码, 实现该品
种真实性及纯度鉴定目的。
2.2 基于微卫星位点染色体定位信息构建棉花
品种 DNA条形码
以鄂杂棉 10 号为对照种, 将 26 对 SSR 首选引
物在鄂杂棉 10 号 DNA 上检测的微卫星位点电泳带
型记为 1, 获得这些引物在其他 11份棉花品种的微
卫星位点电泳带型代码。以 SSR 引物 dPL0542
(Chr.15)扩增 12 个供试品种的扩增产物为例(图 1),
设定第二泳道鄂杂棉 10 号的扩增带型为 1, 后续泳
道中遇到与其带型一致的记为 1, 不一致的记为 2,
遇到与带型 2不一致的记为 3, 依次类推, 从而得知
图片中该引物在 12 个品种中的微卫星代码分别为
123145556557。进一步获得每一个中选引物在 12个
供试品种的微卫星位点代码, 根据微卫星位点的染
色体定位信息, 按染色体号从小到大, 先 At 亚组后
Dt 亚组的顺序依次排列, 串联各带型编号, 形成一
组数据, 获得每一供试品种在 26条染色体上的微卫
星位点代码组合, 共 26 位数字码, 形成相应棉花品
种特有的 SSR相对分子身份证号。身份证中的每一
位数值表示的是该品种相对对照种在不同染色体位
置的微卫星位点代码, 各个位置对应的标记顺序不
变, 形成该品种 DNA条形码(表 4)。
3 讨论
构建棉花品种DNA条形码数据库, 需要具有多
图 1 SSR引物 dPL0542扩增 12个供试品种的微卫星位点
Fig. 1 Microsatellite loci of 12 tested cotton cultivars
amplified by dPL0543 primer pairs
M: marker; 1: 鄂杂棉 10号; 2: 苏杂 3号; 3: 湘杂棉 10号; 4: 中
棉所 63; 5: 中棉所 70; 6: 鲁棉研 21; 7: 鲁棉研 28; 8: 中植棉 2
号; 9: 中棉所 50; 10: 中棉所 49; 11: 新陆早 33; 12: 新陆早 42。
1: Ezamian 10; 2: Suza 3; 3: Xiangzamian 10; 4: Zhongmiansuo 63;
5: Zhongmiansuo 70; 6: Lumianyan 21; 7: Lumianyan 28; 8:
Zhongzhimian 2; 9: Zhongmiansuo 50; 10: Zhongmiansuo 49;
11: Xinluzao 33; 12: Xinluzao 42.
表 4 12份棉花材料的 DNA条形码
Table 4 DNA barcode corresponding to 12 cotton cultivars
品种
Cultivar
DNA条形码
DNA barcode
鄂杂棉 10号 Ezamian 10 11111111111111111111111111
苏杂 3号 Suza 3 22122122212212222221221212
湘杂棉 10号 Xiangzamian 10 11221222311123321131231111
中棉所 63 Zhongmiansuo 63 33113131121211131311112112
中棉所 70 Zhongmiansuo 70 33131243111314323111123111
鲁棉研 21 Lumianyan 21 13123142322315123331313111
鲁棉研 28 Lumianyan 28 43113143223215132321313112
中植棉 2号 Zhongzhimian 2 43343342222415122331313111
中棉所 50 Zhongmiansuo 50 13313323212416122321311112
中棉所 49 Zhongmiansuo 49 43122343223315222222221112
新陆早 33 Xinluzao 33 22143143413315222331221222
新陆早 42 Xinluzao 42 43143142122117113331132111
态性高、信息量大、共显性、稳定性好、易于鉴定、
扩增产物短等特点的目标标记。国内外研究者的实
验结果均表明, SSR标记技术具有多态性高, 呈共显
性, 对样品 DNA 用量小、质量要求不高, 带型容易
统计 , 结果稳定 , 重演性好等优点 , 是进行不同材
料分子差异检测的优选标记。棉花的 SSR标记开发
与应用已取得长足发展, 在棉花 SSR 数据库 CMD
中, 整合了国内外同行开发的近 9 000对棉花 eSSR、
gSSR引物, 这些引物已被广泛用于棉花的基因组及
育种研究[21-26]。
在利用 SSR标记构建作物 DNA条形码研究中,
筛选和确定高多态性微卫星位点是首要和重要的步
骤[27]。同时, 来源于不同棉花图谱上的多态 SSR 标
记及染色体定位信息也为追溯和评价鉴定棉花品种
分子差异的微卫星位点来源及代表性提供了参考依
据, 将大大加速构建棉花不同品种DNA条形码的研
1816 作 物 学 报 第 38卷
究进程。本文综合考虑了 SSR引物所扩增的微卫星
位点在材料间的多态性、多样性指数及 PIC 值, 兼
顾引物扩增条带的清晰及易判别性, 依照已释放的
图谱信息 [9], 在棉花每条染色体上选择一个多态性
相对高的 SSR位点。按照上述原则, 最终得到 26对
扩增效果较好, 鉴别率较高的 SSR 引物, 推荐为构
建棉花品种DNA条形码的一套首选引物, 同时也提
供了 25对候选引物, 以满足不同来源品种鉴定及引
物组合的需求。这套涉及棉花 26条染色体, 多态性
较高的微卫星位点可用于今后构建不同来源棉花品
种的 DNA条形码数据库。
不同研究者对不同材料进行 DNA 条形码编码
的方式各不相同, 多数为一对或多对引物按条带有
无编成 0、1码。鉴于生产上大面积种植的陆地棉是
异源四倍体 , 基因组中存在重复或异位同效基因 ,
因此本研究中参考颜静宛等 [6]的方法, 建议利用棉
花 SSR标记构建其DNA条形码时, 至少在每条染色
体上选择一个高多态性的 SSR 位点, 共使用 26 对
SSR 引物扩增的微卫星位点, 用于构建供试品种 26
位数字码的相对 DNA条形码。相对 DNA条形码是
以供检测的其中一个品种的微卫星位点基因型值为
对照, 将其他不同品种在给定引物中的基因型代码,
按引物所在的染色体号从小到大, 先 At 亚组后 Dt
亚组的顺序依次排列, 构建供试棉花品种的 SSR 相
对 DNA条形码。在本研究中, 我们随机选择鄂杂棉
10号为构建棉花品种DNA条形码的对照品种, 验证
了这种排列的有效性。鉴于陆地棉遗传标准系 TM-1
遗传背景的纯合一致性及其在遗传、育种研究中应
用的广泛性, 建议在今后棉花品种DNA条形码构建
中, 均选用 TM-1作为标准对照品种, 构建供试品种
的DNA条形码, 以利于不同棉花品种间分子差异的
比较和鉴定。
由于陆地棉品种间多态性较低, 为了筛选获得
既涉及每一染色体, 多态性又相对高的 SSR 位点,
有效区别不同棉花品种基因组特征, 本研究选用了
12个棉花推广品种, 其种植地区涉及我国三大棉区;
系谱来源涉及斯字棉、福字棉、金字棉、黑山棉、
岱字棉等遗传系统; 由 11个研究院所及公司参与选
育, 引进或审定的年份跨度从 2004 年到 2009 年。
因此, 利用这些材料, 基于全基因组覆盖的标记位
点筛选, 在 26条染色体上均筛选到多态性相对高的
SSR位点, 并将其相应的 26对 SSR引物推荐为构建
棉花品种 DNA条形码的一套首选引物。这套首选引
物扩增的微卫星位点能很好地代表不同来源棉花品
种的多样性特点 , 有望广泛推广到其他棉花品种
DNA 条形码构建中, 为棉花品种真实性和纯度鉴定
奠定基础。
为了有效发挥分子标记技术在棉花品种 DNA
条形码构建及品种知识产权保障中的作用, 在今后
的研究中, 建议进一步加强以下工作。第一, 力求供
试材料来源可靠, 完整。棉花品种 DNA条形码构建
的主要目的之一是鉴定棉花品种纯度和真实性, 避
免棉花品种混乱; 而现今生产上推广的棉花品种中,
杂交种占据相当大的比例, 在构建 DNA 条形码时,
应当同时构建双亲及杂种 F1的 DNA 条形码, 确保
杂交种品种的真实性和可靠性。本文的研究重点是
筛选构建棉花品种DNA条形码的微卫星位点, 主要
关注了供试品种的系统来源, 没有考虑供试材料的
品种特点。建议今后构建苏杂 3号、鄂杂棉 10号、
中棉所 70、中棉所 63和湘杂棉 10号等 5个杂交种
的 DNA 条形码时, 考虑从育种单位收集其亲本, 同
步构建其亲本的 DNA条形码。第二, 继续筛选和补
充新 SSR位点。本文选用 12个棉花品种, 共获得 26
对首选引物和 25对候选引物, 扩增出多态性相对高
的 SSR 位点。但供试材料数量有限, 还不能完全代
表棉花品种的多样性。同时, 棉花栽培品种均为四
倍体, 其基因组大小为 2 250 Mb。对于这样庞大的
基因组, 要达到精细鉴定棉花品种, 每条染色上只
选择一个 SSR位点来检验棉花品种的真实性和纯合
性还远远不够。因此, 在今后实践中, 应增加不同来
源棉花品种样本量, 发掘新多态性 SSR 位点, 确保
准确构建不同来源棉花品种的 DNA条形码。
4 结论
获得一套共 26 对 SSR 引物可扩增出多态性高,
易于鉴别, 且涉及 26 条染色体的微卫星位点, 并用
于棉花品种 DNA条形码数据库构建。提出按多态性
微卫星位点所在染色体号从小到大, 先 At 亚组后
Dt亚组的顺序编制棉花品种 26位 DNA条形码。该
方法及提供的微卫星位点可用于棉花新品种 DNA
条形码数据库构建, 及品种真实性和纯度鉴定。
致谢: 感谢中国农业科学院棉花研究所匡猛博士提
供用 12份棉花标准品种。
References
[1] Liu X-L(刘新龙 ), Ma L(马丽 ), Chen X-K(陈学宽 ), Ying
X-M(应雄美), Cai Q(蔡青), Liu J-Y(刘家勇), Wu C-W(吴才文).
Establishment of DNA fingerprint ID in sugarcane cultivars in
第 10期 赵 亮等: 用于区别不同棉花品种基因组特征的微卫星位点筛选 1817
Yunnan, China. Acta Agron Sin (作物学报), 2010, 36(2): 202−
210 (in Chinese with English abstract)
[2] Kuang M(匡猛), Yang W-H(杨伟华), Xu H-X(许红霞), Wang
Y-Q(王延琴), Zhou D-Y(周大云), Feng X-A(冯新爱) Construc-
tion of DNA fingerprinting and analysis of genetic diversity with
SSR markers for cotton major cultivars in china. Sci Agric Sin (中
国农业科学), 2011, 44(1): 20−27 (in Chinese with English ab-
stract)
[3] Kashi Y, King D, Soller M. Simple sequence repeats as a source
of quantitative genetic variation. Trends Genet, 1997, 13: 74–78
[4] Röder M S, Korzun V, Gill B S, Ganal M W. The physical map-
ping of microsatellite markers in wheat. Genome, 1998, 41:
278–283
[5] Röder M S, Korzun V, Wendehake K, Plaschke J, Tixier M H,
Leroy P, Ganal M W. A microsatellite map of wheat. Genetics,
1998, 149: 2007–2023
[6] Yan J-W(颜静宛), Tian D-G(田大刚), Xu Y(许彦), Wang F(王
锋). Constructing SSR molecular database for identity system of
hybrid rice parents. Fujian J Agric Sci (福建农业学报), 2011,
26( 2): 148−152 (in Chinese with English abstract)
[7] Zhao X-Y(赵新燕), Huang L(黄莉), Ren X-P(任小平), Jiang
H-F(姜慧芳), Chen Y-N(陈玉宁). Establishment of DNA finger-
print identity of Arachis species with high oil content. Acta Agric
Boreali-Sin (华北农学报) 2010, 25(6): 64−70 (in Chinese with
English abstract)
[8] Ai C-X(艾呈祥), Zhang L-S(张力思), Wei H-R(魏海蓉), Yuan
K-J(苑克俊), Jin S-N(金松南), Liu Q-Z(刘庆忠). Construction
of molecular fingerprinting database for sweet cherry using SSR
markers. Chin Agric Sci Bull (中国农学通报), 2007, 23(5):
55–58 (in Chinese with English abstract)
[9] Guo W Z, Cai C P, Wang C B, Zhao L, Wang L, Zhang T Z. A
preliminary analysis of genome structure and composition in
Gossypium hirsutum. BMC Genomics, 2008, 9: 313
[10] Rong J, Abbey C, Bowers J E, Brubaker C L, Chang C, Chee P W,
Delmonte T A, Ding X, Garza J J, Marler B S, Park C H, Pierce
G J, Rainey K M, Rastogi V K, Schulze S R, Trolinder N L,
Wendel J F, Wilkins T A, Williams-Coplin T D, Wing R A,
Wright R J, Zhao X, Zhu L, Paterson A H. A 3347-locus genetic
recombination map of sequence-tagged sites reveals features of
genome organization, transmission and evolution of cotton (Gos-
sypium). Genetics, 2004, 166: 389–417
[11] Nguyen T B, Giband M, Brottier P, Risterucci A M, Lacape J M.
Wide coverage of the tetraploid cotton genome using newly de-
veloped microsatellite markers. Theor Appl Genet, 2004, 109:
167–175
[12] Frelichowski J E Jr, Palmer M B, Main D, Tomkins J P, Cantrell
R G, Stelly D M, Yu J, Kohel R J, Ulloa M. Cotton genome map-
ping with new microsatellites from Acala ‘Maxxa’ BAC-ends.
Mol Gen Genom, 2006, 275: 479–491
[13] Wu Y-T(武耀廷), Zhang T-Z(张天真), Yin J-M(殷剑美). Genetic
diversity detected by DNA markers and phenotypes in upland
cotton. Acta Genet Sin (遗传学报), 2001, 28(11): 1040–1050 (in
Chinese with English abstract)
[14] Zhu L-F(朱龙付 ), Zhang X-L(张献龙 ), Nie Y-C(聂以春 ).
Analysis of genetic diversity in upland cotton (Gossypium hirsu-
tum L.) Cultivars from China and foreign countries by RAPDs
and SSRs. J Agric Biotechnol (农业生物技术学报), 2003, 11(5):
450–455 (in Chinese with English abstract)
[15] Liu S, Cantrell R G, McCarty J C, Stewart J M. Simple sequence
repeat-based assessment of genetic diversity in cotton race stock
accessions. Crop Sci, 2000, 40: 1459–1469
[16] Zhao J-R(赵久然), Wang F-G(王凤格), Guo J-L(郭景伦), Chen
G(陈刚), Liao Q(廖琴), Sun S-X(孙世贤), Chen R-M(陈如明),
Liu L-Z(刘龙洲). Series of research on establishing DNA finger-
print pool of Chinese new maize cultivars: II. Confirmation of a
set of SSR core primers pairs. J Maize Sci (玉米科学), 2003,
11(2): 3–5 (in Chinese with English abstract)
[17] Huang Z-K(黄滋康). Cotton Varieties and Their Genealogy in
China (revised and enlarged edition)[中国棉花品种及其系谱(修
订本)]. Beijing: China Agriculture Press, 2007 (in Chinese)
[18] Cotton Research Institute of Chinese Academy of Agriculture
Sciences (中国农业科学院棉花研究所). Flora of Cotton Varie-
ties in China (1978–2007)[中国棉花品种志(1978–2007)]. Bei-
jing: China Agricultural Science Technology Press, 2009 (in Chi-
nese)
[19] Paterson A H, Brubaker C, Wendel J F. A rapid method for ex-
traction of cotton (Gossypium spp.) genomic DNA suitable for
RFLP or PCR analysis. Plant Mol Biol Rep, 1993, 11: 122–127
[20] Zhang J(张军), Wu Y-T(武耀廷), Guo W-Z(郭旺珍), Zhang
T-Z(张天真). Fast screening of microsatellite markers in cotton
with PAGE/silver staining. Acta Gossypii Sin (棉花学报), 2000,
12(5): 267–269 (in Chinese with English abstract)
[21] Zhang J, Guo W Z, Zhang T Z. Molecular linkage map of al-
lotetraploid cotton (Gossypium hirsutum L. × Gossypium bar-
badense L.) with a haploid population. Theor Appl Genet, 2002,
105: 1166–1174
[22] Reddy O U K, Pepper A E, Abdurakhmonov I, Saha S, Jenkins J
N, Brooks T, Bolek Y, El-Zik K M. New dinucleotide and trinu-
cleotide microsatellite marker resources for cotton genome re-
search. J Cotton Sci, 2001, 5: 103–113
[23] Han Z G, Guo W Z, Song X L, Zhang T Z. Genetic mapping of
EST-derived microsatellites from the diploid Gossypium arboreum
in allotetraploid cotton. Mol Gen Genom, 2004, 272: 308–327
[24] Park Y H, Alabady M S, Ulloa M, Sickler B, Wilkins T A, Yu J,
Stelly D M, Kohel R J, El-Shihy O M, Cantrell R G. Genetic
mapping of new cotton fiber loci using EST-derived microsatellites
in an interspecific recombinant inbred (RIL) cotton population.
Mol Gen Genom, 2005, 274: 428–441
[25] Song X L, Wang K, Guo W Z, Zhang J, Zhang T Z. A comparison
of genetic maps constructed from haploid and BC1 mapping
populations from the same crossing between Gossypium hirsutum
L. × G. barbadense L. Genome, 2005, 48: 378–390
[26] Han Z G, Wang C B, Song X L, Guo W Z, Gou J Y, Li C H,
Chen X Y, Zhang T Z. Characteristics, development and mapping
of Gossypium hirsutum derived EST-SSR in allotetraploid cotton.
Theor Appl Genet, 2006, 112: 430–439
[27] Yu X-Y(于新艳), Wang F-G(王凤格), Zhao J-R(赵久然), Wang
X(王玺), Yi H-M(易红梅), Wang L(王璐), Guo J-L(郭景伦),
Kuang M(匡猛), Sun Y-M(孙艳美). Redesigning and optimizing
SSR core primer pairs for establishing DNA fingerprinting pro-
files. Mol Plant Breed (分子植物育种), 2007, 5(3): 443–447 (in
Chinese with English abstract)