全 文 :作物学报 ACTA AGRONOMICA SINICA 2016, 42(4): 492500 http://zwxb.chinacrops.org/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn
本研究由江苏省农业科技自主创新资金项目[CX(14)2044]和美国国际发展署 Securing Water for Food Award-salt Tolerant Quinoa子项目
(UR4443 B)资助。
This study was supported by Jiangsu Agriculture Science and Technology Innovation Fund [CX(14)2044] and the subproject of “Securing
Water for Food Award-salt Tolerant Quinoa” from USAID (UR4443 B).
通讯作者(Corresponding author): 赵涵, E-mail: zhaohan@jaas.ac.cn, Tel: 025-84390751
同等贡献(Contributed equally to this work)
第一作者联系方式: 张体付, E-mail: zhangtifu_82@jaas.ac.cn, Tel: 025-84391957
Received(收稿日期): 2015-05-31; Accepted(接受日期): 2016-01-11; Published online(网络出版日期): 2016-01-25.
URL: http://www.cnki.net/kcms/detail/11.1809.S.20160125.1622.006.html
DOI: 10.3724/SP.J.1006.2016.00492
藜麦 EST-SSR的开发及通用性分析
张体付 1,** 戚维聪 1,** 顾闽峰 2 张晓林 1 李 坦 1 赵 涵 1,*
1 江苏省农业科学院 / 江苏省农业生物学重点实验室, 江苏南京 210014; 2 盐城市新洋农业试验站, 江苏盐城 224336
摘 要: 藜麦因营养均衡受到越来越多的关注, 但尚未深入开展其基础研究。开发微卫星序列重复 SSR 分子标记将
为藜麦的遗传分析提供重要资源。本研究利用 NCBI数据库中藜麦 RNA测序 RNA-Seq及表达序列标签 EST数据挖
掘、验证及评价藜麦 EST-SSR, 共发现 1862个藜麦非单核苷酸 EST-SSR。其中, 二核苷酸重复最多(38.3%), 六核苷
酸重复最少(11.7%)。不同重复类型 SSR的数量随着核苷酸数目的增加呈下降趋势。在随机选取验证的 119个 EST-SSR
标记中, 66 (55.9%)个能够扩增出清晰条带, 39个在 4份藜麦资源中具有多态性, 且其多态性与重复序列长度不具有
显著相关性。t测验显示, 多态性 EST-SSR在藜麦与其他藜科种质间不存在显著差异, 说明其具有良好的通用性, 可
用于藜科物种的遗传关系分析。
关键词: 藜麦; EST-SSR; 分子标记; 遗传关系; 通用性
Exploration and Transferability Evaluation of EST-SSRs in Quinoa
ZHANG Ti-Fu1,**, QI Wi-Cong1,**, GU Min-Feng2, ZHANG Xiao-Lin1, LI Tan1, and ZHAO Han 1,*
1 Provincial Key Laboratory of Agrobiology, Jiangsu Academy of Agricultural Sciences, Nanjing 210014, China; 2 Xinyang Agricultural Experiment
Station of Yancheng City, Yancheng 224336, China
Abstract: Quinoa draws more and more attentions from people, since quinoa seed as grain has comprehensive nutrients. But the
fundamental research on quinoa just starts and remains in a moderated level. Simple sequence repeat (SSR) development in qui-
noa will enhance the resource for its genetic analysis. Here, the available RNA based sequencing (RNA-Seq) and expressed se-
quence tag (EST) data of quinoa deposited in the National Center for Biotechnology Information (NCBI) were engaged in
EST-SSR development. Totally, 1862 non-mononucleotide EST-SSRs were identified. Among the EST-SSRs, the dinucleotide
type was the most abundant (38.3%), and the hexanucleotide was the minimal (11.7%). The amount of the EST-SSR showed the
declined trend along with the increase in its motif nucleotide length. Among 119 EST-SSR primers randomly chosen for validation,
66 (55.9%) primers could give clear amplification bands and 39 showed polymorphisms in four quinoa accessions. Further analy-
sis showed that the polymorphisms of EST-SSRs had no significant correlation with their motif nucleotide length. In addition,
t-test demonstrated that the significant difference of EST-SSR polymorphisms was not occurred between quinoa accessions and
other Chenopodiaceae germplasm. These results indicating EST-SSRs developed in quinoa could be transferable in Chenopodi-
aceous genus and applied in genetic relationship analysis.
Keywords: Quinoa; EST-SSR; Molecular marker; Genetic relationship; Transferability
藜麦(Chenopodium quinoa Willd.)原产于南美
安第斯地区, 属一年生草本植物, 具有耐干旱、耐
盐碱特性[1-2]。与主要作物玉米、水稻、小麦相比, 藜
麦种子含有更高的碳水化合物 (64%)和蛋白质 (平
均为16%), 特别是含有人体所需的所有必需氨基
酸, 是唯一一种被联合国粮农组织认可的单体即可
第 4期 张体付等: 藜麦 EST-SSR的开发及通用性分析 493
满足人体基本营养需求的植物 [3]。因此, 开发和利
用藜麦种质资源对于发展节水农业、提高盐碱、干
旱土地利用率等方面具有重要意义。特别是当前中
国种质资源没有新突破, 藜麦作为有潜力的种质资
源受到越来越多的关注。中国作物学会藜麦分会的
成立及“首届中国藜麦产业(长春)高峰论坛”的召开
标志着藜麦在我国已经开始了系统性的研究和产
业推动工作。
为了进一步推广、研究藜麦资源 , 联合国将
2013 年设为国际藜麦年(http://www.fao.org/quinoa-
2013/zh/), 美国国际发展署也于 2014 年正式启动了
藜麦耐盐项目 (http://www.securingwaterforfood.org/
wur/)的研究工作。然而与主要作物相比, 人们还未
对藜麦深入研究。由于长期缺少生物技术研发的投
入, 藜麦的遗传基础理论薄弱, 育种水平没有明显
改善。与玉米和小麦相比, 其单产仍然很低, 平均只
有 0.8 t hm–2。除提高栽培、管理水平外, 利用生物
技术快速培育高产品种也是提高藜麦产量的重要途
径。因此, 大规模开发藜麦分子标记, 是进一步挖掘
藜麦重要农艺性状的遗传位点及利用分子标记进行
辅助选择的重要基础, 对利用生物技术解决育种瓶
颈具有重要科学意义和应用价值。但目前关于藜麦
分子标记开发的研究报道相对较少, 可用于藜麦遗
传育种研究的工具和相关资源非常有限。
1993年 Fairbanks等[4]首先报道了基于藜麦基因
组的 RAPD 标记。这种分子标记可用于藜麦种间杂
交种的鉴定以及藜麦和其它藜科物种的遗传变异分
析。随后 , 通过对富含微卫星基元的克隆测序 ,
Mason等[5]于 2005年开发并验证了 208个在藜麦种
间具有较高多态性的共显性 SSR 分子标记。同年,
Coles等[6]利用藜麦未成熟种子和花的EST文库发展
了 51 个 SNP 标记, 分析发现平均每 462 bp 就会出
现一个 SNP。之后 Fuentes等[7]的研究表明, 在藜麦
中相比于二核苷酸重复的 SSR 分子标记, 长度大于
20 bp的三核苷酸基元 SSR具有更高的多态性。2008
年 Jarvis 等[8]借助富含 GA、CAA 和 AAT 重复的文
库以及 BES, 开发了 216 个新型多态性 SSR 以及 6
个 BES-SSR, 并构建了藜麦首个基于 SSR标记的遗
传连锁图谱。该遗传连锁图谱包含 200 个 SSR, 由
38个连锁群组成, 覆盖了藜麦 913 cM的遗传距离。
2012年 Maughan等[9]利用 113个藜麦材料进一步将
功能性 SNP 的分子标记数目扩展为 511 个, 并利用
新开发的 SNP标记将藜麦的遗传连锁图谱缩小为 29
个连锁群, 总的遗传距离扩大为 1404 cM。
藜麦基因组研究发现其大小介于主要作物水稻
基因组(430 Mb)和玉米基因组(2500 Mb)之间, 约为
967 Mb [10-12]。随着测序技术的快速发展, 水稻、玉
米等二倍体作物的全基因组测序相继完成。得益于
此, 水稻、玉米等作物在分子遗传领域的研究取得
深入进展, 且相关研究成果已广泛用于育种实践并
取得巨大效益。然而, 藜麦因其为四倍体物种(2n =
4x = 36)[13-14], 基因组序列组装困难, 至今尚无基因
组测序相关报道。因此, 很难大规模开发分子标记。
近年来, 公共数据库公布的物种表达谱序列信息越
来越多, 为大规模开发 EST-SSR 分子标记提供了丰
富资源[15-17]。截止到目前, 尚未见利用藜麦表达谱
序列挖掘 EST-SSR和开发分子标记的报道。为了弥
补藜麦 EST-SSR分子标记开发的空白、丰富藜麦分
子标记资源, 本研究利用公共数据库 NCBI 中所有
藜麦表达序列数据, 通过生物信息学手段大规模挖
掘藜麦 EST-SSR, 并对藜麦 EST-SSR 核苷酸重复特
点、多态性以及应用作出评价。
1 材料与方法
1.1 试验材料与表达序列数据的获取
试验材料均为藜科物种, 包括 4份藜麦, 2份苍
白茎藜, 1份台湾藜和 1份杖藜共 8份种质(表 1)。藜
麦表达序列数据来自 NCBI 的 SRA 数据库(http://
www.ncbi.nlm.nih.gov/sra), 包括 11.9 G Illumina
HiSeq 2000的 RNA-Seq数据(登录号为 SRX257003
和 SRX256971)以及 2.1 G Roche 454的 EST数据(登
录号: SRX084791)。
1.2 数据预处理与 EST-SSR鉴定
利用 Fastq-Dump 程序将 SRA 格式数据转换成
Fastq 格式文件, 并采用并行清理通道将转换的文件
清理, 控制数据质量, 包括 Q20 (1%的碱基错误率)
清理及 L40 (长度≥40 bp)过滤, 并去除 5、3端的
polyT、polyA序列以及载体序列。随后, 利用 Trinity
软件按照默认参数对质量控制后的序列组装拼接 ,
去除冗余的序列获得 unigene [18]。通过 MISA 软件
(http://pgrc.ipk-gatersleben.de/misa/)对 unigene 序列
进行 SSR 位点识别, 其识别条件为单核苷酸重复不
低于 10 次, 二核苷酸重复不低于 8 次, 三核苷酸重
复不低于 7次, 四核苷酸重复不低于 5次, 五核苷酸
及六核苷酸重复不低于 4 次, 复合 SSR 的识别条件
是 2个 SSR之间的距离不超过 50 bp。
494 作 物 学 报 第 42卷
表 1 8份供试材料信息
Table 1 Information of eight Chenopodiaceous species tested in the experiment
物种
Species
种质名称
Name
登录号
Accession number
来源
Origin
藜麦 Chenopodium quinoa - PI433232 智利 Chile
藜麦 Chenopodium quinoa Quinoa Negra PI510536 秘鲁 Peru
藜麦 Chenopodium quinoa Riobamba - 荷兰 Holland
藜麦 Chenopodium quinoa Koito Jaira PI510537 秘鲁 Peru
苍白茎藜 Chenopodium pallidicaule Robtosa PI510529 秘鲁 Peru
苍白茎藜 Chenopodium pallidicaule AnccoCcanahua PI510526 秘鲁 Peru
台湾藜 Chenopodium formosanum Balt PI433379 中国台湾 Taiwan, China
杖藜 Chenopodium giganteum Ames1027 PI596371 美国 United States
“-”表示没有相关信息。“-” indicates no related information.
1.3 SSR引物的设计
利用 Primer 3.0软件(http://primer3.sourceforge.
net/)对 SSR 位点的侧翼序列进行引物设计, 设置参
数 Tm为 58℃±3℃, 引物长度为 20±3 bp, 产物预期
长度为 100~450 bp, 其他参数为默认。
1.4 DNA提取、PCR扩增及电泳检测
利用 Karroten DNA提取试剂盒提取 8份试验材
料的幼苗 DNA。经过 1%琼脂糖凝胶检测的 DNA用
于 PCR 扩增。PCR 体系为 25 μL, 含 2 mmol L–1
MgCl2、100 μmol L–1 dNTPs、0.2 μmol L–1引物、1 U
Taq酶及 50 μg DNA。PCR程序为 94℃ 3 min; 94℃
30 s, 58℃ 35 s, 72℃ 50 s, 38个循环; 72℃ 3 min。
PCR扩增产物经 10%聚丙烯酰胺凝胶 100 V电压电
泳 120 min, EB染色后在紫外透射仪上观察结果。
1.5 多态性分析
EST-SSR的多态性信息含量 PIC (polymorphism
information content)的计算公式为 PIC=1– 2
1
k
i
i
P
, 式中
Pi为第 i个等位基因的频率, k为等位基因的数量[19]。根
据 Ott [20]的分析, PIC≥0.10 为多态性 SSR, PIC≥
0.70为高多态性 SSR。
1.6 聚类分析
利用本研究发展的 EST-SSR 及 42 个通过基因
组 DNA 文库发展的 SSR 标记对供试材料进行基因
分型[8]。基于 UPGMA 法计算遗传相似性[19], 采用
NTSYS-pc 2.1软件聚类[21]。
2 结果与分析
2.1 藜麦 EST-SSR的信息分析
根据获取的 14.0 G藜麦 RNA-Seq数据以及 EST
数据, 利用 Trinity软件拼接得到 19 571条 unigene,
总碱基数为 80 448 006 bp, 平均每条 unigene长约 4
kb。其中, 16 854条序列含有 SSR位点。通过 MISA
软件对 unigene 序列进行 SSR 位点搜索, 发现藜麦
EST-SSR 重复类型丰富, 从单核苷酸重复到六核苷
酸重复均有出现。其中, 单核苷酸重复 SSR 丰度最
高, 达到 18 476 个。与单核苷酸重复相比, 非单核
苷酸重复 SSR数量明显降低, 只有 1862个。尽管对
原始序列预处理时去除了 5、3端的 polyT、polyA
序列 , 但 A/T 类型占单核苷酸 SSR 的比例高达
97.9%说明假阳性 A/T的存在。因此, 本文不对单核
苷酸 SSR 进行深入分析。非单核苷酸重复中, 二核
苷酸重复 SSR最多, 占非单核苷酸重复 SSR总数的
38.3% (713个), 其次为三核苷酸重复, 占非单核苷
酸重复 SSR总数的 22.7% (423个), 最少的为六核苷
酸重复, 占非单核苷酸重复 SSR总数的 11.7% (217
个)。结果显示, 不同重复类型的 SSR数量随着基元
核苷酸数目的增加呈下降趋势。
不同重复类型的藜麦 EST-SSR 均有多种基元,
二、三、四、五、六核苷酸重复分别有 3、10、18、
47、103 种, 共计 181 种基元。各重复类型 SSR 中
优势基元如图 1 所示。二、四、五核苷酸重复的优
势基元分别为 AG/CT、AAAT/ATTT 及 AAAAT/
ATTTT, 分别占各自重复类型的 49.8%、41.9%及
28.9%。三核苷酸重复的优势基元有 AAT/ATT、
AAC/GTT 和 AAG/CTT 三种, 分别占全部三核苷酸
重复的 28.6%、20.3%和 17.0%, 共 65.9%。六核苷
酸 重 复 的 优 势 基 元 有 AAAGAG/CTCTTT 和
ACTATC/AGTGAT 两种, 分别占全部六核苷酸重复
SSR的 5.5%和 5.1%, 共 10.6%。
各重复类型的藜麦 EST-SSR在不同重复数下的
数量分布差异明显(表 2)。二核苷酸重复呈主要分布
第 4期 张体付等: 藜麦 EST-SSR的开发及通用性分析 495
图 1 不同重复类型 EST-SSR的优势基元
Fig. 1 Primary motifs of EST-SSR with different repeat types
的重复数有四种, 分别为 8、9、10和 11。三、四、
五、六核苷酸重复呈主要分布的重复数各自只有一
种, 分别为 7、5、4和 4。此外, 重复数最多的基元
为两碱基重复 AC/GT, 重复次数为 171 次, 这也是
长度最长的重复(342 bp)。
2.2 藜麦 EST-SSR的验证及多态性分析
利用 Primer 3.0对侧翼序列大于 200 bp且重复
长度大于 16 bp的非单核苷酸重复 SSR位点设计引
物, 随机选取 119 个 EST-SSR 位点的引物对 4 份藜
麦材料(表 1) DNA 扩增的结果显示, 共有 66 对
EST-SSR引物(表 3)能够获得清晰的扩增条带, 成功
率为 55.9%; 六核苷酸重复 SSR 的成功率最高, 为
74.3%; 五核苷酸重复 SSR的成功率最低, 为 31.8%
(图 2)。多个引物出现了三等位基因、四等位基因带
型(图 3)。这 66对 EST-SSR引物共扩增出 112种条
带, 平均每对引物扩增 1.7 种条带。其中 39 对扩增
出两种以上类型的条带, 2对扩增出 4种类型的条带
(表 3)。三核苷酸重复及六核苷酸重复具有最高的平
均扩增条带数, 为 2.3 种; 其次为二核苷酸重复, 为
2.0种; 最低的是五核苷酸重复, 为 1.7种。通过 PIC
计算, 39个为多态性 EST-SSR (PIC≥0.10), 占总数
的 59.1%, 其中 2个具有高多态性(PIC≥0.70)。相关
性分析表明, EST-SSR 多态性与基元的碱基数(r =
–0.241, P = 0.051)或重复序列长度(r = –0.138, P =
0.270)的相关性均不显著 , 但与条带数呈极显著正
相关(r = 0.536, P = 0.000)。同时本研究也利用前人
报道的 42对藜麦基因组 SSR引物[8]对相同材料进行
了扩增, 共得到了 66种条带, 平均每对引物扩增 1.6
种条带; 其中 21个基因组 SSR的 PIC≥0.10。t测验
表明 EST-SSR与基因组 SSR的 PIC差异不显著(P =
0.316)。
2.3 藜麦 EST-SSR的通用性分析
为验证藜麦 EST-SSR 分子标记的通用性, 本研
究将验证的 66个 EST-SSR及 42个基因组 SSR共计
108个分子标记用于其他 4份藜科种质(表 1)的基因
型分析。其中, 49 个 EST-SSR 及 26 个基因组 SSR
在该藜科种质中表现出多态性(PIC≥0.10)。统计分
析发现, EST-SSR在其他 4份藜科种质的 PIC与藜麦
中的 PIC无显著差异(P = 0.121), 但基因组 SSR在藜
麦中的 PIC 值显著高于其在另外 4 种藜科种质中的
值(P = 0.044)。该结果表明, 藜麦的 EST-SSR在其他
藜科种质中的稳定性和通用性高于基因组 SSR。基
于 EST-SSR引物 PCR结果的UPGMA聚类分析表明,
来自南美的四份藜科种质被聚成一类, 包括 3 份藜
麦和 1 份苍白茎藜; 来自北美的杖藜、欧洲的藜麦
以及中国的台湾藜被明显地分开 , 各自分成三类 ;
表 2 不同重复类型 EST-SSR的分布规律
Table 2 Distribution of EST-SSR with different repeat types
重复类型 Repeat type 重复数
Repeat 两核苷酸
Dinucleotide
三核苷酸
Trinucleotide
四核苷酸
Tetranucleotide
五核苷酸
Pentanucleotide
六核苷酸
Hexanucleotide
4 - - - 270 170
5 - - 193 11 17
6 - - 23 1 7
7 - 368 3 1 3
8 256 29 0 2 9
9 194 5 0 1 11
10 124 7 0 1 0
11 127 3 0 0 0
≥12 12 11 3 0 0
总数 713 423 222 287 217
“-”表示不符合鉴定条件。“-” indicates that did not meet the analysis conditions.
496 作 物 学 报 第 42卷
表 3 验证的 EST-SSR引物序列及其扩增条带种类
Table 3 Sequence of validated EST-SSR primers and their amplified band type
引物名称
Primer name
重复类型
Repeat type
正向引物
Forward primer (5–3)
反向引物
Reverse primer (5–3)
扩增条带种类
Amplified band type
CQ29 (CT)8 TAGGGTTAGCCTCTTCATTTCC GAACTTTCGCTTCTTGCTCATC 1
CQ30 (GT)9 TTGGGTGAAGAGAGAGATCAGG AGCCATGTACGCAGCCTAAAG 2
CQ31 (TA)9 GTTCTTACGAGCCGGTTGTAG AAGCAAGAAATGGAGGTGTAAC 1
CQ32 (TC)8 GCAAGATTGAAAATGCGGTAAG TATGAACACGACCGTCATGAG 3
CQ34 (AAC)7 AAGAAGAAGCGGTCCAAGCG ACTCCACACTTGTACGTCACC 2
CQ35 (AAC)9 GACTTTCCAGAAGAAGTTGTGC ATCCGAGGTTGTTCCTTCATTG 1
CQ36 (AAT)7 AAGAGGAAGTGCTCTGCTATGG CAGAATCACTGGCATCGGATG 2
CQ37 (ACA)7 GGGCTATGGGCTTCTCTAATGC CCAGTTCGATCAGCGATGCG 2
CQ38 (ACA)8 GGTCTTGGTCATGAGGAGGATG CGCCGTCATTTCTTGTTCGTAG 2
CQ39 (ACC)7 CAGCCCACCACCCTTTGC TGCTGCTAGGGTCTTAACACAC 3
CQ40 (AGA)7 TCTCTTGTTGGGGTTCTTCCTC TGCTTGAGACCCAAATTGCTC 2
CQ42 (ATG)10 AGCATCATAGCCTCAAGGAACG CGATAACCCACCACCGTTCAC 2
CQ44 (ATT)8 TTTACTGCACTTGATGGACAAC TTGAGATCACCATCACATGCTG 4
CQ45 (CAA)11 CTTCGACGACGCTTTCTTCG TGTTAGCAATGGAAGGTTCTGG 1
CQ46 (CAA)7 AACCAATCTCCGCCGACAAC GAAGATGGAGGTTGAGGTGGTG 2
CQ47 (CAA)9 TAGGAATGAAAGTGCCCGTTTC GGTAGGCTCGTAACACAAGTTG 3
CQ50 (CAT)9 ACTGTCGTCGTCGTCATCATC GGTTGACGGCGAGGAAGAAG 2
CQ51 (CCA)7 CTTAAGCTCATTCCGCCGTCTG GGCATGGTCATGGGCATCATC 1
CQ52 (CCA)8 TTTCTCCACCACCTCAAAACCC CGAAGGAGAGGAGGCGGAAG 3
CQ53 (CGC)7 CGATCCGAAGCCGGTCGAGAC CCTCGCCGCGCTGCAACG 1
CQ54 (CTT)9 AGTAGATGGTTGGCAAAGATGG GAGTAGAAGCAGCAGCGAGAG 1
CQ55 (GAA)7 TCGAAGCCTGTTGAAGAGGAAG ATCGGAATCGGCTCATCATCAG 2
CQ56 (GAA)8 CCCAAACGAGCAAACCATTC AATCAAAGGAAGGCTCGATTTC 1
CQ62 (GGA)8 GGCGGAGGTACAGAATTGTTAG CCCACCTGCTGCCTCCAC 3
CQ66 (GTT)8 ATTTTGCTGCTGCTGCTGTTG AGCCGCGACAATTGGTACTG 2
CQ67 (TAC)7 CTACGTGTGCTTTTACTCTTCC GCAGTAATGGCAACGGTAGTAG 2
CQ72 (TCA)7 CTATCTTGGGCCAGAGAGTTCC CATGCCAACCGATCCTCATC 2
CQ76 (TGT)8 TCAAGATACTCCCAGAAAGCTG TTACGCTTGTCAATGCAAATCG 1
CQ78 (TTC)8 ATCATCCCTAGGCCACCAATTC CGATGGAAGAAGGGTGGAGTTC 1
CQ82 (ATTT)6 CTTGGGCGTCTGGCATAGTTG AGGTCTGTCCACAACAATCCAC 1
CQ83 (GCAC)5 GCCTCAAGCACGTAGCACATC ACTCACACAGCAACAGCAACAC 2
CQ84 (TCAC)5 ACTCTCATCATATCTGCCCTTC GAAAGCTGGACTCTCACTACTC 4
CQ86 (TTAT)5 AGATTTGCCATGTTGCCTATTG AGGCTTAAGACATGCAAGAGAC 1
CQ91 (AATCC)4 GCAGGCATTGAAGGCGAAAG ACGAGCATTGCATTGCATAACC 1
CQ97 (CTTCC)5 AATACCCCTCACCATACCTCAC AGCTGTGGAAGTTGGTAGAGTC 2
CQ100 (GATTT)4 AATTGTGCCCCGATTCCTACG AGGGTTCGCACTTCCATTCTTC 1
CQ105 (TCAAA)4 TCAGTACCAACTTCGAAAGCTG GCAGTTTGATGTTTGTGGTTTG 1
CQ107 (TCCGA)4 GAACTAGGGGTGTCCGTTTGG AATTCGGATTGGACTGGGAGAG 2
CQ108 (TGTTG)4 GACTGCGACGGATCTTATTGG GCTCAAGGTAAGGCATCCTCAC 2
CQ109 (TTCTT)4 GACTGCGGTTCTGATTTTCTTC AAAGTCCGAGAAGAGAGTGAGC 2
CQ110 (AAATCA)4 TCAATGGCGTCTTCAACTGTAC AAAGAGGTGGTTGAGATTGTGG 1
CQ111 (AAGGAG)4 AGTGATGTTCCGTTGGGGTTTG CCAATCGGCCTCACGCTTC 2
CQ112 (AATACT)4 TGTGCTACAAACCCTTGAAAAG CCACCATCATCAAACTCAACAC 1
CQ113 (AATAGT)4 AGGCAGATGCCCGTACTTTTC GCCTCAGCTTGCATATCATCAG 1
第 4期 张体付等: 藜麦 EST-SSR的开发及通用性分析 497
(续表 3)
引物名称
Primer name
重复类型
Repeat type
正向引物
Forward primer (5–3)
反向引物
Reverse primer (5–3)
扩增条带种类
Amplified band type
CQ115 (ACAAGC)4 ATAACGCGCATGTGCTTAGAG TATCCTTCTAGCGGCAAGATTC 1
CQ116 (ACTGGC)4 CAGCATTACGCACAGTTTAGC TGAGATGTGCAAGCAATGATTC 1
CQ117 (AGCACC)4 ACTGTGATGTTGGCAACGAAC AAGCCAGACTAAACACCTTAGC 1
CQ119 (AGCTCA)4 TGCACCTGAGCTGTCTTCC ATCAGGCAGCTTAACTTCATCC 2
CQ121 (ATGAGC)5 AGCTGATGCCTTCTTCTCTGAC GCTTTCTTGACCACTGGCTCTG 1
CQ122 (CATAAC)5 CCATGTCATCATCATCATCCAC GTTCTGCATCATCATGGGTTG 2
CQ123 (CCACGA)4 ATGACCTTCCTCTCCGCAGTTG GGGGCTCGGGGATTTGATGG 2
CQ124 (CCATGA)4 ACTGCCGCCATGACCATG GGTCCACTAGAGAAGGATGAGG 2
CQ125 (CGACTC)4 AGGGTCTTCAGCATCTCCAATG GACAATGTCACCGCTGCTTC 2
CQ126 (GAGAAG)4 CAACGACGAATGAGCAAGAAG CCTCAACAACAGCCTTAGTTTC 1
CQ128 (GAGTTT)5 TGTAGGCATGTTTGGACTGTG TCCAACACCTCAAACTCCTATC 2
CQ131 (GGTTAG)4 GTGGGTTTCATCACCTTGGG CGGCGGCGACTTAGTTAGC 2
CQ132 (TAGCAC)4 GCGTGTGCGTGTGCGATG GCTGTAATGGGCGATGCTTGTG 2
CQ133 (TCATCC)6 TCGCATCTCTTCATCTTCATCC ATTCTTGGGAGACATGGTATCG 1
CQ136 (TCCTGG)4 TTAGAGGAGTTAGGTGGTGGTC AACCTATGCTCGGGATTATTCC 1
CQ137 (TCGGAG)4 GACTGCCGCGTTCTCAAC GCCGTGTATCTTCTTCCTCTTC 2
CQ138 (TCTTCC)4 GCTGCAAACCCTCTTCATCTTC TCAGCACCATAACGAGGATCAG 2
CQ139 (TGATCT)5 TCAGGCTCCTCAGACATCTG ATGGAACTTCAGGGTATAAGCC 1
CQ140 (TGTATC)4 ACGTGTTAGTGTATGGTAGTCG GGTCCACATTCTGCATTCCC 2
CQ142 (TTCTCA)4 AAACTCTTCGTGTTGGTTCTCG TGTGACTGAAAGGCAAGGAATG 3
CQ143 (TTCTCT)5 CAGACTCTCACAACACCATTCG ATTGCGCTCATGGGAAGTTTTC 1
CQ144 (TTGGAA)6 AGATCCATAACGCCTACGAAAC AATGCCTACCAACACTGATCCG 2
图 2 EST-SSR的验证
Fig. 2 Validation of EST-SSR
来自南美的另一份苍白茎藜并没有与南美的其他 4
份藜科种质聚为一类, 提示该苍白茎藜与来自同一区
域的其他 4份藜科种质亲缘关系较远(图 4)。该结果表
明藜麦 EST-SSR可用于藜科种质的遗传关系分析。
3 讨论
SSR 在真核生物中普遍存在, 基于 SSR 开发的
分子标记具有多态性高、稳定性好、共显性等优点[22],
多用于遗传连锁图谱构建、遗传多样性分析、指纹
图谱以及分子标记辅助选择等[23-26]。早期的 SSR标
记开发主要依赖基因组文库和 cDNA 文库, 成本高
且耗时长。近年来, 通过生物信息学手段利用公共
数据库中丰富的基因组和转录组序列发展分子标记
成为开发 SSR及其他类型分子标记的重要途径[27-29]。
本研究通过 NCBI数据库藜麦 RNA-Seq及 EST数据
图 3 多种 EST-SSR扩增带型图
Fig. 3 Different amplified patterns of EST-SSR
498 作 物 学 报 第 42卷
图 4 基于相似性系数构建的 8份藜科种质的 UPGMA树状图
Fig. 4 UPGMA dendrogram of eight Chenopodiaceous species based on similarity coefficient
挖掘藜麦全基因组范围的 SSR位点, 共发现 1862个
非单核苷酸 SSR位点。尽管 EST-SSR重复类型丰富,
但不同物种 EST-SSR的主要重复类型不同。研究发
现植物中多以二、三核苷酸重复为主[30-31]。主要作
物玉米、水稻、小麦、大豆 EST-SSR中三核苷酸重
复类型占的比例最大[32]。与大多数植物一样, 本研
究发现藜麦 EST-SSR中二、三核苷酸重复为主要重
复类型。不同重复类型藜麦 EST-SSR数量随基元碱
基数量增加呈下降趋势, 这种 EST-SSR 重复类型的
偏好性可能与分析的 EST 数据量有关, 也可能与其
自身长度的稳定性有关。不同物种, 同一重复类型
的优势基元有所不同。本研究中, 藜麦二核苷酸重
复类型的优势基元为 AG/CT, 与玉米、水稻、小麦
该重复类型优势基元一致, 但与棉花的优势基元不
同[32-33]。在双子叶模式植物拟南芥 EST-SSR 中, 二
核苷酸优势基元也是 AG/CT, 但是拟南芥 EST-SSR
中的三核苷酸优势基元为AAG/TTC, 而且其含量高
于 AG/CT。另外拟南芥 EST-SSR还富含 ATC/TAG、
GGA/CCT、AAC/TTG等三核苷酸基元, 这些都是在
藜麦 EST-SSR中比较稀少的。藜麦 EST-SSR中所富
含的三核苷酸基元如 AAT/TTA、AAC/GTT 等在拟
南芥中比较少见[30]。包括藜麦在内的多个物种中 3个
以上核苷酸重复类型的优势基元均不尽相同[28,32]。
利用富含 CA、ATT 和 ATG 的基因组文库 ,
Mason 等[10]开发了 208 个藜麦多态性分子标记, 但
与基因组文库不同 , SSR 中的主要基元为 GA 和
CAA。Jarvis 等[8]利用相同的技术构建了富含 GA、
AAT和 CAA的基因组文库, 开发了 216个藜麦多态
性基因组 SSR标记。新开发的基因组 SSR的主要基
元与基因组文库相一致。本研究开发的 EST-SSR中
二、三核苷酸重复类型优势基元与前人开发的藜麦
基因组 SSR 及其他植物中报道的优势基元并不相
同。最主要的原因可能是 EST序列代表基因编码区,
编码区只占基因组的很小部分, 基因组大部分为基
因间区。因此, 通过 EST开发的 SSR与通过基因组
手段开发的 SSR 的优势基元不同。通常情况下, 由
于EST编码功能基因, 序列保守性高, EST-SSR的多
态性低于基因组 SSR[34-35]。Jarvis等[12]报道利用其开
发的基因组 SSR 在 22 份藜麦种质中可平均扩增 4
种带型。在本研究中, 新开发的 66对 EST-SSR引物
在 4 份藜麦种质中最多可以扩增出 4 种带型, 平均
扩增 1.7 种带型。同时, 我们以 Jarvis 等[12]报道的
42对基因组 SSR引物为对照, 平均扩增 1.6种带型。
t 测验显示两种类型 SSR 的 PIC 差异不显著。尽管
有研究认为重复序列长度大于 20 bp的 SSR具有高
多态性[5,36], 但本研究分析 EST-SSR 重复序列长度
与多态性的相关性发现二者并不存在显著的相关。
EST-SSR 广泛用于物种遗传关系分析[26]。本研究开
发的藜麦 EST-SSR可以将藜科种质的区域特点明显
地划分出来 , 在不同藜科物种间具有良好的通用
性。由于植物中直系同源基因存在的普遍性 , 且
EST-SSR 编码功能基因, 因此, EST-SSR 比基因组
SSR具有更高的通用性。
4 结论
藜麦基因组约有 1800个非单核苷酸 EST-SSR。
二、三核苷酸重复为主要重复类型。藜麦 EST-SSR
重复序列长度与多态性之间不具有显著相关性。藜
麦 EST-SSR 在藜科物种间具有良好的通用性, 可以
用于藜科种质的遗传关系分析等研究。
References
[1] Razzaghi F, Plauborg F, Jacobsen S, Jensen C R, Andersen M N.
Effect of nitrogen and water availability of three soil types on
yield, radiation use efficiency and evapotranspiration in
field-grown quinoa. Agric Water Manag, 2012, 109: 20–29
[2] Adolf V I, Jacobsen S, Shabala S. Salt tolerance mechanisms in
quinoa (Chenopodium quinoa Willd.). Environ Exp Bot, 2013, 92:
43–54
[3] Ogungbenle H N. Nutritional evaluation and functional properties
第 4期 张体付等: 藜麦 EST-SSR的开发及通用性分析 499
of quinoa (Chenopodium quinoa) flour. Intl J Food Sci Nutr,
2003, 54: 153–158
[4] Fairbanks D J, Waldrigues A, Ruas C F, Ruas P M, Maughan P J,
Robison L R, Andersen W R, Riede C R, Pauley C S, Caetano L
G. Efficient characterization of biological diversity using field
DNA extraction and random amplified polymorphic DNA mark-
ers. Rev Brazil Genet, 1993, 16: 11–22
[5] Mason S L, Stevens M R, Jellen E N, Bonifacio A, Fairbanks D J,
Coleman C E, Mccarty R R, Rasmussen A G, Maughan P J. De-
velopment and use of microsatellite markers for germplasm
characterization in quinoa (Chenopodium quinoa Willd.). Crop
Sci, 2005, 45: 1618–1630
[6] Coles N D, Coleman C E, Christensen S A, Jellen E N, Stevens
M R, Bonifacio A, Rojas-Beltran J A, Fairbanks D J, Maughan P
J. Development and use of an expressed sequenced tag library in
quinoa (Chenopodium quinoa Willd.) for the discovery of single
nucleotide polymorphisms. Plant Sci, 2005, 168: 439–447
[7] Fuentes F F, Bazile D, Bhargava A, Martínez E A. Implications of
farmers’ seed exchanges for on-farm conservation of quinoa, as
revealed by its genetic diversity in Chile. J Agric Sci, 2012, 150:
702–716
[8] Jarvis D E, Maughan P J, Kopp O R, Jellen E N, Mallory M A,
Pattee J, Bonifacio A, Coleman C E, Stevens M R, Fairbanks D J.
Simple sequence repeat marker development and genetic map-
ping in quinoa (Chenopodium quinoa Willd.). J Genet, 2008, 87:
39–51
[9] Maughan P J, Smith S M, Rojas-Beltrán J A, Elzinga D, Raney J
A, Jellen E N, Bonifacio A, Udall J A, Fairbanks D J. Single
nucleotide polymorphisms identification, characterization and
linkage mapping in Chenopodium quinoa. Plant Genome, 2012, 5:
1–7
[10] Eckardt N A. Sequencing the rice genome. Plant Cell, 2000, 12:
2011–2017
[11] Martienssen R A, Rabinowicz P D, O’Shaughnessy A, McCom-
bie W R. Sequencing the maize genome. Curr Opin Plant Biol,
2004, 7: 102–107
[12] Stevens M R, Coleman C E, Parkinson S E, Maughan P J, Zhang
H B, Balzotti M R, Kooyman D L, Arumuganathan K, Bonifacio
A, Fairbanks D J, Jellen E N, Stevens J J. Construction of a qui-
noa (Chenopodium quinoa Willd.) BAC library and its use in
identifying genes encoding seed storage proteins. Theor Appl
Genet, 2006, 112: 1593–1600
[13] Palomino G, Hernández L T, de la Cruz Torres E. Nuclear genome
size and chromosome analysis in Chenopodium quinoa and C.
berlandieri subsp. nuttalliae. Euphytica, 2008, 164: 221–230
[14] Fuentes F, Bhargava A. Morphological analysis of quinoa germ-
plasm grown under lowland desert conditions. J Agron Crop Sci,
2011, 197: 124–134
[15] Xia H, Zheng X, Chen L, Gao H, Yang H, Long P, Rong J, Lu B,
Li J, Luo L. Genetic differentiation revealed by selective loci of
drought-responding EST-SSRs between upland and lowland rice
in China. PloS One, 2014, 9: e106352
[16] Asadi A A, Monfared S R. Characterization of EST-SSR markers
in durum wheat EST library and functional analysis of
SSR-containing EST fragments. Mol Genet Genom, 2014, 289:
625–640
[17] Chuang T, Yang M, Lin C, Hsieh P, Hung L. Comparative ge-
nomics of grass EST libraries reveals previously uncharacterized
splicing events in crop plants. BMC Plant Biol, 2015, 15: 39–53
[18] Grabherr M G, Haas B J, Yassour M, Levin J Z, Thompson D A,
Amit I, Adiconis X, Fan L, Raychowdhury R, Zeng Q.
Full-length transcriptome assembly from RNA-Seq data without
a reference genome. Nat Biotechnol, 2011, 29: 644–652
[19] Nei M. Estimation of average heterozygosity and genetic distance
from a small number of individuals. Genetics, 1978, 89: 583–590
[20] Ott J. Strategies for characterizing highly polymorphic markers in
human gene mapping. Am J Human Genet, 1992, 51: 283–290
[21] Rohlf F J. NTSYS-pc: Numerical taxonomy system. ver. 2.1. Se-
tauket, NY: Exeter Publishing Ltd. 2002
[22] Tautz D, Renz M. Simple sequences are ubiquitous repetitive
components of eukaryotic genomes. Nucl Acids Res, 1984, 12:
4127–4138
[23] 潘海涛, 汪俊君, 王盈盈, 齐照良, 李斯深. 小麦 EST-SSR 的
开发和遗传作图. 中国农业科学, 2010, 24: 452–461
Pan H T, Wang J J, Wang Y Y, Qi Z L, Li S S. Development and
mapping of EST-SSR markers in wheat. Sci Agric Sin, 2010, 24:
452–461 (in Chinese with English abstract)
[24] 赖勇, 王鹏喜, 范贵强, 司二静, 王晋, 杨轲, 孟亚雄, 李葆春,
马小乐, 尚勋武, 王化俊. 大麦 SSR标记遗传多样性及其与农
艺性状关联分析. 中国农业科学, 2013, 27: 233–242
Lai Y, Wang P X, Fan G Q, Si E J, Wang J, Yang K, Meng Y X,
Li B C, Ma X L, Shang X W, Wang H J. Genetic diversity and
association analysis using SSR markers in barley. Sci Agric Sin,
2013, 27: 233–242 (in Chinese with English abstract)
[25] 宋海斌, 崔喜波, 马鸿艳, 朱子成, 栾非时. 基于 SSR 标记的
甜瓜品种(系) DNA 指纹图谱库的构建. 中国农业科学, 2012,
26: 2676–2689
Song H B, Cui X B, Ma H Y, Zhu Z C, Luan F S. Construction of
DNA fingerprint database based on SSR marker for varieties
(lines) of Cucumis melo L. Sci Agric Sin, 2012, 26: 2676–2689
(in Chinese with English abstract)
[26] 王西成, 姜淑苓, 上官凌飞, 曹玉芬, 乔玉山, 章镇, 房经贵.
梨 EST-SSR 标记的开发及其在梨品种遗传多样性分析中的应
用评价. 中国农业科学, 2010, 24: 5079–5087
Wang X C, Jiang S L, Shang-Guan L F, Cao Y F, Qiao Y S, Zhang
Z, Fang J G. Development of EST-derived SSR markers for pear
and evaluation of their application in pear genetic diversity
analysis. Sci Agric Sin, 2010, 24: 5079–5087 (in Chinese with
English abstract)
[27] 张体付, 葛敏, 韦玉才, 赵涵. 玉米功能性 Insertion/Deletion
(InDel)分子标记的挖掘及其在杂交种纯度鉴定中的应用. 玉
米科学, 2012, 20(2): 64–68
Zhang T F, Ge M, Wei Y C, Zhao H. Discovery for maize func-
tion Insertion/Deletion (InDel) polymorphic marker and its im-
plication in purity identification of maize hybrid seeds. J Maize
Sci, 2012, 20(2): 64–68 (in Chinese with English abstract)
[28] 戚维聪, 程计华, 黄邦全, 李坦, 林峰. 基于海甘蓝 RNA-Seq
序列开发 EST-SSR 分子标记 . 江苏农业学报 , 2014, 30:
997–1002
Qi W C, Cheng J H, Huang B Q, Li T, Lin F. Development and
characterization of EST-SSR markers derived from RNA-Seq in
Crambe abyssinica. Jiangsu J Agric Sci, 2014, 30: 997–1002 (in
500 作 物 学 报 第 42卷
Chinese with English abstract)
[29] 束永俊, 李勇, 吴娜拉胡, 柏锡, 才华, 纪巍, 朱延明. 大豆
EST-SNP 的挖掘、鉴定及其 CAPS 标记的开发. 作物学报,
2010, 36: 574–579
Shu Y J, Li Y, Wu N L H, Bai X, Cai H, Ji W, Zhu Y M. Mining
and identification of SNP from EST sequences and conversion of
CAPS markers in soybean. Acta Agron Sin, 2010, 36: 574–579
(in Chinese with English abstract)
[30] Cardle L, Ramsay L, Milbourne D, Macaulay M, Marshall D,
Waugh R. Computational and experimental characterization of
physically clustered simple sequence repeats in plants. Genetics,
2000, 156: 847–854
[31] 李淑娴, 张新叶, 王英亚, 尹佟明. 桉树 EST 序列中微卫星含
量及相关特征. 植物学报, 2010, 45: 363–371
Li S X, Zhang X Y, Wang Y Y, Yin T M. Content and characteris-
tics of microsatellites detected in expressed sequence tag se-
quences in Eucalyptus. Chin Bull Bot, 2010, 45: 363–371 (in
Chinese with English abstract)
[32] Gao L, Tang J, Li H, Jia J. Analysis of microsatellites in major
crops assessed by computational and experimental approaches.
Mol Breed, 2003, 12: 245–261
[33] 程海亮, 陆才瑞, 邹长松, 余道乾, 姜鹏飞, 杨文翠, 张友平,
王巧连 , 宋国立 . 基于 10 个棉花腺体相关材料转录组的
EST-SSR标记开发. 棉花学报, 2015, 27: 1–8
Cheng H L, Lu C R, Zou C S, Yu D Q, Jiang P F, Yang W C,
Zhang Y P, Wang Q L, Song G L. Development of EST-SSR
markers in cotton based on the transcriptome information of 10
gland related materials. Cotton Sci, 2015, 27: 1–8 (in Chinese
with English abstract)
[34] Chabane K, Ablett G A, Cordeiro G M, Valkoun J, Henry R J.
EST versus genomic derived microsatellite markers for genotyp-
ing wild and cultivated barley. Genet Resourc Crop Evol, 2005,
52: 903–909
[35] Cho Y G, Ishii T, Temnykh S, Chen X, Lipovich L, McCouch S R,
Park W D, Ayres N, Cartinhour S. Diversity of microsatellites de-
rived from genomic libraries and GenBank sequences in rice
(Oryza sativa L.). Theor Appl Genet, 2000, 100: 713–722
[36] Temnykh S, Declerck G, Lukashova A, Lipovich L, Cartin-
hour S, McCouch S. Computational and experimental analysis
of microsatellites in rice (Oryza sativa L.): frequency, length
variation, transposon associations, and genetic marker poten-
tial. Genome Res, 2001, 11: 1441–1452