全 文 :植物科学学报 2013ꎬ 31(5): 485~ 492
Plant Science Journal
DOI:10.3724 / SP.J.1142.2013.50485
基于转录组测序信息的水生植物莕菜 SSR标记开发
袁阳阳1ꎬ2ꎬ 王青锋1∗ꎬ 陈进明1∗
(1. 中国科学院武汉植物园ꎬ 中国科学院水生植物与流域生态重点实验室ꎬ 武汉 430074ꎻ
2. 中国科学院大学ꎬ 北京 100049)
摘 要: 利用软件 MISA对水生植物莕菜转录组测序所获得的 79536 条 EST序列进行分析ꎬ 共检测出 12319 个
EST ̄SSR位点ꎮ 在莕菜的 EST ̄SSR中ꎬ 二核苷酸和三核苷酸重复单元是主导类型ꎬ 分别占总 SSR的 57 31%和
30 87%ꎬ 其中 AG / CT、 AAG / CTT分别是二、 三重复单元类型的优势重复基元ꎬ 分别占总 SSR 的 29 76%和
8 66%ꎮ 随机挑选了 130对 EST ̄SSR引物对莕菜两个居群进行遗传多样性检测ꎬ 结果发现: 78对引物能扩增出
清晰可分辨的条带ꎬ 其中 37对能成功检测出多态性ꎬ 引物多态率为 47 44%ꎮ 这些多态性引物共检测出 114 个
等位基因ꎬ 每个位点 2~6 个ꎬ 平均 3 08 个ꎮ 观测杂合度(Ho )及预期杂合度(He )分别在 0 229 ~1 000 和
0 351~0 756之间ꎬ 多态信息含量 PIC 值在 0 286~0 698 之间ꎬ 平均达 0 495ꎮ 以上研究结果表明ꎬ 通过莕
菜转录组测序产生的 EST数据来开发 SSR标记是一种简单而高效的途径ꎬ 这些新的 SSR分子标记为研究莕菜的
居群遗传多样性及其遗传结构提供了工具ꎮ
关键词: 水生植物ꎻ 莕菜ꎻ 转录组测序ꎻ ESTꎻ SSR
中图分类号: Q347 文献标识码: A 文章编号: 2095 ̄ 0837(2013)05 ̄ 0485 ̄ 08
收稿日期: 2013 ̄04 ̄23ꎬ 修回日期: 2013 ̄05 ̄08ꎮ
基金项目: 国家自然科学基金资助项目(30970195ꎬ 31270278)ꎮ
作者简介: 袁阳阳(1987-)ꎬ 女ꎬ 硕士研究生ꎬ 研究方向为植物系统学与进化生物学ꎮ
∗通讯作者(Authors for correspondence E ̄mail: jmchen@wbgcas cnꎻ qfwang@wbgcas cn)ꎮ
Development of SSR Markers in Aquatic Plant Nymphoides
peltata (Menyanthaceae) Based on Information from
Transcriptome Sequencing
YUAN Yang ̄Yang1ꎬ 2ꎬ WANG Qing ̄Feng1∗ꎬ CHEN Jin ̄Ming1∗
(1. Key Laboratory of Aquatic Botany and Watershed Ecologyꎬ Wuhan Botanical Gardenꎬ Chinese Academy of Sciencesꎬ
Wuhan 430074ꎬ China ꎻ 2. University of Chinese Academy of Sciencesꎬ Beijing 100049ꎬ China)
Abstract: Using the program MISAꎬ a total of 12319 EST ̄SSRs were sought out from 79536
ESTs of aquatic plant Nymphoides peltata. Dinucleotide and trinucleotide SSRs were the two
main motif typesꎬ accounting for 57 31% and 30 87%ꎬ respectively. The most abundant di ̄
and tri ̄ motifs were AG / CT (29 76%) and AAG / CTT (8 66%)ꎬ respectively. We randomly
selected 130 primer pairs to evaluate their application and polymorphism across two
populations of N. peltata. Seventy ̄eight SSR markers were amplified successfullyꎬ yielding
clear and discernible bandsꎬ among which 37 were found to be polymorphic and the
polymorphic rate was 47 44%. Using the polymorphic SSR markersꎬ a total of 114 alleles were
detected. The number of alleles per locus ranged from 2 to 6 (mean 3 08) . Observed
heterozygosity (Ho) and expected value (He) per locus varied from 0 229 to 1 000 and from
0 351 to 0 756ꎬ respectively. Polymorphism information content (PIC) ranged from 0 286 to
0 698ꎬ with an average of 0 495. The results indicated that the development of SSR molecular
markers from the EST dataset generated by next generation sequencing in the aquatic plant N.
peltata is valuable and effective. These newly generated SSR makers will provide new tools for
studying genetic diversity and population genetic structure of N. peltata.
Key words: Aquatic plantꎻ Nymphoides peltataꎻ Transcriptome sequencingꎻ ESTꎻ SSR
莕菜(Nymphoides peltata (Gmel.) O. Kuntze)
为睡菜科(Manyanthaceae)莕菜属(Nymphoides)
多年生水生浮叶植物[1]ꎮ 该种曾广泛分布于欧亚
大陆温带和亚热带地区ꎮ 莕菜花黄色ꎬ 艳丽、 繁
盛ꎬ 具有重要的观赏价值ꎮ 同时ꎬ 它还具有一定的
食用价值和医药价值ꎬ 其根茎和嫩花茎在不少地区
被当作蔬菜食用ꎬ 我国传统医学中也有使用莕菜入
药的记载[2]ꎮ 此外ꎬ 有研究发现莕菜在水生环境
修复方面也具有重要的作用[3]ꎮ 然而近年来ꎬ 由
于水产养殖等对水体的开发利用ꎬ 许多莕菜赖以生
存的生长环境遭到破坏ꎬ 莕菜的居群数量大大减
少ꎮ 为了防止该种遗传资源的进一步丧失ꎬ 开展该
种的保护生物学研究已很有必要ꎮ
采用分子标记评价物种的遗传多样性及其居群
遗传结构能为物种保护策略的制定提供基础资
料[4]ꎮ 在诸多分子标记中ꎬ 微卫星 ( Simple Se ̄
quence Repeatꎬ SSR)分子标记由于其高丰度、 高
变异、 共显性等优点ꎬ 已广泛应用于多种植物的保
护遗传学研究中[5]ꎮ 采用分子标记评价莕菜居群
遗传多样性及居群遗传结构已有多篇报道[4ꎬ6-10]ꎮ
相关的研究结果也被逐渐用来指导该种的保
护[6ꎬ7]ꎮ 虽然目前关于莕菜遗传多样性及其居群遗
传结构的研究多是基于 SSR 分子标记ꎮ 然而ꎬ 迄
今为止ꎬ 莕菜中公开报道可利用的 SSR 分子标记
只有 10个ꎬ 数量十分有限[11]ꎬ 远远不能满足开展
其保护遗传学研究的需要ꎮ
莕菜是典型的花柱二型性植物ꎬ 为了研究该种
花柱二型的分子机理ꎬ 陈进明等对具有不同花型的
莕菜花芽材料进行了高通量转录组测序ꎬ 获得了大
量的表达序列标签 ( Expressed Sequence Tagꎬ
EST)ꎬ 同时在该研究组中建立了莕菜 EST 数据库
(结果另文发表)ꎮ 莕菜 EST 数据库为大量开发
SSR分子标记进行该种的居群遗传学研究也提供
了契机ꎮ 利用 EST数据库进行 EST ̄SSR 的开发已
成为一种省时、 省力的有效方法ꎬ 大量的 EST ̄
SSR标记已在不同的物种中开发和利用[12-14]ꎮ
本研究基于前期对莕菜花芽转录组高通量测序
所得到的 EST 序列进行 EST ̄SSR 分子标记的开
发ꎮ 利用莕菜 EST 资源ꎬ 进行 SSR 搜索和分析ꎬ
建立了 EST ̄SSR 标记ꎬ 并对其多态性进行了分析
与评价ꎮ 开发的 EST ̄SSR 分子标记将会成为今后
进行水生植物莕菜遗传多样性及遗传结构研究可利
用的有效工具ꎮ
1 材料与方法
1 1 植物材料
本实验中采用来自于湖北枝江(ZJꎻ 30°29′Nꎬ
111°46′E)和云南洱海(EHꎻ 25°47′Nꎬ 100°11′E)
的两个莕菜 ( Nymphoides peltata (Gmel.) O.
Kuntze)居群进行 EST ̄SSR的验证及多态性分析ꎮ
1 2 DNA提取
利用植物基因组 DNA 提取试剂盒提取参试材
料的叶片 DNAꎬ 试剂盒购置于天根生物公司(提取
方法参照试剂盒的说明)ꎮ
1 3 EST ̄SSR位点的开发及引物设计
基于先前陈进明等对莕菜花芽进行的转录组高
通量测序结果中的 79536条 EST序列ꎬ 利用MISA
( MicroSatelliteꎬ http: / / pgrc. ipk ̄gatersleben.
de / misa / )软件进行 SSR 位点的搜素ꎬ 搜索参数
设置为: 单、 二、 三、 四、 五、 六核苷酸重复次数
至少分别为 12、 6、 5、 5、 4、 4 次ꎬ 且 SSR 位点
距离两端侧翼序列大于 50 bpꎮ 利用 primer 3 0对
筛选得到的 SSR 位点设计引物ꎬ 引物设计原则:
①引物长度 18~22 bpꎬ 最适长度 20 bpꎻ ②退火
温度在 55~65℃ꎬ 最适退火温度 60℃ꎻ ③PCR 产
物长度 80~300 bpꎬ 最适长度 180 bpꎻ ④GC 含
量在 40%~60%ꎬ 最适 GC含量 50%ꎮ
在引物设计时如果没能设计出最理想的 SSR
引物ꎬ 则根据情况适当调整相关参数ꎮ 基于以上引
物设计原则ꎬ 总共对 1808条包含 SSR位点的高质
量 EST 序列 ( SSR 位点前后侧翼序列长度大于
150 bp)设计出 8064 对引物ꎮ 每个位点至少有
5对候选引物ꎬ 用于后续在两个莕菜居群中进行
SSR的多态性检测ꎮ
684 植 物 科 学 学 报 第 31卷
1 4 EST ̄SSR引物初步筛选
随机挑选 130 对 SSR 引物 (编号 XC1 ~
XC130)ꎬ 由上海 Sangon 生物技术公司进行引物
序列合成ꎮ 分别从居群 ZJ 和 RH 中选取 4 个个体
对引物 XC1~XC130 进行初步筛选ꎮ 实验 PCR 反
应体系(15 μL)包括: 10 ~30 ng 的基因组 DNA
模板ꎻ 015 mmol / L 的 dNTPꎻ 15 μL10×Taq 缓
冲液[6 mmol / L Tris ̄HCl (pH 8 3)ꎬ 0 9 mmol / L
MgCl2 和 30 mmol / L KCl ]ꎻ 正 反 向 引 物 各
0 6 mmol / Lꎻ 1 U 的 Taq 酶 ( TIANGEN 公司)ꎮ
PCR反应在 PTC ̄100TM thermocycler 仪器上进行
(MJ Researchꎬ Walthamꎬ MAꎬ USA)ꎻ 循环条件
为: 94℃预变性 5 minꎬ 35 个循环 ( 94℃变性
30 sꎬ 合适温度退火 30 sꎬ 72℃延伸 1 min) ꎬ 72℃
延伸 7 minꎮ 各对引物的最适退火温度通过梯度
PCR 实验确定ꎬ 参考李玉恒等的梯度 PCR 方
法[15]ꎮ PCR产物利用 12%聚丙烯酰胺凝胶在北京
六一仪器厂生产的 DYY ̄11B 型垂直板电泳仪及
DYCZ ̄24B型电泳槽中进行电泳检测ꎮ 上样量为每
个点样孔: 5 μL PCR产物+1 μL 1 / 1000体积分数
的花青素+1 μL 6× loading bufferꎬ 25 V 电压ꎬ 电
泳 150 min后用 AlphalmagerTM2200凝胶成像系统
(美国Alpha Innotech公司)对条带进行扫描分析ꎮ
1 5 EST ̄SSR引物多态性检测
筛选出在居群 ZJ 和 EH 中都有清晰稳定扩增
条带的引物ꎬ 同样用这两个居群对筛选出的引物进
行多态性检测ꎮ 多态性检测在扩大数量的居群中进
行(每个居群 18个个体)ꎮ PCR反应条件和反应程
序同 1 4ꎮ
1 6 数据分析
对在两个莕菜居群(ZJ 和 EH)内都能产生稳
定且具有多态性条带的引物ꎬ 其 PCR 产物经聚丙
烯酰胺凝胶电泳后ꎬ 统计各对引物在两个居群 36
个个体间的条带迁移情况ꎮ 分别用两个字母表示条
带: 纯合子条带表示为 AA、 BB、 CC、 DD等ꎻ 杂
合子表示为 AB、 AC、 BC、 DE 等ꎬ 建立相应矩
阵ꎮ 利用 Popgene 1 31 计算每一个多态性 SSR
位点的总的等位基因数(NA)、 观测杂合度(Ho)、
预计杂合度 ( He )ꎬ Wrights ( 1978) 固定指数
(FIS) [16]ꎮ 利用软件 PIC_ CALC和 GenAlex6对各
个位点的等位基因频率进行评价从而得到多态性信
息含量(PIC) [17]ꎮ
2 结果与分析
2 1 莕菜转录组中 EST ̄SSR的分布及频率
利用 MISA 软件在莕菜花芽 79536 个 EST 序
列中搜索到 12319 个 SSR 位点ꎬ 分布于 9993 个
EST中ꎬ 其中 1834个 EST序列含有两个或两个以
上 EST ̄SSR 位点ꎮ 总体上ꎬ SSR 出现频率为
15 48%ꎮ 莕菜 EST 序列中ꎬ 各种类型的 SSR 出
现的频率不同(表 1)ꎬ 二和三核苷酸重复类型占优
势ꎬ 分别占总 SSR的 57 31%和 30 87%ꎻ 其他 4
种重复类型所占比例相对较少: 单核苷酸重复占
5 41%ꎬ 四核苷酸重复占 1 75%ꎬ 五核苷酸重复
占 1 90%ꎬ 六核苷酸重复占 2 74%ꎮ 所有 SSR
中ꎬ 以 6次重复数目的 SSR 最多ꎬ 占 31 86%ꎬ 5
次重复数目的 SSR 占 21 13%ꎬ 7 次重复数目的
SSR占 18 26%(见表 1)ꎮ 本实验中共发现 4种二
核苷酸重复基元和 10 种三核苷酸重复基元ꎬ 二核
苷酸重复基元中ꎬ AG / CT 含量最高ꎬ 占 29 76%ꎬ
三核苷酸重复基元中ꎬ AAG / CTT 含量最高ꎬ 占
8 66%ꎮ 其它重复基元类型及发生频率见表 2ꎮ 在
所有的重复基元类型中 CG / CG 发生频率最低
(0 03%)ꎮ
2 2 EST ̄SSR的多态性
随机挑选的 130对 SSR引物中共有 78对成功
扩增出清晰条带(65 对产生与预期大小相同的条
带ꎬ 另 13对产生条带较长)ꎬ 其中 37 对引物扩增
的 DNA条带在两个居群内都具有多态性ꎮ 引物有
效扩增率为 60%ꎬ 其中多态性占 47 44%ꎮ 37 对
多态性引物的名称、 序列及在两个莕菜居群的
PCR扩增产物分析结果见表 3ꎬ 不同引物对的最适
退火温度见表 3ꎮ
3 讨论
3 1 莕菜 EST ̄SSR的特点
新一代测序技术的出现为非模式物种中基因组
的研究提供了有利条件ꎮ 同时ꎬ 测序产生的 EST
库ꎬ 也为 EST ̄SSR的挖掘提供了宝贵资源ꎮ 本实
验中ꎬ 利用 MISA软件在莕菜花芽转录组测序得到
784 第 5期 袁阳阳等: 基于转录组测序信息的水生植物莕菜 SSR标记开发
表 1 莕菜 EST ̄SSR的类型、 数量及分布频率
Table 1 Typeꎬ number and frequency of EST ̄SSRs in N. peltata
重复基元长度
Repeat motif length
重复次数 Repeat numbers
4 5 6 7 8 9 10 11 ≥12
总计
Total
百分比
%
单核苷酸重复 Mono ̄ - - - - - - - - 667 667 5 41
二核苷酸重复 di ̄ - - 2946 1858 1158 549 363 172 14 7060 57 31
三核苷酸重复 tri ̄ - 2404 949 390 54 3 2 1 0 3803 30 87
四核苷酸重复 quad ̄ - 185 30 1 0 0 0 0 0 216 1 75
五核苷酸重复 penta ̄ 226 9 0 0 0 0 0 0 0 235 1 90
六核苷酸重复 hexa ̄ 332 6 0 0 0 0 0 0 0 338 2 74
总计 Total 558 2604 3925 2249 1212 552 365 187 681
百分比 % 4 53 21 13 31 86 18 26 9 84 4 48 2 96 1 52 5 53
注: 单、 二、 三、 四、 五、 六核苷酸重复类型的 SSR最小重复次数标准分别为 12、 6、 5、 5、 4、 4次ꎮ
Note: Mono ̄ꎬ di ̄ꎬ tri ̄ꎬ quad ̄ꎬ penta ̄ and hexa ̄nucleotide repeats with a minimum of twelveꎬ sixꎬ fiveꎬ fiveꎬ four and four subunitsꎬ
respectively.
表 2 莕菜 EST ̄SSR中二和三碱基重复基元的类型及频率
Table 2 Di ̄ and tri ̄nucleotide EST ̄SSR repeat motifs and their frequency in ESTs of N. peltata
重复基元类型
Repeat motif
重复次数 Repeat numbers
5 6 7 8 9 10 11 12 >12
总计
Total
频率
%
AC / GT - 653 360 221 94 48 30 2 1 1409 11 44
AG / CT - 1541 879 544 302 274 119 6 1 3666 29 76
AT / AT - 749 618 393 153 41 23 4 0 1981 16 08
CG / CG - 3 1 0 0 0 0 0 0 4 0 03
AAC / GTT 177 77 22 4 0 1 0 0 1 282 2 29
AAG / CTT 642 295 120 10 0 0 0 0 0 1067 8 66
AAT / ATT 81 23 9 2 1 0 0 0 0 116 0 94
ACC / GGT 396 149 73 6 0 0 0 0 0 624 5 07
ACG / CGT 41 23 20 4 0 0 0 0 0 88 0 71
ACT / AGT 54 31 7 1 1 0 0 1 0 95 0 77
AGC / CTG 229 71 34 9 0 0 0 0 0 343 2 78
AGG / CCT 343 128 28 11 0 0 0 0 0 510 4 14
ATC / ATG 311 111 59 7 0 1 0 0 3 492 4 00
CCG / CGG 130 41 14 1 0 0 0 0 0 186 1 51
总计 Total 2404 3895 2244 1213 551 365 172 13 6
频率 % 19 51 31 62 18 22 9 85 4 47 2 96 1 40 0 11 0 05
的 EST库中共检测到 12319个 SSR位点ꎮ 二碱基
和三碱基重复类型的 SSR 所占的比例较大ꎬ 分别
为 57 31%和 30 87%ꎬ 这一结果与多数植物基因
组中二和三碱基重复序列分布频率相似[18-20] ꎮ 前
人的研究结果显示有些物种中前者占优势ꎬ 另一些
物种中后者占优势ꎬ 这种现象的出现ꎬ 在一定程度
上与 SSR搜索时相关参数的设置有很大关系[14]ꎮ
Aggarwal等[18]发现ꎬ 原本是二核苷酸重复 SSR
占优势的研究中ꎬ 如果人为改变 SSR 搜索标准ꎬ
提高二核苷酸重复类型的重复次数ꎬ 或降低三核苷
酸重复类型的重复次数ꎬ 就会出现三核苷酸重复
SSR占优势的情况ꎮ 这也暗示了ꎬ 亟需一个统一
的 SSR检测参数设置标准ꎬ 以便于更有效地在不
同的研究中进行 SSR分布类型与特点的比较ꎮ
二核苷酸重复类型中ꎬ AG / CT (占总 SSR 的
29. 76%) 为重复基元的最多ꎬ CG / CG 最少
(0 03%)ꎬ 这与 Wei等[14]在芝麻(Sesamum indi ̄
cum)和 Aggarwal 等[18]在咖啡(Coffea arabica)
EST ̄SSR 筛选所得到的结果一致ꎮ 也与 Kantety
等[21]对水稻(Oryza sativa)、 高粱(Sorghum bi ̄
color)等多种植物 EST ̄SSR 进行综合分析后报道
的结果相符ꎮ 莕菜三核苷酸重复中ꎬ AAG / CTT
(占总 SSR 的 8 66%)最多ꎬ 一些植物ꎬ 如芝麻、
咖啡以及莲(Nelumbo nucifera Gaertn)等中都有相
884 植 物 科 学 学 报 第 31卷
表 3 莕菜中 37对多态性 EST ̄SSR引物的特点
Table 3 Characterization of thirty ̄seven polymorphic EST ̄SSR markers of N. peltata
引物编号
Prime code
正反向引物序列(5′→3′)
Primer sequence (5′→3′)
重复基元
Repeat type NA
a Ho b He c PICd FIS e
XC1 F: AACAACACGAACATGAAGACGAR: CACAAATCCTTGACATTTTCATTG
(TAG) 7 3 0 417 0 448 0 394 0 070
XC8 F: AATGCAAGAAACACAAAGCAAATR: TGAATGCATATATACAGGGAGGC
(TCA) 7 6 0 667 0 721 0 685 0 075
XC9 F: GGTGGTTTTGGTGAGATTCAATAR: TATAGCCAAAGCAAGATTACCCA
(CGG) 7 3 0 719 0 655 0 581 -0 098
XC17 F: ACATTATGAGAGCAGAAGTGGGAR: CAATTTCCCCTATTCATCAACAA
(TGAATC) 6 2 0 514 0 382 0 309 -0 346
XC24 F: AAGAAGAATGACATGAAGAAGCGR: CGAATTGAATCACTCAGTCAAAA
(TTAGA) 4 2 0 500 0 500 0 375 0 000
XC28 F: TGACTAGCTTCTACGGAGACTGGR: CAGCTTTCCTTCTTCCAAGATTT
(GT) 10 4 0 833 0 628 0 568 -0 327
XC37 F: GATGGCAAGGAATGAATTTGTTAR: CATGGTTTCTTCCTCAGAAGCTA
(TG) 10 3 0 667 0 636 0 559 -0 048
XC42 F: TCTTGGGTGATTCTTGTTCTTGTR: TCAATTTTGAGTTTTCAACAGCA
(TTC) 6 4 0 694 0 528 0 492 -0 315
XC44 F: GATAATATTGCCATTGGGGAAACR: ATGATCAACCCTTTCAGTTTCAG
(CTA) 9 3 0 611 0 517 0 454 -0 182
XC45 F: TCATCATCTTCTTCTTCAGCTCCR: GATGATGGGGGAACTAGTGACAT
(TCC) 6 3 0 694 0 513 0 459 -0 354
XC49 F: TCTACAGCTACACCTCCTTCTGGR: TCACCAGAAAGCTGTTCCATTAT
(TAA) 6 3 0 472 0 520 0 460 0 093
XC51 F: GATGCATTTGGAGTGATATTGGTR: CCATCATCTCAATGTTACCGAGT
(TTC) 6 4 1 000 0 667 0 600 -0 500
XC52 F: CACCTCATGAGTTTATCACCCTCR: AATAAGTGAAACCGGAGAAGGAC
(TAC) 6 3 0 889 0 659 0 585 -0 348
XC53 F: ACTTGGAAGTCCTCATCCTTCTCR: CCTCAGAAGAAAGCACCAAGTAA
(ATC) 6 3 0 833 0 647 0 573 -0 289
XC54 F: AGATTTCCCCGCAGTTCTTTR: TATTGGACAAGTTTTCCTTCACG
(GCG) 6 4 0 639 0 612 0 532 -0 044
XC56 F: GTCTGAGTCGCATACAAAATCAAR: AGTCTGTTGAGATGAAAGAAGCG
(CTT) 6 2 0 529 0 493 0 372 -0 074
XC57 F: GGTTTGCTCGAATACCCTAATTCR: CACCAATTCGATTAGCACTTTTC
(GAA) 6 3 0 667 0 648 0 565 -0 044
XC59 F: GCTGTGATCTTTTACCGAAATTGR: AAAGCTGATGCTAGCAAGATGAA
(TTC) 6 2 0 529 0 395 0 314 -0 360
XC61 F: TAACGTACCCATTATCGAGCTTCR: TAATCGCCGCGTAATAACTAAGA
(TCT) 6 3 0 500 0 506 0 446 -0 003
XC62 F: GGAAATATTGAGACGGAAATCCTR: AAATTTGTAGCAGCCATTTGAAG
(GAA) 6 3 0 528 0 643 0 558 0 168
XC63 F: GACCCTCTCCTAGACTTCGACTCR: ACGACATCCGTCTCTGTAGGTT
(AAG) 6 2 0 528 0 441 0 340 -0 214
XC66 F: CAGCCCATGTCTTTCCTTGATR: CAGGAGCACATCACCGTATTTAT
(CTA) 6 3 0 722 0 495 0 403 -0 480
XC67 F: CACACCTCCTCAATCACCAACR: TGAAGAGGGAGAGTAGTGTACCG
(GCC) 6 3 0 485 0 573 0 469 0 141
XC69 F: CCATCAGAAAACCCTCTTCTTTTR: ATCGCACTTGTTGATGTTGTAAA
(CCA) 6 4 0 750 0 687 0 611 -0 106
XC77 F: CATGGTTTCTTCCTCAGAAGCTAR: GATGGCAAGGAATGAATTTGTTA
(CA) 10 4 0 861 0 734 0 675 -0 190
984 第 5期 袁阳阳等: 基于转录组测序信息的水生植物莕菜 SSR标记开发
续表 3
引物编号
Prime code
正反向引物序列(5′→3′)
Primer sequence (5′→3′)
重复基元
Repeat type NA
a Ho b He c PICd FIS e
XC81 F: GGCAACCTCTAAGAGTCTGTCAAR: GGATCAGTGCACATAACGCTAAT
(TC) 10 3 0 361 0 668 0 585 0 452
XC82 F: ACGGCTCTACATCATTTGGAGATR: TCTTTACTCTTCCAAATACGGGTC
(TAGT) 6 2 0 229 0 497 0 370 0 533
XC88 F: CGTTTGGTGTCAGTCTAGCTTGTR: CTTCACAGGGATTTTTACTGCC
(TAGAC) 4 3 0 486 0 658 0 574 0 251
XC90 F: GTTTGGAGGGATCCATCTCTAGTR: TAATTTCAACATCATTGGGGTCT
(GGCTCA) 4 2 0 389 0 501 0 372 0 213
XC92 F: GGTTGATGTTCACCAACAGAAATR: TAACGTCTCGGAAAAGATTCTCA
(GGC) 5 3 0 250 0 626 0 537 0 595
XC94 F: CCTTTTGTAGTCCACACTTGGAAR: GAACAGAGAATTCAACCTCCGTA
(GCA) 5 2 0 389 0 351 0 286 -0 125
XC96 F: ACAACCACCGATCGAAAATACTR: ATTTCCAGAAACTCTCTCCTTCG
(AG) 9 3 0 722 0 562 0 480 -0 304
XC98 F: AACCAAACACAGTTCAACAGGACR: TTAGCTCATGATCGATGTTTGAA
(AT) 8 3 0 611 0 546 0 480 -0 136
XC100 F: TGTATGTGTGTATCTGCTTGCGTR: CTAACGGAGGAGCTTTCTTCTTC
(AG) 8 3 0 722 0 657 0 575 -0 115
XC112 F: TAGCCTCATTATCCTCTTCATCGR: TCATTCTCGTACTCAGGATCACC
(TCT) 6 4 0 944 0 756 0 698 -0 267
XC114 F: ATAGGCATCGATCTAGGAGGAGTR: TGCCGTCATTAGAAAAGTACCAT
(TG) 9 4 0 333 0 594 0 499 0 431
XC117 F: AAAATATTGACCCGATCTCGTTTR: GATGTGGAATTTCCTGCTTATGA
(TGA) 7 3 0 611 0 571 0 495 -0 085
平均
Mean 3 08 0 603 0 574 0 495
-0 063
注: a. 有效等位基因数ꎻ b. 观测杂合度ꎻ c. 预计杂合度ꎻ d. 多态信息含量ꎻ e. Wrights固定指数ꎮ
Notes: a. No. of effective allelesꎻ b. Observed heterozygosityꎻ c. Expected heterozygosityꎻ d. Polymorphism information contentꎻ
e. Wright’s fixation index .
同的研究结果[14ꎬ18ꎬ22]ꎮ 而在水稻、 高粱、 玉米
(Zea mays L.)等作物中却观察到是 GGC / CCG
三核苷酸型最多 [21]ꎮ 这可能与不同物种中相应的
编码蛋白的使用频率有关ꎮ
3 2 引物的验证及多态性评价
随机挑选的 130对 SSR引物中ꎬ 78 对能成功
扩增出清晰条带ꎬ 引物有效扩增率为 60%ꎮ 莕菜
中 EST ̄SSR的扩增率要略低于其它一些物种ꎬ 这
些物种中的扩增率可高达 70%~90%[12ꎬ14ꎬ23]ꎮ 本
研究莕菜中略低的 EST ̄SSR 扩增率可能是源于某
些 EST序列错误组装、 引物正好跨剪接位点ꎬ 或
是对于某些特定的引物缺乏最适的 PCR 扩增条件
等原因ꎮ 78对引物中有 13对产生的条带长于预期
大小ꎬ 可能是由于基因组中存在内含子ꎮ
共有 37对引物不仅能同时在两个莕菜居群 36
个个体中扩增出稳定条带ꎬ 且扩增条带在居群内和
居群间都具有多态性ꎬ 引物多态率为 47 44%ꎮ 这
与一些研究中报道的多态率相似[13ꎬ23ꎬ24]ꎮ 引物的
多态率受到检测用 DNA 样的多少和样品地理来源
不同的影响ꎮ Chavarriaga ̄Aguirre 等[25]指出如果
把 DNA样从 38 个增加到 500 个ꎬ 在木薯(Mani ̄
hot esculenta)中就会出现一个较高的多态率ꎮ 37
个多态性引物位点中ꎬ 每个位点扩增的等位基因数
2~6 个ꎬ 共扩增出等位基因 114 个ꎬ 平均 3 08
个ꎮ 这与早期 Uesugi 等[11]在莕菜 SSR 的开发中
所报道的研究结果一致ꎮ
遗传杂合度及多态信息含量等是衡量群体遗传
变异的重要指标ꎬ 同时也是评价 SSR 位点可用性
和使用效率的重要参数[26]ꎮ 本研究中 37个多态位
点的观测杂合度 Ho和预计杂合度 He分别平均为
0 603 和 0 574ꎬ 平均多态信息含量 ( PIC) 为
0 495ꎬ 暗示出实验中的两个莕菜居群具有较高的
094 植 物 科 学 学 报 第 31卷
遗传多样性ꎬ 同时也表明这些新开发的 EST ̄SSR
位点能够很好地应用于以后相关研究中ꎮ 此外ꎬ 我
们还分析了这些多态性位点的固定指数 FISꎮ FIS可
用来检验在群体中基因型频率偏离 Hardy ̄Wein ̄
berg 平衡期望比例的程度[27]ꎮ 当群体中纯合子过
量ꎬ 即群体内个体间自交繁殖时ꎬ FIS >0ꎻ 反之ꎬ
当杂合子过量ꎬ 即群体内个体间为异交繁殖时ꎬ
FIS<0ꎻ 当群体处于 Hardy ̄Weinberg 平衡状态ꎬ
随机交配时ꎬ FIS =0[28]ꎮ 本实验中 37 个多态位点
FIS平均为-0 063ꎬ 且大多(有 25 个)为负值ꎬ 显
示出居群有过多的杂合体ꎬ 这可能与莕菜以异交为
主的繁殖方式有关ꎮ 这一结果与先前野外调查统计
及控制实验的研究结果一致[29]ꎮ
综上所述ꎬ 通过莕菜转录组测序产生的 EST
数据来开发 SSR 标记是一种简单而高效的途径ꎬ
本研究新开发的 37对 SSR分子标记为研究莕菜的
居群遗传多样性及其遗传结构提供了工具ꎮ
致谢: 感谢本实验室的杜智渊老师、 王盾老师以及刘
华、 叶忠铭、 代文魁等同学在野外采样工作和实验过程中
给予的诸多帮助ꎮ
参考文献:
[ 1 ] 中国科学院植物研究所. 中国植物志: 第 62 卷
[M] . 北京: 科学出版社ꎬ 1999.
[ 2 ] 朱静. 睡菜科睡菜与莕菜的发育形态学研究及其分
类学意义[D] . 哈尔滨: 哈尔滨师范大学ꎬ 2011.
[ 3 ] 雷泽湘. 太湖大型水生植被及其环境效应研究[D] .
广州: 暨南大学ꎬ 2006.
[ 4 ] Liao Y Yꎬ Yue X Lꎬ Guo Y Hꎬ Gituru W Rꎬ Wang
Q Fꎬ Chen J M. Genotypic diversity and genetic
structure of populations of the distylous aquatic
plant Nymphoides peltata (Menyanthaceae) in
China [ J] . J Syst Evolꎬ 2013ꎬ DOI: 10. 1111 /
jse. 12023.
[ 5 ] 李美琼ꎬ 高浦新ꎬ 朱友林ꎬ 李绍波. 微卫星 (SSR)
分子标记应用于濒危植物保护的研究进展[J] . 江
西林业科技ꎬ 2011ꎬ 2: 24-28.
[ 6 ] Larson D. Reproduction strategies in introduced
Nymphoides peltata populations revealed by ge ̄
netic markers [ J ] . Aquat Botꎬ 2007ꎬ 86 ( 4 ):
402-406.
[ 7 ] Nishihiro Jꎬ Uesugi Rꎬ Takagawa Sꎬ Washitani I.
Toward the restoration of a sustainable population
of a threatened aquatic plantꎬ Nymphoides pelta ̄
ta: Integrated genetic / demographic studies and
practices [ J] . Biol Conservnꎬ 2009ꎬ 142 ( 9 ):
1906-1912.
[ 8 ] Uesugi Rꎬ Goka Kꎬ Nishihiro Jꎬ Washitani I. Al ̄
lozyme polymorphism and conservation of the
Lake Kasumigaura population of Nymphoides pel ̄
tata[J] . Aquat Botꎬ 2004ꎬ 79(3): 203-210.
[ 9 ] Uesugi Rꎬ Nishihiro Jꎬ Tsumura Yꎬ Washitani I.
Restoration of genetic diversity from soil seed
banks in a threatened aquatic plantꎬ Nymphoides
peltata[J] . Conservn Genetꎬ 2007ꎬ 8(1): 111-
121.
[10] Uesugi Rꎬ Nishihiro Jꎬ Washitani I. Population
status and genetic diversity of Nymphoides peltata
in Japan[J] . Japanese J Conserv Ecolꎬ 2009ꎬ 14
(1): 13-24.
[11] Uesugi Rꎬ Tani Nꎬ Goka Kꎬ Nishihiro Jꎬ Tsumu ̄
ra Yꎬ Washitani I. Isolation and characterization of
highly polymorphic microsatellites in the aquatic
plantꎬ Nymphoides peltata ( Menyanthaceae )
[J] . Mol Ecol Notesꎬ 2005ꎬ 5(2): 343-345.
[12] Iorizzo Mꎬ Senalik D Aꎬ Grzebelus Dꎬ Bowman
Mꎬ Cavagnaro P Fꎬ Matvienko Mꎬ Ashrafi Hꎬ
Van Deynze Aꎬ Simon P W. De novo assembly
and characterization of the carrot transcriptome
reveals novel genesꎬ new markersꎬ and genetic
diversity[J] . BMC Genomicsꎬ 2011ꎬ 12: 389.
[13] Kaur Sꎬ Cogan N Oꎬ Pembleton L Wꎬ Shinozuka
Mꎬ Savin K Wꎬ Materne Mꎬ Forster J W. Tran ̄
scriptome sequencing of lentil based on second ̄
generation technology permits large ̄scale unigene
assembly and SSR marker discovery [ J] . BMC
Genomicsꎬ 2011ꎬ 12: 265.
[14] Wei Wꎬ Qi Xꎬ Wang Lꎬ Zhang Yꎬ Hua Wꎬ Li Dꎬ
Lv Hꎬ Zhang X. Characterization of the sesame
( Sesamum indicum L.) global transcriptome u ̄
sing Illumina paired ̄end sequencing and develop ̄
ment of EST ̄SSR markers [ J] . BMC Genomicsꎬ
2011ꎬ 12(1): 451.
[15] 李玉恒ꎬ 赵明慧ꎬ 赵紫阳ꎬ 李峥ꎬ 袁雪ꎬ 李昌盛ꎬ
林增ꎬ 胡婧ꎬ 李俭ꎬ 李士泽. 利用梯度 PCR 和降
落 PCR 扩增 CIRP 基因的比较[J] . 黑龙江八一农
垦大学学报ꎬ 2011ꎬ 23(5): 46-49.
194 第 5期 袁阳阳等: 基于转录组测序信息的水生植物莕菜 SSR标记开发
[16] Yeh F. Population genetic analysis of codominant
and dominant markers and quantitative traits[J] .
Belgian J Botꎬ 1997ꎬ 129: 157.
[17] Peakall Rꎬ Smouse P E. GenAlEx 6. 5: genetic a ̄
nalysis in Excel. Population genetic software for
teaching and research ̄an update[J] . Bioinforma ̄
ticsꎬ 2012ꎬ 28(19): 2537-2539.
[18] Aggarwal R Kꎬ Hendre P Sꎬ Varshney R Kꎬ Bhat
P Rꎬ Krishnakumar Vꎬ Singh L. Identificationꎬ
characterization and utilization of EST ̄derived
genic microsatellite markers for genome analyses
of coffee and related species [ J] . Theor Appl
Genetꎬ 2007ꎬ 114(2): 359-372.
[19] Gupta P Kꎬ Rustgi Sꎬ Sharma Sꎬ Singh Rꎬ Ku ̄
mar Nꎬ Balyan H S. Transferable EST ̄SSR mar ̄
kers for the study of polymorphism and genetic di ̄
versity in bread wheat[J] . Mol Genet Genomicsꎬ
2003ꎬ 270(4): 315-323.
[20] 杨春霞ꎬ 温强ꎬ 叶金山ꎬ 朱培林. 枳壳 EST ̄SSR 标
记的开发[J] . 分子植物育种ꎬ 2011ꎬ 9(1): 123-
127.
[21] Kantety R Vꎬ La Rota Mꎬ Matthews D Eꎬ Sorrells
M E. Data mining for simple sequence repeats in
expressed sequence tags from barleyꎬ maizeꎬ
riceꎬ sorghum and wheat [ J ] . Plant Mol Biolꎬ
2002ꎬ 48(5-6): 501-510.
[22] Pan Lꎬ Xia Q Quan Zꎬ Liu Hꎬ Ke Wꎬ Ding Y.
Development of novel EST ̄SSRs from sacred lotus
(Nelumbo nucifera Gaertn) and their utilization for
the genetic diversity analysis of N. nucifera[J] . J
Heredꎬ 2010ꎬ 101(1): 71-82.
[23] Wang Dꎬ Liao Xꎬ Cheng Lꎬ Yu Xꎬ Tong J.
Development of novel EST ̄SSR markers in com ̄
mon carp by data mining from public EST se ̄
quences[ J] . Aquacultureꎬ 2007ꎬ 271 ( 1 - 4):
558-574.
[24] Durand Jꎬ Bodenes Cꎬ Chancerel Eꎬ Frigerio J
Mꎬ Vendramin Gꎬ Sebastiani Fꎬ Buonamici Aꎬ
Gailing Oꎬ Koelewijn H Pꎬ Villani Fꎬ Mattioni Cꎬ
Cherubini Mꎬ Goicoechea P Gꎬ Herran Aꎬ Ikaran
Zꎬ Cabane Cꎬ Ueno Sꎬ Alberto Fꎬ Dumoulin P
Yꎬ Guichoux Eꎬ Daruvar Aꎬ Kremer Aꎬ Plomion
C. A fast and cost ̄effective approach to develop
and map EST ̄SSR markers: oak as a case study
[J] . BMC Genomicsꎬ 2010ꎬ 11: 570.
[25] Chavarriaga ̄Aguirre Pꎬ Maya M Mꎬ Bonierbale M
Wꎬ Kresovich Sꎬ Fregene M Aꎬ Tohme Jꎬ Kochert
G. Microsatellites in cassava (Manihot esculenta
Crantz): discoveryꎬ inheritance and variability
[J] . Theoret Appl Genetꎬ 1998ꎬ 97 (3): 493 -
501.
[26] 王金雷ꎬ 朱庆ꎬ 刘益平ꎬ 杜华锐. 鸡 PRKAB2 基因
PCR ̄SSCP 分析及其与屠宰性状和肉质性状的相关
性[J] . 遗传ꎬ 2008ꎬ 30(8): 1033-1038.
[27] 向华ꎬ 毛盛贤. 固定指数理论及其在遗传育种中的
应用[J] . 遗传ꎬ 1995ꎬ 17: 63-70.
[28] 严林俊ꎬ 陈宏ꎬ 房兴堂ꎬ 张润锋ꎬ 鲍斌ꎬ 张海军. 中
国荷斯坦牛微卫星基因座遗传多态性研究[J] . 西
北农林科技大学学报: 自然科学版ꎬ 2007ꎬ 35(7):
23-27.
[29] 王勇. 花柱二型性水生植物莕菜的繁殖生态学研究
[D] . 武汉: 武汉大学ꎬ 2004.
(责任编辑: 王豫鄂)
294 植 物 科 学 学 报 第 31卷