免费文献传递   相关文献

Null Allele Detection in Plant Microsatellite Studies: Comparisons and Applications

植物微卫星分子标记中无效等位基因检测方法的比较与应用



全 文 :植物微卫星分子标记中无效等位基因检测方法的比较与应用∗
侯  盟1ꎬ2ꎬ 杜  芳1∗∗
(1 北京林业大学林学院ꎬ 北京  100083ꎻ 2 兰州大学生命科学学院草地农业
生态系统国家重点实验室ꎬ 甘肃 兰州  730000)
摘要: 微卫星分子标记因其开发便捷、 突变率高、 成本较低等优势一直被广泛应用于群体遗传学、 保护生
物学和分子生态学研究中ꎮ 近年来二代测序技术、 多重 PCR方法以及毛细管电泳等新技术的发展和完善ꎬ
极大地提高了微卫星分子标记的开发和使用效率并降低了使用成本ꎮ 但是在开展微卫星实验过程中普遍存
在的无效等位基因 (或称为哑等位基因ꎬ null alleles) 会对研究结果造成偏差ꎬ 是微卫星分子标记应用中
的最大缺陷之一ꎮ 然而ꎬ 长期以来无效等位基因的检测问题并未受到研究者的足够重视ꎮ 本文通过对国内
外相关文献查阅ꎬ 在对无效等位基因有一个较为深入和全面认识的基础上ꎬ 对目前无效等位基因的主要检
测方法进行全面的介绍和深入的比较ꎮ 最后ꎬ 结合研究实例总结出植物微卫星分子标记研究中无效等位基
因检测的有效办法ꎮ
关键词: 无效等位基因ꎻ 微卫星ꎻ 哈温平衡法ꎻ 亲子代基因型法
中图分类号: Q 3-3ꎬ Q 785        文献标识码: A            文章编号: 2095-0845(2014)06-723-07
Null Allele Detection in Plant Microsatellite Studies:
Comparisons and Applications
HOU Meng1ꎬ2ꎬ DU Fang1∗∗
(1 College of Forestryꎬ Beijing Forestry Unversityꎬ Beijing 100083ꎬ Chinaꎻ 2 School of Life Scienceꎬ
Lanzhou Universityꎬ Lanzhou 730000ꎬ China)
Abstract: Microsatellites remain the most popular markers in the studies of population geneticsꎬ conservation biology
and molecular ecology because of its ease to developmentꎬ high mutation rate and low ̄cost. Nowadaysꎬ the improve ̄
ment of new technologiesꎬ such as Next ̄Generation Sequencing (NGS)ꎬ multiplex ̄PCR and capillary electrophoresis
system have greatly promoted the development and using of microsatellite markers. Howeverꎬ null allelesꎬ one of the
most primary defects of microsatellite markersꎬ widely presented in the studies using microsatellite markersꎬ may
lead to biased results. Unfortunatelyꎬ the detection of null alleles has not been paid enough attention. In this reviewꎬ
we attempted to construct an in ̄depth and comprehensive understanding on null alleles detectionꎬ and thenꎬ applied
a detailed comparison for the different methods used to detect the occurrence of null alleles. Finallyꎬ we propose a
meaningful suggestion for null allele’s detection in plant.
Key words: Null allelesꎻ Microsatelliteꎻ Hardy ̄Weinberg Equilibrium methodꎻ Progeny tests method
  微卫星通常又被称为简单重复序列 (SSRs)、
短串联重复 ( STRs) 或简单序列长度多态性
(SSLP)ꎬ 是以 1 ~ 6 bp 为重复单位 (motifs) 的
串联重复 DNA 片段ꎬ 广泛存在于原核和真核生
植 物 分 类 与 资 源 学 报  2014ꎬ 36 (6): 723~729
Plant Diversity and Resources                                    DOI: 10.7677 / ynzwyj201414053

∗∗
基金项目: 国家自然基金青年项目 (41201051)ꎬ 中央高校基本业务经费 (TD2012 ̄01)ꎬ 111引智计划 (B13007) 和教育部创新
团队发展计划 (IRT13047)
通讯作者: Author for correspondenceꎻ E ̄mail: dufang325@gmail􀆰 com
收稿日期: 2014-03-28ꎬ 2014-07-16接受发表
作者简介: 侯  盟 (1990-) 男ꎬ 硕士研究生ꎬ 主要从事植物群体遗传学及分子生态学研究ꎮ E ̄mail: houm08@lzu􀆰 edu􀆰 cn
物基因组中 (Edwards等ꎬ 1991ꎻ Jacob等ꎬ 1991ꎻ
Tautzꎬ 1989ꎻ Zane 等ꎬ 2002ꎻ Kalia 等ꎬ 2011)ꎮ 目
前ꎬ 微卫星作为遗传学研究中最受欢迎的分子标
记之一 (Guichoux 等ꎬ 2011a)ꎬ 具有高突变率、
高等位基因多态性、 近缘种之间较高的通用性、
共显性遗传以及可重复性好等 ( Kelkar 等ꎬ
2010ꎻ Guichoux等ꎬ 2011aꎻ Jarne和 Lagodaꎬ 1996)
优点ꎬ 因此ꎬ 自八十年代被发现以来ꎬ 微卫星被
大量的用于指纹分析、 亲子鉴定、 基因作图和遗
传结构分析中 (Ellegrenꎬ 2004ꎻ Mittal 和 Dubeyꎬ
2009ꎻ Jones等ꎬ 2010)ꎮ 近年来ꎬ 随着二代测序
技术的发展ꎬ 大量转录组数据和基因组数据的公
开获取ꎬ 使得直接在转录组或基因组数据上进行
微卫星设计更加便捷可行 (Du 等ꎬ 2013ꎻ 程晓
凤等ꎬ 2011)ꎻ 而且多重 PCR 和荧光毛细管电泳
技术在微卫星扩增和检测中的成熟应用 (Gui ̄
choux等ꎬ 2011bꎻ Xu 等ꎬ 2013)ꎬ 使得微卫星的
应用变得更加高效和廉价ꎮ
尽管微卫星具有众多其他分子标记无法匹及
的优点ꎬ 但是无效等位基因的频繁存在ꎬ 使得在
使用微卫星时不得不谨慎对待ꎮ 无效等位基因又
叫哑等位基因ꎬ 是指那些在 PCR 扩增过程中不
能成功扩增的等位基因 ( Oddou ̄Muratorio 等ꎬ
2009)ꎮ 多种原因都可能导致等位基因 PCR扩增
失败ꎮ 首先ꎬ 引物结合区域 (尤其是 3’ 端) 发
生了基因突变导致引物特异性结合受到影响ꎬ 使
等位基因正常扩增受到影响ꎬ 从而显现出无效等
位基因 ( Primmer 等ꎬ 1995ꎻ Kwok 等ꎬ 1990)ꎻ
其次ꎬ 与片段较小的等位基因相比较ꎬ 片段较长
的等位基因扩增效率较低ꎬ 所以往往不容易检测
到ꎬ 从而显现出无效等位基因的假象 (Wattier
等ꎬ 1998)ꎻ 最后ꎬ 较低的模板 DNA质量或浓度
也会导致扩增失败ꎬ 使得将空白结果错误的解读
为无效等位基因 (Garcia de Leon等ꎬ 1998)ꎮ
无效等位基因在微生物 (Szaboꎬ 2007ꎻ Tsui
等ꎬ 2009)、 植物 (Hoban等ꎬ 2008)、 鱼类 (Mc ̄
Coy等ꎬ 2001) 以及哺乳动物 (Paetkau 和 Stro ̄
beckꎬ 1995ꎻ Ishibashi 等ꎬ 1996) 等众多物种中
普遍存在ꎮ 若在研究分析中不排除这些无效等位
基因ꎬ 将会使结果产生巨大偏差ꎬ 甚至会导致错
误的推断ꎮ 例如ꎬ 在群体遗传学研究中ꎬ Paet ̄
kau和 Strobeck (1995) 的研究指出ꎬ 无效等位
基因的存在会使得群体中纯合子个体增加ꎬ 使群
体偏离哈迪 ̄温伯格平衡 (Hardy ̄Weinberg Equi ̄
libriumꎬ HWEꎻ 以下简称 “哈温平衡” )ꎬ 降低
群体的表观杂合度 (HO) 和期望杂合度 (HE)ꎻ
同时ꎬ Carlsson (2008) 研究也发现无效等位基
因使得群体遗传分化系数 FST显著增大ꎻ 此外ꎬ
在进行亲本分析时ꎬ 当无效等位基因频率较高
时ꎬ 亲本的错误排除率也会显著增加 (Dakin 和
Aviseꎬ 2004)ꎮ 类似的ꎬ 较高的无效等位基因频
率同样也会引起亲缘关系 (Wagner 等ꎬ 2006)
分析结果产生显著偏差ꎮ
虽然无效等位基因对研究结果影响显著ꎬ 但
却并未引起研究者的足够重视ꎮ 在大多数使用微
卫星数据进行群体遗传结构和遗传亲缘关系的研
究中ꎬ 研究者并未对其使用的数据进行无效等位
基因检测 (Dakin 和 Aviseꎬ 2004)ꎮ Guichoux 等
(2011a) 在其关于微卫星分子标记的文献综述
中ꎬ 检查了 2009 - 2010 年分子生态 (Molecular
Ecology) 杂志上发表的利用微卫星分子标记的
100篇文章ꎬ 发现仅有 40%的研究进行了无效等
位基因检测ꎮ 文亚峰等 (2013) 在对发表于 2009
-2012年的 1 348项中文微卫星研究案例进行的
检查中ꎬ 也发现仅有 13 项研究进行了无效等位
基因检测ꎮ 因此ꎬ 在进行多样性、 群体遗传结
构、 亲缘关系等分析之前首先排除无效等位基因
的干扰是获得可信结果的第一步ꎮ 本文将通过综
述已有文献报导并结合笔者的实际研究着重介绍
5种常用的无效等位基因检测方法ꎬ 并对其检测
能力进行比较ꎬ 从而提出较为合理的无效等位基
因检测方案ꎬ 以期为植物微卫星无效等位基因检
测提供指导ꎮ
1  无效等位基因的检测方法
虽然无效等位基因从数据表面上来看很难发
现ꎬ 但是完全可以通过适当的方法对其存在与否
进行检测ꎮ 目前的检验方法很多ꎬ 根据其依据的
检验理论不同ꎬ 可将其分为两类: 基于哈温平
衡 (HWE) 的检测方法和亲子代基因型分析法
(progeny tests)ꎬ 以下将作分别介绍ꎮ
1􀆰 1  基于群体哈温平衡 (HWE) 的无效等位基
因检测方法
当特定位点存在无效等位基因时ꎬ 其含有无
427                                  植 物 分 类 与 资 源 学 报                            第 36卷
效等位基因的杂合子就会在基因分型时呈现纯合
现象ꎬ 从而导致该位点的杂合度降低ꎬ 表现出该
位点偏离哈温平衡ꎮ 目前ꎬ 基于这一理论基础的
计算无效等位基因频率的方法理论很多 (Demp ̄
ster 等ꎬ 1977ꎻ Chakraborty 等ꎬ 1992ꎻ Brookfieldꎬ
1996ꎻ Summers和 Amosꎬ 1997ꎻ Kalinowski 和 Ta ̄
perꎬ 2006)ꎬ 它们假定研究群体均为理想群体
(符合哈温平衡定律)ꎬ 通过比较表观杂合度
(HO) 和期望杂合度 (HE) 之间的差异ꎬ 来间
接确定无效等位基因的存在ꎮ 根据这些算法目前
也已开发出了一系列较为成熟的软件ꎬ 其中最为
常用的有以下四种: CERVUS (Marshall等ꎬ 1998)ꎬ
GENEPOP (Rousseꎬ 2008)ꎬ MICRO ̄CHECKER (Van ̄
Oosterhouꎬ 2004)ꎬ 以及 ML ̄NullFreq ( http: / /
www􀆰 montana􀆰 edu / kalinowski / Software / MLNullFreq􀆰
htm)ꎮ 然而ꎬ 这些软件在计算原理、 输入格式
及检测效率等方面均有差异ꎬ 我们将其主要特性
总结为表 1并细述如下:
(1) CERVUS软件包中的无效等位基因检测功能
CERVUS (http: / / www􀆰 fieldgenetics􀆰 com / pages /
home􀆰 jsp) 是由 Marshall 等 (1998) 开发的软件
包ꎬ 可进行等位基因频率分析、 亲子代分析模
拟、 亲子代鉴定等相关分析ꎬ 其中等位基因频率
分析模块中可进行哈温平衡检测和无效等位基因
频率计算ꎮ 软件可识别 Excel 格式数据ꎮ 该软件
根据 Summers 和 Amos (1997) 提出的方法ꎬ 通
过最大似然法计算无效等位基因频率ꎮ 该方法假
设携带有等位基因 a的个体数为 naꎬ 而该等位基
因的频率为 faꎬ 并给出公式: na =Nf 2a+2Nfa (1-
fa)ꎬ 其中 N 为样本个体数目 (成功扩增的)ꎮ
此时如果群体中存在无效等位基因 (0 表示)ꎬ
则基因型为 aa的个体包含了真的 aa 和含有无效
等位基因的杂合子 a0ꎮ 重复上述步骤ꎬ 我们可
以根据其一般性假设群体特定位点的任一等位基
因 (x) 和一个无效等位基因 (0) 以及无效等位
基因频率 f0ꎬ 根据公式 nx0 = 2Nf0 (1-f0)ꎬ nxx =N
(1-f0) 2ꎬ (其中 nx 0和 nxx分别表示携带无效等位
基因的杂合子个体数和不携带无效等位基因的个
体数)ꎬ 推导出 nx 0 / nxx = 2f0 / (1- f0)ꎬ 并得到估
计量 f0: f0 =nx 0 / (2nxx+nx 0)ꎮ 由于无效等位基因
纯合子 (00) 表现为数据缺失ꎬ 且其频率为 f0 2ꎬ
因此此处可修正群体数量 N’ =N / (1-f0 2)ꎮ 由此
可见该软件算法将缺失数据一律视为无效等位基
因纯合子对待ꎬ 因此具有一定的假阳性 (将非无
效等位基因错误的检测为无效等位基因) 率ꎮ
(2) GENEPOP软件包中无效等位基因检测的功能
最早的 GENEPOP3􀆰 4 是由 Raymond 和 Rousset
(1995) 编写的ꎬ 最后经 Rousset (2008) 修正
(GENEPOP4􀆰 0)ꎬ 是一个经典的群体遗传学软件ꎬ
可计算哈温平衡、 估算无效等位基因频率和群体
遗传学参数 (如 FSTꎬ FIS等)、 连锁不平衡以及
地理隔离分析等ꎮ 该软件以其特有 Genepop 文件
为输入文件进行数据处理ꎬ Genepop 文件可通过
Convert软件 (http: / / www􀆰agriculture􀆰purdue􀆰 edu /
fnr / html / faculty / Rhodes / Students%20and%20Staff /
glaubitz / software􀆰 htm) 由原始 Excel 数据转化获
得ꎬ 也可通过 txt 编译器自行编辑获得ꎮ 同时ꎬ
它以 Dempster 等 (1977) 提出的 EM (Expecta ̄
tion ̄Maximization) 算法为基础ꎬ 进行无效等位
基因频率估算ꎬ 并根据公式 P∗i =

2n
[2n∗ii + n∗i0
+ ∑

j≠1
nij] 和 r =

2n
[2n0 + ∑

i = 1
n∗i0 ] 分别计算任意
等位基因 i 的频率 P∗i ꎬ 和无效等位基因 ‘0’
的频率 rꎮ 以此为基础ꎬ 根据迭代方程 p″ i =

2n
[
2(p′i + r′)
p′i + 2r′
× nii + ∑

j≠1
nij] 和 r″ =

2n
[2n0 +


i = 1
( 2r′
p′i + 2r′
) × nii] 进行迭代ꎬ 直至 ( p″i- p′i)
和 ( r″- r′) 都小于 10-5ꎬ 并确定该频率为最终
频率ꎮ 同样的ꎬ 该方法依然将缺失数据以无效等
位基因纯合子处理ꎮ
(3) MICRO ̄CHECKER软件
MICRO ̄CHECKER (Van Oosterhout 等ꎬ 2004)
是专门用于大量微卫星数据分析的软件ꎬ 可用于
检测大片段等位基因遗失 (未产生和小片段等
位基因同等扩增效率的扩增)、 影子带 (Stutter ̄
ing) 和无效等位基因的存在ꎮ 该软件以 Excel格
式文件为输入文件ꎮ 在等位基因检测方面ꎬ 其根
据 Chakraborty 等 (1992) 和 Brookfield (1996)
的方法分别进行无效等位基因频率估算ꎮ Chakr ̄
aborty等 (1992) 的方法将缺失数据视为扩增失败ꎬ
并给出公式 HO =
2∑

i≠j
P∗i P∗j
(1 - r2)
和 HE =
2∑

i≠j
P∗i P∗j
(1 - r) 2
5276期            侯  盟和杜  芳: 植物微卫星分子标记中无效等位基因的检测方法: 比较与应用             
分别计算表观杂合度和期望杂合度ꎬ 并且给出无
效等位基因频率计算公式 r′ = (HE -HO) / (HE +
HO)ꎻ 而 Brookfield (1996) 的方法则将缺失数
据视为无效等位基因纯合子对待 (n0)ꎬ 并得到
r′ = A
+ A2 + B
2(1 + HE)
ꎬ 其中 A = HE(1 + n0) - HO ꎬ B
= 4n0(1 - H2E) 并利用最大似然法进行估算ꎮ 利
用 MICRO ̄CHECKER估算无效等位基因时结果
的假阳性率和假阴性率都比较适中ꎮ
(4) ML ̄NullFreq
ML ̄NullFre ( http: / / www􀆰 montana􀆰 edu / kali ̄
nowski / Software / MLNullFreq􀆰htm) 也以 Genepop 格
式文件为输入文件进行分析ꎬ 并根据 Kalinowski
和 Taper (2006) 的方法ꎬ 给出了等位基因频率
的估计量: L = ∏

i = 1
[(p2i + 2pipn)(1 - β)]
nii{ } ×


i≠j
[(2pipj)(1 - β)]
nij{ } × [β + p2n(1 - β)]nmm{ } ꎮ
其中ꎬ β为由于实验原因而扩增失败的概率ꎬ nmm
为全部未扩增成功个体ꎬ iꎬ j为特定位点等位基
因 iꎬ jꎮ 然后再根据 Chakraborty 等 (1992) 和
Brookfield (1996) 的方法ꎬ 进行迭代计算ꎮ 不同
的是ꎬ 该方法认为缺失数据包含了无效等位基因
纯合子和因实验原因而导致的扩增失败ꎮ
1􀆰 2  亲子代基因型法的无效等位基因检测
不同于哈温平衡法ꎬ 亲子代基因型法并不要
求群体必须处于理想状态ꎬ 即群体可以偏离哈温
平衡ꎮ 事实上ꎬ 自然群体中广泛存在的干扰因素
例如瓶颈效应ꎬ 非随机交配等都会引起群体偏离
哈温平衡ꎮ 因此ꎬ 利用亲子代基因分型法进行无
效等位基因检测就显得尤为重要ꎮ
亲子代基因分型法是基于孟德尔遗传规律的
直接分析无效等位基因的方法ꎮ 在孟德尔遗传规
律下ꎬ 若为全同胞家系 (即父本、 母本及子代)ꎬ
两亲本基因型分别为 01 (0ꎬ 为无效等位基因)
和 23ꎬ 那么如果此时子代中观测到了 22ꎬ 33 基
因型 (实际应为 02ꎬ 03)ꎬ 那么就出现和亲本 01
(仅能观测到等位基因 1) 基因型不一致的现象
(即基因型为 22ꎬ 33 的子代没有获得亲本 01 的
任一等位基因ꎬ 表现出违反孟德尔遗传规律的现
象)ꎬ 据此ꎬ 我们就可检测出无效等位基因的存
在ꎮ 若为半同胞家系 (仅父本、 母本一方及子
代)ꎬ 一方亲本基因型为 01 (仅能观测到等位基
因 1)ꎬ 子代的基因型为 02 (仅能观测到等位基
因 2) 则可确定此位点能够监测到无效等位基
因ꎮ 一般来说ꎬ 对于全同胞家系中只需要有六个
子代的基因型数据、 半同胞家系中 12或 24 个等
位基因型的数据就可确定该位点是否为无效等位
基因 (与 Rémy J􀆰 Petit沟通)ꎮ
2  无效等位基因检测方法比较以及检测
结果可信度评价
在上述总结提到的 5 种方法中ꎬ 毫无疑问ꎬ
亲子代基因分型的方法是最为准确的方法ꎮ 但在
大多数时候ꎬ 尤其是进行自然群体的研究时ꎬ 我
们无法获得有效的亲本遗传信息ꎬ 因此只能通过
间接的杂合度方法来估算无效等位基因频率ꎮ 四
种间接估计的方法ꎬ 无论是在其计算理论还是对
缺失数据的处理等方面上都存在差异 (表 1)ꎬ 那
么ꎬ 对其估计效力在实际应用中应当谨慎对待ꎮ
Oddou ̄Muratorio等 (2009) 使用 CERVUSꎬ GENE
POP和 ML ̄NullFreq 对欧洲山毛榉的研究结果显
示ꎬ 虽然这三种软件检测无效等位基因得到的结
果 (分别为 0􀆰 0783ꎬ 0􀆰 0719 和 0􀆰 0731) 略高于
亲子代法检测的结果 (0􀆰 053)ꎬ 但结果之间并
无显著差异ꎬ 这似乎显示了这些间接方法的有效
性ꎮ 但是文亚峰等 (2013) 则认为ꎬ 该结果的
产生是由于欧洲山毛榉本身较低的无效等位基因
频率以及其广泛连续分布ꎬ 可使其群体处于哈温
平衡状态ꎬ 所以该结果并不能有效的证明在群体
含有较高频率无效等位基因或可能偏离哈温平衡
(可能自交ꎬ 经历瓶颈效应等) 时检测结果的可
靠性ꎮ
Dᶏbrowski等 (2014) 通过比较根田鼠 (Mi ̄
crotus oeconomus) 自然居群连续监测八年的数据
和模拟数据的结果ꎬ 对 4种以哈温平衡为基础无
效等位基因检测方法 (CERVUSꎬ GENEPOP ꎬ MICRO ̄
CHECKERꎬ 以及 ML ̄NullFreq) 的检测效力进行
了评估ꎮ 通过对根田鼠自然群体的研究结果显
示ꎬ 不仅这 4 种方法之间的结果差异显著 (相
似率仅为 15%)ꎬ 并且同种方法不同年份之间的
结果也存在显著差异ꎮ 由于根田鼠的群体数量每
年都会经历季节性的剧烈波动并且存在群体迁
移ꎬ 因而ꎬ 该结果显示了这 4种方法在对非平衡
627                                  植 物 分 类 与 资 源 学 报                            第 36卷
群体进行检测时存在显著的误差ꎮ 另一方面ꎬ 该
文作者还分别模拟了平衡群体下ꎬ 不存在无效等
位基因和存在无效等位基因时的 4种方法的检测
效率ꎮ 不含有无效等位基因的模拟数据检测的结
果发现 4种方法都存在假阳性 (表 1) 且结果之
间还存在显著差异 (相似率仅为 1%)ꎻ 而在含
有已知无效等位基因的模拟数据中除了 GENEPOP
得到了 55%的假阳性外ꎬ 其他 3 种方法均很低
(1􀆰 6%~1􀆰 9%)ꎬ 但是 4 种方法却显示出了高达
22%~42%不等的假阴性 (本为无效等位基因ꎬ
但却未被检测到)ꎮ 这些结果都暗示即使是平衡
群体ꎬ 也应当慎重对待检测结果ꎮ 值得注意的
是ꎬ 该研究还发现随着瓶颈效应的增强ꎬ 检测结
果的误差也显著增高ꎬ 尤以 GENEPOP的检测结果
误差最为突出ꎮ
3  植物微卫星无效等位基因检测的建议
亲子代基因分型法具有准确的鉴定结果ꎬ 并
且无需考虑群体是否符合哈温平衡ꎬ 因而我们建
议优先使用亲子代基因分型法对植物群体无效等
位基因进行检测ꎮ 然而对于开放授粉的植物来
说ꎬ 确定父本非常困难ꎬ 而种子却相对易于获
得ꎬ 我们能够较为方便的构建以母本和其子代信
息为基础的半同胞家系来检验无效等位基因ꎮ 作
者所在的实验室成功利用了半同胞家系 (一个
母本和 12个子代) 检验了胡杨中的无效等位基
因 (在 64对核基因 SSR 引物中检测到 3 对无效
等位基因) (Du 等ꎬ 2013ꎻ Xu 等ꎬ 2013)ꎮ 利用
该方法分析无效等位基因时需要谨慎对待基因分
型ꎬ 以防人为原因造成的分型误差而产生无效等
位基因ꎮ
然而当我们无法获取构建完整的亲缘谱系关
系时ꎬ 就不得不使用间接的估计方法ꎮ 由于上述
4种方法均假定研究群体为哈温平衡群体ꎬ 因此
我们首先必须清楚群体的遗传结构和历史动态ꎬ
以确定群体是否经历了瓶颈效应、 迁移或者非随
机交配而可能偏离哈温平衡ꎬ 若为非哈温平衡群
体ꎬ 则必须使用亲子代基因分型法进行检测ꎮ
在明确群体为平衡群体时ꎬ 我们也必须慎
重对待检测结果ꎮ 由于 GENE POP 在对含有已知
无效等位基因的模拟数据检测中的较差表现
(Dᶏbrowski等ꎬ 2014)ꎬ 因此建议不使用 GENEPOP
书书书
!
!

#
$
%
&

(
)
*
+
,
-
!
# $
%
&
( )
*
+
, %
) -
. /
%
*
% .
/ )
0 1
2 1
% 0
- )
,
3 2
$ $
$
$ %
$ %
1
0 %
. %
4 .
5 )
3
!

#
$
%
&






(
)
*
+
,
-
.
/
0
1
!
6 7














2
3


4
5
%
6
( 8
9
:
;
<
8 =
4 %
$
< 2
*
*
% ,
1 7
> *
) 1
!
& ?
? @
8
9
:
;

<
=
>
?
@
A
B
C
D
& A
B
<
=
>
?
@
A
E
1
F
G
H
!
I
J
K
L
M
E
1
N
O
P

L

Q
R
I
J
8
G
N
.
/
0
1
!
S
T
H
I
J
8
K
N
.
U
0
Q
R

V
W
=
X
Y
Z
[
Q
R
]
^
_
!
S
`
G
a
C
8 D
8
E F
E
G
,
1 /
$
$ >
# &
? ?
H $
C
8 D
8
E F
E
C %
3 %
+ )
+
I %
*
+ 1
. %
, >
!
& ?
@ @
8 G


<
=
>
?
@
A
B
C
D
B A
@
<
=
>
?
@
A
E
1
F
G
H
!
I
J
F
b
N
L
c
Q
R
!
d
I
J
K
L
M
E
1
N
O
P

L

Q
R
.
/
0
1
F
K
!
d
`
e
f
f
g
h
M
i
!

Z
[
Q
R
^
j
k
l
m
h
.
/
0
H
!
M
n
;
o
p
q
r
K
N
.
/
0
Q
R

V
W
=
X
>
Y
Q
R
s
t
]
^
_
!
K
a
M
i
u
v
f
g
!


A
w
!
l
x
y
z
{
|
}
9 )
2 1
1 %
.
# J
K K
H $
G
L (
9 F
M
( N
8 (
O M
8 9
8 =
4 %
$
( /
P
,
# )
, . Q
>
!
& ?
? J

R ,
) )
P S
% $
0 !
& ?
? T
8
9
:
;
<
=
>
?
@
A
B
C
D
~
E (
9

X
)
€
J A
&
<
=
>
?
@
A
E
1
F
G
H
!
L
c
Q
R

‚
!
S
I
J
K
L
M
E
1
N
O
P

L

Q
R
N
.
/
0
1
7
.
U
0
1
k
ƒ
F
„
…

V
W
=
X
>
Y
Q
R
]
F
†
:
3
F )
1 . %
, /
) 2
. >
# J
K K
B $
G
U M
D 2
$ $ V
, %
W
C %
3 %
+ )
+
O
$ 5 3
) X
1 P
5 7
!
+ %
, !
J K
K T
8
9
:
;
7
8 G
‡
Q
C
<
=
>
?
@
A
B
C
D
7
E (
9

X
)
€
Y A
J
<
=
>
?
@
A
E
1
F
G
H
!
L
c
Q
R

‚
!
S
I
J
K
L
M
E
1
N
O
P

L

Q
R
N
.
/
0
1
ˆ
K
!
S
`
.
U
0
1
8
G

V
W
=
X
>
Y
Q
R
]
F
†
/ .
. +
%
6 6
X X
X A
*
) 3
.
3
% A
0 2
6 P
$ 5
3 )
X 1
P 5
6 <
) - .
X
, %
6
G
U D
2 $
$ V
, %
W A
/ .
*
+ ,
) Z
% 3
Q
. %
1 . 1
8 =
4 %
$
‰
Š
ƒ
F
E (
9

X
)
€
&
I
J

‚
N
L
c
Q
R
!
S
`
‹
Œ

x
Ž


‘
!
d
L
c
Q
R
’
“
”
•
–
—
7
E (
9
˜
™
A
š
N
]
%
& $
@
A
›
œ

s

J $
D
ž
# <
. 2
. . %
, 5 3
Z $
]
Ÿ
 
9
†
N
¡
‚
¢
£

[ $
›
¤
¥
# <
+ $
5 .
+ %
P
1 $
]
Ÿ
 
9
†
N
¡
‚
¢
£




&
¦
%
( %
, 2 1

C %
3 %
E )
+
G
5 4
, )
M (
/ %
4 P
% ,

G
U M
D 2
$ $ V
, %
W
>
§
&
N
¨
-
`
<
=
>
?
@
A
©
ª
«
¬
C
­
l
®
!
|
q
¯
°
±
²
³
´
µ

!
A
w
·
¸
!

Œ
¹
Z
[
¯
°
º
C
³
´
µ

»
D
¼
›
œ

º
C
½
¾
¿
À
Á
Â
Ã
!
Y
Z
[
¯
°
<
Œ
¹


!
%
*
+
Ä
Å
I
# ,
) X
1 P
5 >
!
J K
& B
7276期            侯  盟和杜  芳: 植物微卫星分子标记中无效等位基因的检测方法: 比较与应用             
进行检测ꎮ 在使用 CERVUSꎬ MICRO ̄CHECKER 以
及 ML ̄NullFreq检测时ꎬ 结果依然存在较高假阳
性概率 (Dᶏbrowski 等ꎬ 2014) 和高估无效等位
基因频率的趋势 ( Oddou ̄Muratorio 等ꎬ 2009)ꎮ
因此ꎬ 建议使用多种方法同时进行检测ꎬ 并且仅
选取共同检测到的结果ꎬ 这将有效的降低假阳性
的出现ꎮ 但同时ꎬ 这又必将增大假阴性结果出现
的概率ꎬ 综合这一因素ꎬ 建议最好选取任意两种
方法组合ꎬ 且选取共同检测到的结果ꎮ 此外ꎬ 如
果群体数量足够大的话ꎬ 建议不妨随机获取几个
子样本进行检验并将结果综合后与总体数据的检
测结果进行对照ꎬ 以确定检测结果的可信度ꎮ
4  微卫星位点的选择
无效等位基因不仅对群体遗传分析结果产生
巨大影响ꎬ 并且其检验方法亦不够稳定ꎬ 因此在
选择引物时我们应当舍弃具有较高无效等位基因
频率的位点ꎬ 并尽可能选择不含有无效等位基因
的位点ꎮ Xu等 (2013) 的研究显示ꎬ 相对于核
基因 SSR (gSSR)ꎬ 表达序列标签ꎬ EST ̄SSR (eS ̄
SR) 虽然杂合度稍低ꎬ 但是其无效等位基因的
出现频率也有效降低ꎬ 这可能由于外显子序列的
高度保守性使其不易于在引物区段发生突变ꎬ 而
产生无效等位基因ꎮ 此外ꎬ 随着二代测序技术的
发展ꎬ 获得越来越多非模式物种的基因组、 转录
组数据已经成为可能ꎬ 基于这些基因组、 转录组
数据直接开发的引物也可避免由于不同种间的转
移扩增时产生的无效等位基因 (Du等ꎬ 2013)ꎮ
5  结语
无效等位基因在微卫星中普遍存在并会对分
析结果会造成强烈偏差ꎬ 因此在利用微卫星分子
标记进行研究时必须去除无效等位基因ꎬ 以获得
可信的结果ꎮ 一方面ꎬ 在初始微卫星选择时ꎬ 我
们应尽量选择无效等位基因较少出现的微卫星
(如 EST ̄SSR)ꎻ 另一方面ꎬ 我们需要对微卫星
进行严格的无效等位基因检测ꎬ 以去除无效等位
基因ꎮ 鉴于不同方法无效等位基因检测结果的显
著差异ꎬ 我们建议最好选取任意两种方法 (不
建议使用 GENEPOP) 组合ꎬ 并且选取其共同检测
到的结果ꎬ 确保结果可信ꎮ 但就目前的检验方法
而言ꎬ 不管是亲子代基因型法亲缘谱系的难以构
建ꎬ 还是哈温平衡方法假设群体是处于哈温平衡
下的要求ꎬ 都使这些方法的应用具有很大的局限
性ꎬ 因此期望新的更加稳健的无效等位基因检测
方法的出现ꎬ 克服以上方法的局限性ꎬ 使检测更
方便、 检测结果更稳定ꎮ
致谢  感谢中国林科院曾艳飞老师和云南大学生态学与环
境学院贾东瑞老师对文章初稿的修改以及提出的宝贵意见ꎮ
〔参  考  文  献〕
Brookfield JFYꎬ 1996. A simple new method for estimating null allele
frequency from heterozygote deficiency [ J] . Molecular Ecologyꎬ
5: 453—455
Carlsson Jꎬ 2008. Effect of microsatellite null alleles on assignment
testing [J] . Journal of Heredityꎬ 99: 616—623
Chakraborty Rꎬ De Andrade Mꎬ Daiger SP et al.ꎬ 1992. Apparent
heterozygote deficiencies observed in DNA typing data and their
implications in forensic applications [ J] . Annals of Human Ge ̄
neticsꎬ 56: 45—57
Chen XF (程晓凤)ꎬ Huang FJ (黄福江)ꎬ Liu MD (刘明典) et
al.ꎬ 2011. Development of microsatellite markers use 454 pyro ̄
sequencing [J] . Biotechnology Bulletin (生物技术通报)ꎬ 8:
82—90
Dᶏbrowski MJꎬ Pilot Mꎬ Kruczyk M et al.ꎬ 2014. Reliability assess ̄
ment of null allele detection: inconsistencies between and within
different methods [J] . Molecular Ecology Resourcesꎬ 14: 361—
373
Dakin EEꎬ Avise JCꎬ 2004. Microsatellite null alleles in parentage
analysis [J] . Heredityꎬ 93: 504—509
Dempster APꎬ Laird NMꎬ Rubin DBꎬ 1977. Maximum likelihood from
incomplete data via the EM algorithm [J] . Journal of the Royal
Statistical Society Series B (Methodological)ꎬ 39: 1—38
Du FKꎬ Xu Fꎬ Qu H et al.ꎬ 2013. Exploiting the transcriptome of Eu ̄
phrates Poplarꎬ Populus euphratica (Salicaceae) to develop and
characterize new EST ̄SSR markers and construct an EST ̄SSR
database [J] . PloS Oneꎬ 8: e61337
Edwards ALꎬ Civitello Aꎬ Hammond HA et al.ꎬ 1991. DNA typing
and genetic mapping with trimeric and tetrameric tandem repeats
[J] . American Journal of Human Geneticsꎬ 49: 746—756
Ellegren Hꎬ 2004. Microsatellites: simple sequences with complex e ̄
volution [J] . Nature Reviews Geneticsꎬ 5: 435—445
Garcia de Leon FJꎬ Canonne Mꎬ Quillet E et al.ꎬ 1998. The applica ̄
tion of microsatellite markers to breeding programmes in the sea
bassꎬ Dicentrarchus labrax [J] . Aquacultureꎬ 159: 303—316
Guichoux Eꎬ Lagache Lꎬ Wagner S et al.ꎬ 2011a. Current trends in
microsatellite genotyping [J] . Molecular Ecology Resourcesꎬ 11:
591—611
827                                  植 物 分 类 与 资 源 学 报                            第 36卷
Guichoux Eꎬ Lagache Lꎬ Wagner S et al.ꎬ 2011b. Two highly valida ̄
ted multiplexes (12 ̄plex and 8 ̄plex) for species delimitation and
parentage analysis in oaks (Quercus spp.) [J] . Molecular Ecolo ̄
gy Resourcesꎬ 11: 578—585
Hoban Sꎬ Anderson Rꎬ Mccleary T et al.ꎬ 2008. Thirteen nuclear mi ̄
crosatellite loci for butternut (Juglans cinerea L.) [J] . Molecu ̄
lar Ecology Resourcesꎬ 8: 643—646
Ishibashi Yꎬ Saitoh Tꎬ Abe S et al.ꎬ 1996. Null microsatellite alleles
due to nucleotide sequence variation in the grey ̄sided vole Clethri ̄
on mys rufocanus [J] . Molecular Ecologyꎬ 5: 589—590
Jacob HJꎬ Lindpaintnesr Kꎬ Kusumir EL et al.ꎬ 1991. Genetic map ̄
ping of a gene causing hypertension in the stroke ̄prone spontane ̄
ously hypertensive rat [J] . Cellꎬ 67: 213—224
Jarne Pꎬ Lagoda PJꎬ 1996. Microsatellitesꎬ from molecules to popula ̄
tions and back [ J] . Trends in Ecology & Evolutionꎬ 11: 424—
429
Jones AGꎬ Small CMꎬ Paczolt KA et al.ꎬ 2010. A practical guide to
methods of parentage analysis [J] . Molecular Ecology Resourcesꎬ
10: 6—30
Kalia RKꎬ Rai MKꎬ Kalia S et al.ꎬ 2011. Microsatellite markers: an
overview of the recent progress in plants [ J] . Euphyticaꎬ 177:
309—334
Kalinowski STꎬ Taper MLꎬ 2006. Maximum likelihood estimation of
the frequency of null alleles at microsatellite loci [ J] . Conserva ̄
tion Geneticsꎬ 7: 991—995
Kelkar YDꎬ Strubczewski Nꎬ Hile SE et al.ꎬ 2010. What is a microsa ̄
tellite: A computational and experimental definition based upon
repeat mutational behavior at A / T and GT / AC repeats [ J] . Ge ̄
nome Biology and Evolutionꎬ 2: 620—635
Kwok Sꎬ Kellogg DEꎬ McKinney N et al.ꎬ 1990. Effects of primer ̄
template mismatches on the polymerase chain reaction: human
immunodeficiency virus type 1 model studies [J] . Nucleic Acids
Researchꎬ 18: 999—1005
Marshall TCꎬ Slate Jꎬ Kruuk LEB et al.ꎬ 1998. Statistical confidence
for likelihood ̄based paternity inference in natural populations
[J] . Molecular Ecologyꎬ 7: 639—655
McCoy EEꎬ Jones AGꎬ Avise JCꎬ 2001. The genetic mating system
and tests for cuckoldry in a pipefish species in which males fer ̄
tilize eggs and brood offspring externally [ J] . Molecular Ecolo ̄
gyꎬ 10: 1793—1800
Mittal Nꎬ Dubey Aꎬ 2009. Microsatellite markers—A new practice of
DNA based markers in molecular genetics [ J] . Pharmacognosy
Reviewsꎬ 3: 235—246
Oddou ̄Muratorio Sꎬ Vendramin GGꎬ Buiteveld J et al.ꎬ 2009. Popu ̄
lation estimators or progeny tests: what is the best method to as ̄
sess null allele frequencies at SSR loci? [J] . Conservation Genet ̄
icsꎬ 10: 1343—1347
Paetkau Dꎬ Strobeck Cꎬ 1995. The molecular basis and evolutionary
history of a microsatellite null allele in bears [ J] . Molecular
Ecologyꎬ 4: 519—520
Primmer CRꎬ Moller APꎬ Ellegren Hꎬ 1995. Resolving genetic rela ̄
tionship with microsatellite markers: a parentage testing system
for the swallow Hirundo rustica [ J ] . Molecular Ecologyꎬ 4:
493—498
Raymond Mꎬ Rousset Fꎬ 1995. GENEPOP Version 1􀆰 2: population
genetics software for exact tests and ecumenicism [ J] . Journal
of Heredityꎬ 86: 248—249
Rousset Fꎬ 2008. Genepop′007: a complete reimplementation of the
genepop software for Windows and Linux [J] . Molecular Ecology
Resourcesꎬ 8: 103—106
Summers Kꎬ Amos Wꎬ 1997. Behavioralꎬ ecologicalꎬ and molecular
genetic analyses of reproductive strategies in the Amazonian
dart ̄poison frogꎬ Dendrobatesven trimaculatus [ J] . Behavioral
Ecologyꎬ 8: 260—267
Szabo LJꎬ 2007. Development of simple sequence repeat markers for
the plant pathogenic rust fungusꎬ Puccinia graminis [J] . Molecu ̄
lar Ecology Notesꎬ 7: 92—94
Tautz Dꎬ 1989. Hypervariability of simple sequences as a general
source for polymorphic DNA markers [ J] . Nucleic Acids Re ̄
searchꎬ 17: 6463—6471
Tsui CKMꎬ Feau Nꎬ Ritland CE et al.ꎬ 2009. Characterization of mic ̄
rosatellite loci in the fungusꎬ Grosmannia clavigeraꎬ a pine
pathogen associated with the mountain pine beetle [ J] . Molecu ̄
lar Ecology Resourcesꎬ 9: 1500—1503
Van Oosterhout Cꎬ Hutchinson WFꎬ Wills DMP et al.ꎬ 2004. MI ̄
CRO ̄CHECKER: software for identifying and correcting genoty ̄
ping errors in microsatellite data [ J] . Molecular Ecology Notesꎬ
4: 535—538
Wagner APꎬ Creel Sꎬ Kalinowski STꎬ 2006. Estimating relatedness
and relationships using microsatellite loci with null alleles [ J] .
Heredityꎬ 97: 336—345
Wattier Rꎬ Engel CRꎬ Saumitou ̄Laprade P et al.ꎬ 1998. Short allele
dominance as a source of heterozygote deficiency at microsatellite
loci: experimental evidence at the dinucleotide locus Gv1CT in
Gracilaria gracilis ( Rhodophyta) [ J] . Molecular Ecologyꎬ 7:
1569—1573
Wen YF (文亚峰)ꎬ Kentaro Uchiyamaꎬ Han WJ (韩文军) et al.ꎬ
2013. Null alleles in microsatellite markers [ J] . Biodiversity
Science (生物多样性)ꎬ 21: 117—126
Xu Fꎬ Feng Sꎬ Wu R et al.ꎬ 2013. Two highly validated SSR multi ̄
plexes (8 ̄plex) for Euphrates′ poplarꎬ Populus euphratica (Sal ̄
icaceae) [J] . Molecular Ecology Resourcesꎬ 13: 144—153
Zane Lꎬ Bargelloni Lꎬ Patarnello Tꎬ 2002. Strategies for microsatellite
isolation: a review [J] . Molecular Ecologyꎬ 11: 1—16
9276期            侯  盟和杜  芳: 植物微卫星分子标记中无效等位基因的检测方法: 比较与应用