全 文 :园艺学报,2016,43 (2):373–383.
Acta Horticulturae Sinica
doi:10.16420/j.issn.0513-353x.2015-0418;http://www. ahs. ac. cn 373
收稿日期:2015–10–23;修回日期:2016–01–11
基金项目:国家自然科学基金项目(36470666);日本 JSPS 博士后研究员资助课题(11F00787);林业公益性行业专项项目(201104033)
* 通信作者 Author for correspondence(E-mail:wenyafeng7107@163.com)
致谢:部分试验在日本森林综合研究所森林遗传领域分子实验室完成,感谢 Tsumura 教授、Ueno 博士和 Uchiyama 博士的指导和帮助。
南方红豆杉 4 个微卫星位点等位基因变异分析
谢伟东 1,2,文亚峰 3,*,韩文军 1,周 宏 4,徐刚标 1,陈建华 1
(1 中南林业科技大学林学院,长沙 410004;2 广西大学林学院,南宁 530004;3 中南林业科技大学风景园林学院,
长沙 410004;4广东省韶关市林业局,广东韶关 512000)
摘 要:以南方红豆杉(Taxus chinensis var. mairei)的 4 个微卫星位点为例,通过等位基因长度和序
列变异分析,对各位点等位基因的变异特点、变异来源和进化关系进行研究。结果表明:这 4 个位点在
南方红豆杉种内表现出丰富而复杂的变异特点,既有 SSR 重复区突变形成的等位基因,也有因侧翼序列
插入/缺失(Indel)形成的等位基因,还存在同一长度形态的同形异源等位基因(allelic homoplasy),同时,
在 1 个 mtSSR 位点中检测到了线粒体基因的异质性(heteroplasmy)。SSR 重复序列和侧翼序列突变的共
同作用是引起等位基因长度异常的主要原因。等位基因分布及其进化关系研究表明,4 个位点的序列突变
更符合逐步突变模型(SMM),常见等位基因在进化上具有原始性。
关键词:南方红豆杉;微卫星标记;等位基因;序列变异;基因突变
中图分类号:S 68 文献标志码:A 文章编号:0513-353X(2016)02-0373-11
Variation Analysis of Four Microsatellite Loci Within Maire Yew Species
XIE Wei-dong1,2,WEN Ya-feng3,*,HAN Wen-jun1,ZHOU Hong4,XU Gang-biao1,and CHEN Jian-hua1
(1College of Forestry,Central South University of Forestry and Technology,Changsha 410004,China;2College of
Forestry,Guangxi University,Nanning 530004,China;3College of Landscape Architecture,Central South University of
Forestry and Technology,Changsha 410004,China;4Forestry Bureau of Shaoguan,Guangdong Province,Shaoguan,
Guangdong 512000,China)
Abstract:This paper focused on the variation and phylogeny relationship of four microsatellite loci
originated from maire yew(Taxus chinensis var. mairei). Comparison of allelic size and sequences
indicated that abundant variation and complex SSR structure existed in four SSR loci. Inter-allelic size
variation in SSR loci was due to the mutation of SSR repeats and insertions or deletions(Indels) in
flanking regions,which also the main reason caused the allelic size mismatch with sequences data. Two
sets allelic homoplasy were observed in TY05 locus where alleles identical in state are not identical by
descent. Mitochondrial DNA heteroplasmy was detected in one mitochondrial SSR locus(TB01). Allelic
distribution and their phylogeny relationship suggested that stepwise mutation model(SMM)appropriated
for these loci,common allele have the characteristic of aboriginality on evolution phylogeny.
Key words:Taxus chinensis var. mairei;microsatellite marker;allele;sequence variation;gene
mutation
Xie Wei-dong,Wen Ya-feng,Han Wen-jun,Zhou Hong,Xu Gang-biao,Chen Jian-hua.
Variation analysis of four microsatellite loci within maire yew species.
374 Acta Horticulturae Sinica,2016,43 (2):373–383.
微卫星(microsatellite)也称简单重复序列(simple sequence repeat,SSR),是以 1 ~ 6 个核苷
酸碱基(bp)为重复单元组成的简单串联重复序列(Tautz,1989;Oppen et al.,2000)。微卫星普
遍存在于核基因组、线粒体和叶绿体基因组中,其突变率显著高于基因组其他序列(SchlÖtterer,
2000)。微卫星标记正是基于重复序列的高度变异性和侧翼序列的保守性而设计引物,在基因分型的
基础上,通过基因型或等位基因频率进行相关遗传学分析。微卫星标记技术自建立以来,以其多态
性高、呈共显性遗传、重复性好、试验操作容易等特点(Jarne & Lagoda,1996),在人类医学、动
物、植物及微生物等学科各领域得到了广泛应用,是遗传育种、资源保护、系统发生和群体遗传学
研究的有力工具。
但微卫星位点的高突变也会带来不利影响(Nagylaki,1998;Hedrick,1999)。已有研究表明,
微卫星位点的突变不仅存在于重复序列,而且相对保守的侧翼序列也会有一定程度的变异发生
(Grimaldi & Crouau-Roy,1997)。特定位点的等位基因并不仅仅取决于 SSR 重复单元(motif)的
增加或减少,SSR 重复区突变、侧翼序列的插入/缺失(Indel)也会形成新的等位基因(Matsuoka et
al.,2002),同形异源等位基因(Estoup et al.,2002)、无效等位基因(文亚峰 等,2012)的产生相
当普遍。单纯依靠等位基因长度多态很难发现 SSR 位点隐含的全部变异信息(Selkoe & Toonen,
2006),会对研究结果的准确性造成影响。同时,微卫星变异的复杂性使其突变机理至今尚不明确(Li
et al.,2002;Beck et al.,2003),而群体遗传学参数的估算正是基于相关突变模型。这些不足和缺
陷一定程度限制了微卫星标记的使用范围。
南方红豆杉(Taxus chinensis var. mairei)也称美丽红豆杉,属红豆杉科(Taxaceae)红豆杉属
(Taxus)一变种,是中国一级保护树种。在南方红豆杉分子遗传学研究中发现,有些微卫星位点的
毛细管电泳结果(等位基因长度)与预期(根据 motif 重复单元推断)并不一致,并且有部分等位
基因间的长度差异出现异常。因为这些位点是通过种间扩增法(Wen et al.,2012)获得,因而怀疑
引起异常的原因是基因分型错误或等位基因序列种间变异。为确定其产生的原因,以 4 个等位基因
长度出现异常的位点用于测序分析,等位基因长度和序列比较发现这些位点在种内存在非常丰富的
序列变异,SSR 位点的高突变是引起等位基因长度异常的主要原因。作者还重建了等位基因间的系
统进化关系,对微卫星的突变机理进行探索。研究结果对于明确微卫星等位基因变异特点,进一步
了解微卫星突变机理具有重要意义,有助于获得更为准确可靠的标记结果。
1 材料与方法
1.1 研究材料
南方红豆杉样本于 2011 年至 2015 年采自南岭山地及周边地区的 28 个群体,共 609 个单株。每
个样本采嫩叶适量,干燥硅胶保存。叶片 DNA 提取采用改良 CTAB 法(Tsumura et al.,1995)。依
Wen 等(2012)的文献选择 4 个微卫星位点,TY24、N-TY16、TY05 是核基因组微卫星位点,TB01
是线粒体基因组微卫星位点。因其电泳分型等位基因长度(size)存在异常,同时这些位点的纯合
体样本数量较多,便于取样测序。试验在日本森林综合研究所和中南林业科技大学生物技术实验中
心完成。
1.2 方法
利用毛细管电泳技术对 609 个南方红豆杉样本进行基因分型,统计各位点的等位基因数量及频
谢伟东,文亚峰,韩文军,周 宏,徐刚标,陈建华.
南方红豆杉 4 个微卫星位点等位基因变异分析.
园艺学报,2016,43 (2):373–383. 375
率。从不同等位基因所对应的样本材料中,随机选取 1 ~ 6 株纯合体个体测序,取样数量依据等位
基因频率大小。比较分析各位点等位基因的长度变异、序列变异、等位基因间和等位基因内的突变,
重建等位基因间系统进化关系。
毛细管电泳基因分型:各位点正向引物(F)5′端作 FAM 荧光标记。PCR 按 QIAGEN® Multiplex
PCR 试剂盒方法。扩增体系共 6 μL,其中含 2× Multiplex master 缓冲液 3.0 μL,2 μmol · L-1 的引物
混合液(正向、反向引物)0.6 μL,H2O 1.4 L,5 ~ 10 ng DNA 模板 1.0 L。PCR 扩增程序为 95 ℃
预变性 15 min,35 个循环的 94 ℃变性 30 s,60 ℃退火 90 s,72 ℃延伸 60 s,最后在 60 ℃延伸 30 min,
4 ℃保存。PCR 产物用 TE buffer 稀释 90×,经毛细管电泳检测。电泳上样液中含 HiDi 甲酰胺 9.0 L,
稀释后的 PCR 产物 1.0 L,Liz 600 分子量内标 0.25 L,PCR 产物经 95 ℃变性 5 min 后在 ABI3100
测序仪上基因分型。GeneScan 收集基因分型结果,等位基因片段分析用 Genotyper3.7 软件(Applied
Biosystems)。
等位基因的序列测定:利用 PCR 产物直接测序法。PCR 扩增体系共 10 μL,其中含 2× Multiplex
master 缓冲液 5.0 μL,2 μmol · L-1 的正向、反向引物各 1.0 μL,5 ~ 10 ng DNA 模板 1.0 L,H2O 2.0
L。PCR 扩增程序与基因分型时相同。利用 ExoSap 去除 PCR 产物中的 dNTPs 和剩余引物,9.0 L
的体系中含 6.0 L 的 ExoSap 100× 稀释液、PCR 产物 3.0 L。混合液 37 ℃温浴 60 min,80 ℃灭
活 20 min,4 ℃保存。产物用 BigDye® Terminator v3.1 Cycle Sequencing 试剂盒(Applied Biosystems)
纯化处理。BigDye 纯化体系共 10 L,其中含 5× 测序缓冲液 2.0 L,BigDye 0.5 L,单引物(F
或 R)1.0 L,H2O 3.5 L,ExoSap 处理后的 PCR 产物 3.0 L。纯化程序为 96 ℃预变性 2 min,接
着 25 个循环的 96 ℃变性 10 s,50 ℃退火 5 s,最后在 60 ℃延伸 4 min,4 ℃保存。BigDye 纯化
产物再经乙醇纯化后在 ABI3100 测序仪上双向测序。Sequencher 4.10(www. genecodes. com)对原
始序列进行校对、双向拼接,选取正向引物(F)和反向引物(R)之间的序列用于比对分析和系统
进化关系重建。
以 FSTAT2.93 统计各位点的等位基因数量(Na)及其频率(Pi)。从 GenBank 下载 TY24
(GU902801)、N-TY16(GU902800)、TY05(GU902797)和 TB01(AB029370)位点的原始序列(该
位点开发时的物种)。用 MEGA 5.05 对等位基因序列进行比对分析,确定南方红豆杉 SSR 重复单元
(motif)是否发生变化,分析等位基因间、等位基因内的序列变异。以 DNASP5.0 用于分析基因序
列多态性,统计多态性核苷酸位点数量(N)、单倍型数量(Ha)、核苷酸差异平均数(k)和核苷酸
多样度(Pi)等遗传参数。利用 Network4.611 分析其系统进化关系,插入/缺失(Indel)序列作为核
苷酸的第 5 性状(the fifth character)参与构建简约网络图。
2 结果与分析
2.1 等位基因长度变异
3 个 nSSR 位点 TY24、N-TY16 和 TY05 在 609 个样本中检测到 19、12 和 9 个等位基因,mtSSR
位点 TB01 检测到 11 个等位基因(表 1)。nSSR 位点的等位基因频率分布(表 2)较为相似,分别
由 2 ~ 5 个常见等位基因(频率 > 0.10)和较多稀有等位基因组成(频率 < 0.05)。位点 TY05 的
9 个等位基因中,两个常见等位基因 466 和 467 的频率之和就达到了 0.874,而 2 个稀有等位基因
453 和 455 分别在 1 株杂合型个体中发现,频率为 0.001。TB01 位点的等位基因频率分布较为均匀,
5 个常见等位基因的频率在 0.123 ~ 0.188 之间。
Xie Wei-dong,Wen Ya-feng,Han Wen-jun,Zhou Hong,Xu Gang-biao,Chen Jian-hua.
Variation analysis of four microsatellite loci within maire yew species.
376 Acta Horticulturae Sinica,2016,43 (2):373–383.
就等位基因长度分布(表 2)而言,多数 TY24 等位基因间的长度差异为 5 bp,同时也存在 3 bp
和 2 bp 的长度间隔,与该位点的原开发物种(云南红豆杉)的二碱基重复单元(AT)(Miao et al.,
2008)相矛盾。可能 TY24 位点在南方红豆杉中的重复单元有变化,从而引起不同长度差异的等位
基因在同一位点中出现。其他 3 个位点也有相同的问题,以 N-TY16 位点表现最为复杂,等位基因
间的长度变化毫无规律,同时存在 1 ~ 5 个碱基的长度差异。
表 1 4 个微卫星位点的特征与序列变异
Table 1 The characterization of four SSR markers and their sequence variation
位点
Locus
基因组
Genome
等位基因
数
Number of
allele
等位基因
长度/bp
Size range
SSR 重复结构
SSR structure
多态性核苷酸位
点数量
Number of
polymorphic sites
Ha
单倍型数量
Number of
hapotype
k
核苷酸差异平均数
Average number of
nucleotide
differences
Pi
核苷酸多样度
Nucleotide
diversity
TY24 nSSR 19 151 ~ 226 SU 7 20 0.897 0.00415
N-TY16 nSSR 12 148 ~ 176 CI 12 13 6.283 0.03510
TY05 nSSR 9 453 ~ 472 CI 13 11# 3.644 0.00762
TB01 mtSSR 11 395 ~ 442 SU 4 12 0.677 0.00151
注:SU:单重复单元,不间断重复结构;CI:复合重复单元,间断型重复结构。11#:未包括两个没有测序的单倍型。
Note:SU:Single motif,uninterrupted repeat;CI:Compound motif,interrupted repeat. 11#:Excluded two no-sequence hapotypes.
表 2 4 个微卫星位点的等位基因及其序列变异
Table 2 Four SSR marker alleles and their sequence variation
等位基因
Gene
等位基因
长度/bp
Allele size
测序数量
Number of
sequence
等位基因
频率
Frequency
重复数
Number of
repeats
微卫星重复区序列
Microsatellite sequence
侧翼序列突变数量
Mutation number of
flanking sequence
Locus TY24 151 4 0.183 2 (ATCAT)2GTGGGGG 1 个点突变,A/B 两
种序列
One mutation , two
sequences
156 1 0.003 3 (ATCAT)3GTGGGGG 0
161 4 0.014 4 (ATCAT)4GTGGGGG 0
166 4 0.024 5 (ATCAT)5GTGGGGG 0
171 4 0.020 6 (ATCAT)6GTGGGGG 0
174 1 0.003 8 (ATCAT)8- - - - - - - 0
176 3 0.051 7 (ATCAT)7GTGGGGG 0
179 4 0.020 9 (ATCAT)9- - - - - - - 0
181 4 0.144 8 (ATCAT)8GTGGGGG 0
184 4 0.013 10 (ATCAT)10- - - - - - - 0
186 6 0.167 9 (ATCAT)9GTGGGGG 0
189 1 0.003 11 (ATCAT)11- - - - - - - 0
191 4 0.124 10 (ATCAT)10GTGGGGG 0
196 3 0.114 11 (ATCAT)11GTGGGGG 0
201 4 0.030 12 (ATCAT)12GTGGGGG 0
206 4 0.038 13 (ATCAT)13GTGGGGG 0
211 4 0.044 14 (ATCAT)14GTGGGGG 0
216 1 0.003 15 (ATCAT)15GTGGGGG 0
226 1 0.002 17 (ATCAT)17GTGGGGG 0
Locus N-TY16 148 4 0.025 6 (CAGTT)2CTATAT(AGAGGG)4 0
153 3 0.076 7 (CAGTT)3CTATAT(AGAGGG)4 0
158 6 0.373 8 (CAGTT)4CTATAT(AGAGGG)4 1 个点突变,A/B 两
种序列
One mutation,
two sequences
159 4 0.093 8 (CAGTT)3CTATAT(AGAGGG)5 0
160 1 0.004 8 (CAGTT)2CTATAT(AGAGGG)6 0
谢伟东,文亚峰,韩文军,周 宏,徐刚标,陈建华.
南方红豆杉 4 个微卫星位点等位基因变异分析.
园艺学报,2016,43 (2):373–383. 377
续表 2
等位基因
Gene
等位基因
长度/bp
Allele size
测序数量
Number of
sequence
等位基因
频率
Frequency
重复数
Number of
repeats
微卫星重复区序列
Microsatellite sequence
侧翼序列突变数量
Mutation number of
flanking sequence
163 6 0.128 9 (CAGTT)5CTATAT(AGAGGG)4 0
164 5 0.155 9 (CAGTT)4CTATAT(AGAGGG)5 0
168 4 0.024 10 (CAGTT)6CTATAT(AGAGGG)4 0
169 4 0.034 10 (CAGTT)5CTATAT(AGAGGG)5 0
170 5 0.083 10 (CAGTT)4CTATAT(AGAGGG)6 0
174 1 0.003 11 (CAGTT)6CTATAT(AGAGGG)5 0
176 1 0.002 11 (CAGTT)4CTATAT(AGAGGG)7 0
Locus TB01 395 1 0.005 6 - - - - - - - (TA)3G(ATCTG)6 0
397 4 0.021 5 GCCCACC(TA)3G(ATCTG)5 1 个点突变
One mutation
402 4 0.158 6 GCCCACC(TA)3G(ATCTG)6 0
407 4 0.176 7 GCCCACC(TA)3G(ATCTG)7 0
412 4 0.188 8 GCCCACC(TA)3G(ATCTG)8 0
417 4 0.185 9 GCCCACC(TA)3G(ATCTG)9 0
422 4 0.123 10 GCCCACC(TA)3G(ATCTG)10 3 个点突变,A/ B 两
种序列
Three mutations,two
sequences
427 4 0.094 11 GCCCACC(TA)3G(ATCTG)11 0
432 4 0.039 12 GCCCACC(TA)3G(ATCTG)12 0
437 4 0.009 13 GCCCACC(TA)3G(ATCTG)13 0
442 1 0.002 14 GCCCACC(TA)3G(ATCTG)14 0
Locus TY05 453 – 0.001 – – –
455 – 0.001 – – –
457 2 0.010 14 (AGAT)5(AG)2(AGAT)2N - - - - - - - - -
- N - - - - - N- - - - - N(AT)5
3 个点突变,A/B 两
种序列
Three mutations,two
sequences
458 3 0.021 14 (AGAT)4(AG)2(AGAT)2N TATCT - - -
- - N - - - - - N- - - - - N(AT)5
1 个点突变
One mutation
461-1 2 0.025 14 (AGAT)9 N- - - - - - - - - - N - - - - - N-
- - - - N(AT)5
0
461-2 2 15 (AGAT)6(AG)2(AGAT)2N - - - - - - - - -
- N - - - - - N- - - - - N(AT)5
0
466 6 0.721 17 (AGAT)4(AG)4(AGAT)3N TATCT - - -
- - N - - - - - N- - - - - N(AT)5
4 个点突变,A/B 两
种序列
Four mutations,two
sequences
467 2 0.153 16 (AGAT)4(AG)2(AGAT)2N TATCT - - -
- - NTATCTN- - - - - N(AT)7
1 个点突变
One mutation
471-1 3 0.062 18 (AGAT)4(AG)4(AGAT)3N(TATCT)2N -
- - - - N- - - - - N(AT)5
1 个点突变
One mutation
471-2 1 18 (AGAT)4(AG)2(AGAT)2NTATCT - - - -
- NTATCTN- - - - - N(AT)9
1 个点突变
One mutation
472 2 0.006 16 (AGAT)4(AG)2(AGAT)2NTATCT - - - -
- NTATCTNTATCTN(AT)7
1 个点突变
One mutation
注:N 表示重复单元之间存在间隔序列。
Note:N means that the motif is interrupted by sequences.
2.2 等位基因序列变异
2.2.1 各位点等位基因序列变异特征
通过等位基因 SSR 重复区和侧翼序列比对(表 2),能有效确定各位点等位基因序列变异特征,
明确等位基因长度出现异常的原因。
Xie Wei-dong,Wen Ya-feng,Han Wen-jun,Zhou Hong,Xu Gang-biao,Chen Jian-hua.
Variation analysis of four microsatellite loci within maire yew species.
378 Acta Horticulturae Sinica,2016,43 (2):373–383.
TY24 的 SSR 重复单元是(ATCAT)n。南方红豆杉中,TY24 的 SSR 重复区由(ATCAT)n 和 7
碱基插入/缺失序列 GTGGGGG 组成。19 个等位基因的 SSR 重复数为 2 ~ 17,与 SSR 重复序列紧密
相连的 GTGGGGG 碱基在 4 个等位基因(174、179、184 和 189)中缺失。正是由于 5 碱基重复单
元和 7 碱基插入/缺失序列的存在,使 TY24 等位基因出现 5、3 和 2 bp 3 种长度差异。该位点的侧翼
序列保守性很强,仅在 151 等位基因中发现 1 个突变点(A→C),使同一等位基因表现出两种不同
的序列类型(文中以 A/B 表示)。
N-TY16 位点的 SSR 重复单元与原文献报道一致,为(CAGTT)nCTATAT(AGAGGG)n,属
于复合—间断型 SSR 位点。该位点存在两个 SSR 重复区,中间被 CTATAT 间隔。12 个等位基因的
SSR 重复数为 6 ~ 11,5 碱基和 6 碱基重复单元的同时存在使该位点的等位基因长度呈现高度多态
性,有 8 个等位基因的长度差异仅为 1 bp。N-TY16 位点的侧冀序列保守性也很强,在 158 等位基因
中发现 1 个突变点(A→G),使该等位基因表现出两种不同的序列类型。
位点 TY05 存在 4 个 SSR 重复区,重复单元以(AGAT)n 为主,同时还有(AG)n 和(AT)n
重复单元,各重复区之间被 5 碱基插入/缺失序列 TATCT 所间隔。该位点共检测到 9 个等位基因,
SSR 重复数为 14 ~ 18,其中稀有等位基因 453 和 455 各在 1 株杂合型个体中发现,没有对其测序。
TY05位点的侧翼序列中发现12个点突变,其中等位基因457 bp有3个突变点(1个C→T,2个A→C),
等位基因 466 有 4 个突变点(A→C,A→T,C→A 和 C→G),均表现出两种不同的序列类型。
等位基因的同形异源是指电泳检测长度相同(size),但进化历史和起源并不相同的等位基因
(Estoup et al.,2002)。测序结果表明,TY05 存在两组同形异源等位基因,分别出现在 461 和 471
等位基因中。461-1 等位基因的 SSR 重复区由(AGAT)9 和(AT)5 两个重复单元组成,共 14 个
SSR 重复数,而 461-2 等位基因含 4 个重复单元[(AGAT)6、(AG)2、(AGAT)2 和(AT)5]15
个 SSR 重复数。虽然这两个等位基因的长度均为 461 bp,但 SSR 重复区结构和重复数不同,互为
同形异源等位基因。同样,SSR 重复区中插入/缺失序列(TATCT)的存在,将 471 等位基因分为两
个完全不同的等位基因,471-1 和 471-2。同形异源等位基因的发现,使 TY05 位点的等位基因数量
从 9 个增加到 11 个。
TB01 位点源于美洲红豆杉(Taxus brevifolia)线粒体基因组,其重复单元为(ATCTG)。11 个
等位基因的 SSR 重复数从 5 ~ 14 不等,除 395 等位基因外,其他等位基因的长度严格按照 5 碱基的
倍数增加(减少)。序列分析表明,TB01 位点 SSR 重复区 5′端存在 7 碱基的插入/缺失(GCCCACC)
序列,该序列仅在 395 等位基因中缺失,从而导致其与其他等位基因的长度异常。TB01 位点的侧翼
序列共发现 4 个突变点,其中 3 个(G→A,C→T,G→C)出现在 422 等位基因中,使其序列表现
出两种不同的类型。
线粒体基因组一般仅有一套 DNA,理论上 SSR 电泳检测只显示 1 条扩增条带。但在 609 个南
方红豆杉样本的基因型结果中,发现有 5 个单株表现出杂合体的条带类型(出现 2 条扩增条带,图
1)。为进一步确定其基因型,对 5 个表现为杂合型的个体进行测序分析。序列测定结果(图 2)显
示,JL1 样本从 125 碱基开始,序列出现杂合体状态(套峰),在测序结束时出现了两个结束信号(碱
基 A),信号之间的碱基数与该样本的两个等位基因长度差异一致(10 bp)。杂合型样本的测序与基
因分型结果得到了相互验证,表明 5 个南方红豆杉样本确为杂合型,也进一步说明这 5 个单株的线
粒体基因存在异质性(Heteroplasy)。
谢伟东,文亚峰,韩文军,周 宏,徐刚标,陈建华.
南方红豆杉 4 个微卫星位点等位基因变异分析.
园艺学报,2016,43 (2):373–383. 379
图 1 杂合型样本(JL1)的线粒体微卫星(TB01)基因型
Fig. 1 Genotype of a heterozygous sample(JL1)revealed by mtSSR marker(TB01)
图 2 杂合型样本(JL1)的线粒体微卫星(TB01)测序结果
A. 杂合型样本(JL1)SSR 重复区序列;B. 杂合型样本(JL1)测序结束部分序列。
Fig. 2 Sequences of a heterozygous sample(JL1)revealed by mtSSR marker(TB01)
A. Sequence of SSR repeat of a heterozygous sample(JL1);B. The end sequence of a heterozygous sample(JL1).
2.2.2 等位基因的序列多态性
4 个微卫星位点的核苷酸多态性参数见表 1。等位基因序列多态性与 SSR 位点类型相关,两个
复合—间断型位点(N-TY16 和 TY05)的 DNA 多态性显著高于完美型,其中 N-TY16 具有最高的 DNA
多态性,多态性核苷酸位点数量(N)、核苷酸差异平均数(k)、核苷酸多样度(Pi)等参数分别为
12、6.283 和 0.03510。位点 TY24 检测到 20 个单倍型,线粒体 SSR 位点(TB01)的 DNA 多态性相
对较小,3 种多态性参数分别为 4、0.677 和 0.00151。
2.3 等位基因(单倍型)间的进化关系
从 4 个微卫星位点的等位基因简约网状图(图 3)可以看出,不同位点等位基因的系统进化较
为相似,分别由两条平行的主要支序构成,代表 SSR 重复数增加和减少的进化过程。完美型位点
Xie Wei-dong,Wen Ya-feng,Han Wen-jun,Zhou Hong,Xu Gang-biao,Chen Jian-hua.
Variation analysis of four microsatellite loci within maire yew species.
380 Acta Horticulturae Sinica,2016,43 (2):373–383.
TY24 和 TB01 从原始等位基因(MV 代表丢失或未检测到的等位基因)开始,沿两条平行支序逐步
进化。复合—间断型位点 N-TY16 和 TY05 存在较多的 MV 结点,支序间相互联结较多,表明其等位
基因的进化过程较为复杂。位点 TY05 的网状图中,同形异源等位基因 471-1 和 471-2 位于不同的支
序,具有较远的亲缘关系,表明二者的起源和进化完全不同。结合等位基因频率分布,常见等位基
因通常位于进化图的中心位置,而较多稀有等位基因则以其为中心散布于不同支序的末端或边缘,
说明常见等位基因在进化上具有较强的原始性。
图 3 微卫星位点 TY24、N-TY16、TY05、TB01 的等位基因系统进化关系图
Fig. 3 The allele’s phylogenetic network of TY24,N-TY16,TY05 and TB01
3 讨论
3.1 关于微卫星等位基因的变异
微卫星标记通常利用等位基因的长度多态性进行遗传学分析。其长度变异有两种途径,一是 SSR
重复区重复单元的增加或减少,每个位点突变率可达 10-2 ~ 10-6(平均 5 × 10-4)每世代(Weber &
Wong,1993;Schlötterer,2000),显著高于基因组平均突变率。另一种变异来源是 SSR 侧翼序列
的突变,这是产生同形异源等位基因和无效等位基因的主要原因(Estoup et al.,2002;文亚峰 等,
2012)。本文中所列举的 4 个位点的等位基因序列分析证实了这一点:既有 SSR 重复区突变形成的
等位基因,也有因侧翼序列插入/缺失形成的等位基因,还存在同一长度形态的同形异源等位基因,
甚至在同一等位基因内也有突变发生。正是由于重复序列和侧翼序列的共同突变,使这 4 个位点的
等位基因在南方红豆杉种内表现出丰富而复杂的变异特点,也是引起等位基因长度“异常”的主要
原因。
微卫星等位基因的变异大小与物种和物种间的遗传距离有关,种间变异通常高于种内(Makova
et al.,2000)。本研究中在南方红豆杉种内检测到丰富的等位基因变异,一方面因为检测位点具有
较高的突变性,同时,也说明南方红豆杉在长期进化过程中形成了丰富的遗传变异。微卫星等位基
因变异还与位点特征有关,复合型—间断型位点的等位基因变异高于完美型(Adams et al.,2004),
具有较长 SSR 重复区序列位点的稳定较差,其变异相对较高(Estoup et al.,2002;Ellegren,2004)。
谢伟东,文亚峰,韩文军,周 宏,徐刚标,陈建华.
南方红豆杉 4 个微卫星位点等位基因变异分析.
园艺学报,2016,43 (2):373–383. 381
本试验中的 N-TY16 和 TY05 位点符合以上特征,其变异不仅高于两个完美型位点(TY24 和 TB01),
而且在 TY05 位点中还检测到同形异源等位基因。通常种间出现同形异源等位基因的概率较大,能
在南方红豆杉种内发现同形异源等位基因可能与 TY05 位点复杂的 SSR 重复区结构有关。同形异源
等位基因会对微卫星标记结果造成影响(Angers et al.,2000;Adams et al.,2004),特别是在种间
系统发育(Culver et al.,2001;Barkley et al.,2009)、群体遗传分化(Estoup et al.,1995)和亲本
分析研究中应引起重视。
微卫星等位基因变异的普遍性、复杂性和对研究结果的潜在影响,提示要重视并谨慎对待微卫
星标记中的等位基因变异。首先,要重视位点的选择。微卫星标记通常选择多态性较高的位点开展
研究,但这种高多态性应以较好的稳定性为前提,避免出现难以检测的“异常”变异(无效等位基
因或同形异源等位基因)。建议选择重复单元碱基数较多(3 碱基以上)的完美型位点,因为完美型
位点的序列变异相对较小(Adams et al.,2004),同时,较多碱基重复单元位点的等位基因便于分
型检测。本试验中的 TY24 和 TB01 位点不仅多态性高,而且基因分型非常方便,不论毛细管电泳还
是分辩率较低的聚丙烯凝胶电泳都能得到清晰、稳定的分型结果。特别是在线粒体位点 TB01 中检
测到 11 个等位基因,这在细胞质遗传位点中非常少见。该位点具有很强的鉴别红豆杉种子来源和散
播路径的能力。如果可供选择的位点较多,可丢弃具有复杂 SSR 重复区结构的位点(本文列举的
N-TY16 和 TY05),防止难以检测的基因分型错误对研究结果的影响。群体遗传学研究中,遗传参数
的估算与位点突变模型相关,选择突变模型较为一致的位点有利获得更为准确的研究结果(Ellegren,
2004)。其次,要谨慎对待微卫星标记过程中的“异常”位点。异常信号的出现,可能预示着变异
的发生。对于所出现的“异常”位点或等位基因,不能片面认为是基因分型错误,必要时要通过基
因测序,分析其变异原因,检验或纠正分型结果。第三,要根据研究目的选择相应的等位基因分析
方法。多数微卫星标记基于等位基因的长度变异,如果开展种间系统发育和进化关系研究,建议通
过基因测序,利用等位基因的序列变异进行分析,因为种间同形异源等位基因的出现概率相对较高,
会对研究结果的准确性造成影响。
3.2 微卫星突变机理的探索
微卫星发现至今已有 30 多年的历史,但其突变机理至今尚不明确(Li et al.,2002;Beck et al.,
2003)。目前,滑动错配(Levinson & Gutmam,1987)和重组假说(Harding et al.,1992)是两种主
要的假说理论。基于这些科学假说,多种微卫星突变模型被提出并用于遗传学研究(Jarne & Lagoda,
1996;Estoup et al.,2002)。常用的无限等位基因模型(infinite allele model,IAM,Kimura & Crow,
1964)和逐步突变模型(stepwise mutation model,SMM,Ohta & Kimura,1973)就是建立在相关
理论之上。明确微卫星突变机理有助于更好地应用微卫星数据研究遗传学问题。
4 个位点的等位基因频率显示(表 2),各位点不同等位基因间 SSR 重复数呈从小到大连续分
布,中间很少发生间断或跳跃,说明其序列突变具有连续性,更符合逐步突变模型(SMM)。3 个
核基因组 SSR 位点由为数不多的常见等位基因和较多稀有等位基因组成,而常见等位基因发生突变
的频率相对较高(表 2,侧翼序列突变数量),说明常见等位基因在进化上可能属于较为原始的序
列(Barkley et al.,2009;Dickey et al.,2013)。等位基因简约网状图(图 3)显示,常见等位基因
通常位于网状图的中心位置,而多数稀有等位基因则以其为中心分布于进化支序的末端或边缘,暗
示稀有等位基因是以常见等位基因为基础进化而来,进一步证明常见等位基因在进化上具有原始性。
系统进化关系的重建与序列变异权重有关。我们在建立等位基因系统进化关系时,将 SSR 重复
区和侧翼序列视为具有相同的突变率(权重)。事实上,这两个区域序列的突变率相差很大。因此,
Xie Wei-dong,Wen Ya-feng,Han Wen-jun,Zhou Hong,Xu Gang-biao,Chen Jian-hua.
Variation analysis of four microsatellite loci within maire yew species.
382 Acta Horticulturae Sinica,2016,43 (2):373–383.
微卫星等位基因系统进化关系的重建,还有赖于对突变率的准确度量。
3.3 线粒体基因的异质性
生物体一般仅有一套线粒体基因组,当不止一种类型的线粒体基因在同一个体中存在时称为线
粒体基因的异质性(heteroplasmy)(Lisa et al.,1998)。异质性可分为长度异质性和位点异质性两类,
位点异质性是因为碱基的突变、插入/缺失等所引起的个体内基因的差异,表现为在同一位点上基因
序列的多态。20 世纪 90 年代初,植物线粒体基因的异质性仅在个别突变种或杂交种中发现,近年
来研究表明,植物线粒体基因的异质性并非原来认为的那样稀少,而是一种较为普遍的植物生理状
态(Woloszynska,2010)。
本研究的结果表明南方红豆杉线粒体基因存在异质性。在 609 个南方红豆杉单株样本中检测到
5 个异质性个体,异质性个体比例为 0.82%。研究所用的南方红豆杉样本均采自天然群体,未受人
为选择或干扰因素的影响,可能南方红豆杉物种的线粒体基因的异质性个体比例就在 0.82%左右。
目前,线粒体基因的异质性检测方法有长 PCR 法、时相温度梯度凝胶电泳、高效液相色谱法等(刘
艳 等,2006)。虽然通过微卫星标记发现南方红豆杉线粒体基因的异质性具有偶然性,但线粒体基
因组中重复序列较多,便于开发 SSR 位点,微卫星标记技术能否作为线粒体基因异质性的检测新方
法,其可行性有待进一步检验。
References
Adams R I,Brown K M,Hamilton M B. 2004. The impact of microsatellite electromorph size homoplasy on multilocus population structure
estimates in a tropical tree(Corythophora alta)and an anadromous fish(Morone saxatilis). Molecular Ecology,13 (9):2579–2588.
Angers B,Estoup A,Jarne P. 2000. Microsatellites size homoplasy,SSCP,and population structure:a case study in the freshwater snail Bulinus
truncatus. Molecular Biology and Evolution,17(12):1926–1932.
Barkley N A,Krueger R R,Federici C T,Roose M L. 2009. What phylogeny and gene genealogy analyses reveal about homoplasy in citrus
microsatellite alleles. Plant System Evolution,282 (1):71–86.
Beck N R,Double M C,Cockburn A. 2003. Microsatellite evolution at two hypervariable loci revealed by extensive avian pedigrees. Molecular
Biology and Evolution,20 (1):54–61.
Culver M,Menotti-Raymond M A,O’Brien S J. 2001. Patterns of size homoplasy at 10 microsatellite loci in pumas(Puma concolor). Molecular
Biology and Evolution,18 (6):1151–1156.
Dickey A M,Hall P M,Shatters Jr R G,Mckenzie C L. 2013. Evolution and homoplasy at the Bem6 microsatellite locus in three sweetpotato
whitefly(Bemisia tabaci)cryptic species. BMC Research Notes,6 (1):1–9.
Ellegren H. 2004. Microsatellites:simple sequences with complex evolution. Nature Reviews Genetics,5 (6):435–445.
Estoup A,Tailliez C,Cornuet J M,Solignac M. 1995. Size homoplasy and mutational processes of interrupted microsatellites in two bee species,
Apis mellifera and Bombus terrestris(Apidae). Molecular Biology and Evolution,12 (6):1074–1084.
Estoup A,Jarne P,Cornuet J M . 2002. Homoplasy and mutation model at microsatellite loci and their consequences for population genetics analysis.
Molecular Ecology,11 (9):1591–1604(14).
Grimaldi M C,Crouau-Roy B. 1997. Microsatellite allelic homoplasy due to variable flanking sequences. Journal of Molecular Ecolution,44 (3):
336–340.
Harding R M,Boyce A J,Clegg J B. 1992. The evolution of tandemly repetitive DNA:recombination rules. Genetics,132 (3):847–859.
Hedrick P W. 1999. Perspective:highly variable loci and their interpretation in evolution and conservation. Evolution,53 (2):313–318.
Jarne P,Lagoda P J L. 1996. Microsatellites,from molecules to populations and back. Trends in Ecology and Evolution,11 (10):424–429.
Kimura M,Crow J F. 1964. The number of alleles that can be maintained in a finite population. Genetics,49 (4):725–738.
谢伟东,文亚峰,韩文军,周 宏,徐刚标,陈建华.
南方红豆杉 4 个微卫星位点等位基因变异分析.
园艺学报,2016,43 (2):373–383. 383
Levinson G,Gutman G A. 1987. Slipped-strand mispairing:a major mechanism for DNA sequence evolution. Molecular Biology and Evolution,4
(3):203–221.
Li Y C,Korol A B,Fahima T,Beiles A,Nevo E. 2002. Microsatellites:genomic distribution,putative functions and mutational mechanisms:
a review. Molecular Ecology,11 (12):2453–2465.
Lisa M K,Erica B R,David M R. 1998. Aging,mating,and the evolution of mtDNA heteroplasmy in Drosophila melanogaster. Proceedings of the
National Academy of Sciences,95 (5):2372–2377.
Liu Yan,Hu Jing,Huang Yuan. 2006. mtDNA heteroplasmy and its detection methods. Chinese Journal of Zoology,41 (6):120–126. (in Chinese)
刘 艳,胡 婧,黄 原. 2006. 线粒体 DNA 的异质性与检测方法. 动物学杂志,41 (6):120–126.
Makova K D,Nekrutenko A,Baker R J. 2000. Evolution of microsatellite alleles in four species of mice(genus Apodemus). Journal of Molecular
Evolution,51 (2):166–172.
Matsuoka Y,Mitchell S E,Kresovich S,Goodman M,Doebley J. 2002. Microsatellites in Zea—variability,patterns of mutations and use for
evolutionary studies. Theoretical and Applied Genetics,104 (2–3):436–450.
Miao Y C,Su J R,Zhang Z J,Li H,Luo J,Zhang Y P. 2008. Isolation and characterization of microsatellite markers for the endangered Taxus
yunnanensis. Conservation Genetics,9 (6):1683–1685.
Nagylaki T. 1998. Fixation indices in subdivided populations. Genetics,148 (3):1325–1332.
Ohta T,Kimura M. 1973. A model of mutation appropriate to estimate the number of electroretically detectable alleles in a finite population.
Genetics Research,22 (5–6):201–204.
Oppen M J H V,Rico C,Turner G F,Hewitt G M. 2000. Extensive homoplasy,nonstepwise mutations,and shared ancestral polymorphism at a
complex microsatellite locus in Lake Malawi cichlids. Molecular Biology and Evolution,17 (4):489–498.
Schlötterer C. 2000. Evolutionary dynamics of microsatellite DNA. Chromosoma,109 (6):365–371.
Selkoe K A,Toonen R J. 2006. Microsatellites for ecologists:a practical guide to using and evaluating microsatellite markers. Ecology Letters,9 (5):
615–629.
Tautz D. 1989. Hypervariability of simple sequences as a general source for polymorphic DNA markers. Nucleic Acids Research,17 (16):6463–
6471.
Tsumura Y,Yoshimura K,Tomaru N,Ohba K. 1995. Molecular phylogeny of conifers using RFLP analysis of PCR-amplified specific chloroplast
genes. Theoretical and Applied Geneticst,91 (8):1222–1236.
Weber J L,Wong C. 1993. Mutation of human short tandem repeats. Human Molecular Genetics,2 (8):1123–l128.
Wen Y,Uchiyama K,Xu G,Ueno S,Han W,Xie W,Tsumura Y. 2012. Cross-species amplification of microsatellite loci for the endangered conifer,
Taxus chinensis var. mairei(Taxaceae). Silvae Genetica,61 (6):287–291.
Wen Ya-feng,Uchiyama K,Han Wen-jun,Ueno S,Xie Wei-dong,Xu Gang-biao,Tsumura Y. 2013. Null allele in microsatellite markers.
Biodiversity Science,21 (1):117–126. (in Chinese)
文亚峰,Uchiyama K,韩文军,Ueno S,谢伟东,徐刚标,Tsumura Y. 2013. 微卫星标记中的无效等位基因. 生物多样性,21 (1):
117–126.
Woloszynska M .2010. Heteroplasmy and stoichiometric complexity of plant mitochondrial genomes–though this be madness,yet there’s method
in’t. Journal of Experimental Botany,61 (3):657–671.