免费文献传递   相关文献

SNP Analysis of Six Nuclear Gene Fragments for Studying Population Genetics of Oryza granulata from China

六个核基因片段在中国颗粒野生稻中的单核苷酸多态性及其在群体遗传学研究中的应用



全 文 :六个核基因片段在中国颗粒野生稻中的单核苷酸多态性
及其在群体遗传学研究中的应用*
吴春燕1,2, 高立志1**
(1 中国科学院昆明植物研究所中国西南野生生物种质资源库植物种质资源与基因组学研究中心,
云南 昆明摇 650201; 2 中国科学院大学, 北京摇 100049)
摘要: 为了筛选可用于亚洲栽培稻的重要野生近缘物种颗粒野生稻群体遗传结构研究的有效 SNPs 标记,
本研究共选取 Osgstf3、 OsNAC6、 BADH、 XCP2、 EMF2 和 ERCC4 6 个重要水稻功能基因, 检测了来自中国
云南和海南 12 份颗粒野生稻代表样品中的单核苷酸多态性, 结果发现 Osgstf3、 OsNAC6、 BADH 和 XCP2
的单核苷酸多态性接近于零, 但在 EMF2 和 ERCC4 内含子区中检测到较低的核苷酸变异。 利用 EMF2 和
ERCC4 片段对来自云南的 3 个天然群体和来自海南的 2 个天然群体共 52 个个体进行了群体遗传学研究,
发现该物种具有高水平的遗传分化和低水平的遗传变异的独特群体遗传结构; 这种剧烈的遗传分化不仅来
自云南和海南两个地区之间, 而且还来自地区内居群间, 说明该野生稻生长的热带、 亚热带森林生境的破
坏导致了碎裂的居群间基因流强烈受阻。
关键词: 核基因; 颗粒野生稻; 单核苷酸多态性; 遗传变异; 群体遗传结构
中图分类号: Q 751摇 摇 摇 摇 摇 摇 文献标识码: A摇 摇 摇 摇 摇 摇 摇 文章编号: 2095-0845(2013)05-537-10
SNP Analysis of Six Nuclear Gene Fragments for Studying
Population Genetics of Oryza granulata from China
WU Chun鄄Yan1,2, GAO Li鄄Zhi1**
(1 Plant Germplasm and Genomics Center, Germplasm Bank of Wild Species in Southwest China, Kunming Institute
of Botany, Chinese Academy of Sciences, Kunming 650201, China; 2 University of Chinese
Academy of Sciences, Beijing 100049, China)
Abstract: A total of six rice genes of functional importance, including Osgstf3, OsNAC6, BADH, XCP2, EMF2 and
ERCC4, were selected to assess suitable SNPs for use in an analysis of population genetic structure of Oryza granula鄄
ta, a precious wild relative of Asian cultivated rice. An initial survey of 12 representative samples of O. granulata
from Yunnan and Hainan, China, resolved few SNPs in Osgstf3, OsNAC6, BADH and XCP2, while low levels of
variation were recorded within introns of EMF2 and ERCC4. A subsequent SNP survey was conducted within the
EMF2 and ERCC4 fragments across a sample of 52 plants collected from three and two natural populations in Yunnan
and Hainan, respectively. This survey showed that O. granulata exhibits fairly high genetic divergence between pop鄄
ulations despite low levels of nucleotide diversity. Genetic divergence between populations was evident both between
and within geographical regions. These findings imply that recent habitat fragmentation in tropical and subtropical
forests led to severe restrictions to gene flow, which enhanced divergence among populations.
植 物 分 类 与 资 源 学 报摇 2013, 35 (5): 537 ~ 546
Plant Diversity and Resources摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 DOI: 10. 7677 / ynzwyj201312151
*
**
基金项目: 云南省自然科学基金重点项目 (2010CC011)、 云南省高端人才项目 (20080A009)、 云南省 “百名海外高层次人才冶
引进计划和中国科学院 “百人计划冶 项目
通讯作者: Author for correspondence; E鄄mail: lgao@ mail. kib. ac. cn
收稿日期: 2012-11-15, 2013-01-05 接受发表
作者简介: 吴春燕 (1986-) 女, 硕士, 主要从事植物谱系地理学研究。 E鄄mail: kinghour@ 163. com
Key words: Nuclear gene; Oryza granulata; Single nucleotide polymorphisms; Genetic variation; Population genetic
structure
摇 稻属 (Oryza L. ) 包含亚洲栽培稻 (O. sati鄄
va)、 非洲栽培稻 (O. glaberrima) 和其他 21 个
野生种 (Khush, 1997; Vaughan 等, 2003), 分布
于亚洲、 非洲、 大洋洲和美洲的热带、 亚热带地
区。 在中国产的 3 种野生稻中, 颗粒野生稻 (O.
granulata) 仅分布于云南、 海南和台湾三省 (高
立志等, 1996)。 根据 Vaughan (1989) 的分类界
定, 疣粒野生稻复合种被认为包含两个二倍体种
(2n=24):即O. granulata Nees et Arn. ex Watt. 和
O. meyeriana (Zoll. et Mor. ex Steud. ) Baill. ; 基
于全基因组 DNA 杂交, 颗粒野生稻被确定属于
GG基因组, 在稻属 20 余种中与亚洲栽培稻的亲
缘关系最远 (Aggarwal等, 1997)。
野生稻不仅是现代水稻遗传育种的重要物质
基础, 也是适应未来环境变化和人类需求而培育
相应品种的前提 (高立志等, 1996)。 其中, 颗
粒野生稻是最为珍贵的稻种资源之一, 它抗白叶
枯病至接近免疫, 高抗稻瘟病、 褐飞虱和螟虫,
并具有耐旱、 耐荫等诸多优异的性状 (章琦和
李道远, 1994)。 然而, 随着经济的快速发展和
人类对热带、 亚热带地区森林破坏的加剧, 该物
种因大量居群灭绝和萎缩而处于濒危状态 (高
立志等, 1996)。 为了有效地保护颗粒野生稻种
质资源, 近年来, 中国学者对其遗传变异和居群
遗传结构进行了深入的研究。 Gao等 (2000) 利
用 12 种酶系统 17 个等位酶位点对采自云南和海
南的颗粒野生稻 15 个居群 304 个个体进行了遗
传多样性研究, 首次报道了该物种具有高水平的
居群间遗传分化和低水平的居群内遗传多样性的
独特居群遗传结构; 钱韦等 (2000) 用 RAPD
和 ISSR分子标记技术研究了云南和海南 20 个颗
粒野生稻居群混合样品和云南、 海南 2 个居群内
的遗传多样性, 比较发现, 来自云南的颗粒野生
稻居群的遗传多样性略高于海南居群; Qian 等
(2001) 分析了云南和海南的 5 个颗粒野生稻居
群, 研究结果与 Gao等 (2000) 获得的结论基本
一致; Wu 等 (2004) 和万亚涛等 (2006) 用
RAPD和 ISSR 分析了云南颗粒野生稻居群间和
居群内的遗传结构, 结果显示, 颗粒野生稻居群
间有着较高水平的遗传分化, 而居群内的遗传多
样性很低。 上述研究结果均表明, 颗粒野生稻具
有高水平的居群间的遗传分化和低水平的居群内
的遗传变异的群体遗传结构。
迄今对中国颗粒野生稻的群体遗传结构进行
了上述一系列的研究工作, 但鉴于这些遗传标记
本身存在的局限性, 仍值得进一步对该物种开展
群体遗传结构的深入研究。 单核苷酸多态性
(Single Nucleotide Polymorphisms, SNPs) 是指在
基因组水平上由单个核苷酸变异引起的 DNA 序
列多态性。 随着测序技术的迅速发展, SNPs 已
成为大规模遗传作图和基因型分析的重要工具
(Henikoff 和 Comai, 2003; Rafalski, 2002; Wang
等, 1998), 目前已经广泛地应用于分子进化、
群体遗传学、 谱系地理学和保护生物学等方面的
研究 (Akashi, 2001; Brookes, 1999)。 然而, 迄
今尚未有颗粒野生稻基因序列的 SNPs 分析及其
遗传多样性和群体遗传结构的报道。 相比于叶绿
体和线粒体基因的序列多态性而言, 核基因序列
因具有双亲的遗传特性而包含着更为丰富的遗传
信息, 无疑对深入认识遗传变异水平较低的颗粒
野生稻的群体遗传学具有十分巨大的潜力。
水稻全基因组测序的完成 (Goff 等, 2002;
Yu等, 2002) 及其许多重要功能基因的相继克
隆 (Brookman等, 1996; Nakamura 等, 2007; Xu
和 Chye, 1999; Yoshida 等, 2001; Soranzo 等,
2004; Li 等, 2006; Nakashima 等, 2007; Cho 和
Kong, 2007; McDaniel和 Schultz, 2009; Gammul鄄
la等, 2010), 为我们开展颗粒野生稻的单核苷
酸多态性分析与群体遗传学研究提供了独一无二
的机会。 在本研究中, 我们共选取 6 个已克隆的
重要水稻功能基因, 在对颗粒野生稻克隆测序得
到的基因序列与亚洲栽培稻直系同源基因比较的
基础上, 检测了中国颗粒野生稻具有广泛地理代
表的样品中的种内单核苷酸多态性 (SNPs) 与结
构变异多态性 (Structural Variation Polymorphisms,
SVPs), 寻找适用于开展颗粒野生稻群体遗传学
和谱系地理学研究的候选核基因。 最后, 我们利
用 2 个具有较高序列变异的基因 (EMF2 和 ER鄄
835摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 植 物 分 类 与 资 源 学 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 35 卷
CC4) 片段对云南的 3 个和海南的 2 个天然群体
进行了群体遗传学研究, 报道了中国颗粒野生稻
天然群体的核苷酸变异水平与群体遗传结构。
1摇 材料和方法
1. 1摇 材料
选取分布于云南及海南省南部的具有广泛地理代表
的 12 个天然居群 (表 1), 每个居群选取 1 个个体用于
单核苷酸多态性分析, 采集植株幼嫩叶片, 每株采集 5
~ 10 片, 放入装有变色硅胶的自封袋中迅速干燥并保
存, 带回实验室进行总 DNA提取。 此外, 还选取了具有
地理代表性的 3 个云南居群和 2 个海南居群进行了群体
遗传学的研究 (表 2)。 每个居群取 10 ~ 11 株, 为避免
取到克隆植株, 取样时个体间至少间隔 10 m, 采集幼嫩
叶片, 硅胶迅速干燥, 放置于自封袋中保存; 凭证标本
保存于中国科学院昆明植物所标本馆 (KUN)。
1. 2摇 DNA的提取和 PCR扩增
采用改良后的 CTAB法对颗粒野生稻的硅胶干燥叶
片进行总 DNA的提取 (Doyle 和 Doyle, 1987)。 Osgstf3、
OsNAC6、 BADH、 XCP2、 EMF2 和 ERCC4 共 6 个候选基
因的 PCR引物依据亚洲栽培稻中的序列特异性设计 (表
3)。 PCR 扩增反应体系为 50 滋L, 内含 10伊Buffer (Mg2+
Plus) 5 滋L, dNTP 400 滋mol·L-1, 每个引物 0. 2 滋mol·L-1,
ExTaq 酶 1. 5 U, 模板 DNA 100 ng。 PCR 反应程序为: 94
益预变性 4 min; 94 益变性 35 s, TM (表 3) 退火 1 min,
72 益延伸 1 min 30 s, 共 35 个循环; 最后 72 益延伸 10
min, 10 益保存。 PCR 在 Biometra 的 Tgradient PCR 仪上
进行。 在 PCR反应结束后, PCR 产物用 1. 0%琼脂糖凝
胶电泳进行检测, 电泳的同时加 3 滋L 的 Trans2K plus 标
准分子量以初步判断 PCR扩增是否为目的片段。 将带有
目的片段的 PCR 产物用纯化试剂盒 (上海生工) 进行
纯化, 然后将纯化后的产物送往深圳华大基因研究院进
行两端引物分别测序。 测序引物为扩增引物, 利用正反
向引物分别对两条链进行测序。
1. 3摇 数据分析
核基因片段的初始序列用软件 Sequencher 4. 1. 4
(Gene Codes, Ann Arbor, MI) 将正反两条序列进行拼
接, 将拼接好的序列用 Bioedit (Hall, 1999) 软件包中
ClustalW 进行序列多重比对 ( Thompson 等, 1994), 辅
以手工校正。 在进行分析时, 将空位 (gap) 当做缺失
(missing); 将长度大于 1 个碱基的插入 /缺失处理为单碱
表 1摇 颗粒野生稻材料的采样地理来源
Table 1摇 Geographical locations of the O. granulata accessions
编号 Number 代码 Codes 摇 摇 摇 摇 摇 摇 摇 摇 采样地点 Sampling Locations
1 AKS 云南省普洱市澜沧县 Lancang County, Puer City, Yunnan Province
2 BS 海南省白沙黎族自治县 Baisha County, Hainan Province
3 CJ 海南省昌江黎族自治县 Changjiang County, Hainan Province
4 CN 云南省保山市昌宁县 Changning County, Baoshan City, Yunnan Province
5 CY 云南省临沧市沧源县 Cangyuan County, Lincang City, Yunnan Province
6 FK 云南省普洱市澜沧县 Lancang County, Puer City, Yunnan Province
7 JB 云南省西双版纳州江北 Jiangbei, Xishuangbanna, Yunnan Province
8 LL 云南省保山市龙陵县 Longling County, Baoshan City, Yunnan Province
9 SM 云南省红河州绿春县 Luchun County, Honghe Prefecture, Yunnan Province
10 YJ 云南省德宏州盈江县那帮 Nabang, Yingjiang County, Dehong Prefecture, Yunnan Province
11 YCB 海南省三亚市崖城镇 Yacheng County, Sanya City, Hainan Province
12 ZKX 云南省临沧市镇康县 Zhenkang County, Lincang City, Yunnan Province
表 2摇 5 个颗粒野生稻天然居群的地理来源
Table 2摇 Geographical origins of the five studied populations of O. granulata
居群
Populations 摇 摇 摇 摇 摇 摇 摇 地理位置 Geographic Locations
样本大小
Sample size
纬度 (N)
Latitude
经度 (E)
longitude
YCB 海南省三亚市崖城县 Yacheng County, Sanya City, Hainan Province 10 18毅22忆 109毅10忆
CJ 海南省昌江黎族自治县 Changjiang County, Sanya City, Hainan Province 10 19毅03忆 108毅50忆
JB 云南省西双版纳江北 Jiangbei, Xishuangbanna, Yunnan Province 11 22毅01忆 100毅48忆
AKS 云南省临沧市沧源县 Cangyuan County, Lincang City, Yunnan Province 10 23毅22忆 98毅50忆
LL 云南省保山市龙陵县 Longling County, Baoshan City, Yunnan Province 11 24毅19忆 99毅01忆
9355 期摇 摇 摇 吴春燕和高立志: 六个核基因片段在中国颗粒野生稻中的单核苷酸多态性及其在群体遗传学 …摇 摇 摇 摇
表 3摇 用于扩增颗粒野生稻 6 个基因所用的 PCR引物
Table 3摇 The primers used for the PCR amplifications of the six gene fragments in O. granulata
基因登录号 Gene Bank ID 基因名称 Genes 引物 (5忆鄄3忆) Primers 退火温度 TM / 益
Os03g0135300 Osgstf3 ATAAGGCCACTCGAGCCCATCCAGCCACTGCTCGTAAACATC
61. 92
59. 97
Os04g0464200 OsNAC6 TCCTCGAAACCCACCACCTCTGTACAGCCGACACAGCAC
61. 90
59. 72
Os03g0815100 BADH TGTACTGACAGCACCTCAAAAGGGGAATAGCGAGGTTGGTA
58. 21
57. 56
Os05g0108600 XCP2 GCAAAGCTTAAAGCCTTGGCATGGAGAAGGCGTAGTCCATGAG
60. 17
59. 85
Os01g0948100 ERCC4 TGGTACACTGGATGGAGCTGGTCGGGAGCACTGTTTATCAC
59. 85
59. 97
Os04g0162100 EMF2 GTACCTTGGGCTTGTGAGCTTGGGCAATGTGCTGTG
57. 30
57. 30
基的插入 /缺失。 所有的插入 /缺失位点被视为第五碱
基, 并进行了重新编码。 采用 MEGA5. 0 ( Tamura 等,
2011) 进行 SNP检测和非加权组平均法构建聚类树, 建
树的自展值设为 1 000。 运用 DNASP 4. 10 (Rozas 等,
2003) 软件统计了 EMF2 和 ERCC4 片段的单倍型, 在居
群水平上对核苷酸多态性 (仔) (Nei和 Li, 1979), 单倍
型多态性 (h) 和分离位点数目 (S) 进行了检测。 利用
DNASP 4. 10 软件对居群间遗传分化系数 (Gst) 和居群间
的平均基因流 (Nm ) (Nei, 1973) 进行了估算。 利用
TCS1. 2 软件 (Clement 等, 2000) 构建 EMF2 和 ERCC4
片段的单倍型网络图。 这种方法应用溯祖理论 (coales鄄
cent theory) 来推测单倍型的亲缘关系, 基于统计简约性
产生单倍型网状关系并保存了单倍型之间 95%的最简约
节点。 应用 ARLEQUIN 3. 0 (Excoffier 等, 2005) 对居群
进行遗传结构的分子方差分析 (AMOVA, Analysis of Mo鄄
lecular Variance) (Excoffier等, 1992)。
2摇 结果
2. 1摇 六个核基因在颗粒野生稻和栽培稻间的序
列变异比较及其在颗粒野生稻中的单核苷
酸多态性分析
在本研究中, 6个候选核基因 Osgstf3、 OsNAC6、
BADH、 XCP2、 EMF2 和 ERCC4 均成功地在颗粒
野生稻中通过 PCR 扩增得到目标片段, 对其进
行克隆、 测序与序列比对的结果发现, Osgstf3
经 PCR扩增后在颗粒野生稻中获得 911 bp 的片
段, 和亚洲栽培稻的直系同源序列相比, 在所测
序的编码区上发现有 17 个单核苷酸的变异, 其
中有 1 bp 的缺失, 两者的相似度为 88% ; Os鄄
NAC6 经 PCR扩增后在颗粒野生稻中获得 871 bp
的片段, 和亚洲栽培稻的直系同源序列相比, 在
编码区发现有 36 个单核苷酸的变异, 其中 3 bp
的缺失, 两者的相似度为 83% ; BADH 经 PCR
扩增后在颗粒野生稻中获得 515 bp 的片段, 和
亚洲栽培稻的直系同源序列相比, 在编码区发现
15 个单核苷酸的变异, 两者的相似度为 86% ;
XCP2 经 PCR扩增后在颗粒野生稻中获得 733 bp
的片段, 和亚洲栽培稻的直系同源序列相比, 在
44 ~52 bp、 72 ~77 bp、 352 ~355 bp、 379 ~384 bp
和 400 ~408 bp发现 5 处碱基的插入 /缺失, 两者
的相似度为 89% ; EMF2 经 PCR 扩增后在颗粒
野生稻中获得 1 592 bp的片段, 和亚洲栽培稻的
直系同源序列相比, 在编码区域发现 12 个单核
苷酸变异, 两者的相似度为 86% ; ERCC4 经
PCR扩增后在颗粒野生稻中获得 1 652 bp 的片
段, 和亚洲栽培稻的直系同源序列相比, 在编码
区域发现 2 个单核苷酸的变异并导致 2 个非同义
替换, 两者的相似度为 87% 。
对来自云南和海南具有广泛地理代表的 12
个颗粒野生稻样品的单核苷酸多态性分析扫描后
发现, OsNAC6、 BADH和 XCP2 片段中未检测到
SNPs; Osgstf3 片段呈现出低水平的多态性, 仅检
测到 2 个 SNPs (90 bp, C圮G; 205 bp, G圮A)。
相对而言, EMF2 和 ERCC4 片段在种内均呈现
出相对较高的单核苷酸多态性 (表 4, 5 )。
EMF2 片段在颗粒野生稻种内共发现 17 个 SNPs,
平均约每 94 bp 出现 1 个 SNP, 还检测到 14 个
InDels (插入 /缺失), 它们分布在 113 bp (1 bp)、
341 bp (1 bp)、 576 ~ 585 bp (10 bp)、 662 ~ 663
045摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 植 物 分 类 与 资 源 学 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 35 卷
bp (2 bp)、 667 ~ 668 bp (2 bp)、 678 ~ 711 bp
(34 bp)、 729 ~ 768 bp (40 bp)、 774 ~ 791 bp
(18 bp)、 802 ~ 888 bp (87 bp)、 946 ~ 977 bp
(32 bp)、 998 ~999 bp (2 bp)、 1 416 bp (1 bp)、
1 498 ~ 1 508 bp (11 bp) 和 1 555 bp (1 bp) 处
(表 4); 在 ERCC4 片段的非编码区检测到了较
为丰富的单核苷酸多态性, 在颗粒野生稻中共检
测到 17 个 SNPs, 平均 约每 97 bp出现 1 个 SNP,
还检测到 3 个 InDels, 它们分布在 628 ~ 629 bp
(2 bp)、 866 ~882 bp (17 bp) 和 1 470 ~ 1 479 bp
(10 bp) 处 (表 5)。
基于 EMF2 和 ERCC4 片段的颗粒野生稻单
核苷酸多态性信息, 构建了来自云南和海南 12
个颗粒野生稻供试样品的 UPGMA 聚类树 (图
1)。 结果发现, 无论 EMF2 (图 1: A) 还是
ERCC4 (图 1: B) 均将来自云南 ( FK、 ZKX、
YJ、 CY、 JB、 AKS、 SM、 CN、 和 LL) 和海南
(CJ、 BS 和 YCB) 的样品明显聚为两大分支,
表明分布于云南和海南的居群已经发生了剧烈的
遗传分化。
表 4摇 EMF2 基因片段在颗粒野生稻中的单核苷酸多态性
Table 4摇 Single nucleotide polymorphisms of the EMF2 gene fragment in O. granulata
材料来源
Source Origins
单核苷酸位置 Sites of Nucleotides
5
7
6
6
4
3
6
6
0
6
7
0
6
7
1
6
7
4
9
1
1
9
1
6
9
3
2
9
7
9
1
0
2
0
1
2
2
4
1
2
3
3
1
2
3
5
1
2
3
9
1
2
7
8
1
3
2
7
AKS T A G G T T C A T G G A T G A G T
BS T T T A C C C A T A G G T G G G G
CJ - A T G G G C G A A A G T A G G G
CN A A G G T T C A T G G A T G A G T
CY A A G G T T C A T G G A T G A G T
FK T A G G T T C A T G G A T G A G T
JB T A G G T T C A T G G A T G A G T
LL A A G G T T C G T G G A T G A G T
SM A A G G T T C A T G G A T G A G T
YJ A A G G T T C A T G G A T G A G T
YCB T T T A C C C G T A A G C G G A G
ZKX A A G G T T T A T G G A T G A G T
表 5摇 ERCC4 基因片段在颗粒野生稻中的单核苷酸多态性
Table 5摇 Single nucleotide polymorphisms of the ERCC4 gene fragment in O. granulata
材料来源
Source Origins
单核苷酸位置 Sites of Nucleotides
1
7
0
4
4
2
4
4
6
5
6
0
6
0
2
7
5
1
8
2
0
8
5
6
9
4
6
9
8
8
1
0
9
0
1
1
0
2
1
2
0
9
1
2
1
0
1
2
1
1
1
3
1
7
1
4
8
7
AKS C G G C G A A A C T A C A T T G G
BS T - A A A G C G T T A C A T T A G
CJ T - A A A G C G T A G T T G T A T
CN C G A C G A A G T T A C A T A A G
CY C G A C G A A G T T A C A T T A G
FK C G G C G A A A C T A C A T T G G
JB C G G C G A A A T T A C A T T A G
LL C G A C G A A G T T A C A T A A G
SM C G A C G A A G T T A C A T T A G
YCB T - A A A G C G T A G T T G T A T
YJ C G A C G A A G T T A C A T T A G
ZKX C G A C G A A G T T A C A T T A G
1455 期摇 摇 摇 吴春燕和高立志: 六个核基因片段在中国颗粒野生稻中的单核苷酸多态性及其在群体遗传学 …摇 摇 摇 摇
图 1摇 基于 P距离构建的颗粒野生稻 12 个个体的非加权组平均法树。 各分支旁所示的数字为该分支的靴带支持率
Fig. 1摇 UPGMA tree of 12 individuals of O. granulata based on P鄄distance. Bootstrap values were shown along the branch for each clade
2. 2摇 EMF2 和 ERCC4 在颗粒野生稻天然居群中
的序列变异分析
对 5 个颗粒野生稻天然居群 52 个个体的
EMF2 和 ERCC4 片段进行了测序, 比对后序列
长度分别为 1 592 bp 和 1 652 bp。 其中, EMF2
片段共检测得到 4 种不同的单倍型。 通过对单倍
型序列间进行比对, 共发现了 26 个变异位点
(表 6), 包括 18 处碱基替换 ( substitutions) 和
8 处插入 /缺失 (indels), 其中 8 处插入 /缺失分
别为 464 bp, 465 bp和 593 bp处的单碱基的插
入 /缺失以及 379 bp, 469 bp, 480 bp, 484 bp 和
1 091 bp处的多碱基的插入 /缺失。
ERCC4片段共检测到 4 种不同的单倍型。 通
过对单倍型序列间进行比对, 共发现了 19 个变异
位点 (表 7), 包括 15处碱基替换 (substitutions)
和 4处插入 /缺失 (indels), 其中的 4 处插入 /缺
失分别为 1 080 bp处的单碱基插入 /缺失和 36 bp,
638 bp和 895 bp处的多碱基的插入 /缺失。
表 6摇 EMF2 核基因片段在颗粒野生稻 4 种单倍型间的序列变异位点
Table 6摇 Variable sites within the aligned sequences of the EMF2 genic fragments in the four haplotypes of O. granulata
单倍型
Haplotype
变异位点 Variable sites
1
3 3 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 6 6 8 8 8 8 9 0
7 7 6 6 6 6 6 7 7 7 8 8 8 4 5 7 9 9 1 2 0 1 2 3 2 9
8 9 2 4 5 8 9 2 3 6 0 3 4 2 8 3 2 3 4 5 8 8 9 3 1 1
H1 T @ G - - A - G T T - G 淫 A T G A T G T A A G A T #
H2 A @ G - - A - G T T - G 淫 A T G A T G T A A G A T #
H3 T @ T - T G - A C C - - - A T A G T G C G G G G G -
H4 - - T T T G & G G G * A 淫 G A A - - A T A G A G G #
@ : TTTTTTTGC; &: AC; *: GGG; 淫: GATTTGGTCGCAGAAATGTTGCTTCGCTTCT; #: GGGCAATCTCA
表 7摇 ERCC4 核基因片段在颗粒野生稻 4 种单倍型间的序列变异位点
Table 7摇 Variable sites within the aligned sequences of the ERCC4 genic fragments in the four haplotypes of O. granulata
单倍型
Haplotype
变异位点 Variable sites
3
6
2
0
7
3
1
3
3
1
4
3
1
5
4
2
2
4
3
4
5
3
6
5
7
8
6
3
8
6
6
8
7
0
4
7
7
3
8
9
5
9
2
2
9
6
4
1
0
7
8
1
0
8
0
1
3
5
4
H1 异 T T T T T T T T - T T T 翌 C G C C G
H2 - C T T C T T C T - C T T - C G T C G
H3 - C T T C T T C T - C T T - C G T C G
H4 异 C G C C G C C G 吟 C G C 翌 T T T - A
异 : AAAAATGTAA; 吟: AATACTTTTCTTTCTTT; 翌: TA
245摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 植 物 分 类 与 资 源 学 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 35 卷
2. 3摇 颗粒野生稻天然居群中的遗传多样性水平
利用 TCS1. 2 软件构建了核基因 EMF2 和
ERCC4片段的单倍型网络图 (图 2)。 对于 EMF2
来说, 来自海南的两个居群 (CJ 和 YCB) 尽管
在岛上有着较远的距离, 却共享单倍型 H4, 说
明了它们在历史上可能共享祖先群体; 来自云南
的 3 个居群 AKS, JB和 LL的单倍型分别为 H1,
H3 和 H2 (图 3: A)。 ERCC4 的单倍型在研究
居群中观察到的分布式样与 EMF2 相似, 来自云
南的 AKS居群拥有的两个单倍型中, H1 同时出
现在同在云南的 JB居群、 H2 与来自海南的 YCB
共享外, 其余的单倍型 H3 和 H4 分别分布在来
自云南和海南的 LL和 CJ居群 (图 3: B)。 上述
结果表明, 颗粒野生稻单倍型多样性水平整体上
极低, 来自云南的居群遗传变异较为丰富, 检测
到的单倍型在不同居群中发生了明显的固定, 体
现了居群之间发生了较为剧烈的遗传分化。
对核基因 EMF2和 ERCC4片段遗传多样性的
分析结果表明 (表 8), 取自云南和海南颗粒野生
稻的代表群体的遗传多样性水平极低, 其中除了
图 2摇 核基因 EMF2 (A) 和 ERCC4 (B) 基因片段的单倍型网络图
Fig. 2摇 Haplotype networks of two nuclear EMF2 (A) and ERCC4 (B) gene fragments
图 3摇 EMF2 (A) 和 ERCC4 (B) 中检测到的 4 种单倍型在颗粒野生稻 5 个居群中的地理分布
Fig. 3摇 The geographic distribution of the four haplotypes detected by EMF2 (A) and ERCC4 (B) in the five populations of O. granulata
3455 期摇 摇 摇 吴春燕和高立志: 六个核基因片段在中国颗粒野生稻中的单核苷酸多态性及其在群体遗传学 …摇 摇 摇 摇
ERCC4片段对来自云南的 AKS居群检测到较高水
平的单倍型多态性水平 (h=0. 533) 和核苷酸多态
性水平 (仔= 0. 00159) 外, 其余取样居群的的单
倍型多态性水平和核苷酸多态性水平均为零。
2. 4摇 颗粒野生稻的居群遗传结构
对颗粒野生稻居群遗传结构分析结果表明,
该物种的居群间存在着高水平的遗传分化。 基于
EMF2 和 ERCC4 估计的居群遗传分化系数分别
为 GST =0. 921和 Gst: 0. 797, Nm值分别为 0. 01 和
0. 16; 将上述两个基因合并估计得到 GST = 0. 861
和 Nm =0. 11, 表明居群间基因流强烈受阻导致
了高水平的遗传分化。
AMOVA分析结果表明 (表 9), 颗粒野生稻的
遗传变异主要存在于地区内居群间。 基于 EMF2和
ERCC4的估计分别高达54. 55%和90. 44%; 其次为
地区间的遗传变异, 分别达 45. 45%和 1. 69%; 居
群内的遗传变异最低, 分别为 0. 00%和 7. 87%。 用
EMF2和 ERCC4估计的颗粒野生稻居群间遗传变异
固定指数分别为 FST =1. 00000 (P<0. 0001) 和 FST =
0. 92127 (P<0. 0001), 表明该物种居群间存在着十
分显著的遗传分化; 地区内居群间遗传变异固定
指数分别高达 FSC =1. 00000 (P<0. 0001) 和 FSC
=0. 91992 (P<0. 0001), 表明该物种地区内居群
间的遗传分化也十分显著。 我们基于核基因
EMF2 和 ERCC4 P距离构建了 5 个颗粒野生稻居
群的 UPGMA聚类树 (图 4), 结果发现来自云南
和海南的居群被聚为两大分支, 进一步支持这两
个地区的居群已经发生了剧烈的遗传分化。
表 8摇 EMF2 和 ERCC4 基因片段单倍型分布和颗粒野生稻的遗传多样性指数
Table 8摇 Haplotype distribution of the EMF2 and ERCC4 gene fragments and measures of genetic diversity in O. granulata
基因 Genes
居群
Populations
单倍型在不同居群中的分布 Distribution of haplotypes in different populations
n H1 H2 H3 H4 S H h 仔
AKS 10 10 0 1 0. 000 0. 00000
CJ 10 10 0 1 0. 000 0. 00000
EMF2 JB 11 11 0 1 0. 000 0. 00000
LL 11 11 0 1 0. 000 0. 00000
YCB 10 10 0 1 0. 000 0. 00000
AKS 10 4 6 4 2 0. 533 0. 00159
CJ 10 10 0 1 0. 000 0. 00000
ERCC4 JB 11 10 0 1 0. 000 0. 00000
LL 11 11 0 1 0. 000 0. 00000
YCB 10 10 0 1 0. 000 0. 00000
n: 序列条数; S: 分离位点数目; H: 单倍型数; h: 单倍型多态性; 仔: 核苷酸多态性
n: number of sequences; S: number of segregating sites; H: number of haplotypes; h: haplotype diversity; 仔: nucleotide diversity
表 9摇 颗粒野生稻居群的 AMOVA分析
Table 9摇 AMOVA analysis of the O. granulata populations
基因
Gene
变异来源
Source of variation
自由度
DF
平方和
Sum of
squares
变异组分
Variance
components
变异百分比
Percentage
of variation
固定指数
Fixation Indices
P值
P values
地区间 Among regions 1 404. 435 10. 95060 45. 45 FCT =0. 45455 0. 09677
EMF2
地区内居群间
Among populations within regions 3 411. 469 13. 14072 54. 55
FSC =1. 00000 <0. 0001
居群内 Within populations 47 0. 000 0. 00000 0. 00 FST =1. 00000 <0. 0001
总计 Total 51 815. 904 24. 09132
地区间 Among regions 1 101. 454 0. 17492 1. 69 FCT =0. 01686 0. 38612
ERCC4
地区内居群间
Among populations within regions 3 296. 319 9. 38500 90. 44
FSC =0. 91992 <0. 0001
居群内 Within populations 47 38. 400 0. 81702 7. 87 FST =0. 92127 <0. 0001
总计 Total 51 436. 173 10. 37694
445摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 植 物 分 类 与 资 源 学 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 35 卷
图 4摇 基于核基因 EMF2 和 ERCC4 P距离构建的 5 个颗粒野生
稻居群的非加权组平均法聚类树。 各分支旁所示的数字为该
分支的靴带支持率, 各群体代码如表 5 所示
Fig. 4摇 UPGMA tree of the five O. granulata populations was constr鄄
ucted by using nucleotide sequences of EMF2 and ERCC4 based
on P鄄distance. Bootstrap values were shown along the branch for
each clade. Code for each population is shown in Table 5
3摇 讨论
本研究首次检测和报道了亚洲栽培稻重要野
生近缘物种颗粒野生稻种内单核苷酸多态性。 在
选用的 6 个重要水稻功能基因中, Osgstf3、 Os鄄
NAC6、 BADH和 XCP2 在中国颗粒野生稻广泛地
理代表样品中的单核苷酸多态性接近于零, 在
EMF2 和 ERCC4 中亦仅检测到较低的核苷酸变
异, 从而在单核苷酸水平上进一步证实了种内遗
传变异贫乏是该物种的特性, 与我们以前的研究
结果十分吻合 (高立志等, 2000)。 当然, 由于
这些基因功能十分重要, 较为强烈的纯化选择也
可能导致它们维持较低水平的遗传变异。 在
EMF2 和 ERCC4 两个基因片段中, 我们在分布
于云南和海南共 12 份中国颗粒野生稻代表样品
中检测到的 SNPs 和 SVPs 均仅出现在基因的内
含子区, 这与我们在其他野生稻中观察到的结果
一致; 这些非编码区中进化上呈中性的丰富 SNPs
为我们进一步研究和认识颗粒野生稻的群体遗传
结构与分子进化提供了有价值的遗传标记。
利用核基因 EMF2 和 ERCC4 片段对来自云
南的 3 个天然群体和来自海南的 2 个天然群体进
行了群体遗传学研究, 在单核苷酸水平上证实了
中国颗粒野生稻具有高水平的居群间遗传分化和
低水平的居群内遗传变异的独特群体遗传结构,
这与以前我们利用等位酶分析 (高立志等,
2000) 和其他研究者利用 RAPD和 ISSR等分子标
记技术 (钱韦等, 2000; Qian 等, 2001; Wu 等,
2004; 万亚涛等, 2006) 所获得的结论一致。 我们
对颗粒野生稻居群遗传结构研究结果进一步揭示
了该物种剧烈的遗传分化不仅来自云南和海南两
个地区之间, 而且还来自地区内居群间, 说明热
带、 亚热带生境的破坏导致了碎裂的居群间基因
流强烈地受阻。
在稻属系统发育中颗粒野生稻位于基部 (Ge
等, 1999), 是目前稻属中最为缺乏了解的植物
之一。 本研究检测了 6 个核基因片段在中国颗粒
野生稻中的单核苷酸多态性, 通过利用核苷酸变
异较为丰富的核基因片段对颗粒野生稻代表天然
居群开展了初步的群体遗传学研究, 证明了单核
苷酸多态性分析可以成为深入开展颗粒野生稻群
体遗传学、 谱系地理学和保护生物学等方面研究
的重要工具。 基于单核苷酸多态性分析对颗粒野
生稻在世界范围内更为广泛地取样, 开展群体遗
传学研究, 必将大大地推动对这一珍贵野生稻种
质资源的深入研究、 保护与有效发掘利用。
也参摇 考摇 文摇 献页
Aggarwal R, Brar D, Khush G, 1997. Two new genomes in the Oryza
complex identified on the basis of molecular divergence analysis
using total genomic DNA hybridization [J] . Molecular and Ge鄄
neral Genetics, 254: 1—12
Akashi H, 2001. Gene expression and molecular evolution [J] . Cur鄄
rent Opinion in Genetics & Development, 11: 660—666
Brookes AJ, 1999. The essence of SNPs [J] . Gene, 234: 177—186
Brookman KW, Lamerdin JE, Thelen MP et al., 1996. ERCC4
(XPF) encodes a human nucleotide excision repair protein with
eukaryotic recombination homologs [ J] . Molecular and Cellular
Biology, 16: 6553—6562
Cho HY, Kong KH, 2007. Study on the biochemical characterization
of herbicide detoxification enzyme, glutathione S鄄transferase
[J] . Biofactors, 30: 281—287
Clement M, Posada D, Crandall KA, 2000. TCS: a computer pro鄄
gram to estimate gene genealogies [ J] . Molecular Ecology, 9
(10): 1657—1659
Doyle JJ, Doyle JL, 1987. A rapid DNA isolation procedure for small
quantities of fresh leaf tissue [ J] . Phytochemical Bulletin, 19:
11—15
Excoffier L, Smouse PE, Quattro JM, 1992. Analysis of molecular
variance inferred from metric distances among DNA haplotypes:
application to human mitochondrial DNA restriction data [ J] .
Genetics, 131 (2): 479—491
Excoffier L, Laval G, Schneider S, 2005. Arlequin ( version 3. 0):
an integrated software package for population genetics data analy鄄
sis [J] . Evolutionary Bioinformatics, 1: 47—50
5455 期摇 摇 摇 吴春燕和高立志: 六个核基因片段在中国颗粒野生稻中的单核苷酸多态性及其在群体遗传学 …摇 摇 摇 摇
Gammulla CG, Pascovici D, Atwell BJ et al., 2010. Differential met鄄
abolic response of cultured rice (Oryza sativa) cells exposed to
high鄄and low鄄temperature stress [ J] . Proteomics, 10: 3001—
3019
Gao LZ (高立志), Zhang SZ (张寿洲), Zhou Y (周毅) et al.,
1996. A survey of the current status of wild rice in China [ J] .
Chinese Biodiversity (生物多样性), 4 (3): 160—166
Gao L, Ge S, Hong DY, 2000. Low levels of genetic diversity within
populations and high differentiation among populations of a wild
rice, Oryza granulata Nees et Arn. ex Watt. , from China [J] .
International Journal of Plant Sciences, 161: 691—697
Ge S, Sang T, Lu BR et al., 1999. Phylogeny of rice genomes with
emphasis on origins of allotetraploid species [J] . Proceedings of
the National Academy of Sciences of the United States of America,
96: 14400
Goff SA, Ricke D, Lan TH et al., 2002. A draft sequence of the rice
genome (Oryza sativa L. ssp. japonica) [ J] . Science, 296:
92—100
Hall TA, 1999. BioEdit: a user鄄friendly biological sequence align鄄
ment editor and analysis program for Windows 95 / 98 / NT [ J] .
Nucleic Acids Symposium Series, 41: 95—98
Henikoff S, Comai L, 2003. Single鄄nucleotide mutations for plant
functional genomics [J] . Annual Review of Plant Biology, 54:
375—401
Khush GS, 1997. Origin, dispersal, cultivation and variation of rice
[J] . Plant Molecular Biology, 35: 25—34
Li K, Yang J, Liu J et al., 2006. Cloning, characterization and tis鄄
sue鄄specific expression of a cDNA encoding a novel embryonic
flower 2 gene (OsEMF2) in Oryza sativa [ J] . Mitochondrial
DNA, 17: 74—78
McDaniel LD, Schultz RA, 2009. XPF / ERCC4 and ERCC1: their
products and biological roles [J] . Molecular Mechanisms of Xe鄄
roderma Pigmentosum, 65—82
Nakashima K, Tran LSP, Van ND et al., 2007. Functional analysis
of a NAC鄄type transcription factor OsNAC6 involved in abiotic
and biotic stress鄄responsive gene expression in rice [ J] . The
Plant Journal, 51: 617—630
Nei M, 1973. Analysis of gene diversity in subdivided populations
[J] . Proceedings of the National Academy of Sciences of the Unit鄄
ed States of America, 70 (12): 3321—3323
Nei M, Li WH, 1979. Mathematical model for studying genetic varia鄄
tion in terms of restriction endonucleases [J] . Proceedings of the
National Academy of Sciences of the United States of America, 76
(10): 5269—5273
Qian W (钱韦), Ge S (葛颂), Hong DY (洪德元), 2000. As鄄
sessment of genetic variation of Oryza granulata detected by
RAPDs and ISSRs [J] . Acta Botanica Sinica (植物学报), 42
(7): 741—750
Qian W, Ge S, Hong DY, 2001. Genetic variation within and among
populations of a wild rice Oryza granulata from China detected
by RAPD and ISSR markers [ J] . Theoretical and Applied Ge鄄
netics, 102: 440—449
Rafalski A, 2002. Applications of single nucleotide polymorphisms in
crop genetics [J] . Current Opinion in Plant Biology, 5: 94—
100
Rozas J, Sanchez鄄DelBarrio JC, Messeguer X et al., 2003. DnaSP,
DNA polymorphism analyses by the coalescent and other methods
[J] . Bioinformatics, 19 (18): 2496—2497
Soranzo N, Sari GM, Mizzi L et al., 2004. Organisation and structur鄄
al evolution of the rice glutathione S鄄transferase gene family [J] .
Molecular Genetics and Genomics, 271: 511—521
Tamura K, Peterson D, Peterson N et al., 2011. MEGA5: molecular
evolutionary genetics analysis using maximum likelihood, evolu鄄
tionary distance, and maximum parsimony methods [J] . Mole鄄
cular Biology and Evolution, 28: 2731—2739
Thompson JD, Higgins DG, Gibson TJ, 1994. CLUSTAL W: impro鄄
ving the sensitivity of progressive multiple sequence alignment
through sequence weighting, position鄄specific gap penalties and
weight matrix choice [J] . Nucleic Acids Research, 22: 4673—
4680
Vaughan DA, 1989. Genus Oryza L. current status of taxonomy
[R]. IRRI Research Paper Series (Philippines)
Vaughan DA, Morishima H, Kadowaki K, 2003. Diversity in the
Oryza genus [J] . Current Opinion in Plant Biology, 6: 139—
146
Wan ST (万亚涛), A XX (阿新祥), Fan CZ (樊传章) et al.,
2006. ISSR analysis on genetic diversity of the 34 populations of
Oryza meyeriana distributed in Yunnan Province [ J] . Chinese
Journal Rice Science (中国水稻科学), 20 (6): 596—602
Wang DG, Fan JB, Siao CJ et al., 1998. Large鄄scale identification,
mapping, and genotyping of single鄄nucleotide polymorphisms in
the human genome [J] . Science, 280: 1077—1082
Wu CJ, Cheng ZQ, Huang XQ et al., 2004. Genetic diversity among
and within populations of Oryza granulata from Yunnan of China
revealed by RAPD and ISSR markers: implications for conserva鄄
tion of the endangered species [J] . Plant Science, 167: 35—
42
Xu FX, Chye ML, 1999. Expression of cysteine proteinase during de鄄
velopmental events associated with programmed cell death in
brinjal [J] . The Plant Journal, 17: 321—327
Yoshida N, Yanai Y, Chen L et al., 2001. EMBRYONIC FLOW鄄
ER2, a novel polycomb group protein homolog, mediates shoot
development and flowering in Arabidopsis [ J] . The Plant Cell,
13: 2471—2481
Yu J, Hu S, Wang J et al., 2002. A draft sequence of the rice genome
(Oryza sativa L. ssp. indica) [J]. Science, 296 (5565): 79—92
Zhang Q (章琦), Li DY (李道远), 1994. Evaluation of resistance
to bacterial blight (Xanthomonas oryzae pv. oryzae) in wild rice
species [J] . Agricultural Sciences in China (中国农业科学),
27 (5): 1—9
645摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 植 物 分 类 与 资 源 学 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 35 卷