免费文献传递   相关文献

Intragenomic Polymorphism of the Internal Transcribed Spacer Region of Ribosomal DNA in Camellia hongkongensis (Theaceae) and Species Identification

香港红山茶个体内ITS多态性及物种鉴定的应用



全 文 :植物学报 Chinese Bulletin of Botany 2015, 50 (2): 217–226, www.chinbullbotany.com
doi: 10.3724/SP.J.1259.2015.00217
——————————————————
收稿日期: 2014-03-14; 接受日期: 2014-05-09
基金项目: 国家重点基础研究发展规划(No.2007CB411600)
* 通讯作者。E-mail: wjzhang@fudan.edu.cn
香港红山茶个体内ITS多态性及物种鉴定的应用
范文1, 徐颖1, 许汀1, 徐晶1, 2, Takahiro Yonezawa1, 高继银3, 张文驹1*
1复旦大学生命科学学院生物多样性科学研究所, 生物多样性与生态工程教育部重点实验室, 上海 200433
2中国科学院上海生命科学信息中心, 上海 200031; 3广东棕榈风景园林科学研究院, 中山 528416
摘要 核糖体DNA的内转录间隔区(ITS)一直被作为一种重要的分子标记, 却很难用于山茶物种中。通过对1个疑似香港红
山茶(Camellia hongkongensis)的样本进行ITS区域的扩增、克隆和测序, 从中获得74种不同序列。研究结果表明, 其ITS
区域具有高度的多态性, 其中76%的序列为假基因。系统发育分析显示, 超过半数的假基因源自同一祖先。这些假基因在
经历多次基因重复后分化成至少5个谱系, 且每个谱系中的序列非常相似, 这表明一些假基因不但未被剔除, 反而通过快速
复制事件幸存下来。由于山茶物种个体内ITS的高度多态, 使用这个区域区分山茶物种可能导致错误。然而, 通过比较香港
红山茶中的1个种间特异性rDNA假基因, 确定该样本属于香港红山茶。
关键词 香港红山茶, 内转录间隔区(ITS), 系统发育, 多态性, 假基因
范文, 徐颖, 许汀, 徐晶, Takahiro Yonezawa, 高继银, 张文驹 (2015). 香港红山茶个体内ITS多态性及物种鉴定的应用.
植物学报 50, 217–226.
45S核糖体RNA基因重复单元是一个被广泛研
究的多基因家族 , 在大多数真核生物中存在30–
30 000份拷贝(Long and Dawid, 1980; Prokopowich
et al., 2003)。这些拷贝在基因组内串联重复, 成簇存
在 , 分布于基因组的一个至多个位点上(Pedersen
and Linde-Laursen, 1994)。每一个重复单元包括3个
rRNA基因(18S rRNA、5.8S rRNA和26S rRNA), 基
因之间被内部转录间隔区 (internal transcribed
spacer, ITS)ITS1和 ITS2隔开 (Long and Dawid,
1980) 。
对许多物种的研究证明, 虽然个体内存在许多份
ITS拷贝, 但它们却保持着高度一致性(Hillis et al.,
1991)。研究显示, 这些拷贝在不等交换、基因转换
及基因扩增等分子机制的驱动下保持着高度一致性
的进化式样 (Zimmer et al., 1980; Dover, 1982;
Ganley and Kobayashi, 2007)。即使在一些新近形成
的异源多倍体中, rDNA基因也都经历了快速的一致
性进化(Kovarik et al., 2005)。ITS已经成为现今被子
植物系统学研究中, 特别是较低阶元分类群研究中最
常用的分子标记之一(Baldwin et al., 1995; Álvarez
and Wendel, 2003)。
然而, ITS区不能轻易用于山茶属(山茶科)的研究
中。该属是山茶科中最大的属, 包括一些重要的种,
如Camellia sinensis (L.) O. Kuntze、C. japonica L.
和C. oleifera Abel等。按照不同的分类系统, 该属在
全世界约有120–300种(张宏达和任善湘, 1998; 闵天
禄, 2000)。由于山茶属中的许多物种彼此间的形态特
征非常类似, 导致种类难以鉴别, 系统发育关系存在
较多争议。作为最常用的分子标记, ITS序列被众多研
究者选择用于解决山茶属系统分类中的难题(唐绍清
等, 2004; 杨俊波等, 2006)。但使用ITS序列构建的山
茶属系统发育关系与基于形态特征的传统系统发育
关系存在明显的冲突(闵天禄和张文驹, 1996; 闵天
禄, 2000; Vijayan et al., 2009)。两者关系的不统一可
能是由于一些山茶属种类的 ITS拷贝存在多态性
(Vijayan et al., 2009; 徐颖等, 2011)。为了更加合理
地使用这个区域作为分子标记, 更深层次地理解山茶
属植物个体内的ITS重复片段尤显必要。
本研究中, 我们选择一株采自越南(VN)的疑似
香港红山茶的样本, 除了叶子有些许不同, 其它形态
特征与香港红山茶基本一致。根据现有记录, 香港红
山茶仅限于中国的香港(HK)及其邻近地区广东(GD)。
·研究报告·
218 植物学报 50(2) 2015
为了评估山茶属植物个体内ITS拷贝的差异水平和多
态性, 以及明确来自越南的样本是出现在新的独特地
域的香港红山茶还是一个新的分类单元, 我们对该样
本进行了ITS片段的扩增、克隆和测序, 并将其与来
自广东、香港的香港红山茶以及其它山茶属种类进行
ITS序列比较。
1 材料与方法
1.1 实验材料
本研究的实验材料是一株从越南移栽至中国上海茶
花园温室中的疑似香港红山茶样本。2株典型的香港
红山茶(Camellia hongkongensis Seemann)样本分
别采自香港和广东省佛山市。凭证标本保存于复旦大
学植物标本室(FUS)。
1.2 方法
1.2.1 DNA提取与PCR扩增
新鲜植物材料经变色硅胶充分干燥后, 取约10 mg叶
片于液氮中粉碎并使用CTAB法(Doyle and Doyle,
1987)提取DNA。使用引物对ITS4 (5-TCCTCCGCT-
ATATGATATGC-3)和ITS5 (5-GGAAGTAAAAGTC-
GTAACAAGG-3)扩增越南样本中rDNA的ITS片段。
PCR扩增使用大连宝生物工程有限公司的Ex Taq酶,
扩增体系按照说明书配置。PCR扩增程序如下: 94°C
预变性5分钟 ; 94°C变性1分钟 , 54°C退火1分钟 ,
72°C延伸1分钟; 35个循环; 72°C延伸10分钟。PCR
产物于4°C保存。

1.2.2 克隆、测序及序列分析
PCR产物经琼脂糖凝胶电泳后进行割胶分离。使用北
京博大泰克生物基因技术有限公司的凝胶纯化试剂
盒, 按照说明书对分离出的DNA片段进行清洗纯化。
使用大连宝生物工程有限公司的pMD18-T载体试剂
盒, 按照说明书对纯化的DNA片段进行克隆。每一个
阳性克隆被单独挑选到盛有LB (Luria-Bertani)液体
培养基的试管中, 37°C摇晃培养。约12小时后, 抽提
质粒。克隆产物用北京华大基因研究中心(BGI)的
ABI3770测序仪完成测序。
首先, 将测序报告使用软件GENtle (http://gentle.
magnusmanske.de/)打开进行手工检查 , 并纠正所
有错误, 然后利用Clustal X软件(Thompson et al.,
1997)对DNA序列进行排列分析, 对其中插入缺失的
区域人工对齐。利用MEGA 5.05软件(Tamura et al.,
2011)计算GC含量、遗传距离及其标准误差。利用
DnaSP 5.00.04软件进行单倍型(haplotype)识别、单
倍型多样性的估计及其标准误差(h±SD)和核苷酸多
样性(π)的计算(Librado and Rozas, 2009)。
1.2.3 检测潜在重组
利用RDP3软件(Martinet al., 2010)检测所有序列内
的潜在重组子。使用4种统计方法进行计算 , 包括
Chimaera法(Posada and Crandall, 2001)、GENE-
CONV法(Padidam et al., 1999)、MaxChi法(Smith,
1992; Posada and Crandall, 2001)和RDP法(Martin
et al., 2005)。本研究中使用的这4种方法均为默认设
置。易位断点位置、主要亲本和次要亲本也使用RDP3
进行检测确定, 之后再手动检查以判断所有重组子是
否为真。
1.2.4 假基因鉴定
根据Buckler和Holtsford(1996)的研究, 核苷酸替换
率不同可用于区分功能基因与假基因。我们使用5.8S
rDNA的序列变异、插入缺失作为判断假基因的主要
依据, 整个ITS区域的GC含量、碱基替换作为次要依
据。此外, 研究中还比较了山茶属中其它种的5.8S
rDNA功能基因共有序列, 如果序列在5.8S rDNA区
域没有碱基替换和插入缺失或者存在1–3个碱基替换
但保持保守的二级结构, 则认为序列是假定的功能基
因。我们还获得了18S rDNA和26S rDNA的部分序列,
长度分别为54 bp和60 bp。BLAST检索结果显示, 所
有功能基因的18S和26S这部分的片段与其它被子植
物都保持一致。
1.2.5 系统发育分析
本研究分别采用邻接法 (neighbour joining, NJ)
(Saitou and Nei, 1987)、最大简约法 (maximum
parsimony, MP) (Swofford and Berlocher, 1987)和
贝叶斯分析法 (Bayesian inference; BI) (Rannala
and Yang, 1996)构建系统发育关系。使用的序列包
括实验克隆获得的所有单倍型, 3条香港红山茶ITS序
列(来自GenBank, 登录号为EU579716、 EU579717
范文等: 香港红山茶个体内 ITS多态性及物种鉴定的应用 219
和EU579718)以及16条来自山茶属14个种的功能基
因序列 (来自GenBank, 登录号为 EU579685、
EU579715、EU579753、EU579754、EU579759、
EU579761、EU579763、EU579764、EU579767、
EU579768、 EU579769、EU579772、FJ432112、
FJ432200、FJ432234和FJ432299)。这14个种分别
为 C. chekiangoleosa Hu 、 C. hengchunensis
Chang、C. pachyandra Hu、C. parvilimba Merr. et
Metcalf、C. petelotii (Merr.) Sealy、C. pitardii (Coh.
Stuart) Rehd.、C. pubifurfuracea Zhong、C. rhyti-
docarpa Chang et Liang、C. saluensis Stapf ex
Bean、C. sasanqua Sims、C. sinensis (L.) Kuntze、
C. yunnanensis (Pitard ex Diels) Cohen Stuart、C.
phanae和C. pyxidiacea Z. R. Xu, F. P. Chen et C.
Y. Deng。14个种在张宏达和任善湘(1998)的研究中
属于10种类群, 在基于山茶属ITS序列构建的系统发
育树上处于8个不同分支(Vijayan et al., 2009)。
邻接法分析使用MEGA 5.05软件(Tamura et al.,
2011)计算, 采用按Kimura Two-Parameter Model计
算的距离矩阵构建。在分析中 , 空位或缺失位点
(gaps)均作为配对状态删除(pairwise deletion)。系统
树各分支的相对支持率采用bootstrap (1 000次重复
取样)检验。为了提高MP和BI分析的有效性, 我们使
用Gap Coder (Young and Healy, 2003)处理插入缺
失的数据, 每一个插入缺失作为一个整体, 用二维01
数据表示。
MP树使用PAUP 4.10 b软件(Swofford, 2002)构
建。最大简约法分析采用启发性(heuristic)和分支-边
界法(branch and bound)的搜索策略。搜索参数设置
为 : TBR 枝长交换 , MULPARS, ACCTRAN优化 ,
100次随机序列加入 (random-taxon-addition repli-
cates), 所有核苷酸等权处理, 空位(gaps)作为缺失
状态(missing)处理。当最大简约树不只1棵时, 则算
出其严格一致树(strict consensus tree)或50%多数一
致树(50% majority-rule consensus tree)。系统树上
各分支的相对支持率采用bootstrap进行检验(1 000
次重复取样), 搜索参数同上。
贝叶斯分析采用MrBayes Version 3.1.2软件
(Ronquist and Huelsenbeck, 2003)运算。使用
MrModeltest Version 2.3软件(Nylander, 2004), 采
用Akaike Information Criterion (AIC: Akaike, 1974)
标准, 得到最适用的HKY+I+G模型, 插入缺失使用
二维模型处理。采用 2次独立运算 , 每次运行
5 000 000代, 每1 000代储存1棵树。检验所有的
PSRF (potential scale reduction factor), 当这个数
值足够接近1.000时, 确定参数收敛。舍弃前1 250棵
树的老化数据(burn-in), 使用剩下的3 750棵树。对静
态数据计算其一致性树(consensus tree), 一致性树
各分支可信度的评价用后验概率(posterior probabil-
ity, PP)表示。

1.2.6 二级结构
本研究针对实验克隆获得的所有单倍型序列 , 用
Centroid Homfold software (Hamada et al., 2009)的
方法模拟其5.8S RNA的二级结构(http://www.ncrna.
org/centroidhomfold), 同时计算每条序列二级结构
的最小自由能。
2 结果与讨论
2.1 单倍型与ITS序列特征
对该越南样本的ITS片段克隆测序, 共得到74个克
隆。利用RDP3软件(Martin et al., 2010)进行数据分
析和人工校对, 在所有的序列中检测出13条很可能
是PCR介导的重组子。由于PCR介导的重组可能会影
响序列多态性和系统发育分析, 将其人工剔除。剩余
的61条序列包含48种单倍型 (序列已上传至Gen-
Bank, 登录号为: KJ560889–KJ560936)。
整个 ITS区域除了C_hon7以外 , 长度变化在
589–687 bp之间, 序列比对之后的长度为733 bp,
C_hon7在ITS1区域存在一个长达180 bp的缺失, 因
而只有490 bp。我们根据5.8S基因及ITS片段的变异
来区分功能基因与假基因, 在48种单倍型中得到10
条可能的功能基因, 38条可能的假基因。这些假基因
根据其长度和插入缺失特征被分为不同类型(Pa1、
Pa2、Pa3、Pa4和Pb)。从越南样本中获得的单倍型
和ITS序列特征见表1。
虽然这些假基因在类型之间存在很大的差异, 但
在每种类型内部却极其保守, 并与功能基因序列有很
多相似性极高的位点。比如在5.8S区域的 ACTTGG-
TGTGAATTG、 TCTTTGAA以及 TAGGTTGAGG-
GCA, 在ITS1区域的AACTTGTC, ITS2区域的GTG-
220 植物学报 50(2) 2015
表1 香港红山茶ITS序列特征
Table 1 Characteristics of the ITS sequences of Camellia hongkongensis
a: F表示功能基因, P表示假基因, Pa1、Pa2、Pa3、Pa4和Pb是假基因的不同类型; b: 共使用了47条序列进行计算, C_hon7排除在
外; c: ∆G表示最小自由能, 表中只列出了每种类型序列中最大和最小∆G值; d: 在计算时, C_hon42不属于Pa或者Pb
a: F represents functional genes, P represents pseudogenes, Pa1, Pa2, Pa3, Pa4, and Pb represent the different type of pseu-
dogenes; b: The 47 sequences except C_hon7 were used to calculate; c: ∆G represents the minimum free energy; Only the
maximum and minimum values of ∆G in all sequences of each type are shown in the table; d: C_hon42 does not belong to Pa
type or Pb type in calculation


GTGGT, 这些位点在所有序列中都非常保守。
2.2 个体内多态性
这些序列展示了极高水平的个体内多态性。遗传距
离及其标准差、单倍型多样性指数及其标准差
(h±SD)和核苷酸多样性指数(π)均在表1中列出。功
能基因的核苷酸多样性指数为0.009 74, 显著低于假
基因的数值(0.164 71)。然而Pa1–Pa4各类型之间的
核苷酸多样性指数也非常低, 变化范围在0.003 58–
0.011 11。
Typea rDNA region Haptotypesb Genetic distance h±SD π Lengths
(bp)
GC contents ∆G
(kcal·mol–1)c
All ITS1-5.8S-ITS2 47 0.210 5±0.011 7 0.991±0.008 0.166 72 589–687 0.557
ITS1 0.297 4±0.023 0 0.958±0.015 0.242 21 221–291 0.550
5.8S 0.083 1±0.011 5 0.961±0.013 0.065 27 139–163 0.501
ITS2 0.240 1±0.020 1 0.962±0.012 0.171 55 198–233 0.610
F ITS1-5.8S-ITS2 10 0.010 3±0.001 9 0.978±0.054 0.009 74 674–687 0.686
ITS1 0.007 0±0.002 1 0.667±0.163 0.006 47 281–291 0.719
5.8S 0.008 4±0.003 6 0.667±0.163 0.008 32 163 0.543 –36.90, –47.42
ITS2 0.015 7±0.004 2 0.933±0.077 0.014 69 230–233 0.751
P ITS1-5.8S-ITS2 37 0.212 2±0.012 0 0.994±0.009 0.164 71 589–632 0.531
ITS1 0.283 5±0.023 0 0.964±0.015 0.225 14 221–258 0.515
5.8S 0.095 8±0.013 3 0.959±0.014 0.073 47 139–163 0.491
ITS2 0.248 3±0.020 9 0.953±0.016 0.176 47 198–223 0.581
Pa1d ITS1-5.8S-ITS2 5 0.003 6±0.001 6 1.000±0.126 0.003 58 614 0.523
ITS1 0.002 6±0.002 6 0.600±0.175 0.002 61 230 0.523
5.8S 0.004 9±0.003 5 0.700±0.218 0.004 91 163 0.461 –24.90, –36.00
ITS2 0.003 6±0.002 6 0.700±0.218 0.003 62 221 0.567
Pa2 ITS1-5.8S-ITS2 8 0.006 1±0.002 0 1.000±0.063 0.006 06 607 0.541
ITS1 0.005 8±0.003 0 0.857±0.108 0.005 77 223 0.535
5.8S 0.005 1±0.003 7 0.679±0.122 0.005 04 163 0.512 –30.22, –35.70
ITS2 0.007 2±0.003 7 0.750±0.139 0.007 11 221 0.568
Pa3 ITS1-5.8S-ITS2 5 0.005 8±0.002 1 1.000±0.126 0.005 77 589 0.529
ITS1 0.003 5±0.002 5 0.700±0.218 0.003 51 228 0.528
5.8S 0.009 9±0.005 0 0.900±0.161 0.009 82 163 0.490 –20.80, –23.62
ITS2 0.005 1±0.003 6 0.800±0.164 0.005 05 198 0.564
Pa4 ITS1-5.8S-ITS2 9 0.011 3±0.002 9 0.972±0.064 0.011 11 610–611 0.577
ITS1 0.006 7±0.003 6 0.833±0.098 0.006 70 224–225 0.584
5.8S 0.020 0±0.008 3 0.806±0.120 0.019 43 163 0.501 –23.10, –34.50
ITS2 0.009 6±0.004 6 0.694±0.147 0.009 47 223 0.624
Pb ITS1-5.8S-ITS2 9 0.151 4±0.009 5 1.000±0.052 0.121 31 590–632 0.582
ITS1 0.174 4±0.017 4 1.000±0.052 0.139 17 221–258 0.587
5.8S 0.088 8±0.013 5 0.917±0.092 0.076 94 139–163 0.499 –15.22, –42.12
ITS2 0.181 0±0.019 4 0.917±0.092 0.136 33 206–221 0.644
范文等: 香港红山茶个体内 ITS多态性及物种鉴定的应用 221
2.3 GC含量、最小自由能以及二级结构
整个ITS区域内, 假定功能基因存在一些独特的GC
含量富集区 , 其总GC含量为68.6%, ITS1区域、
5.8S rDNA以及ITS2区域的GC含量分别为71.9%、
54.3%和75.1%。然而假基因的GC含量只有53.1%。
功能基因的GC含量显著高于假基因。除了C_hon7,
其它假定功能基因的5.8S rRNA的二级结构都是相似
的 , 最小自由能约为–47 kcal·mol–1(表1); 而5.8S
rRNA假基因的二级结构则非常不稳定, 最小自由能
较低(平均值为–28.83 kcal·mol–1)。
2.4 个体内ITS序列的系统发育树
我们使用了NJ、MP以及BI三种方法构建ITS序列的系
统发育树。NJ 树中包括越南样本的所有序列, 6条香
港红山茶的ITS序列以及16条由山茶属14个种的序列
构成的外类群。结果显示, 3种方法得到的系统发育结
构基本一致。所有假定的功能基因和3条来自Gen-
Bank的香港红山茶ITS功能序列都聚成了一个独立
分支。3种方法都得到了非常高的支持率(图1中绿色
分支; NJ-100%, MP-100%, BI-1.00)。28条假基因序
列有很多相同的变异位点以及插入缺失, 构成了一个
拥有高可信度且超长枝长的分支(Pa)(图1中蓝色分
支; NJ-100%, MP-100%, BI-1.00)。Pa假基因分支由
序列中4个支持率很高的分支和1个单独的序列
C_hon42组成。4个分支分别为Pa1、Pa2、Pa3和Pa4,
每种类型包括5–9种单倍型, 每种类型内的序列之间
相似度很高, 4种类型构成的亚分支呈现内部枝长、端
部枝短的特点。ITS假基因的剩余9条序列都聚集在树
的根部(图1中红色分支), 除了3个序列(C_hon1、
C_hon2和C_hon3)在末端构成一个稳定分支外, 其
它序列之间没有形成一个可靠的分支。功能基因、假
基因和外类群序列之间的关系没有得到很好的解决。
2.5 香港红山茶中独特的ITS假基因序列
为了鉴定来自越南的疑似种, 根据Pa3类假基因序
列, 我们设计了1对引物, Pa3-F (5-GCCATTTCCC-
GGCAAAACAA-3)和Pa3-R (5-ACTTGATGGTTCA-
CGGGATT-3), 对来自香港和广东的香港红山茶及
来自越南的疑似香港红山茶3个样本进行PCR特异性
扩增, 获得185 bp PCR产物后克隆并测序。从广东样
本中获得12条序列(9种单倍型); 从香港样本中获得4
条序列(4种单倍型); 从广东样本中既获得与越南样
本相同的克隆序列, 又获得与香港样本相同的克隆序
列。
2.6 讨论
2.6.1 ITS假基因序列的判断
根据Álvarez和Wendel (2003)的研究结果, 假基因的
判断标准包括系统发育树上是否处于同一分支、大的
插入缺失、预测的二级结构的变化和GC含量, 序列差
异以及异常甲基化模式等 (Mayol and Rosselló,
2001; Bailey et al., 2003)。在本研究中, 我们的判断
标准与Bailey等(2003)和Zheng等(2008)使用的标准
相似, 将5.8S rRNA区域的插入缺失、序列变异、最
小自由能以及RNA二级结构作为判定假基因的主要
标准。结果表明, 所有被识别为假定功能基因的序列
在系统树上形成了一支具有极高支持率的分支(图1),
且在ITS1和ITS2区域仅有很少的插入缺失。而推断可
能为假基因的38条序列在ITS1和ITS2区域存在大量
的核苷酸变异, 5.8S rRNA二级结构的最小自由能较
低, 与功能基因相比GC含量明显少, 展现出巨大的
序列差异。这些结果都说明本研究对假基因的判断是
准确可靠的。

2.6.2 个体内ITS的多态性
本研究中, 所有61条ITS序列, 在排除了13条由PCR
介导产生的重组子后, 仍有78.7% (48条)的序列属于
不同的单倍型, 这一结果揭示出山茶属极其丰富的个
体内多态性。rDNA的物种内多态性在许多物种中都
被发现(Odorico and Miller, 1997; Carranza et al.,
1999; Muir et al., 2001; Van Oppen et al., 2002;
Keller et al., 2006; Xu et al., 2009; Xiao et al.,
2010)。科学家提出了几种可能的原因或机制解释
rDNA位点变异、假基因的出现和如此高的多态性。
一些研究表明, 位于同一条染色体的序列比位于不同
染色体位点间的序列更容易发生一致性进化。因为不
等交换在姐妹染色体之间比非姐妹染色体之间更加
频繁, 所以位点之间的基因重组频率要比位点内低得
多(Schlötterer and Tautz, 1994; Copenhaver and
Pikaard, 1996; Parkin and Butlin, 2004; Eickbush
222 植物学报 50(2) 2015

图1 疑似香港红山茶及外类群ITS序列的邻接树
总共53条香港红山茶序列, 其中47条来自本研究, 3条来自GenBank, 3条(C hon S256ppA, C hon S257L, C hon S257J)由邹稚华教
授提供。外类群序列来自GenBank, 由14个山茶属物种组成(以种名的前3个字母指代)

Figure 1 The Neighbor-joining tree of the ITS sequences of Camellia hongkongensis and its outgroups
Among 53 sequences of C. honghkongensis, 47 sequences were obtained in this study, 3 sequences from GenBank, and 3
sequences (C hon S256ppA, C hon S257L, C hon S257J) from Dr. Tsou. Outgroups consist of 14 species (only show the first 3
letters of their specific names in this tree), and their sequences were obtained from GenBank
范文等: 香港红山茶个体内 ITS多态性及物种鉴定的应用 223
and Eickbush, 2007)。另有研究表明, 一些rDNA序
列逃离了一致性进化、失去功能变成了假基因(Muir
et al., 2001; Márquez et al., 2003; Keller et al.,
2006), 这也将导致rDNA序列在基因组的多态性。事
实上, 山茶属植物存在许多rDNA位点, 而且大都位
于不同染色体上(4–12个位点) (Gu and Xiao, 2003)。
而在本研究中, 48条序列中有38条(79.2%)被认为是
假基因。此外, 杂交事件也可能成为导致ITS多态性
的原因之一 , 因为在发生杂交的物种中 , 不同的
rDNA拷贝在发生一致性进化的过程之前可能会暂时
共存一定的时间(Parks, 1990)。尽管山茶属植物存在
非常普遍的种间杂交, 但在本研究中我们并没有发现
杂交的证据。

2.6.3 个体内ITS的系统发育与进化
由图1可见, 在来自越南的样本中, 功能基因和假基
因能够很好地分离。所有的功能基因和GenBank上下
载的3条香港红山茶序列构成了一个单独分支, 而且
有很强的支持率。这暗示越南样本的功能基因进行了
比较有效的一致性进化, 且越南样本很可能属于香港
红山茶。而假基因却展示出非常不同的模式。大部分
假基因(76%)在ITS1区域有2个共同的大缺失, 并且
在系统发育树中形成了一个可信度很高的独立分支
(图1中蓝色分支Pa), 包括1个单独的序列(C_hon42)
和4个支持率很高、内部枝长较长、末端枝长较短的
小分支(Pa1、Pa2、Pa3和Pa4)。此外, 假基因与假
定的功能基因间的遗传距离较高(0.010 3 ± 0.001 9 –
0. 212 2 ± 0.012 0), 而这4个小分支内部的遗传距离
较低(0.003 6 ± 0.001 6 – 0.011 3 ± 0.002 9)。以上
结果说明这些假基因在很久以前可能起源于一个共
同祖先, 在进化的历史进程中它们非但没有消失, 反
而发生了近期快速倍增事件。不同于上述假基因类型,
其余9条假基因序列聚集在系统发育树的根部, 并且
枝长不一, 未构成高支持率的分支(图1中红色分支
Pb)。它们大多内部枝长较短, 而末端枝长较长, 说明
它们可能从功能基因多次独立起源。

2.6.4 假基因的物种鉴定应用
根据现有记录, 香港红山茶的分布区很小, 仅限于中
国香港(HK)及其邻近地区广东(GD)。为了确定形态上
疑似香港红山茶的越南样本是一个新种, 还是香港红
山茶的变种, 抑或就属于香港红山茶, 我们利用获得
的假基因序列做了进一步实验。本研究中, 由于ITS
片段的高度多态性, 其PCR产物无法直接测序。虽然
越南样本中假定的ITS功能基因序列与GenBank中获
得的3条香港红山茶序列构成一个分支, 而且得到了
非常高的支持率, 但这不能成为证明该样本属于香港
红山茶的直接证据。其原因是山茶属不同物种的26S
rDNA功能基因之间也非常相似, 如NJ树中3个外类
群的种C. yunnanensis、C. pitardii和C. pyxidiacea
形态差异很大, 分属于不同组, 但其ITS序列很相似
(图1)。在本研究中, 我们针对Pa3类假基因设计种间
特异性引物。结果显示, 在来自广东的香港红山茶样
本中既获得了与越南样本一样的克隆序列, 又获得了
与来自香港的香港红山茶样本完全相同的克隆序列。
由于假基因变化速率很快, 在不同物种中差异很大,
然而来自越南的样本与来自广东的香港红山茶却具
有完全相同的序列, 因此我们认为这2个样本为同一
个物种, 即来自越南的样本并非新种, 而是香港红山
茶。以上实验结果表明, 当不同个体形态上有细微的
差异, 无法判断是否为新种时, 选取合适的假基因作
为有效的分子标记能够帮助我们进行鉴定, 尤其是当
功能基因太保守而不能区分不同物种的时候。
致谢 本研究中有3条香港红山茶ITS序列是由邹稚
华教授提供的, 特此致谢。
参考文献
闵天禄 (2000). 世界山茶属的研究. 昆明: 云南科学技术出版
社. pp. 4–308.
闵天禄, 张文驹 (1996). 山茶属植物的进化与分布. 云南植物
研究 18, 1–13.
唐绍清, 施苏华, 钟杨, 王燕 (2004). 基于ITS序列探讨山茶
属金花茶组的系统发育关系. 广西植物 24, 488–492.
徐颖, 徐晶, 高继银, 张文驹 (2011). 山茶属植物ITS的多态
性——一个广泛逃离一致性进化的实例 . 植物学报 46,
162–169.
杨俊波, 李洪涛, 杨世雄, 李德铢, 杨莹燕 (2006). 四个DNA
片段在山茶属分子系统学研究中的应用. 云南植物研究 28,
108–114.
张宏达, 任善湘 (1998). 中国植物志(第49卷第3分册). 北京:
科学出版社. pp. 6–170.
Akaike H (1974). A new look at the statistical model identi-
224 植物学报 50(2) 2015
fication. IEEE Trans Automat Contr 19, 716–723.
Álvarez I, Wendel JF (2003). Ribosomal ITS sequences and
plant phylogenetic inference. Mol Phylogenet Evol 29,
417–434.
Bailey CD, Carr TG, Harris SA, Hughes CE (2003). Char-
acterization of angiosperm nrDNA polymorphism, para-
logy, and pseudogenes. Mol Phylogenet Evol 29, 435–
455.
Baldwin BG, Sanderson MJ, Porter JM, Wojciechowski
MF, Campbell CS, Donoghue MJ (1995). The ITS region
of nuclear ribosomal DNA: a valuable source of evidence
on angiosperm phylogeny. Ann Missouri Bot Gard 82,
247–277.
Buckler ES 4th, Holtsford TP (1996). Zea ribosomal repeat
evolution and substitution patterns. Mol Biol Evol 13,
623–632.
Carranza S, Baguñà J, Riutort M (1999). Origin and evolu-
tion of paralogous rRNA gene clusters within the flatworm
family Dugesiidae (Platyhelminthes, Tricladida). J Mol
Evol 49, 250–259.
Copenhaver GP, Pikaard CS (1996). Two-dimensional
RFLP analyses reveal megabase-sized clusters of rRNA
gene variants in Arabidopsis thaliana, suggesting local
spreading of variants as the mode for gene homogeniza-
tion during concerted evolution. Plant J 9, 273–282.
Dover G (1982). Molecular drive: a cohesive mode of spe-
cies evolution. Nature 299, 111–117.
Doyle JJ, Doyle JL (1987). A rapid DNA isolation procedure
for small quantities of fresh leaf tissue. Phytochem Bull
19, 11–15.
Eickbush TH, Eickbush DG (2007). Finely orchestrated
movements: evolution of the ribosomal RNA genes. Ge-
netics 175, 477–485.
Ganley ARD, Kobayashi T (2007). Highly efficient con-
certed evolution in the ribosomal DNA repeats: total rDNA
repeat variation revealed by whole-genome shotgun se-
quence data. Genome Res 17, 184–191.
Gu ZJ, Hua X (2003). Physical mapping of the 18S–26S
rDNA by fluorescent in situ hybridization (FISH) in Camel-
lia reticulata polyploid complex (Theaceae). Plant Sci 164,
279–285.
Hamada M, Sato K, Kiryu H, Mituyama T, Asai K (2009).
Predictions of RNA secondary structure by combining
homologous sequence information. Bioinformatics 25,
i330–i338.
Hillis DM, Moritz C, Porter CA, Baker RJ (1991). Evidence
for biased gene conversion in concerted evolution of ri-
bosomal DNA. Science 251, 308–310.
Keller I, Chintauan-Marquier IC, Veltsos P, Nichols RA
(2006). Ribosomal DNA in the grasshopper Podisma
pedestris: escape from concerted evolution. Genetics
174, 863–874.
Kovarik A, Pires JC, Leitch AR, Lim KY, Sherwood AM,
Matyasek R, Rocca J, Soltis DE, Soltis PS (2005).
Rapid concerted evolution of nuclear ribosomal DNA in
two Tragopogon allopolyploids of recent and recurrent
origin. Genetics 169, 931–944.
Librado P, Rozas J (2009). DnaSP v5: a software for com-
prehensive analysis of DNA polymorphism data. Bioin-
formatics 25, 1451–1452.
Long EO, Dawid IB (1980). Repeated genes in eukaryotes.
Annu Rev Biochem 49, 727–764.
Márquez LM, Miller DJ, MacKenzie JB, Van Oppen MJH
(2003). Pseudogenes contribute to the extreme diversity
of nuclear ribosomal DNA in the hard coral Acropora. Mol
Biol Evol 20, 1077–1086.
Martin DP, Lemey P, Lott M, Moulton V, Posada D, Le-
feuvre P (2010). RDP3: a flexible and fast computer pro-
gram for analyzing recombination. Bioinformatics 26,
2462–2463.
Martin DP, Williamson C, Posada D (2005). RDP2: re-
combination detection and analysis from sequence align-
ments. Bioinformatics 21, 260–262.
Mayol M, Rosselló JA (2001). Why nuclear ribosomal DNA
spacers (ITS) tell different stories in Quercus. Mol Phy-
logenet Evol 19, 167–176.
Muir G, Fleming CC, Schlötterer C (2001). Three divergent
rDNA clusters predate the species divergence in Quercus
petraea (matt.) liebl. and Quercus robur L. Mol Biol Evol
18, 112–119.
Nylander JAA (2004). MrModeltest v2. Program distributed
by the author. Evolutionary Biology Centre, Uppsala Uni-
versity.
Odorico DM, Miller DJ (1997). Variation in the ribosomal
internal transcribed spacers and 5.8S rDNA among five
species of Acropora (Cnidaria; Scleractinia): patterns of
variation consistent with reticulate evolution. Mol Biol Evol
14, 465–473.
Padidam M, Sawyer S, Fauquet CM (1999). Possible
emergence of new geminiviruses by frequent recombina-
tion. Virology 265, 218–225.
Parkin EJ, Butlin RK (2004). Within- and between-
individual sequence variation among ITS1 copies in the
meadow grasshopper Chorthippus parallelus indicates
范文等: 香港红山茶个体内 ITS多态性及物种鉴定的应用 225
frequent intrachromosomal gene conversion. Mol Biol
Evol 21, 1595–1601.
Parks CR (1990). Cross-compatibility studies in the genus
Camellia. A presentation for the ICS congress at Maizura.
Int Camellia J 22, 37–54.
Pedersen C, Linde-Laursen I (1994). Chromosomal loca-
tions of four minor rDNA loci and a marker microsatellite
sequence in barley. Chromosome Res 2, 65–71.
Posada D, Crandall KA (2001). Evaluation of methods for
detecting recombination from DNA sequences: computer
simulations. Proc Natl Acad Sci USA 98, 13757–13762.
Prokopowich CD, Gregory TR, Crease TJ (2003). The
correlation between rDNA copy number and genome size
in eukaryotes. Genome 46, 48–50.
Rannala B, Yang ZH (1996). Probability distribution of mo-
lecular evolutionary trees: a new method of phylogenetic
inference. J Mol Evol 43, 304–311.
Ronquist F, Huelsenbeck JP (2003). MrBayes 3: Bayesian
phylogenetic inference under mixed models. Bioinformat-
ics 19, 1572–1574.
Saitou N, Nei M (1987). The neighbor-joining method: a new
method for reconstructing phylogenetic trees. Mol Biol
Evol 4, 406–425.
Schlötterer C, Tautz D (1994). Chromosomal homogeneity
of Drosophila ribosomal DNA arrays suggests intrachro-
mosomal exchanges drive concerted evolution. Curr Biol
4, 777–783.
Smith JM (1992). Analyzing the mosaic structure of genes. J
Mol Evol 34, 126–129.
Swofford DL (2002). PAUP*: Phylogenetic Analysis Using
Parsimony (*and Other Methods). Version 4. Sinauer
Associates, Sunderland, MA.
Swofford DL, Berlocher SH (1987). Inferring evolutionary
trees from gene frequency data under the principle of
maximum parsimony. Syst Zool 36, 293–325.
Tamura K, Peterson D, Peterson N, Stecher G, Nei M,
Kumar S (2011). MEGA5: molecular evolutionary genet-
ics analysis using maximum likelihood, evolutionary dis-
tance, and maximum parsimony methods. Mol Biol Evol
28, 2731–2739.
Thompson JD, Gibson TJ, Plewniak F, Jeanmougin F,
Higgins DG (1997). The CLUSTAL_X windows interface:
flexible strategies for multiple sequence alignment aided by
quality analysis tools. Nucleic Acids Res 25, 4876–4882.
Van Oppen MJH, Willis BL, Van Rheede T, Miller DJ
(2002). Spawning times, reproductive compatibilities and
genetic structuring in the Acropora aspera group: evi-
dence for natural hybridization and semi-permeable spe-
cies boundaries in corals. Mol Ecol 11, 1363–1376.
Vijayan K, Zhang WJ, Tsou CH (2009). Molecular taxo-
nomy of Camellia (Theaceae) inferred from nrITS se-
quences. Am J Bot 96, 1348–1360.
Xiao LQ, Möller M, Zhu H (2010). High nrDNA ITS poly-
morphism in the ancient extant seed plant Cycas: incom-
plete concerted evolution and the origin of pseudogenes.
Mol Phylogenet Evol 55, 168–177.
Xu JP, Zhang QQ, Xu XF, Wang ZG, Qi J (2009). Intrage-
nomic variability and pseudogenes of ribosomal DNA in
Stone flounder Kareius bicoloratus. Mol Phylogenet Evol
52, 157–166.
Young ND, Healy J (2003). GapCoder automates the use of
indel characters in phylogenetic analysis. BMC Bioinfor-
matics 4, 6.
Zheng XY, Cai DY, Yao LH, Teng YW (2008). Non-concerted
ITS evolution, early origin and phylogenetic utility of ITS
pseudogenes in Pyrus. Mol Phylogenet Evol 48, 892–903.
Zimmer EA, Martin SL, Beverley SM, Kan YW, Wilson AC
(1980). Rapid duplication and loss of genes coding for the
alpha chains of hemoglobin. Proc Natl Acad Sci USA 77,
2158–2162.

226 植物学报 50(2) 2015
Intragenomic Polymorphism of the Internal Transcribed Spacer
Region of Ribosomal DNA in Camellia hongkongensis
(Theaceae) and Species Identification
Wen Fan1, Ying Xu1, Ting Xu1, Jing Xu1, 2, Takahiro Yonezawa1, Jiyin Gao3, Wenju Zhang1*
1Ministry of Education Key Laboratory for Biodiversity Science and Ecological Engineering, Institute of Biodiversity Science,
School of Life Sciences, Fudan University, Shanghai 200433, China; 2Shanghai Information Center for Life Sciences, Chi-
nese Academy of Sciences, Shanghai 200031, China; 3Guangdong Palm Landscape Architecture Research Institute,
Zhongshan 528416, China
Abstract The internal transcribed spacer (ITS) region of ribosomal DNA has been selected as an important barcoding
region in plants, but its use in Camellia species is difficult. In this study, we amplified, cloned and sequenced the ITS
region of a Camellia plant from Vietnam that was similar to C. hongkongensis and obtained 74 sequences from an indi-
vidual. The ITS region showed high polymorphism within the individual, and 76% of the sequences were pseudogenes.
Phylogenetic analysis showed that more than half of the pseudogenes originated from a common ancestor. These older
rDNA pseudogenes differentiated into at least 5 lineages after repeated gene duplication, and sequences in each lineage
were similar to each other, which suggests that some pseudogenes had not been deleted but had recently undergone
rapid duplication events. The high polymorphism of the ITS region within an individual in Camellia species would likely
result in faulty identities when using this region as a barcode. However, by comparing the species-specific rDNA pseu-
dogenes in C. hongkongensis, we identified the sample from Vietnam that belongs to C. hongkongensis.
Key words Camellia hongkongensis, internal transcribed spacer (ITS), phylogeny, polymorphism, pseudogenes
Fan W, Xu Y, Xu T, Xu J, Yonezawa T, Gao JY, Zhang WJ (2015). Intragenomic polymorphism of the internal trans-
cribed spacer region of ribosomal DNA in Camellia hongkongensis (Theaceae) and species identification. Chin Bull Bot
50, 217–226.
———————————————
* Author for correspondence. E-mail: wjzhang@fudan.edu.cn
(责任编辑: 白羽红)