全 文 :植物学报 Chinese Bulletin of Botany 2011, 46 (3): 276–284, www.chinbullbotany.com
doi: 10.3724/SP.J.1259.2011.00276
——————————————————
收稿日期: 2010-11-05; 接受日期: 2010-12-29
基金项目: 国际科技合作项目(No.2007DFA30990)和卫生行业科研专项(No.200802043)
* 通讯作者。E-mail: kelichen@126.com
锦葵科植物DNA条形码通用序列的筛选
王柯1, 陈科力1*, 刘震1, 陈士林2
1湖北中医药大学, 中药资源和中药复方教育部重点实验室, 武汉 430065
2中国医学科学院北京协和医学院药用植物研究所, 北京 100193
摘要 对锦葵科植物样品的ITS、ITS2、rbcL、matK和psbA-trnH序列进行PCR扩增和测序, 比较各序列的扩增效率、测序
成功率、种内和种间变异的差异以及barcoding gap图, 使用BLAST1和Nearest Distance方法评价不同序列的鉴定能力, 进
而从这些候选序列中筛选出较适合锦葵科植物鉴别的DNA条形码序列。结果表明, ITS序列在采集的锦葵科植物11个种26
个样品中的扩增成功率较高, 其种内、种间变异差异和barcoding gap较ITS2、psbA-trnH及rbcL序列具有更明显的优势, 且
纳入60个属316个种共1 228个样品的网上数据后, 其鉴定成功率可达89.9%。psbA-trnH序列的扩增和测序成功率最高, 其
鉴定成功率为63.2%, 并能鉴别一些ITS序列无法鉴别的种。实验结果表明, ITS和psbA-trnH是较适合鉴别锦葵科植物的
DNA条形码序列组合。
关键词 DNA条形码, 鉴定, ITS, ITS2, 锦葵科, psbA-trnH
王柯, 陈科力, 刘震, 陈士林 (2011). 锦葵科植物DNA条形码通用序列的筛选. 植物学报 46, 276–284.
锦葵科 (Malvaceae)植物全世界约有50个属 ,
1 000多种, 广泛分布于温带和热带地区, 我国有17
个属, 76个种, 南北各地均有分布(侯宽昭, 1982)。该
科一些植物具有较高的经济价值 , 如陆地棉(Gos-
sypium hirsutum L.) 、 苘 麻 (Abutilon theophrasti
Medik.)和大麻槿(Hibiscus cannabinus L.)等是重要
的工业纤维作物 , 木槿 (H. syriacus L.)和木芙蓉
(H. mutabilis L.)等是著名的庭园观赏植物。另外, 据
记载该科有12个属, 60多个种具有药用价值。
加拿大动物学家Hebert等 (2003a)首次提出的
DNA条形码技术(即通过使用一段DNA片段对物种进
行鉴定)具有快速、客观和操作程序化等特点。该技
术一经推出便引起了科学界的广泛关注, 并成为生物
学领域近期的研究热点之一(闫化学和于杰, 2010)。
该技术的重点任务是筛选出能够广泛使用的DNA通
用序列。Hebert等(2003b)对动物界的11个门13 320
个物种(除刺胞动物门外)的CO1(cytochrome coxi-
dase subunit 1)基因序列进行了分析, 发现该序列的
种间变异能够较好地区分物种。在随后的研究中
(Vences et al., 2005; Janzen et al., 2005; Ward et
al., 2005)CO1基因被公认为动物界中标准的DNA条
形码基因。由于植物容易发生杂交和网状进化, 同一
基因在不同类群中的进化速率可能不同, 导致植物条
形码的研究比动物复杂得多 (Kress et al., 2005;
Newmaster et al., 2006), 目前DNA条形码在植物类
群中的研究和应用尚处于起步阶段(任保青和陈之端,
2010)。学者们推荐了几种植物的DNA条形码候选序
列及其组合(Chase et al., 2007; Kress and Erickson,
2007; Pennisi, 2007), 但这些序列是否适合每一个
具体的植物科或属, 尚需进行针对性的探索研究。在
此背景下, 本文选取近年来几个重点推荐的序列如
ITS、ITS2、rbcL、matK以及psbA-trnH, 比较其对锦
葵科种类的鉴别能力, 考察各候选序列作为该科植物
DNA条形码通用序列的适用性, 以期为DNA条形码
技术在锦葵科植物中的应用提供依据。
1 材料与方法
1.1 材料
实验材料为锦葵科14个种26份样品(表1)。凭证标本
·研究报告·
王柯等: 锦葵科植物 DNA 条形码通用序列的筛选 277
表1 样本信息
Table 1 Information of samples
Taxons Locality Voucher numbers
Abelmoschus manihot (L.) Medik Wuhan, Hubei WS0401MT01
A. manihot (L.) Medik Wuhan, Hubei WS0401MT02
Urena lobata L. Wuhan, Hubei WS0402MT01
U. lobata L. Wuhan, Hubei WS0402MT02
Althaea rosea (L.) Cav. Wuhan, Hubei WS0403MT01
A. rosea (L.) Cav. Wuhan, Hubei WS0403MT02
Hibiscus syriacus L. Lushan, Jiangxi WS0404MT01
H. syriacus L. Lushan, Jiangxi WS0404MT02
H. rosa-sinensis L. Wuhan, Hubei WS0405MT01
H. schizopetalus (Dyer) Hook.f. Wuhan, Hubei WS0406MT01
H. schizopetalus (Dyer) Hook.f. Wuhan, Hubei WS0406MT02
H. cannabinus L. Wuhan, Hubei WS0407MT01
H. cannabinus L. Wuhan, Hubei WS0407MT02
H. mutabilis f. plenus S.Y. Hu Wuhan, Hubei WS0408MT01
Malva cathayensis M. G. Gilbert, Y. Tang & Dorr Shenzhen, Guangdong WS0409MT01
M. sinensis Cav. Shenzhen, Guangdong WS0409MT02
Abelmoschus moschatus Medik Wuhan, Hubei WS0410MT01
A. moschatus Medik Wuhan, Hubei WS0410MT02
Hibiscus paramutabilis L. H. Bailey Lushan, Jiangxi WS0411MT01
H. paramutabilis L. H. Bailey Lushan, Jiangxi WS0411MT02
H. sabdariffa L. Guangxi WS0412MT01
H. sabdariffa L. Guangxi WS0412MT02
H. mutabilis L. Wuhan, Hubei WS0413MT01
H. mutabilis L. Wuhan, Hubei WS0413MT02
H. syriacus var. totoalbus T. Moore Wuhan, Hubei WS0414MT01
H. syriacus var. totoalbus T. Moore Wuhan, Hubei WS0414MT02
由湖北中医药大学药学教研室潘宏林教授鉴定, 数字
影像信息及凭证标本保存于湖北中医药大学标本馆。
数据从GenBank数据库中下载(2009年6月10日)。研
究材料包括锦葵科62属327种1 254份样本。其中, ≥2
个物种的属有32个, ≥5个物种的属有14个, ≥2个样本
的物种有279个, ≥5个样本的物种有93个, 包括棉属
(Gossypium L.)、木槿属 (Hibiscus L.)、苘麻属
(Abutilon Mill.)、梵天花属(Urena L.)及黄花棯属(Sida
L.)等锦葵科经济类植物的代表属, 涵盖了中国境内
锦葵科70%以上的属。
1.2 方法
1.2.1 样品DNA的提取、PCR扩增和测序
称取经硅胶干燥的植物叶片约10 mg, 用液氮研磨
后, 使用植物DNA提取试剂盒(Tiangen Biotech Co.,
China)提取总DNA。各候选序列的PCR反应条件、通
用引物及扩增程序参照Chen等 (2010)所述方法。
PCR扩增产物经纯化后, 使用ABI 3730XL测序仪(A-
pplied Biosystems Co., USA)进行双向测序。
1.2.2 数据处理
使用CodonCode Aligner V 2.06 (CodonCode Co.,
USA)软件校对拼接测序所得的峰图, 去除低质量序
列及引物区, 利用ClustalX V2.0 (Higgins D.G.)软件
进行多序列比对并查错, 可用数据纳入后续分析。其
中, ITS2序列依照Keller等(2009)的方法处理, 拼接
得到一致序列后, 使用基于隐马尔可夫模型的HM-
Mer注释方法 , 去除两端 (5.8S和26S)区段 , 获得
ITS2间隔区序列。 psbA-trnH序列根据GenBank上的
注释, 去除psbA和trnH区段获得psbA-trnH间隔区。
其它序列先采用CodonCode Aligner软件初步切齐,
再使用MEGA4.0软件进行多序列比对切齐。Gen-
278 植物学报 46(3) 2011
Bank数据库中下载序列的处理方法与自测序列相同。
利用实验材料考察各候选序列PCR扩增效率的优劣,
使用罗焜等(2010)和朱英杰等(2010)的方法, 对不同
序列种间和种内变异进行比较, 并使用Wilcoxon Si-
gned Rank Tests (Lahaye et al., 2008a)对计算结果
进行检验, 然后利用TAXON DNA(Slabbinck et al.,
2008)软件做出各候选序列的barcoding gap图。采用
相似性搜索算法 (BLAST1)和最近距离法 (nearest
distance)考察各序列的鉴定成功率 (Ross et al.,
2008)。
2 结果与讨论
2.1 PCR扩增效率与测序成功率
本实验对5个候选序列的PCR扩增效率(出现明显PCR
条带即判定为成功)、测序成功率(测序后获得高质量的
序列即判定为成功)及有效序列的获得率(有效序列比
例=PCR扩增效率×测序成功率)进行了统计(表2)。其
中, psbA-trnH的有效序列为100%; ITS和ITS2的有效
序列均为77%; rbcL为73%; matK为0。虽然实验的样本
数较少, 但这些数据可以反映各序列对锦葵科物种分
析能力的差异。在上述候选序列中, 由于matK获得的
有效序列比例为0, 故在后续研究中被排除。
2.2 不同DNA条形码候选序列反映的种内及种间
差异
使用本实验数据和GenBank数据库中锦葵科的相关
数据, 分析各序列所反映的锦葵科各物种种间及种内
的变异情况。结果(表3)表明, ITS2序列的种间变异最
大, ITS和psbA-trnH序列次之, rbcL序列最小; 种内
变异同样是ITS2序列最大, ITS序列次之, rbcL序列最
小。ITS序列的种间最小变异明显大于其种内最大变
异, 较有利于物种的鉴别; rbcL序列虽然在种内基本
没有变异, 但其种间最小变异与其种内最大变异差距
不明显, 故不适于锦葵科物种的鉴别。
2.3 不同序列种间与种内变异的比较
使用Wilcoxon检验比较不同序列种间和种内变异(表
3)的差异情况, 结果(表4, 表5)表明, ITS序列的种间
变异大于ITS2序列和rbcL序列, 并存在显著性差异,
而与psbA-trnH序列的变异差异不明显。ITS序列的种
内变异也大于ITS2序列和rbcL序列, 并存在显著性
差异, 而与psbA-trnH序列没有显著性差异。
2.4 不同序列的barcoding gap图分析
理想条形码检测到的种间遗传变异应明显大于种内
遗传变异, 并在两者间形成一个明显的间隔区, 即
表2 不同DNA序列扩增获得的有效序列比例
Table 2 The effective sequence ratio obtained by five candidate sequences’ PCR amplification
Marker Amplification efficiency (%) Success rate of sequencing (%) Effective sequence ratio (%)
ITS 76.9 100 76.90
ITS2 88.5 87.0 76.995
psbA-trnH 100 100 100
matK 0 – 0
rbcL 80.8 90.5 73.124
表3 GenBank数据与实验数据结合后4个候选序列的种间及种内差异
Table 3 Inter-specific divergence between congeneric species and intra-specific variation of 4 candidate barcodes by analyzing
data from GenBank and experiment samples
ITS ITS2 psbA-trnH rbcL
All_inter_specific_distance 0.044 9±0.059 9 0.075 7±0.100 6 0.045 0±0.113 3 0.010 4±0.007 7
Theta prime 0.044 5±0.049 6 0.043 1±0.041 5 0.031 4±0.079 2 0.009 5±0.007 9
The_minimum_inter_specific_distance 0.018 0±0.029 8 0.011 1±0.028 2 0.000 4±0.000 9 0.002 0±0.002 0
All_intra_specific_distance 0.001 9±0.007 0 0.013 8±0.013 9 0.000 7±0.002 7 0.000 0±0.000 0
Theta 0.004 1±0.012 7 0.008 9±0.012 0 0.000 8±0.002 5 0.000 0±0.000 0
Coalescent_depth 0.004 6±0.012 7 0.013 7±0.017 5 0.001 1±0.003 4 0.000 0±0.000 0
王柯等: 锦葵科植物 DNA 条形码通用序列的筛选 279
表4 候选序列种间差异的Wilcoxon检验
Table 4 Wilcoxon signed tests for interspecific divergences of candidate sequences
W+ W– Inter relative ranks, n, P value Result
ITS ITS2 W+=37.0, W–=173.0, n=20, P=0.011 1 P<0.05, ITS>ITS2
ITS psbA-trnH W+=100.0, W–=131.0, n=21, P=0.590 1 P>0.05, ITS=psbA-trnH
ITS rbcL W+=230.0, W–=1.0, n=21, P=0.046 48 P<0.05, ITS>rbcL
ITS2 psbA-trnH W+=168.0, W–=63.0, n=21, P=0.068 0 P>0.05, ITS2=psbA-trnH
ITS2 rbcL W+=230.0, W–=1.0, n=21, P=0.046 48 P<0.05, ITS2>rbcL
psbA-trnH rbcL W+=231.0, W–=0.0, n=21, P=0.040 15 P<0.05, psbA-trnH>rbcL
表5 候选序列种内差异的Wilcoxon检验
Table 5 Wilcoxon signed tests for intraspecific variations of candidate sequences
W+ W– Intra relative ranks, n, P value Result
ITS ITS2 W+=3.0, W–=42.0, n=9, P=0.020 9 P<0.05, ITS>ITS2
ITS psbA-trnH W+=37.0, W–=8.0, n=9, P=0.085 8 P>0.05, ITS=psbA-trnH
ITS rbcL W+=45.0, W–=0.0, n=9, P=0.007 4 P<0.01, ITS>rbcL
ITS2 psbA-trnH W+=36.0, W–=0.0, n=8, P=0.011 7 P<0.05, ITS2>psbA-trnH
ITS2 rbcL W+=36.0, W–=0.0, n=8, P=0.011 6 P<0.05, ITS2>rbcL
psbA-trnH rbcL W+=28.0, W–=0.0, n=7, P=0.017 8 P<0.05, psbA-trnH>rbcL
barcoding gap (Meyer and Paulay, 2005; Lahaye et
al., 2008a, 2008b)。此外, 理想状态下, 柱形图上的
种内变异集中在数值较小的一侧(左侧), 而种间变异
集中在数值较大的一侧(右侧)。本实验中, 我们利用
TAXON DNA软件对所选序列进行计算 , 并作出
barcoding gap图(图1)。由图1可知, rbcL序列的种内
和种间变异重合, 不适用于物种鉴别。其它3个序列
的种间和种内变异分别集中在barcoding gap图的两
端, 但又均没有形成明显的种间与种内变异间隔区。
因此, 鉴于锦葵科中某些物种的种内变异较大, 这3
个序列均难以单独完成对这一科的鉴别。其中 ,
psbA-trnH序列种内变异的幅度和变异样本的比例明
显较小, 与种间变异幅度和变异样本的比例较大形成
鲜明的对照, 其barcoding gap图相对较好。与ITS2
序列相比, ITS序列种内变异更集中于图的左端, 更
有利于物种鉴定。
2.5 候选序列的鉴定效率评估
将该项评估与实验数据相结合, 并纳入网上可用数
据, 在更大样本量下, 考察各候选序列的鉴定成功
率。结果(表6)表明, 经BLAST1和nearest distance
两种不同方法评估, ITS序列在物种水平上的鉴定成
功率最高, 是这批序列中较适用的序列。rbcL序列的
鉴定成功率最低, 且其能考察的样本数又太少, 不适
于作为通用序列。本研究发现, ITS、psbA-trnH和ITS2
序列不能区分的属分别为1、3和5个; 不能区别的物
种涉及的属分别为7、12和21个。其中ITS不能区别
的物种涉及的属完全包括在ITS2序列中, 所以ITS能
够完全涵盖ITS2的鉴定效果; ITS和psbA-trnH序列不
能区别的物种涉及的属互有不同, 因此, psbA-trnH
序列能够鉴别一些 ITS序列不能够区别的物种。
psbA-trnH序列的鉴定成功率虽然低于ITS序列, 但
其具有较高的扩增效率和测序成功率, 能够覆盖并分
析相当一部分 ITS序列无法分析的物种区域 (大约
23%); ITS序列虽具有较高的鉴定成功率(89.9%), 但
考虑到其较低的有效序列获得率(76.9%), 其真实的
鉴定成功率也不会很高(69.1%), 还有相当一部分物
种无法分析。因此, 将psbA-trnH与ITS联合应用作为
锦葵科的DNA条形码通用序列组合较为适当。
2.6 讨论
2.6.1 锦葵科候选序列的筛选
从目前推荐的5个热点植物DNA条形码序列中, 筛选出
较适合锦葵科物种鉴定的候选序列ITS和psbA-trnH。
280 植物学报 46(3) 2011
图1 Barcoding gap图
(A) ITS序列; (B) ITS2序列; (C) psbA-trnH序列; (D) rbcL序列
Figure 1 Distribution for intra and inter-specific variation
(A) ITS sequence; (B) ITS2 sequence; (C) psbA-trnH sequence; (D) rbcL sequence
表6 比对法和最小距离法分析4种候选序列的鉴定效率
Table 6 Comparison of the identification efficiency for 4 candidate sequences using BLAST1 and nearest distance methods
Correct identification Incorrect identification Ambiguous identificationMarker Methods of species
identification
Number of
species
Number of
samples Species
level (%)
Genus
level (%)
Species
level (%)
Genus
level (%)
Species
level (%)
Genus
level (%)
BLAST1 194 337 89.9 99.0 0 0 10.1 1.0 ITS
Nearest distance 194 337 81.9 98.5 0 0 18.1 1.5
BLAST1 302 716 66.5 96.7 0 0 33.5 3.3 ITS2
Nearest distance 302 716 53.9 91.7 0 0 46.1 8.3
BLAST1 139 222 63.5 96.4 0 0 36.5 3.6 psbA-trnH
Nearest distance 139 222 36.9 85.6 0 0 63.1 14.4
BLAST1 27 38 63.2 81.5 0 0 36.8 18.5 rbcL
Nearest distance 27 38 52.6 81.5 0 0 47.4 18.5
王柯等: 锦葵科植物 DNA 条形码通用序列的筛选 281
理想的DNA条形码序列应具备明显的种间变异,
同时种内变异要足够小, 并且应该能够使用单引物对
其进行扩增, 通过双向测序得到高质量的序列(Song
et al., 2009; Yao et al., 2009)。本研究结果表明, 核
基因ITS序列具有较好的PCR扩增效率和测序成功
率, 在所考察的候选序列中具有较大的种间变异和较
小的种内变异, 且两者存在极显著差异, 同时在样本
量较大的情况下, 其物种鉴定成功率达到89.9%, 故
在候选序列中推荐ITS序列为锦葵科植物首选的DNA
条形码序列。
psbA-trnH片段是进化速率最快的叶绿体间隔区
之一, 其两端存在约75 bp的保守序列, 可用于设计
通用引物(Kress et al., 2005; Kress and Erickson,
2007; Fazekas et al., 2008); 后经Kress等(2005)、
Kress和Erickson(2007)及Yao等(2009)验证发现其
通用性较好且扩增成功率较高, 因而在条形码序列研
究中重点推荐。本研究发现, psbA-trnH序列在种间与
种内的变异存在显著差异, 在属的水平上鉴定成功率
较高, 可达到96.4%, 尽管其在物种水平上的鉴定成
功率较低, 仅为63.5%, 但由于其扩增效率和测序成
功率对实验样品为100%, 可以覆盖和分析ITS不能
分析的物种区域(大约23%), 此外, 它与ITS序列不能
区别的物种所涉及的属也有所不同 , 因此 , 建议
psbA-trnH和ITS序列联合应用作为锦葵科的DNA条
形码通用序列组合。由于本研究中所采用的网上数据
每条序列对应的种类数和样本数均不相同, 不是平行
数据, 所以未将psbA-trnH和ITS序列的数据联合起
来进行分析。psbA-trnH和ITS是进化速率较快的2个
分子标记, 许多研究结果表明, 它们在陆地植物涉及
的种级鉴定中是比较可行的条形码组合(Kress et al.,
2005; 任保青和陈之端, 2010)。一项对桦木科桤木属
(Alnus Mill.)26个物种131个个体的分析发现, 4个片
段在种水平上的分辨能力分别为10%(rbcL)、31.25%
(matK)、63.6%(trnH-psbA)和76.9%(ITS), 如果将
ITS和trnH-psbA结合则可以分辨全部种类的88.5%
(Ren et al., 2010)。因此预计这一组合在锦葵科物种
的鉴定中将会发挥较好的作用。
陈士林等(2009)对药用植物及其近缘种中4 800
个物种6 600个样本进行研究, 发现ITS2序列在物种
水平上的鉴定成功率超过90%, 表明ITS2序列在药
用植物鉴定中将会发挥重要作用。刘震等(2010)在对
忍冬科种类鉴定的研究中发现, ITS2序列具有较大的
优势, 推荐其为忍冬科植物首选的候选序列。但本研
究发现, 虽然ITS2序列在锦葵科植物类群间有最大
的变异, 但其种内变异与种间变异的重叠区较大, 无
法鉴定的种及其所涉及的属也较多, 且完全涵盖并多
于ITS序列所涉及的属, 因此, 根据目前的数据我们
不推荐ITS2序列作为锦葵科的候选序列。
国际生命条形码协会植物工作组(plant working
group of the consortium for the barcode of life,
CBOL)在最新的研究中推荐rbcL+matK为植物条形
码序列(CBOL, 2009)。matK片段相对于其它编码区
片段进化速率快, 但其引物在不同物种间的通用性差
别较大(Chase et al., 2007; Hollingsworth, 2008)。
本研究对实验采集的26个样本首先使用390R/1326F
引物进行扩增(陈士林等, 2009), 结果其成功率为0;
后又参考苏铁目植物DNA条形码研究中所使用的4对
matK引物和反应程序分别进行扩增 (Sass et al.,
2007), 结果成功率还是0, 故在后续研究中排除了
matK序列。rbcL序列在GenBank数据库中有大量数
据, 且其具有通用、易扩增和易比对的优点, 但其变
异主要存在于种以上水平, 物种水平上变异通常不够
大(Kress and Erickson, 2007; Sass et al., 2007;
Fazekas et al., 2008; Lahaye et al., 2008a; New-
master et al., 2008)。Kress等(2005)最早将其作为植
物条形码的候选片段。本文对锦葵科的研究发现 ,
rbcL序列的种间和种内变异差异不显著, 并且利用
Blast1 和 nearest distance 法其鉴定效率也只有
63.2%和52.6%, 故不适合作为锦葵科植物的DNA条
形码序列。
2.6.2 DNA条形码技术应用于锦葵科的展望
DNA条形码技术是以一段短的DNA片段作为通用序
列来鉴定物种, 其研究结果客观性强且操作较简便,
大大提高了非专业人员进行物种鉴定的效率和准确
性, 成为分类学家非常有力的工具(宁淑萍等, 2008;
陈士林等, 2009; 任保青和陈之端, 2010)。本文对
DNA条形码技术在锦葵科植物中的应用作了初步探
索, 应用锦葵科14个物种26份样品和GenBank数据
库中60个属316个物种1 228份样本, 从5个推荐的热
点序列中, 确定ITS和psbA-trnH序列为锦葵科DNA
条形码较适合的序列组合。这2个序列不能够区别的
282 植物学报 46(3) 2011
物种所涉及的属互有不同, 因而它们在某些属的属下
分类中能够互补。此外, 研究中也发现, 这2个序列无
法鉴别的物种所涉及的属有些是共同的(如蜀葵属
(Alcea L.)、药葵属(Althaea L.)、花葵属(Lavatera L.)
和Palau Cav.)。通过分析我们发现, 2003年前后分子
生物学的证据使人们对与锦葵科相关的几个科的分
类地位产生了一些新的认识, 相应锦葵科内属的划分
也发生了一些变化。我国1984年版《中国植物志》中
锦葵科介绍的大约1 000个物种50个属在2007年的英
文版《中国植物志》中变成了100个属, 中国的锦葵
科植物也由81个物种16个属变成了19个属, 其中包
括把药葵属(Althaea (Lin.) Cav.)重新还原为林奈的
蜀葵属 (Alcea) 和药葵属 (Althaea) (Tang et al.,
2007)。本文中蜀葵(Althaea rosea (L.) Cav.)是根据
1984年版《中国植物志》命名的, 因而与从GenBank
数据库中下载的大部分蜀葵(Alcea rosea Linn.)的命
名不同。同一种植物出现2种不同的命名方式, 这正
是基于同一的ITS和psbA-trnH条形码特征对它们不
能够区分的原因, 反过来也说明这些条形码的分子特
征也能够作为一个稳定的分子性状对传统形态学分
类进行补充和订正。目前, 各国分类学家在与锦葵科
相关的分类学研究中还存在争议, 可能也是本文其它
一些物种无法正确识别的原因。一旦这些形态分类得
到订正和统一, 条形码的鉴别率还会大幅度提高。因
此, 有专家指出, 对类群进行形态分类学修订是开展
植物DNA条形码研究的基础, 传统形态分类学和分
子分类学需要有机结合(任保青和陈之端, 2010)。相
信随着锦葵科相关科及其属下分类通过修订不断取
得一致, 以及对锦葵科属下的近缘种进行密集的多样
本采样和条形码鉴别研究, 条形码终将成为锦葵科植
物鉴别的一个有力的工具。
参考文献
陈士林, 宋经元, 姚辉, 石林春, 罗焜, 韩建萍 (2009). 药用
植物DNA条形码鉴定策略及关键技术分析. 中国天然药物
7, 322–327.
侯宽昭 (1982). 中国种子植物科属词典. 北京: 科学出版社.
pp. 293–293.
刘震, 陈科力, 罗焜, 潘宏林, 陈士林 (2010). 忍冬科药用植
物DNA条形码通用序列的筛选. 中国中药杂志 35, 2527–
2527.
罗焜, 陈士林, 陈科力, 宋经元, 姚辉, 马新业, 朱英杰, 庞晓
慧, 余华, 李西文, 刘震 (2010). 基于芸香科的植物通用
DNA条形码研究. 中国科学C辑: 生命科学 40, 342–351.
宁淑萍, 颜海飞, 郝刚, 葛学军 (2008). 植物DNA条形码研究
进展. 生物多样性 16, 417–425.
任保青 , 陈之端 (2010). 植物DNA条形码技术 . 植物学报
45, 1–12.
闫化学, 于杰 (2010). DNA条形码技术在植物中的研究现状.
植物学报 45, 102–108.
朱英杰, 陈士林, 姚辉, 谭睿, 宋经元, 罗焜, 鲁静 (2010).
重楼属药用植物DNA条形码鉴定研究. 药学学报 45, 376–
382.
CBOL Plant Working Group (2009). A DNA barcode for
land plants. Proc Natl Acad Sci USA 106, 12794–12797.
Chase MW, Cowan RS, Hollingsworth PM, van den Berg
C, Madriñán S, Petersen G, Seberg O, Jørgsensen T,
Cameron KM, Carine M, Pedersen N, Hedderson TAJ,
Conrad F, Salazar GA, Richardson JE, Hollingsworth
ML, Barraclough TG, Kelly L, Wilkinson M (2007). A
proposal for a standardised protocol to barcode all land
plants. Taxon 56, 295–299.
Chen SL, Yao H, Han JP, Liu C, Song JY, Shi LC, Zhu YJ,
Ma XY, Gao T, Pang XH, Luo K, Li Y, Li XW, Jia XC, Lin
YL, Leon C (2010). Validation of the ITS2 region as a
novel DNA barcode for identifying medicinal plant spe-
cies. PLoS One 5, e8613.
Fazekas AJ, Burgess KS, Kesanakurti PR, Graham SW,
Newmaster SG, Husband BC, Percy DM, Hajibabaei M,
Barrett SCH (2008). Multiple multilocus DNA barcodes
from the plastid genome discriminate plant species
equally well. PLoS One 3, e2802.
Hebert PDN, Cywinska A, Ball SL, deWaard JR (2003a).
Biological identifications through DNA barcodes. Proc R
Soc Lond B Biol Sci 270, 313–321.
Hebert PDN, Ratnasingham S, deWaard JR (2003b).
Barcoding animal life: cytochrome c oxidase subunit 1
divergences among closely related species. Proc R Soc
Lond B Biol Sci 270, S96–S99.
Hollingsworth PM (2008). DNA barcoding plants in biodi-
versity hot spots: progress and outstanding questions.
Heredity 101, 1–2.
Janzen DH, Hajibabaei M, Burns JM, Hallwachs W, Re-
migio E, Hebert PDN (2005). Wedding biodiversity in-
ventory of a large and complex Lepidoptera fauna with
DNA barcoding. Philos Trans R Soc Lond B Biol Sci 360,
1835–1845.
王柯等: 锦葵科植物 DNA 条形码通用序列的筛选 283
Keller A, Schleicher T, Schultz J, Müller T, Dandekar T,
Wolf M (2009). 5.8S–28S rRNA interaction and HMM-
based ITS2 annotation. Gene 430, 50–57.
Kress WJ, Erickson DL (2007). A two-locus global DNA
barcode for land plants: the coding rbcL gene comple-
ments the non-coding trnH-psbA spacer region. PLoS
One 2, e508.
Kress WJ, Wurdack KJ, Zimmer EA, Weigt LA, Janzen
DH (2005). Use of DNA barcodes to identify flowering
plants. Proc Natl Acad Sci USA 102, 8369–8374.
Lahaye R, van der Bank M, Bogarin D, Warner J, Pupulin
F, Gigot G, Maurin O, Duthoit S, Barraclough TG,
Savolainen V (2008a). DNA barcoding the floras of bio-
diversity hotspots. Proc Natl Acad Sci USA 105, 2923–
2928.
Lahaye R, Savolainen V, Duthoit S, Maurin O, van der
Bank M (2008b). A test of psbK-psbI and atpF-atpH as
potential plant DNA barcodes using the flora of the Kruger
National Park (South Africa) as a model system. Available
from Nature Precedings. http://hdl.handle.net/10101/npre.
2008.1896.1
Meyer CP, Paulay G (2005). DNA barcoding: error rates
based on comprehensive sampling. PLoS Biol 3, e422.
Newmaster SG, Fazekas AJ, Ragupathy S (2006). DNA
barcoding in land plants: evaluation of rbcL in a multigene
tiered approach. Can J Bot 84, 335–341.
Newmaster SG, Fazekas AJ, Steeves RAD, Janovec J
(2008). Testing candidate plant barcode regions in the
Myristicaceae. Mol Ecol Res 8, 480–490.
Pennisi E (2007). Wanted: a barcode for plants. Science
318, 190–191.
Ren BQ, Xiang XG, Chen ZD (2010). Species identification
of Alnus (Betulaceae) using nrDNA and cpDNA genetic
markers. Mol Ecol Res 10, 594–605.
Ross HA, Murugan S, Li WLS (2008). Testing the reliability
of genetic methods of species identification via simulation.
Syst Biol 57, 216–230.
Sass C, Little DP, Stevenson DW, Specht CD (2007). DNA
barcoding in the Cycadales: testing the potential of pro-
posed barcoding markers for species identification of
Cycads. PLoS One 2, e1154.
Slabbinck B, Dawyndt P, Martens M, De Vos P, De Baets
B (2008). Taxon gap: a visualization tool for intra- and
inter-species variation among individual biomarkers. Bio-
informatics 24, 866–867.
Song JY, Yao H, Li Y, Li XW, Lin YL, Liu C, Han JP, Xie
CX, Chen SL (2009). Authentication of the family Poly-
gonaceae in Chinese pharmacopoeia by DNA barcoding
technique. J Ethnopharmacol 124, 434–439.
Tang Y, Micheal GG, Laurence JD (2007). Malvaceae.
Flora of China. Vol12. Beijing: Science Press. pp. 264–
298.
Vences M, Thomas M, Bonett RM, Vieites DR (2005).
Deciphering amphibian diversity through DNA barcoding:
chances and challenges. Philos Trans R Soc Lond B Biol
Sci 360, 1859–1868.
Ward RD, Zemlak TS, Innes BH, Last PR, Hebert PDN
(2005). DNA barcoding Australias fish species. Philos
Trans R Soc Lond B Biol Sci 360, 1847–1857.
Yao H, Song JY, Ma XY, Liu C, Li Y, Xu HX, Han JP,
Duan LS, Chen SL (2009). Identification of Dendrobium
species by a candidate DNA barcode sequence: the
chloroplast psbA-trnH intergenic region. Planta Med 75,
667–669.
284 植物学报 46(3) 2011
Screening of Universal DNA Barcodes for Malvaceae Plants
Ke Wang1, Keli Chen1*, Zhen Liu1, Shilin Chen2
1Key Laboratory of Ministry of Education on Traditional Chinese Medicine Resource and Compound Prescription, Hubei
University of Chinese Medicine, Wuhan 430065, China; 2Institute of Medicinal Plant Development, Peking Union
Medical College, Chinese Academy of Medical Sciences, Beijing 100193, China
Abstract To screen the best candidate sequence that can be used as a universal DNA barcode to identify species in
Malvaceae, we amplified by PCR and sequenced the DNA fragments of 5 hot regions (ITS, ITS2, rbcL, matK and
psbA-trnH) in samples from the family Malvaceae. PCR amplification and sequencing, differential intra- and interspecific
divergences, DNA barcoding gap and identification (using BLAST1 and nearest distance methods) were used to evaluate
the discrimination ability of these candidate sequences. The ITS region had fairly high amplification efficiency in 26 plant
samples belonging to 11 Malvaceae species and better intra- and interspecific divergences and DNA barcoding gap than
any other region tested (ITS2, psbA-trnH and rbcL). In addition, the rate of successful identification with the ITS region
was 89.9% at the species level for after added 1 228 plant samples from the GenBank database of Malvaceae belonging
to 316 species from 60 distinct genera. The psbA-trnH region had the best amplification efficiency and sequencing effi-
ciency; the rate of successful identification with the psbA-trnH region was 63.2%, and the region can discriminate some
species that cannot be successfully discriminated by the ITS region. We propose that ITS and psbA-trnH are a promising
DNA barcode sequence combination for identification.
Key words DNA barcoding, identification, ITS, ITS2, Malvaceae, psbA-trnH
Wang K, Chen KL, Liu Z, Chen SL (2011). Screening of universal DNA barcodes for Malvaceae plants. Chin Bull Bot 46,
276–284.
———————————————
* Author for correspondence. E-mail: kelichen@126.com
(责任编辑: 孙冬花)