免费文献传递   相关文献

Identification of plant species based on DNA barcode technology.

利用DNA条形码技术识别植物物种



全 文 :利用 DNA条形码技术识别植物物种*
裴男才**
(中国林业科学研究院热带林业研究所, 广州 510520)
摘摇 要摇 DNA条形码技术能够快速、准确地识别物种,对于开展基础性的分类学研究和应用
性的生物多样性研究极为重要.本文对鼎湖山 20 hm2大样地 183 个植物物种进行 DNA 条形
码测序.结果表明: 单个条形码片段时, psbA鄄trnH 的综合成功率最高(75% ),其次是 matK
(70% )和 rbcL(56% );片段组合时,matK+rbcL+psbA鄄trnH 三片段组合的物种水平识别率在
87%以上,随后是 matK+psbA鄄trnH(85% )、rbcL+psbA鄄trnH(83% )和 matK+rbcL(81% ) .综合了
亚热带波多黎各的 LFDP样地(143 个种)和热带巴拿马的 BCI样地(296 个种)以及圭亚那的
Nouragues样地(254 个种)3 个森林类型的研究结果,评价 DNA 条形码各片段在 4 个森林样
地的通用性. 在热带和亚热带地区的森林样地中,各片段测序成功率分别为 rbcL (93% ,
95郾 1% )、psbA鄄trnH(91. 5% ,94. 6% )和 matK(68. 5% ,79. 7% ) .在植物类群水平上,核心条形
码片段 matK+ rbcL 组合的物种准确识别率不高,只在局部群落中表现较为理想;而三位点
DNA条形码片段组合在热带和亚热带森林样地中综合成功率可达 84%和 90% .
关键词摇 DNA条形码技术摇 物种鉴定摇 局部群落摇 生物多样性摇 热带森林摇 亚热带森林
文章编号摇 1001-9332(2012)05-1240-07摇 中图分类号摇 Q14,Q19摇 文献标识码摇 A
Identification of plant species based on DNA barcode technology. PEI Nan鄄cai ( Research
Institute of Tropical Forestry, Chinese Academy of Forestry, Guangzhou 510520, China) . 鄄Chin. J.
Appl. Ecol. ,2012,23(5): 1240-1246.
Abstract: It is crucial for the studies of taxonomy and biodiversity by using DNA barcode technolo鄄
gy to fast and accurately make species identification in the forests across tropics and temperate
zones. In this study, the 183 plant species in a 20 hm2 subtropical forest plot in Dinghushan
(DHS) National Nature Reserve of South China were sampled and sequenced, and the matK, rbcL,
and psbA鄄trnH were employed to generate multi鄄locus barcodes. For the plot, the psbA鄄trnH pos鄄
sessed the highest integral success rate, i. e. , the product of sequencing recovery and correct spe鄄
cies identification (75% ), followed by matK (70% ), and rbcL (56% ). A combination of three鄄
locus barcode (matK, rbcL and psbA鄄trnH) could identify greater than 87% of the total species,
followed by two鄄locus barcode (85% for matK+psbA鄄trnH, 83% for rbcL+psbA鄄trnH, and 81% for
matK+rbcL). A comparison was made with the previously published results from one subtropical
forest plot (LFDP in Puerto Rico, 143 species) and two tropical forest plots (BCI in Panama, 296
species; and NRS in French Guiana, 254 species) to evaluate the universality and species identifi鄄
cation correctness of the proposed DNA barcodes for these four forest plots. For the plots in tropics
and subtropics, the sequencing success rate of rbcL, psbA鄄trnH and matK were 93% and 95. 1% ,
91. 5% and 94. 6% , and 68. 5% and 79. 7% , respectively. The combination of matK + rbcL
showed a high identification capacity in geographically restricted regions in taxonomic groups,
whereas the three鄄locus barcode had a high rate of correct species identification both in tropics
(84% ) and in subtropics (90% ).
Key words: DNA barcode technology; species identification; local community; biodiversity; tropi鄄
cal forest; subtropical forest.
*国家科技部林业公益性行业科研专项(200804006)、中国林业科学研究院热带林业研究所中央级公益性科研院所基本科研业务费专项
(RITFYWZX201208)和珠三角森林生态系统定位研究站项目(2007 / 66号)资助.
**通讯作者. E鄄mail: nancai. pei@ gmail. com
2011鄄09鄄17 收稿,2012鄄02鄄24 接受.
应 用 生 态 学 报摇 2012 年 5 月摇 第 23 卷摇 第 5 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
Chinese Journal of Applied Ecology, May 2012,23(5): 1240-1246
摇 摇 在进化生态学和保护生物学领域中,分辨物种
所处的系统分类位置并对其做出相对准确的鉴定是
此类研究的重要基础[1-3] . 但由于分类学家日渐缺
乏,野外采集样本既费时又难以确保足够的标本数,
且长期保藏难度大,从而限制了生物学家准确深入
地开展进化和保护生物学研究. DNA 条形码技术的
出现为解决物种水平上的准确鉴定工作提供了条
件,可通过一段短的 DNA序列达到物种水平上的识
别[4] .已往的研究表明,采用线粒体基因(COI)600
bp的 DNA序列作为一个标准片段来分辨动物界中
的近缘物种非常有效[4] .随着 DNA条形码在动物界
的成功应用,启发了植物学家将它运用到植物的识
别和鉴定中.经过一段时间的筛选和评价,国际植物
条形码工作组(The Consortium for the Barcode of Life
Plant Working Group)推荐叶绿体基因 matK 和 rbcL
作为陆生植物的标准 DNA条形码片段[5] .为了提高
近缘物种的准确识别率,有研究者提出将叶绿体基
因间隔区 psbA鄄trnH作为 DNA条形码重要的补充片
段[6] .到目前为止,植物 DNA 条形码技术被证明是
监测植物根系的空间分布格局[7]、发现隐形物
种[1]、辨别食草动物日常取食材料[8]以及研究入侵
植物的好工具[9] .
当前,绝大多数有关候选 DNA条形码片段的评
价工作集中在特定的分类群上[10-12];而且国际植物
条形码工作组建议使用的核心植物 DNA 条形码片
段在近缘类群(种甚至属的水平)上的准确物种识
别率比较低[13-14] . 在区系水平上,通常聚集在一起
生长的物种其亲缘关系较远,使用 DNA条形码方法
可获得比较高的物种识别率,DNA 序列所构建的系
统发育关系也能得到较好的拓扑结构和较高的节点
支持率[15-16] . 但在区系水平上使用 DNA 条形码片
段探讨准确物种识别率的研究较少,仅见基于样地
平台开展的研究. Gonzalez 等[17]在圭亚那(Noura鄄
gues Research Station,NRS)热带雨林中 2 个 1 hm2
样地上,检测了 8 个候选植物 DNA片段在 252 种幼
树上的表现,发现叶绿体基因 matK和核基因 ITS 的
测序成功率较低,且没有一个片段单独使用时的准
确物种识别率可以超过 70% .这个数值也低于国际
植物条形码工作组所报道的 72%成功率[5] . 然而,
同样在热带雨林,Kress等[18-19]在巴拿马 Barro Colo鄄
rado Island(BCI) 50 hm2的样地上,使用 matK+rbcL+
psbA鄄trnH的 DNA条形码片段组合时发现,299 个物
种的准确物种识别率高达 98% .此外,Kress等[19]在
波多黎各 Luquillo亚热带湿润森林一个 16 hm2的样
地上也发现,在 143 个物种上获得的准确物种识别
率达 93% .目前,DNA 条形码片段在森林群落中物
种识别中的应用已有相关报道[18-20],而基于更多森
林类型的研究仍然极为缺乏,尤其是各大森林样地
基于群落水平的 DNA 条形码应用前景更加引起关
注:1)DNA条形码片段通用性如何;2)DNA 条形码
片段可以在多大程度上分辨或识别一个未知物种;
3)如何设计最佳的片段组合,既能辨别物种而又能
控制成本.
本文在中国南亚热带森林大样地鼎湖山,利用
植物 DNA 条形码的 2 个核心片段 (叶绿体基因
matK和 rbcL)和一个重要的补充片段(叶绿体基因
间隔区 psbA鄄trnH),研究了各片段的序列扩增和物
种识别,然后综合了波多黎各的 LFDP 样地、巴拿马
的 BCI样地以及圭亚那的 Nouragues 样地 3 个森林
类型的研究结果,分别作为热带和亚热带森林的代
表来评价 DNA条形码各片段的通用性,推算出 4 个
森林样地中利用单片段和组合片段(即两位点和三
位点)时各自的准确物种识别率,最后归纳出三位
点植物 DNA 条形码组合在热带和亚热带森林区域
中的综合成功率,以期为样地平台或群落水平上植
物 DNA条形码研究提供参考.
1摇 研究地区与研究方法
1郾 1摇 研究区概况
研究区设在广东省肇庆市的鼎湖山国家自然保
护区 ( 23毅 09忆 21义—23毅 11忆 30义 N, 112毅 30忆 39义 —
112毅33忆41义 E,海拔 50 ~ 1000郾 3 m)内的南亚热带森
林动态监测样地 郾 该地区属于南亚热带湿润季风气
候类型,年均气温 20郾 9 益,年均降雨量 1985 mm,年
均相对湿度 80郾 3% ,是中国森林生物多样性监测网
络的关键节点,同时也是 CTFS 全球网络的重要组
成单元.主要森林植被类型有沟谷雨林、南亚热带常
绿阔叶林、山地常绿阔叶林和山地常绿灌草丛,及外
围丘陵山地伴生的针阔混交林[21] .
1郾 2摇 样品采集
2005 年,中国科学院华南植物园和鼎湖山国家
自然保护区管理局参照 BCI 样地建设的技术规范,
采用全站仪将 20 hm2(东西向 400 m、南北向 500
m)大样地划分为 20 m伊20 m的样方(共 500 个),每
个样方的四周用水泥桩作永久标记;标记样地内胸
径>1 cm的全部木本植物并作形态学鉴定,此后在
一定的时间内进行复查[21](表 1).对鼎湖山大样地
中的木本被子植物进行分子材料的采集,保存在放
14215 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 裴男才: 利用 DNA条形码技术识别植物物种摇 摇 摇 摇 摇 摇
表 1摇 4 个森林样地的物种多样性、测序样本数量、样地大小及位置
Table 1摇 Species diversity, number of samples sequenced, plot size and plot site for four forest plots
样地
Plot
森林类型
Forest type
建立年代
Year initiated
物种多样性
Species diversity
样本数
Samples
样地大小
Plot size (m)
样地位置
Plot site
DHS 亚热带季风
常绿阔叶林
2005 56 科,119 属,210 种,71617
棵植株(胸径>1 cm)
183 种,188 个样品 400伊500 23毅09忆21义 N,
112毅30忆39义 E
LFDP 亚热带
湿地森林
1990 50 科, 108 属, 143 种, 67467
棵植株(胸径>1 cm)
143 种,288 个样品 500伊 320 18毅20忆 N,
65毅49忆 W
BCI 低洼热带
潮湿森林
1982 57 科,181 属,299 种,208400
棵植株(胸径>1 cm)
296 种,1035 个样品 1000伊500 9毅09忆15义 N,
79毅50忆46义 W
NRS 低洼热带雨林 2008 54 科,143 属,254 种,1073 棵
植株(胸径>10 cm)
254 种,285 个样品 2 个 1 hm2
样地(非 CTFS网络成员)
4毅03忆 N,
52毅24忆 W
DHS:中国鼎湖山 Dinghushan, China; LFDP:波多黎各的卢奎约森林动态样地 Luquillo Forest Dynamics Plot, Puerto Rica; BCI:巴拿马的巴罗科
罗拉多岛 Barro Colorado Island, Panama; NRS:法属圭亚那的努里格研究站 Nouragues Research Station, French Guiana.
有新鲜硅胶的封口袋中. 共采集到 183 个物种,503
份新鲜分子材料),分属于 24 目 51 科 110 属,其中
有 72 属只有一个物种,15 属含有 3 个及以上的物
种 郾 这些样品分属于被子植物的三大分支:木兰类
植物有 2 目 2 科 22 种,单子叶植物有 2 目 2 科 2
种,真双子叶植物有 20 目 47 科 159 种.
1郾 3摇 DNA提取
采用新鲜的嫩叶片进行总 DNA提取,对少量无
法采集到叶片的物种利用其树皮韧皮部进行总
DNA提取.采用标准 CTAB方法[22],部分 DNA用于
PCR扩增和测序,其余 DNA 保存在-80 益冰柜内.
对少数富含次生代谢物质或者油脂的物种(主要是
樟科植物),在正常的 CTAB 程序之前增加冰浴步
骤,以消除芳香组织的影响[23] .
1郾 4摇 PCR扩增和测序
试验的 PCR 扩增反应体系为:Genomic DNA
0郾 5 滋L ;10伊buffer (缓冲液,MgCl2) 3 滋L;MgCl2浓
度(视情况添加) 2 滋L;dNTPs (2 mmol·L–1) 0郾 5
滋L ; 正引物(Forward primer,10 mmol·L–1) 1 滋L;
反引物(Reverse primer,10 mmol·L–1) 1 滋L;Taq E
(5 U·滋L–1) 0郾 5 滋L;ddH2O(超纯水)加至总体积
30 滋L郾
根据引物测序长度,PCR 扩增反应和测序策略
可分为 2 类:
1) rbcL和 psbA鄄trnH扩增程序:95 益变性 3 min,
然后是 35 个循环的 95 益变性 30 s+51 益退火 30 s
+72 益延伸 1 min,最后是 72 益延伸 7min[6] . 退火
温度的变化幅度可在 48 ~ 53 益之间调整. 2)matK
扩增程序:95 益变性 3 min,然后是 35 个循环的 95
益变性 30 s+51 益退火 30 s+72 益延伸 90 s,最后是
72 益延伸 7 min[11] .退火温度的变化幅度可在 48 ~
53 益之间调整;循环数可增加至 40. 全部扩增反应
均在东胜龙(Eastwin)热循环仪上完成.测序所使用
的仪器为 ABI 3730 自动测序仪 ( Applied Biosys鄄
tems),测序引物使用 PCR扩增引物.
1郾 5摇 序列拼接、比对和 BLAST搜索
rbcL片段长约 540 bp,对其扩增和测序都比较
容易,通常只需一个反应即可完成测序,全部物种成
功率均达 100% . matK 片段长约 900 bp,需正、反 2
个反应测序,少数物种只能获得一端序列. 本研究
中,rbcL和 matK片段的序列均以 F端引物为正向进
行序列比对和调整. psbA鄄trnH 片段长度范围为
300 ~ 800 bp,约 1 / 3 的个体 1 个反应可以测完(单
独 trnH端,或者单独 psbA端即可),其余 2 / 3 存在单
碱基核苷酸重复(POLY 结构)的干扰需要双向测
序.本研究均以 trnH端引物为正向进行序列比对和
调整.
对于一个反应可以完成的个体,使用 Chromas
2郾 13(Technelysium, Helensvale, Australia),检验序
列测序质量和长度,编辑后保存为 FASTA 格式文
档;对于 2 个反应的个体,使用 DNAStar 的 Seqman
5郾 3(Lasergene, Madison, USA),选定 1 个方向作标
准,双向校准序列,编辑后保存为 FASTA格式文档.
3 个条形码片段编辑和比对工作各有差异. 1)
rbcL片段:该片段的序列排列整齐,没有碱基的插入
或缺失.使用 Chromas 软件检验序列测序质量和长
度,编辑后保存为 FASTA 格式文档作为 BLAST 搜
索文件. 2)matK片段:该片段属于编码基因,不同引
物对测序时得到的序列长度不等,且存在较大变异;
即使用相同的引物测序,得到的序列在不同类群中
也有较大变异.在使用 matK 片段的序列前,需要将
这些粗略的序列进行反向翻译处理. 使用 MEGA 4
软件,反向翻译成核苷酸序列后以比对过的 FASTA
格式输出,其他样本的 matK 序列(每个物种有一个
序列可用)以同样的方式同时进行相互间比对. 3)
psbA鄄trnH片段:该片段的 FASTA文件通过科或目的
2421 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 应摇 用摇 生摇 态摇 学摇 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 23 卷
分类方法进行模块分割处理,以便于系统发育分析.
当样地中一个科只有一个物种时,将其与同目的另
外一个科放在一起进行比对;当一个目只含有一个
物种时,则在系统发育分析时将这个物种的 psbA鄄
trnH序列排除在外.
为保证测序所得序列不会发生误差(如人为因
素导致的顺序紊乱,或者测序污染而得到错误的序
列),对每一条序列在 GenBank 中进行 BLASTn 搜
索[24] .分 3 个片段逐条搜索,并记录到科、属和种时
的最大匹配率.
1郾 6摇 其他森林样地的信息
除了鼎湖山样地作为亚热带森林类型之外,本
研究还筛选出 Holdridge 亚热带湿地类型波多黎各
的 LFDP样地[19,25]、巴拿马的 BCI 样地[18]以及圭亚
那的 Nouragues 样地[17]作为参考. 从已发表的文献
中提取出 PCR 扩增成功率、准确物种识别率、单片
段和片段组合时总体的物种识别率,以此来分析热
带鄄亚热带 2 种森林类型 4 个森林样地中植物 DNA
条形码的一般表现规律. 4 个样地在准确物种识别
率的搜索方法上略有差异,但仍可用于比较分析.其
中,BCI、LFDP 和 DHS 使用的是 BLASTn 方法,而
NRS使用的是 TaxonDNA 方法[26] .本研究定义三片
段条形码片段的综合成功率为:全体物种的 PCR 扩
增成功率和单个物种的准确识别率的乘积,以其评
价 DNA 条形码在该样地中全部木本物种的总体表
现情况.
2摇 结果与分析
2郾 1摇 鼎湖山样地木本植物测序成功率与序列质量
在鼎湖山样地,rbcL、psbA鄄trnH 和 matK 的测序
成功率分别为 100% 、97%和 89% ,其中同时满足 3
个片段测序的成功率为 88% (表 2). rbcL 片段测序
时全部样品仅需一个反应即可,序列的峰型全部显
示正常,获得的序列质量最好. 对于 matK 片段,有
167 个样品可以获得序列,其中 90%的序列峰型显
示正常,剩下 10%的序列经过手工校准后可用. 对
于 psbA鄄trnH,有 182 个样品可以获得序列,其中
56郾 04%的序列峰型显示正常,剩下 43郾 96%的序列
受到 POLY结构干扰,需双向测序后经过手工校准
可用.
摇 摇 在亚热带森林水平上(本文特指 DHS和 LFDP,
下同),matK、psbA鄄trnH 和 rbcL 测序成功率分别为
79郾 7% 、94郾 6%和 95郾 1% ;在热带森林水平上(本文
特指 BCI 和 NRS,下同),matK、psbA鄄trnH 和 rbcL 测
序成功率分别为 68郾 5% 、91郾 5%和 93% . matK 片段
在亚热带样地中的测序成功率(79郾 7% )显著高于
在热带样地的比率(68郾 5% )(图 1).
2郾 2摇 鼎湖山样地木本植物物种识别
在鼎湖山样地,考虑单个条形码片段时,matK
的物种水平识别率最高(79% ),其次是 psbA鄄trnH
(77% )和 rbcL(56% )(图 2).当综合考虑序列扩增
和准确物种识别率时,psbA鄄trnH的综合成功率最高
表 2摇 鼎湖山样地 24 目 51 科 110 属 188 个木本植物分类群的 PCR扩增和测序结果
Table 2摇 PCR and sequence (SEQ) results for 24 orders, 51 families, 110 genera and 188 taxa of trees and shrubs in the
Dinghushan forest plot
引物名称
Primer name
单个片段或组合
Single fragment
or combination
试验项目
Item
目数目
Ordera)
科数目
Familyb)
属数目
Genusc)
分类群数目
Taxa
分类群数目
与总数百分比*
Percentage of
taxa / 188
rbcL 单个片段
Single fragment
扩增 PCR
测序 SEQ
24
24
51
51
110
110
188
188
1
1
matK 单个片段
Single fragment
扩增 PCR
测序 SEQ
-
摇 23**
-
49
-
100
169
167
0郾 90
0郾 89
psbA鄄trnH 单个片段
Single fragment
扩增 PCR
测序 SEQ
-
24
-
51
-
108
184
182
0郾 98
0郾 97
rbcL+matK 任一片段 Either
2 个片段 Both
测序 SEQ
测序 SEQ
24
23
51
49
110
100
188
176
1
0郾 89
rbcL+psbA鄄trnH 任一片段 Either
2 个片段 Both
测序 SEQ
测序 SEQ
24
24
51
51
110
108
188
182
1
0郾 97
matK+psbA鄄trnH 任一片段 Either
2 个片段 Both
测序 SEQ
测序 SEQ
24
23
51
49
110
108
183
166
0郾 97
0郾 88
rbcL+matK+psbA鄄trnH 3 个片段 All 测序 SEQ 23 49 100 166 0郾 88
*百分比值是单个引物或引物组合的 PCR和 SEQ与总分类群数值(188)的比值 For the number of taxa the count for each category was given with
the percentage relative to the total possible listed above; **Ehretia属的 matK片段的序列缺失,且 Ehretia属所在的目在鼎湖山样地只有 1 个物种
分布 matK missing for Ehretia which was an order containing a single species in Dinghushan plot郾 a)有 4 个目只含 1 个物种 4 orders had only one spe鄄
cies; b)有 16 个科只含 1 个物种 16 families had only one species; c)有 72 个属只含 1 个物种 72 genera had only one species郾
34215 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 裴男才: 利用 DNA条形码技术识别植物物种摇 摇 摇 摇 摇 摇
图 1摇 4 个森林样地上 matK、rbcL和 psbA鄄trnH的测序成功率
Fig. 1摇 Sequencing recovery rates of matK, rbcL and psbA鄄trnH
in four forest plots郾
DHS:中国鼎湖山 Dinghushan, China; LFDP:波多黎各的卢奎约森林
动态样地 Luquillo Forest Dynamics Plot, Puerto Rica; BCI:巴拿马的
巴罗科罗拉多岛 Barro Colorado Island, Panama; NRS:法属圭亚那的
努里格研究站 Nouragues Research Station, French Guiana郾 下同 The
same below郾
图 2摇 4 个森林样地上 matK、rbcL和 psbA鄄trnH的准确物种识
别率
Fig. 2 摇 Correct species identification rates of matK, rbcL and
psbA鄄trnH in four forest plots郾
(75% ),其次是 matK(70% )和 rbcL(56% )(图 3).
考虑片段组合时,三片段的组合(matK+ rbcL+psbA鄄
trnH)表现最佳,可以准确识别 188 个样品中 87%以
上的物种,其次是双片段 matK+psbA鄄trnH(85% )、
rbcL+psbA鄄trnH(83% )和 matK+rbcL(81% ). 对于三
位点的组合片段,不能完全准确识别的物种主要集
中在一些多种属,如润楠属、新木姜子属、杜英属、榕
属、冬青属和杜鹃花属等(表 3).在属的水平上,单
片段和组合片段都能识别 92%以上的属.
摇 摇 在亚热带森林样地,matK、psbA鄄trnH 和 rbcL 准
确识别植物到物种水平的概率分别是 89郾 5% 、
87郾 5%和 74郾 8% ;而在热带森林样地,其概率分别
是 80% 、79郾 5%和 66% (图 3). 当考虑测序成功率
和物种识别率的综合表现时,matK、psbA鄄trnH、rbcL、
表 3摇 鼎湖山样地 15 个多种属中三位点 DNA 条形码组合
的鉴定成功率
Table 3摇 Correct identification rates of fifteen multiple鄄spe鄄
cies genera (逸3 species) using a combination of three鄄locus
barcode in the Dinghushan forest plots
科名
Family name
属名
Genus
name
物种数
Number of
species
per
genus
物种水平
鉴定物种数
Number of
correct
identification
at species
level
物种水平
鉴定成功率
Correct
identification
rate at
species
level (% )
Lauraceae Machilus 6 3 50郾 0
Lauraceae Neolitsea 4 1 25郾 0
Lauraceae Lindera 3 3 100郾 0
Lauraceae Litsea 3 3 100郾 0
Phyllanthaceae Antidesma 3 3 100郾 0
Phyllanthaceae Glochidion 3 3 100郾 0
Euphorbiaceae Mallotus 4 4 100郾 0
Moraceae Ficus 9 7 77郾 8
Aquifoliaceae Ilex 8 6 75郾 0
Myrtaceae Syzygium 6 4 66郾 7
Ericaceae Rhododendron 5 3 60郾 0
Elaeocarpaceae Elaeocarpus 4 2 50郾 0
Fabaceae Ormosia 4 2 50郾 0
Symplocaceae Symplocos 4 4 100郾 0
Verbenaceae Clerodendrum 3 3 100郾 0
图 3摇 4 个森林样地上单片段和片段组合的综合成功率
Fig. 3摇 Comprehensive correct identification rates of single and
combined barcode fragments in four forest plots郾
rbcL+psbA鄄trnH、matK+ rbcL 和 matK+ rbcL+psbA鄄trnH
在亚热带森林样地中的概率分别是 70郾 2% 、
82郾 7% 、70郾 2% 、 88% 、85% 和 90% (其中 matK +
psbA鄄trnH 片段组合在 LFDP 缺乏);而 matK、psbA鄄
trnH、rbcL 和 matK+rbcL+psbA鄄trnH 在热带森林样地
中的概率分别是 55% 、73郾 5% 、61郾 5%和 84% (其中
matK+ rbcL + psbA鄄trnH 在 BCI 为 98% ,在 NRS 为
70% )(图 3). 另外,在 NRS 样地,片段组合 rbcL+
psbA鄄trnH、matK+rbcL和 matK+psbA鄄trnH 在 Gonzalez
等[17]研究中没有报道直接的物种识别成功率数据,
4421 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 应摇 用摇 生摇 态摇 学摇 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 23 卷
而单片段 matK、rbcL 和 psbA鄄trnH 的综合成功率约
为 41%和 53% ,由此可估计出片段组合 rbcL+psbA鄄
trnH和 matK+rbcL 在 NRS 样地的综合成功率不超
过 60% .由此获得片段组合 rbcL+psbA鄄trnH 和 matK
+rbcL在热带森林样地中的综合成功率为 77郾 5%和
76% (其中 rbcL+psbA鄄trnH和 matK+rbcL在 BCI中的
综合成功率分别为 95%和 92% ).
3摇 讨摇 摇 论
3郾 1摇 植物 DNA条形码在热带和亚热带森林区域的
表现
本文通过比较单片段和组合片段(两位点和三
位点条形码)的测序成功率和准确物种识别率,说
明 DNA条形码在物种丰富地区(热带和亚热带森
林)的综合成功率. 与单片段和两位点条形码片段
组合相比,三位点 DNA条形码片段组合在热带和亚
热带森林样地中的综合成功率最高,分别在 84%和
90%以上.
研究表明,条形码片段 rbcL的 PCR扩增和测序
成功率最高,在热带和亚热带森林样地分别达 93%
和 90% ~ 100% ;但该片段的准确物种识别率却比
matK 和 psbA鄄trnH 低,在热带和亚热带森林样地仅
有 66%和 75%左右.这说明最通用的片段 rbcL可变
位点最少,造成其在热带和亚热带森林样地近缘类
群中的辨别能力最弱[6,27] .条形码片段 psbA鄄trnH 在
4 个森林样地中的测序成功率都超过 89% ,且在 3
个条形码片段中的准确物种识别成功率最高(4 个
森林样地中的平均值超过 78% ; 在 LFDP 达
90郾 4% ,而在 NRS仅有 57% ).
以往研究表明,片段 matK 的通用性不高. 仅在
兰科植物中,matK 的测序成功率达 90% [1,5] . 本研
究发现,这主要是受限于较低的测序成功率,其在热
带森林样地中只有 68郾 5% ,在植物类群相对简单的
亚热带森林样地中也只有 79郾 7% . 在 matK 测序反
应体系中加入化学物质 DMSO,或者增加几对其他
matK引物参加反应,最终也能提高整体的测序成功
率,如在鼎湖山样地,matK 的综合成功率达 89% ,
高于其他 3 个森林样地 (其中 LFDP 70郾 4% 、BCI
69% 、NRS 68% ).
国际生命条形码联盟推荐叶绿体基因 matK 和
rbcL作为陆生植物的核心片段[5] .本研究表明,这 2
个片段组合在热带森林样地中可以准确识别 76%
的植物,在亚热带森林样地中则可以准确识别 85%
的植物.这说明两位点条形码组合可以作为标准和
快速的策略来辨别区系背景下大部分的植物类群.
而三位点条形码组合(matK+ rbcL+psbA鄄trnH)在热
带、亚热带森林样地中可以准确识别 84%和 90%的
植物.三位点条形码组合比两位点组合具有更高的
综合成功率,应归功于基因间隔区 psbA鄄trnH郾 该片
段在近缘类群(如属间不同物种)上表现出了较好
的分辨能力.这说明核心 DNA条形码片段具有准确
分辨物种的能力,且在局部群落(如区系背景下或
者森林动态样地上)上的表现更佳(另文详述). 另
外,通过增加具有快速进化速率的片段,可以显著提
高近缘类群的分辨率.
3郾 2摇 核心条形码片段在局部群落的表现
研究表明,matK+ rbcL 组合片段在植物类群水
平上的准确物种识别率不高,特别是当目标类群包
含有较多同属种时[10,28],如在 Alnus 属(Betulaceae)
的 23 个物种中, 其准确物种识别率不超过
50% [13],在 Berberis属(Berberidaceae)的 16 个物种
中不超过 23% [14],远低于国际植物条形码工作组
报道的陆生植物 72%的准确物种识别率[5] .这可能
与叶绿体基因本身所包含的可用变异信息位点数量
直接相关.与类群水平上较低的准确物种识别率相
比,matK和 rbcL的组合片段在局部群落的表现却有
较大改观,即使是在物种丰富度较高的热带和亚热
带森林区域,这个组合片段仍能达到较理想的准确
物种识别率.其原因可能是,在局部群落内生长的植
物通常包含较少数量的近缘类群(如同属种较少),
使用 matK和 rbcL的组合片段时提供的可用变异信
息位点数量足够将该区域内的各植物类群归类到相
应的分类位置上,从而解决了准确物种识别的问
题[15] .
随着纬度的升高,物种多样性和同属种数目减
少[29] .在热带森林区域,BCI 样地共有 181 个属,其
中有 22 个多种属(逸3 个物种);NRS 样地共有 143
个属,其中有 28 个多种属. 而在亚热带森林区域,
DHS样地共有 110 个属,其中有 15 个多种属;LFDP
样地共有 108 个属,仅有 7 个多种属.这说明在热带
森林区域中,约有 16%的植物物种暂时不能得到准
确识别,如 Eschweilera、Ficus、 Inga、Nectandra、Ocot鄄
ea、Pouteria和 Psychotria等多种属;而在亚热带森林
区域中,约有 12%的植物物种暂时不能得到准确识
别,主要为 Callicarpa、Ficus、 Ilex、Litsea、Machilus 和
Rhododendron等(表 3).
亚热带森林中本身含有较少的多种属,因此其
样地中的准确物种识别率高于热带森林区域. 由此
推断,在温带区域[30-31],植物 DNA 条形码的准确物
种识别率可能会更高.如果植物 DNA条形码的准确
54215 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 裴男才: 利用 DNA条形码技术识别植物物种摇 摇 摇 摇 摇 摇
物种识别功能在不同森林类型得到应用,将大力推
动系统分类和植物区系等基础性研究的发展[32],也
有助于确立这一新兴分子技术在生物多样性保护等
应用性研究中的地位.
致谢摇 感谢中国科学院华南植物园分子生态学研究组为本
研究部分试验提供平台. 感谢中国鼎湖山、波多黎各的 Lu鄄
quillo、巴拿马的 BCI和法属圭亚那的 Nouragues 4 个森林样
地的数据共享.
参考文献
[1]摇 Lahaye R, van der Bank M, Bogarin D, et al. DNA
barcoding the floras of biodiversity hotspots. Proceedings
of the National Academy of Sciences of the United States
of America, 2008, 105: 2923-2928
[2]摇 Pennisi E. Wanted: A barcode for plants. Science,
2007, 318: 190-191
[3] 摇 Webb CO, Slik JWF, Triono T. Biodiversity inventory
and informatics in Southeast Asia. Biodiversity and Con鄄
servation, 2010, 19: 955-972
[4]摇 Hebert PDN, Ratnasingham S, deWaard JR. Barcoding
animal life: Cytochrome c oxidase subunit 1 divergences
among closely related species. Proceedings of the Royal
Society of London Series B鄄Biological Sciences, 2003,
270: S96-S99
[5]摇 CBOL Plant Working Group. A DNA barcode for land
plants. Proceedings of the National Academy of Sciences
of the United States of America, 2009, 106: 12794 -
12797
[6]摇 Kress WJ, Erickson DL. A two鄄locus global DNA bar鄄
code for land plants: The coding rbcL gene complements
the non鄄coding trnH鄄psbA spacer region. PLoS ONE,
2007, 2: e508
[7]摇 Chase MW, Cowan RS, Hollingsworth PM, et al. A
proposal for a standardised protocol to barcode all land
plants. Taxon, 2007, 56: 295-299
[8]摇 Jurado鄄Rivera JA, Vogler AP, Reid CAM, et al. DNA
barcoding insect鄄host plant associations. Proceedings of
the Royal Society B鄄Biological Sciences, 2009, 276:
639-648
[9] 摇 van de Wiel CCM, van der Schoot J, van Valkenburg
JLCH, et al. DNA barcoding discriminates the noxious
invasive plant species, floating pennywort (Hydrocotyle
ranunculoides L. f. ), from non鄄invasive relatives. Mo鄄
lecular Ecology Resources, 2009, 9: 1086-1091
[10]摇 Pang X, Song J, Zhu Y, et al. Applying plant DNA
barcodes for Rosaceae species identification. Cladistics,
2010, 26: 1-6
[11]摇 Fazekas AJ, Burgess KS, Kesanakurti PR, et al. Multi鄄
ple multilocus DNA barcodes from the plastid genome
discriminate plant species equally well. PLoS ONE
2008, 3: e2802
[12]摇 Newmaster SG, Fazekas AJ, Steeves RAD, et al. Tes鄄
ting candidate plant barcode regions in the Myristicace鄄
ae. Molecular Ecology Resources, 2008, 8: 480-490
[13]摇 Ren BQ, Xiang XG, Chen ZD. Species identification of
Alnus ( Betulaceae) using nrDNA and cpDNA genetic
markers. Molecular Ecology Resources, 2010, 10: 594-
605
[14]摇 Roy S, Tyagi A, Shukla V, et al. Universal plant DNA
barcode loci may not work in complex groups: A case
study with Indian Berberis species. PLoS ONE, 2010,
5: e13674
[15]摇 Chase MW, Fay MF. Barcoding of plants and fungi.
Science, 2009, 325: 682-683
[16]摇 Starr JR, Naczi RFC, Chouinard BN. Plant DNA bar鄄
codes and species resolution in sedges (Carex, Cyper鄄
aceae). Molecular Ecology Resources, 2009, 9: 151 -
163
[17]摇 Gonzalez MA, Baraloto C, Engel J, et al. Identification
of Amazonian trees with DNA barcodes. PLoS ONE,
2009, 4: e7483
[18]摇 Kress WJ, Erickson DL, Jones FA, et al. Plant DNA
barcodes and a community phylogeny of a tropical forest
dynamics plot in Panama. Proceedings of the National
Academy of Sciences of the United States of America,
2009, 106: 18621-18626
[19]摇 Kress WJ, Erickson DL, Swenson NG, et al. Advances
in the use of DNA barcodes to build a community phy鄄
logeny for tropical trees in a Puerto Rican forest dynam鄄
ics plot. PLoS ONE, 2010, 5: e15409
[20]摇 Pei N, Lian JY, Erickson DL, et al. Exploring tree鄄
habitat associations in a Chinese subtropical forest plot
using a molecular phylogeny generated from DNA bar鄄
code loci. PLoS ONE, 2011, 6: e21273
[21]摇 Ye W鄄H (叶万辉), Cao H鄄L (曹洪麟), Huang Z鄄L
(黄忠良), et al. Community structure of a 20 hm2 low鄄
er subtropical evergreen broadleaved forest plot in Ding鄄
hushan, China. Chinese Journal of Plant Ecology (植
物生态学报), 2008, 32(2): 274-286 (in Chinese)
[22]摇 Doyle JJ, Doyle JL. A rapid DNA isolation procedure
for small quantities of fresh leaf tissue. Phytochemical
Bulletin, 1987, 19: 11-15
[23]摇 Khanuja SPS, Shasany AK, Darokar MP, et al. Rapid
isolation of DNA from dry and fresh samples of plants
producing large amounts of secondary metabolites and
essential oils. Plant Molecular Biology Reporter, 1999,
17: 1-7
[24]摇 Altschul SF, Madden TL, Sch覿ffer AA, et al. Gapped
BLAST and PSI鄄BLAST: A new generation of protein
database search programs. Nucleic Acids Research,
1997, 1: 3389-3402
[25]摇 Ewel JJ, Whitmore JL. The ecological life zones of
Puerto Rico and the United States Virgin Islands
(Research Paper ITF鄄18). Rio Piedras, Puerto Rico:
Institute of Tropical Forestry, USDA Forest Service,
1973
[26]摇 Meier R, Shiyang K, Vaidya G, et al. DNA barcoding
and taxonomy in Diptera: A tale of high intraspecific
variability and low identification success. Systematic Bi鄄
ology, 2006, 55: 715-728
[27] 摇 Newmaster SG, Fazekas AJ, Ragupathy S. DNA bar鄄
coding in land plants: Evaluation of rbcL in a multigene
tiered approach. Canadian Journal of Botany, 2006,
84: 335-341
[28]摇 Gao T, Yao H, Song J, et al. Evaluating the feasibility
of using candidate DNA barcodes in discriminating spe鄄
cies of the large Asteraceae family. BMC Evolutionary
Biology, 2010, 10: 324
[29]摇 Federov AA. The structure of the tropical rain forest and
speciation in the humid tropics. Journal of Ecology,
1966, 54: 1-11
[30]摇 Huntley B. Species鄄richness in north鄄temperate zone for鄄
ests. Journal of Biogeography, 1993, 20: 163-180
[31]摇 Wu Z鄄Y (吴征镒), Chen X鄄Q (陈心启). Flora
Reipublicae Popularis Sinicae, Tomus 1. Beijing: Sci鄄
ence Press, 2004 (in Chinese)
[32]摇 Pei N鄄C (裴男才), Zhang J鄄L (张金龙), Mi X鄄C (米
湘成), et al. Plant DNA barcodes promote the develop鄄
ment of phylogenetic community ecology. Biodiversity
Science (生物多样性), 2011, 19(3): 284-294 ( in
Chinese)
作者简介 摇 裴男才,男,1984 年生,博士,助理研究员. 主要
从事植物系统发育和群落生态学研究, 发表论文 6 篇.
E鄄mail: nancai. pei@ gmail. com
责任编辑摇 李凤琴
6421 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 应摇 用摇 生摇 态摇 学摇 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 23 卷