免费文献传递   相关文献

Trends of iFlora by Literature and Information Analysis

从文献情报分析看iFlora 的发展趋势



全 文 :从文献情报分析看 iFlora的发展趋势*
杨摇 雅1, 王雨华1**, 杜摇 宁1, 王春明2
(1 中国科学院昆明植物研究所科技信息中心, 云南 昆明摇 650201; 2 中国科学院成都文献情报中心, 四川 成都摇 610041)
摘要: 在网络化、 信息化逐渐改变人们学习、 认知和生活的背景下, 本文检索并分析了与 iFlora研究相关
的 DNA条形码、 生物多样性信息库、 基因测序技术、 移动鉴定设备等研究论文和情报, 取得下列结果:
(1) 植物 DNA条形码的研究对象以及研究领域在不断延伸和扩展, 但寻找高分辨率的 DNA条码和组合片
段仍是研究热点, 相关的植物分类学、 系统发育与演化、 生态学、 植物多样性等研究也在快速发展; (2)
生物多样性信息数据库建设爆发式增长, 为 iFlora的知识积累和扩展奠定了基础; (3) 第三代 DNA 测序
技术的发展, 快速测序设备的小型化将成为可能; (4) 物种认知和识别的初级移动设备已经出现; (5) 信
息技术与植物科学等研究的结合, 促进跨领域的研究合作和产品开发。 本文讨论了 iFlora研究计划, 表明
其是未来植物多样性研究的发展趋势。
关键词: 文献计量分析; 植物 DNA条形码; 数据库; 新一代植物志; 研究趋势
中图分类号: G 250. 2, Q 948. 2摇 摇 摇 摇 文献标识码: A摇 摇 摇 摇 文章编号: 2095-0845(2012)06-546-09
Trends of iFlora by Literature and Information Analysis
YANG Ya1, WANG Yu鄄Hua1**, DU Ning1, WANG Chun鄄Ming2
(1 Science and Technology Information Center, Kunming Institute of Botany, Chinese Academy of Sciences,
Kunming 650201, China; 2 Chengdu Branch of National Science Library,
Chinese Academy of Sciences, Chengdu 610041, China)
Abstract: Advances in networking and information technology are gradually changing our ways of learning, cognition
and living. This paper employed the methods of bibliometry and retrieval to analyze research papers and information
about DNA barcoding, biodiversity database, DNA sequencing technology and mobile identification devices which
are related to iFlora research. The results indicate that: (1) The research field of plant DNA barcoding is expan鄄
ding, but the exploration of a high鄄resolution DNA barcode and combinations of barcodes is still on the top of the a鄄
genda. And integrated studies of plant taxonomy, plant systematics and evolution, ecology, plant diversity etc. are
constantly developing; (2) The explosive growth of biodiversity information databases provides the foundation for the
accumulation and expansion of knowledge about iFlora; (3) The third鄄generation sequencing technology has emerged
and rapidly developing. The miniaturization of sequencing equipment will soon become feasible; (4) Only a few ex鄄
perimental devices which can assist with the identification of plant species have appeared so far; (5) A cyberin鄄
frastructure collaborative for the plant sciences promote interdisciplinary research and product development. Finally,
the paper concludes with a discussion of the iFlora research plan and shows that it is an inevitable trend in future
studies on plant diversity.
Key words: Bibliometry; Plant DNA barcoding; Database; iFlora; Research trends
植 物 分 类 与 资 源 学 报摇 2012, 34 (6): 546 ~ 554
Plant Diversity and Resources摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 DOI: 10. 3724 / SP. J. 1143. 2012. 12142
*
**
基金项目: 中科院国家科学图书馆可持续服务能力建设子项目; 国家科技部科技基础工作专项项目; 国家高科技研究发展计划
(863 计划) (2012AA021801); 中国科学院大科学装置开放研究项目 (2009鄄LSFGBOWS鄄01)
通讯作者: Author for correspondence; E鄄mail: wangyuhua@ mail. kib. ac. cn
收稿日期: 2012-11-05, 2012-11-09 接受发表
作者简介: 杨摇 雅 (1986-) 女, 硕士, 主要从事图书情报研究。 E鄄mail: yangya@ mail. kib. ac. cn
摇 iFlora是为植物学家、 政府部门、 行业和公
众提供的便捷、 准确识别植物的新一代 “智能
植物志冶 (李德铢等, 2012)。 它涉及多个学科复
杂的研究问题和运行环境, 需要跨学科情报资料
的整合, 才能够更好地体现相关研究的最新成
果。 本文综合运用文献情报分析的手段和方法,
通过选定统计源, 对与 iFlora 研究相关的 DNA
条形码、 生物多样性信息库、 基因测序技术、 移
动鉴定设备等研究论文和情报信息进行了统计分
析和追踪, 以期为 iFlora的研制提供相关资料。
1摇 数据源与研究方法
本文检索了多个国内外数据库和相关研究机
构、 研究平台网站。 文献信息主要来自于 Science
Citation Index Expanded 数据库、 Conference Pro鄄
ceedings Citation Index鄄Science 数据库、 Current
Chemical Reactions数据库、 China National Knowl鄄
edge Infrastructure数据库以及相关的 iPlant、 GBIF、
iBOL、 eFlora等研究机构和研究平台网站。 检索
时间为各数据库的起始时间到 2012 年 9 月 10
日, 并利用 WOS 引文分析工具、 Citespace 等文
献情报分析的手段和方法对相关数据进行了文献
数据挖掘和可视化分析。
2摇 iFlora相关研究进展
2. 1摇 植物 DNA条码
2. 1. 1摇 研究领域概况摇 文献总量反映了一定时
期内科学研究活动的绝对产出, 是衡量科研活动
的一个重要指示因子 (Moed, 2002)。 通过 Sci鄄
ence Citation Index Expanded 数据库, 检索到整
个 DNA条形码研究领域发表了 2415 篇文献 (截
止 2012 年 9 月 10 日), 其中植物 DNA条形码相
关文献有 490 篇。 以 ISI分类来看, 相对植物DNA
条形码, 动物 DNA 条形码的研究开始更早, 但
植物 DNA条形码研究从 2008 年起增速加快, 成
为研究热点之一 (图 1)。
目前共有 64 个国家涉入植物 DNA条形码研
究领域, 其中美国、 加拿大等国家相关研究开始
较早, 中国的相关研究论文从 2008 年开始出现,
但增速较快。 目前发表文章较多的国家依次是美
国 (135 篇)、 中国 (85 篇)、 加拿大 (61 篇)、
法国 (49 篇)。 参与研究的机构有 210 个, 中国
科学院虽然进入该领域时间较晚, 但论文总量目
前排在世界第一位, 其次是加拿大圭尔夫大学、
中国医学科学院药物研究院、 美国史密森研究
院。 从研究论文影响力来看, 被引用次数最高的
文章是美国史密森研究院 John Kress教授推荐的
有花植物 DNA条形码的文章 (Kress 等, 2005)。
依据篇均被引用次数, 美国 (22. 33)、 加拿大
(28. 78) 和新西兰 (34. 61) 的研究论文受关注
程度较高, 中国的研究论文因为发表较晚, 篇均
被引用次数为 5. 65, 相对较低。 在该领域影响
力较高的机构是加拿大圭尔夫大学 (45. 19) 和
美国史密森研究院 (32. 16)。
DNA条形码研究吸引了超过一千名科研人
员的参与, 研究论文产出最多的作者是中国医
学科学院药物研究院陈士林 ( 27 篇, 篇均被
引用次数为 10. 23)。 研究影响力最高的是美国
史密森研究院 John Kress (篇均被引用次数达
78. 15) 和加拿大圭尔夫大学的 Paul Hebert (篇
均被引用次数达 73. 62)。 刊载植物 DNA 条形码
相关研究最多的期刊是 《 PLoS ONE》 51 篇、
《MOLECULAR ECOLOGY RESOURCES 》 38 篇、
《JOURNAL OF SYSTEMATICS AND EVOLUTION 》
20 篇和 《PLANTA MEDICA 》 19 篇。
2. 1. 2摇 研究主题分析摇 利用 Citespace 分析相关
领域发表论文, 得到植物 DNA研究领域的高频关
键词 (表 1, 图 2), 可以看出植物 DNA条形码的
研究对象以及研究领域一直在不断延伸和扩展。
表 1摇 植物 DNA条形码研究关键词变化统计表
Table 1摇 Keywords change statistics of plant
DNA barcoding study
部分高频关键词 (按出现频率排序)
研究内容 植物类 条形码类
identification land plants rbcL
taxonomy flowering plants matK
sequences fungi ITS
phylogeny Fabaceae tmH鄄psbA
evolution tropical forests psbA鄄trnH
diversity ginseng trnL鄄F
molecular systematics ferns rpoC1
biogeography angiosperms rbcL
7456 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 杨摇 雅等: 从文献情报分析看 iFlora的发展趋势摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
图 1摇 植物 DNA条形码主要国家和机构研究情况
Fig. 1摇 Major countries and institutions in plant DNA barcoding study
图 2摇 植物 DNA条形码研究关键词聚类图
Fig. 2摇 Index word clustering map of plant DNA barcoding study
845摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 植 物 分 类 与 资 源 学 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 34 卷
摇 摇 在 DNA 条形码研究方面, 2009 年 CBOL 植
物工作组建议将 rbcL和 matK作为陆地植物通用
的条形码 ( CBOL Plant Working Group, 2009)。
叶绿体基因间隔区 psbA鄄trnH 和核基因片段 ITS
也被提议可以作为陆生植物的标准 DNA 条形码
核心片段 ( Kress 等, 2005; Hollingsworth 等,
2011), 但寻找高分辨率的 DNA条码和组合片段
仍是植物条形码研究的热点: (1) 主要的单片段
研究: rbcL 被大部分学者作为研究对象 (129
篇), 其次是 matK (101 篇)、 ITS (97 篇) 和
trnH鄄psbA (79 篇)。 近年来, 大多数研究者都在
不同物种中验证 4 个被广泛建议的 DNA 条形码
的有效性。 rbcL和 matK 作为核心条形码, 受到
的关注度最高。 rbcL具有通用性高、 易扩增、 易
对比的特点, 可以区分不同属物种, 但在种的区
分上效果不理想 (Kress和 Erickson, 2007; Faze鄄
kas 等, 2008; Bafeel 等, 2012)。 Kress 等 (2007)
采用 matK对 48 属 96 种植物的成功扩增率仅为
39. 3% ; Fazekas等 (2008) 利用该片段对 92 种
植物的正确识别率仅达到 56% , 因此 matK通用
性引物的设计和效果验证将是下一步工作重点
(唐建阳等, 2009)。 近年来, matK 通用引物在
被子植物中验证了具有很好的适用性 (Yu 等,
2011), 目前 matK 也常用在遗传关系分析
(Wang 等, 2012) 和系统发育研究方面 ( Liu
等, 2012; Crawley和 Hilu, 2012)。 ITS作为 DNA
条形码鉴定物种的潜力得到了一些研究者的认
可, ITS2 被提出可作为通用 DNA 条形码来鉴定
植物和动物 ( Chen 等, 2010; Yao 等, 2010),
近年来, 针对其在药用植物方面的探讨相对较
多。 2012 年的文献中, ITS2 在鉴定唇形科药用
植物 (Han 等, 2012)、 五加科 (Liu 等, 2012)
等药用植物上有很好的表现。 根据对主要来自中
国的种子植物的 4 个 DNA 候选条形码片段的综
合分析, 中国植物条形码研究团队 (China Plant
BOL Group) 建议将 ITS 作为种子植物的核心
DNA 条形码 (Li 等, 2011)。 trnH鄄psbA 间隔区
是叶绿体基因进化速率较快的片段之一, 并且易
于设计引物 (Shaw等, 2005), 鉴于该片段在扩
增成功率和物种识别率上的出色表现, 建议
trnH鄄psbA应作为条形码片段组合中重要的非编
码区片段之一 (Kress和 Erickson, 2007; Fazekas
等, 2008; Chen 等, 2010)。 区分近缘及近期分
化物种是 DNA条形码研究的重要挑战, 仅 2012
年就有 37 篇文献涉及 trnH鄄psbA的讨论。 (2) 片
段组合情况: 随研究的不断深入, 研究人员发现
单一片段 DNA 条形码存在一定的局限性, 提出
需要多片段组合。 Kress 等 (2007) 提出使用
rbcL+ trnH鄄psbA 对陆生植物进行识别和鉴定;
Chase等 (2007) 提出了 rpoC1 + rpoB +matK 或
rpoC1 + matK + trnH鄄psbA 的 组 合; Lahaye 等
(2008) 和 Newmaster 等 (2008) 均提出了 matK
+trnH鄄psbA 的组合; 而 Hollingsworth 等 (2009)
通过对 7 个候选 DNA 条形码的评估分析认为,
三个 DNA 片段组合 ( rbcL + trnH鄄psbA + matK,
rpoC1+rbcL+ trnH鄄psbA 和 rpoC1+rbcL+matK) 均
能成功鉴定 57% ~ 60% 的物种, 建议 rbcL,
rpoC1, matK 和 trnH鄄psbA 间的一些组合可作为
陆生植物条形码的解决方案。 通过综合评价分
析, CBOL植物工作组建议将 rbcL+matK 组合作
为陆地植物的核心条形码 (CBOL Plant Working
Group, 2009)。 rbcL, matK 和 trnH鄄psbA 三个条
形码片段单独用于识别热带雨林木本植物的准确
率分别为 62% 、 55%和 74% ; 如果使用 rbcL+
matK两个片段组合, 准确率约为 76% ; 如果使
用 rbcL+matK+trnH鄄psbA 三个片段组合, 准确率
能提高至 84% (Kress等, 2009)。
在研究主题进展方面, 研究较多的是陆地植
物、 开花植物和药用植物。 2011 年和 2012 年出
现最多的植物类关键词是豆科植物、 蔷薇科植物
和药用植物, 2012 年还出现了对无开花种子植
物的研究 (Pang 等, 2012), 验证了用 ITS 可以
有效区分无开花种子植物。 药用植物的鉴定成为
近年来相关研究的热点 (51 篇), 以中国研究最
多 (29 篇)。 在药用植物领域, 出现次数最多关
键词的是 ITS2、 matK和 trnH鄄psbA。 ITS2 被推荐
作为药用植物的通用 DNA 条形码 ( Chen 等,
2010)。
物种识别和鉴定是植物 DNA 条形码研究的
重要内容, 关键词 “鉴定 (identification)冶 在文
献中出现的频率最高 (120 次)。 除寻找高分辨
率的 DNA条码和组合片段外, 其他出现频率较
高的关键词是: (1) 系统发育研究。 如结合群落
生态学进行植物群落系统发育研究 (Kress 等,
9456 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 杨摇 雅等: 从文献情报分析看 iFlora的发展趋势摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
2009; Gonzalez等, 2010); (2) 植物分类学。 如
外来入侵物种和濒危物种鉴定 (Dick 和 Kress,
2009), 发现新种和疑难物种 ( Pennisi, 2007;
Lahaye等, 2008), 如 2012 年一种来自于安第斯
山云雾森林的灌木于 4 月被正式分类命名, 这一
发现开创了 DNA 条形码定义新植物种类的先河
(Filipowicz等, 2012); (3) 植物多样性研究。 如
利用 DNA条形作为植物类群物种多样性识别和
检测工具 (Armenise等, 2012), 通过 DNA 条形
码研究植物根系群落多样性 ( Kesanakurti 等,
2011), 进行某一地区植被调查 (De Mattia 等,
2012) 等。 同时, DNA 条形码研究的应用已扩
展到日常生活中, 加拿大圭尔夫大学使用 DNA
条形码来验证 90 多个广泛使用的植物和动物的
天然保健品成分, 包括升麻、 绿茶和圣约翰草等
(Lauren等, 2012)。
2. 2摇 生物多样性信息平台
伴随着生物信息学及计算机科学的发展, 生
物多样性信息数据库建设爆发式增长。 根据生物
多样性信息学标准 (TDWG) 网站 (http: / / www.
tdwg. org / biodiv鄄projects / ) 的统计, 目前有超过
679 个生物多样性信息学研究项目, 62 个生物多
样性信息网络数据库 (截至 2012 年 9 月 10 日)。
生物多样性数据和信息服务的内容不断扩展, 已
经覆盖了分类学、 生态学、 分子生物学、 生物地
理学和生物多样性等相关研究领域。
现有生物多样性信息平台类型多样, 包括
(1) 物种信息数据库, 如物种 2000、 中国植物
物种信息数据库 (DCP) 等; (2) 标本数据库,
如中国数字植物标本馆; (3) 图像数据库, 如牛
津大学的 The Virtual Field Herbarium 项目; (4)
文献信息数据库, 如生物多样性遗产图书馆
BHL等。 由于生物多样性工作在国际间的交流
和合作增多, 综合型和跨学科的国际生物多样性
平台的建设开始成为主流, 全球生物多样性信息
网络 (GBIF) 通过多样性原始数据的共享, 将
目前世界上现存的生物多样性数据库及信息系
统整合, 形成一个面向全世界用户的关于全球生
物多样性的综合性信息服务系统 (http: / / www.
gbif. org / )。
此外, DNA 条形码的出现及发展, 丰富了
生物多样性信息学的内容, 大量的生物 DNA 条
形码数据平台相继建立。 国际生命条形码计划
(iBOL, International Barcode of Life) 由加拿大科
学家 Paul Hebert 等发起, 于 2010 年正式启动,
目标是 5 年获得至少 50 万个物种的 DNA条形码
标准序列, 其中包括 10 万种陆生植物, 并建立
通用的实验标准和数据平台。 iBOL 的主要科学
成果是全球条形码 (BOLD) 系统 (www. bold鄄
systems. org), 2012 年 iBOL 正式成为 GBIF 的参
与者。 生命条形码咨询委员会 (Consortium Bar鄄
coding of Life, CBOL) 已启动了一系列的 DNA条
形码计划, 包括: 鸟类 ABBI、 鱼类 FISH鄄BOL、
海洋生物 MarBOL、 实蝇 TBI、 蚊子 MBI、 蜜蜂
Bee鄄BOL等, 并建立了国际植物条形码工作组
(CBOL Plant Working Group), 目前已进入大规
模的标本收集、 测序、 物种鉴定等阶段。
除了这些大型数据平台, 各国科学家也在探
索建立自己的 DNA 条形码数据库。 例如, 香港
大学建立药材 DNA 数据库 (MMDBD), 这项工
作提供了一个整合的药材 DNA 条码资料库和生
物信息学工具, 可以进行数据存储、 分析和促进
药材鉴定交流 (Lou 等, 2010)。 中国西南野生
生物种质资源库建立了 “中国重要生物类群
DNA条形码数据库冶 (http: / / www. pbl. csdb. cn)。
韩国基于亚洲生物多样性建立了 BioBarcode数据
库 (Lim等, 2009), BioBarcode数据库可以免费
为亚洲 DNA条码技术研究人员提供亚洲生物多
样性资源。 韩国生命数据库 (KBOL, http: / / ko鄄
reabarcode. org) 是一个基于 Web的数据库系统,
用于编译大量的 DNA 条形码数据和鉴定未知的
生物标本, 用户不仅可以获取 DNA 条形码和生
物信息学数据, 也可以藉此平台开展资源保护工
作, 包括环境管理、 监测和检测有机体指标。
在数据库开发方面, 加拿大圭尔夫大学在
DNA条码的研究中一直处于世界领先水平,
2009 年其在 DNA 条形码数据库的基础上开发了
“The DNA Barcode Linker冶 工具, 可以用 Google
的方法来检索条形码, 它提供了一个在网络上搜
索序列强大和有效的解决方案, 以及更快捷地访
问 DNA条码大型序列库的服务 (Hajibabaei 等,
2009)。
2. 3摇 DNA测序技术
高通量、 低成本的 DNA 测序技术成为后基
055摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 植 物 分 类 与 资 源 学 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 34 卷
因组时代的挑战之一。 经过了第一代的 Sanger
测序时代, 第二代以高通量测序为主, 第二代测
序技术与第一代 Sanger 测序法的原理都是基于
边合成边测序的思想, 但第二代的高通量测序技
术速度快、 成本低, 使其在植物全基因组测序、
植物转录组测序、 小分子 RNA 研究等生命科学
研究领域迅速得到广泛应用。 目前, 第三代测序
技术已经出现, 结合了单分子测序并继承了高通
量测序的优点, 其中正在研发的纳米孔单分子技
术则更是在原理上做出本质变革 (孙海汐和王
秀杰, 2009)。 对于纳米孔测序技术而言, 最大
挑战之一是, DNA 链通过纳米孔的速度太快,
以致来不及对碱基进行检测, 因此目前的研究一
方面尝试减缓 DNA 通过的速度, 另一方面构建
更快的检测设备。 2010 年美国华盛顿大学物理
学家领导的研究小组结合生物和纳米技术, 在纳
米孔内对 DNA进行快速测序, 研制出 DNA阅读
器。 这种纳米微孔只有 1 个纳米大小, 仅够用来
测量一个 DNA的单分子链 (Butler 等, 2008; Der鄄
rington等, 2010)。 为了能获得可行的、 易于操控
的测序平台, 该研究小组提高了蛋白纳米孔的效
用, 最新报道了第三代 DNA测序技术新机制, 即
纳米孔检测核酸碱基数增加至 20 ~30 个 (Manrao
等, 2012), 这使纳米孔测序的研究更进一步。
纳米级别的孔径保证了检测具有良好的持续性,
所以测序的准确度非常高。 使用纳米孔测序法进
行检测, 使得便宜、 快速地进行 DNA 测序成为
可能。
2. 4摇 移动识别设备
在早期的 DNA 条形码研究中开始出现了便
携式装置设想 ( Janzen, 2004), 但目前还没有
文献报道成功实现 DNA条形码的移动识别设备。
加拿大圭尔夫大学一直是手持设备构想的有力推
动者, 并致力于手持识别设备的开发, 在发表的
很多文章中都探讨了手持识别设备开发的实现,
如提出组织片段插入到扫描仪后, 用户会收到一
个即时的现场鉴定动物或植物的设想 (Singer 和
Hajibabaei, 2009), 考虑简化分析链以助于发展
手持式条形码设备 (Ivanova, 2009) 等。 圭尔夫
大学主导的 iBOL项目中一个主要的研究核心就
是联合相关信息技术专家尝试研发出便携式的
DNA条形码移动识别设备, 可以直接链接到
BOLD数据库。
2012年美国加州的沿海海洋生物实验室发布
了第一款 iPhone 应用程序 “DNA 条形码助理冶
(http: / / www.dnabarcodingassistant. org / )。 “DNA 条
形码助理冶 是一个新的移动技术应用程序, 提供
了一个直观的界面, 可从国际生命条码 (iBOLD)
项目获取元数据。 通过唯一标识符和编译记录,
使用户能够获取分类标识、 数码影像、 地理空间
数据以及物种详细信息。 标本记录可以导出到
iPhone或很容易导入到 Excel电子表格。
除 DNA条形码外, 图像识别也是移动识别
设备的关键技术热点。 美国史密森研究院、 哥伦
比亚大学和马里兰大学开发了世界上第一个植物识
别的移动应用程序—Leafsnap (Belhumeur, 2008)。
Leafsnap通过计算机视觉图像技术将叶片图像与
数据库进行对比, 用户可以快速比较与提供照片
的标本是否属于同一物种, 并由此建立了 Leafs鄄
nap系统, 与 iPhone等相结合, 实现手持设备的
应用。 虽然该移动设备不是使用 DNA 数据, 但
是通过图像对比, 得到结果的正确率也达到
80%以上。 DNA 数据远程获取和图像识别都是
对移动识别设备的一种尝试, 对于真正实现移动
识别设备来说, 必要的技术还有待开发, 未来所
面临的挑战在于如何整合这些技术并降低成本。
2. 5摇 整合性研究
2. 5. 1摇 基础信息数字化整合利用摇 物种及其地
理分布是生物多样性基础数据。 植物志作为一种
记载物种信息及其地理分布的传统载体, 随着网
络化时代的到来也在逐渐发生转变。 最先受到网
络化影响的就是电子化植物志的出现。 2006 年
就有文章报道通过 Flora of China 计划实现了
eFloras ( http: / / www. efloras. org / ) 的开发, 通
过访问网上的电子植物志, 用户可以在线浏览植
物区系的信息, 并可以按名称搜索, 不过, 植物
志数字化开始的时间远比文献报道早得多。 2012
年 “国际生物多样性公约冶 第十届缔约国大会
一致通过的最新的 《全球植物保护战略 (2011-
2020)》 (GSPC), 提出希望全世界植物研究机构
共同合作, 力争在 2020 年完成 “世界全部已知
植物的在线植物志冶 ( online flora of all known
plants)。 这一构想将植物志的数字化和整合推向
一个新高峰。
1556 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 杨摇 雅等: 从文献情报分析看 iFlora的发展趋势摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
此外, 很多网站已经开始提供物种编目信息
的数字化, 比较早期的是邱园索引 (Index Kew鄄
ensis)、 国际植物学名索引 ( International Plant
Name Index, IPNI)、 分类学信息系统 (Integrated
Taxonomic Information System, ITIS) 等。 其中最
有影响力的是物种 2000, 主要建立了一个包含
全球主要生物类群的物种工作名录, 提供免费下
载和使用。 全球生物多样性信息学组织 GBIF 也
发起了全球分类名称架构 (Global Name Archi鄄
tecture, GNA) 项目, 力图建立一个多层次的名
称数据体系, 联合多个信息源, 整合全球分类名
称信息, 从而促进生物多样性研究和利用。
2. 5. 2摇 跨领域研究计划摇 计算机技术、 网络基
础设施与现代植物学研究的结合是未来植物科学
的发展趋势。 目前在这方面的相关计划和研究数
量还不多。 2008 年美国国家科学基金 ( NSF)
资助开发的探索物种起源的 iPlant 计划, 研究大
型网络基础设施与植物科学研究的结合, 创造了
一个大型的网络协作平台。 该项目是基于网络基
础设施的合作, 不仅是对纯粹的网络基础设施的
利用, 还涉及协同研发平台的构建。 生物学家、
计算机信息科学家和工程师通过这个平台, 利用
科学计算和网络基础设施共同来解决生命科学上
的重大问题。 该项目优先的目标是建设 “大规
模冶 系统进化树, 了解植物物种关系、 基因家
族的演化, 解决分类学问题等。 目前已取得了一
些重要进展, 如使用系统进化树讨论几个大的被
子植物类群的多样性 (Smith, 2011); 同时还开
发了 “Discovery environment冶 工具, 集成了现
有的生物信息学工具, 可以在远程高性能计算资
源上无缝运行。 其中 “生命之树 (Tree of life)冶
可视化工具创新了系统进化树的展现方式, 能够
帮助科研人员跟踪基因组序列, 研究植物迁移、
适应气候变化的方式等。 这项跨领域的合作汇集
了植物学、 生物信息学、 计算科学和高性能计
算的优势, 极大地促进了植物学研究领域的创
新发展。
3摇 结语
综上所述, 通过相关分析表明: (1) 植物
DNA条形码作为 iFlora的组成要素之一, 其研究
对象以及研究领域在不断延伸和扩展。 目前寻找
高鉴定分辨率的 DNA 条码和组合片段仍是研究
热点。 同时, 国际上的研究者们开始将选定的条
形码应用于生命科学多个研究领域, 并逐步建立
完整的条形码数据库以及开发各种应用工具;
(2) 生物多样性信息数据库建设爆发式增长, 综
合型和跨学科的国际性生物多样性平台开始出
现, 大量的生物 DNA条形码数据平台相继建立,
提供了海量的生物信息学数据和知识; (3) 分子
测序已进入第三代测序技术时代, 纳米孔测序法
的研究进展, 使得精确、 快速地进行 DNA 测序
成为可能; (4) 目前还未能真正实现 DNA 条形
码的便携式移动设备, 但一些基于不同理念的初
级植物物种识别设备已经出现, 相关技术在不断
完善和发展中; (5) 电子植物志, 以及未来 GSPC
和 GNA构想的实施, 意味着整合的、 数字化的、
基于网络的植物志时代已经到来; 而随着更多像
iPlant这样的跨领域计划出现, 信息技术与植物
科学研究的结合, 不同学科和领域之间的合作,
将成为植物科学的一个发展趋势。
摇 摇 可以预见, 随着未来植物 DNA 条形码技术
的发展, 植物 DNA 条形码标准数据库的不断扩
充和完善都将为 iFlora的实施提供丰富的数据资
源和技术条件; 相关研究对物种准确快速鉴定,
植物多样性信息的快速获取和使用的需求也将催
生和促进 iFlora的出现和发展; 大量的生物多样
性数据平台为 iFlora提供了生物多样性和遗传信
息的海量数据, 以及不同类型资源整合利用的机
会; 由于纳米孔测序技术的出现, DNA 测序已
进入更便宜、 更方便快捷的时代, 而与移动设备
相关的技术不断进步和深入探索, 使 iFlora 这种
创新地利用 DNA 数据来获取植物信息的方式成
为可能; 基础数据的数字化、 整合化利用, 以及
大型网络基础设施与植物科学研究的结合, 意味
着未来跨资源、 跨学科、 跨领域的 iFlora 协同研
发平台将成为植物学相关研究发展的必然趋势。
在现代植物学与信息技术、 计算机科学不断融
合, 生物多样性数据平台间合作不断加深的过程
中, 形成不同学科工作者可以共同参与、 整合多
方资源和数据, 并可以在多个领域上开展协同合
作的开放的 iFlora智能认知系统。
255摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 植 物 分 类 与 资 源 学 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 34 卷
也参摇 考摇 文摇 献页
Armenise L, Simeone MC, Piredda R et al., 2012. Validation of
DNA barcoding as an efficient tool for taxon identification and
detection of species diversity in Italian conifer [ J] . European
Journal of Forest Research, 131 (5): 1337—1353
Bafeel SO, Arif IA, Bakir MA et al., 2012. DNA barcoding of arid
wild plants using rbcL gene sequences [J] . Genetics and Molecu鄄
lar Research , 2 (6): e508
Belhumeur PN, Chen DZ, Feiner S et al., 2008. Searching the
world忆s herbaria: A system for visual identification of plant spe鄄
cies [J] . Computer Vision鄄ECCV 2008, Part IV, Proceedings,
5305: 116—129
Butler TZ, Pavlenok, M Derrington IM et al., 2008. Single鄄molecule
DNA detection with an engineered MspA protein nanopore [ J] .
Proceedings of the National Academy of Sciences of the United
States of America, 105 (52): 20647—20652
CBOL Plant Working Group, 2009. A DNA barcode for land plants
[ J] . Proceedings National Academy of Sciences of the United
States of America, 106: 12794—12797
Chase MW, Salamin N, Wilkinson M et al., 2005. Land plants and
DNA barcodes: short鄄term and long鄄term goals [J] . Philosophi鄄
cal Transactions of the Royal Society B: Biological Sciences, 360
(1462): 1889—1895
Chase MW, Cowan RS, Hollingsworth PM et al., 2007. A proposal
for a standardised protocol to barcode all land plants [ J] . Tax鄄
on, 56 (2): 295—299
Chen SL, Yao H, Han JP et al., 2010. Validation of the ITS2 region
as a novel DNA barcode for identifying medicinal plant species
[J] . PloS One, 5 (1): e8613
Crawley SS, Hilu KW, 2012. Caryophyllales: Evaluating phylogenet鄄
ic signal in trnK intron versus matK [J] . Journal of Systematics
and Evolution, 50 (5): 387—410
Derrington IM, Butler TZ, Collins MD et al., 2010. Nanopore DNA
sequencing with MspA [J] . Proceedings of the National Academy
of Sciences of the United States of America, 107 (37): 16060—
16065
De Mattia F, Gentili R, Bruni I et al., 2012. A multi鄄marker DNA
barcoding approach to save time and resources in vegetation sur鄄
veys [J] . Botanical Journal of the Linnean Society, 169 (3):
518—529
Dick CW, Kress WJ, 2009. Dissecting tropical plant diversity with
forest plots and a molecular toolkit [ J] . Bioscience, 59 (9):
745—755
Fazekas AJ, Burgess KS, Kesanakurti PR et al., 2008. Multiple
multi locus DNA barcodes from the plastid genome discriminate
plant species equally well [J] . PloS One, 3 (7): e2802
Filipowicz N, Nee MH, Renner SS, 2012. Description and molecular
diagnosis of a new species of Brunfelsia (Solanaceae) from the Bo鄄
livian and Argentinean Andes [J] . PhytoKeys, 10: 83—94
Gonzalez MA, Roger A, Courtois EA et al., 2010. Shifts in species
and phylogenetic diversity between sapling and tree communities
indicate negative density dependence in a lowland rain forest
[J] . Journal of Ecology, 98 (1): 137—146
Hajibabaei M, Singer GAC, 2009. Googling DNA sequences on the
world wide web [J] . BMC Bioinformatics, 10: S4
Han JP, Shi LC, Chen XC et al., 2012. Comparison of four DNA
barcodes in identifying certain medicinal plants of Lamiaceae
[J] . Journal of Systematics and Evolution, 50 (3): 227—234
Hollingsworth ML, Clark AA, Forrest LL et al., 2009. Selecting bar鄄
coding loci for plants: Evaluation of seven candidate loci with spe鄄
cies鄄level sampling in three divergent groups of land plants [ J] .
Molecular Ecology Resources, 9 (2): 439—457
Hollingsworth PM, Graham SW, Little DP, 2011. Choosing and u鄄
sing a plant DNA barcode [J] . PLoS One, 6: e19254
Ivanova NV, Borisenko AV, Hebert PDN, 2009. Express barcodes:
racing from specimen to identification [ J] . Molecular Ecology
Resources, 9 (Suppl. 1): 35—41
Janzen DH, 2004. Now is the time [ J] . Philosophical Transactions
of the Royal Society B: Biological Sciences, 359: 731—732
Kesanakurti PR, Fazekas AJ, Burgess KS et al., 2011. Spatial pat鄄
terns of plant diversity below鄄ground as revealed by DNA barcod鄄
ing [J] . Molecular Ecology, 20 (6): 1289—1302
Kress WJ, Erickson DL, 2007. A two鄄 locus global DNA barcode for
land plants: the coding rbcL gene complements the non鄄 coding
trnH鄄psbA spacer region [J] . PLoS One, 2 (6): e508
Kress WJ, Erickson DL, Jones FA et al., 2009. Plant DNA barcodes
and a community phylogeny of a tropical forest dynamics plot in
Panama [J] . Proceedings of the National Academy of Sciences of
the United States of America, 106 (44): 18621—18626
Kress WJ, Wurdack KJ, Zimmer EA et al., 2005. Use of DNA bar鄄
codes to identify flowering plants [J] . Proceedings of the Nation鄄
al Academy of Sciences of the United States of America, 102
(23): 8369—8374
Lahaye R, Vander Bank M, Bogarin D et al., 2008. DNA barcoding
the floras of biodiversity hotspots [J] . Proceedings of the Nation鄄
al Academy of Sciences of the United States of America, 105 (8):
2923—2928
Lauren JW, Stephanie MALB, Shannon HCE et al., 2012. DNA bar鄄
codes for everyday life: Routine authentication of natural health
products [J] . Food Research International, 49 (1): 446—452
Li DZ, Gao LM, Li HT et al., 2011. Comparative analysis of a
large dataset indicates that internal transcribed spacer ( ITS )
should be incorporinto the core barcode for seed plants [ J] .
Proceedings of the National Academy of Sciences of the United
States of America, 108 (49): 19641—19646
Li DZ (李德铢), Wang YH (王雨华), Yi TS (伊廷双) et al.,
2012. The next鄄generation Flora: iFlora [ J] . Plant Diversity
and Resources, 34 (6): 525—531
3556 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 杨摇 雅等: 从文献情报分析看 iFlora的发展趋势摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
Li Y, Gao LM, Poudel RC et al., 2011b. High universality of matK
primers for barcoding gymnosperms [ J] . Journal of Systematics
and Evolution, 49: 169—175
Lim J Kim, SY KimS, Kim S et al., 2009. BioBarcode: a general
DNA barcoding database and server platform for Asian biodiversi鄄
ty resources [J] . Bmc Genomics, 10: S8
Liu L, Zhao B, Tan DY et al., 2012. Phylogenetic relationships of
Brassicaceae species based on mark swquences [ J] . Pakistan
Journal of Botany, 44 (2): 619—626
Liu ZH, Zeng X, Yang D et al., 2012. Applying DNA barcodes for i鄄
dentification of plant species in the family Araliaceae [J] . Gene,
499 (1): 76—80
Lou SK, Wong KL, Li M et al., 2010. An integrated web medicinal
materials DNA database: MMDBD ( Medicinal Materials DNA
Barcode Database) [J] . Bmc Genomics, 11: 402
Manrao EA, Derrington IM, Laszlo AH et al., 2012. Reading DNA at
single鄄nucleotide resolution with amutant MspA nanopore and
phi29 DNA polymerase [ J] . Nature Biotechnology, 30 (4):
349—U174
Moed HF, 2002. Measuring China爷s research performance using the
science citation index [J] . Scientometrics, 53 (3): 281—296
Newmaster SG, Fazekas AJ, Steeves RAD et al., 2008. Testing can鄄
didate plant barcode regions in the Myristicaceae [J] . Molecu鄄
lar Ecology Resources, 8: 480—490
Pang X, Luo H, Sun C, 2012. Assessing the potential of candidate
DNA barcodes for identifying non鄄flowering seed plants [ J] .
Plant Biology, 14 (5): 839—844
Pennisi E, 2007. Wanted: A barcode for plants [ J] . Science, 31
(8): 190—191
Shaw J, Lickey EB, Beck JT et al., 2005. The tortoise and the hare.
II. Relative utility of 21 noncoding chloroplast DNA sequences
for phylogenetic analysis [J] . American Journal of Botany, 92:
142—166
Singer GAC, Hajibabaei M, 2009. iBarcode. org: web鄄based molecu鄄
lar biodiversity analysis [J] . BMC Bioinformatics, 10: S14
Smith SA, Beaulieu JM, Stamatakis A, 2011. Understanding angio鄄
sperm diversification using small and large phylogenetic trees
[J] . American Journal of Botany, 98 (3): 404—414
Sun HX (孙海汐), Wang XJ (王秀杰), 2009. The development
and future perspectives of DNA sequencing technology [ J] . E鄄
Science Technology & Application (科研信息化技术与应用),
6: 19—29
Tang JY (唐建阳), Zhou XZ (周先治), 2009. Progress and out鄄
standing of DNA barcoding in plant [ J] . Chinese Agricultural
Science Bulletin (中国农学通报), 25 (24): 35—43
Wang H, Yao L, Cai R et al., 2012. Genetic relationship analyses of
oil鄄bearing roses in China using matK sequences [J] . Scientia
Horticulturae, 137: 121—124
Yao H, Song JY, Liu C et al., 2010. Use of ITS2 region as the uni鄄
versal DNA barcode for plants and animals [ J] . PLoS One, 5:
370—375
Yu J, Xue JH, Zhou SL, 2011. New universal matK primers for DNA
barcoding angiosperms [ J] . Journal of Systematics and Evolu鄄
tion, 49 (3): 176—18
455摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 植 物 分 类 与 资 源 学 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 34 卷