免费文献传递   相关文献

A Framework of Scientific-Cloud for iFlora

iFlora科技领域云的建设构想



全 文 :iFlora科技领域云的建设构想*
庄会富, 王雨华**
(中国科学院昆明植物研究所科技信息中心, 云南 昆明摇 650201)
摘要: 应对社会公众和国家相关行业和部门对植物物种认知的广泛需求, 新一代植物志 ( iFlora) 应
运而生。 为了服务于该研究计划, 本文提出了 iFlora 科技领域云的建设构想, 拟建设由云服务端 (资源
层、 服务层)、 植物志智能生成系统、 客户端 (应用层) 和核心用户群组成的信息化协同工作环境和应用
平台: 即 (1) 在云端搭建协同工作平台, 用以整合植物 DNA 条形码标准数据库、 植物多样性信息数据
库、 计算模型库等信息化资源; (2) 在虚拟化科研平台中嵌入智能生成系统, 为终端用户生成和展示智能
植物志; (3) 在客户端开发多平台移动应用程序, 服务于终端用户和实际应用。 该建设将遵循植物学发展
的规律, 在植物学与信息化融合的过程中, 形成众多科学工作者能够共同参与的, 可共享、 无障碍、 无缝
链接的云工作环境。 该环境将整合机器、 网络和分类学家的认知能力, 为公众认知植物世界提供智能的认
知系统。
关键词: 植物 DNA条形码; 新一代植物志; 科技领域云; 虚拟化
中图分类号: TP316, Q 948. 2摇 摇 摇 摇 文献标识码: A摇 摇 摇 摇 摇 文章编号: 2095-0845(2012)06-623-08
A Framework of Scientific鄄Cloud for iFlora*
ZHUANG Hui鄄Fu, WANG Yu鄄Hua**
(Science and Technology Information Center, Kunming Institute of Botany, Chinese Academy
of Sciences, Kunming 650201, China)
Abstract: In order to meet the broad requirements of the public and state departments to recognize and distinguish
plant species, a plan for the next鄄generation Flora was proposed, which is internet鄄, DNA鄄sequence鄄 and informa鄄
tion鄄technology鄄 based, i. e. , iFlora. In this paper, we suggest and present a research framework of “ Scientific鄄
Cloud for iFlora冶, which is a combination of Resource鄄Cloud (Resource and Service layer), Intelligent Re鄄organiza鄄
tion System, Mobile鄄Clients (Application layer) and Key鄄Users. (1) Resource鄄Cloud: a collaborative working plat鄄
form in the cloud site. This platform is used to integrate all relevant information resources, including DNA barcoding
reference library, plant biodiversity information, and analysis models. (2) Intelligent Re鄄organization System of Vir鄄
tualization: a system to retrieve, re鄄organize and present iFlora鄄records of a given plant species automatically and in鄄
telligently. (3) Mobile鄄Clients: software applications of mainstream mobile platforms, such as iOS, android and
Windows phone. Constructed by these three parts, the framework will not only service for the key users with co鄄oper鄄
ating platform but also providing web service for the general public.
The construction of this project will gradually combine botany and informatics. We are aiming to construct a
sharing, easily accessible, and seamless connected Scientific鄄Cloud, with which numerous scientists co鄄operate to鄄
gether for iFlora. In addition, the Scientific鄄Cloud will integrate cognitive abilities of the machine, network, and
taxonomists. It will provide an intelligent public service to perceive the plant world in a new dimension.
植 物 分 类 与 资 源 学 报摇 2012, 34 (6): 623 ~ 630
Plant Diversity and Resources摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 DOI: 10. 3724 / SP. J. 1143. 2012. 12139
*
**
基金项目: 科技部基础科学数据共享网项目 (BSDN2009鄄12); 国家科技部科技基础工作专项项目; 国家高科技研究发展计划
(863 计划) (2012AA021801); 中国科学院大科学装置开放研究项目 (2009鄄LSFGBOWS鄄01)
通讯作者: Author for correspondence; E鄄mail: wangyuhua@ mail. kib. ac. cn
收稿日期: 2012-11-05, 2012-11-09 接受发表
作者简介: 庄会富 (1985-) 男, 硕士, 主要从事生物多样性信息学研究。 E鄄mail: zhuanghuifu@ mail. kib. ac. cn
Key words: Plant DNA barcode; iFlora; Intelligent flora; Scientific cloud; Virtualization
摇 随着移动互联网设备、 智能手机、 平板电
脑应用的迅速普及, 使人们可以随时随地获取海
量的资讯和知识, 进行无阻隔的交流和通讯, 因
此, 网络化和信息化正深刻改变着人们的认知、 学
习乃至生活方式。 如 Google 搜索引擎 (http:/ /
www.google. com) 以 “集成全球范围的信息, 让
人人皆可访问并从中受益冶 (http: / / zh. wikipedia.
org / wiki / Google) 为理念, 每天处理数亿个搜索
请求, 成为人们获取资讯的重要途径。 随着科学
计算的发展, 近年来兴起的 “云计算冶、 “云服
务冶 概念, 已经被亚马逊、 谷歌、 IBM 和 Sales鄄
force. com等国际著名公司使用, 特别是苹果公
司于 2011 年正式发布了 iCloud (云服务) ( ht鄄
tps: / / www. icloud. com / )。 该技术能够满足人们
日益膨胀的个性化需求, 能够像使用水和电一样
随需使用各种信息化资源 ( http: / / baike. baidu.
com / view / 1316082. htm)。
基于植物学与信息技术的高速发展, 以及社
会公众、 国家相关行业和部门对植物物种认知的
广泛需求, 昆明植物研究所提出了新一代植物志
(iFlora) 研究计划, 将植物学、 分子生物学与信
息技术等多学科相结合, 旨在为植物学专家、 政
府部门、 相关行业和社会公众提供能够便捷、 准
确识别植物和获取相关信息的智能植物志 (智
能装备) (李德铢等, 2012)。 实现的前提之一是
科研人员与信息技术人员构建出完善的信息化环
境, 将海量的数据信息与领域专家的认知能力进
行整合, 形成资源 “云冶, 并构建出便捷的信息
检索、 分析和获取服务工具。 2012 年中国科学
院提出了 “科技领域云冶 的建设计划, 通过信
息化基础设施及资源与科技活动的直接融合, 在
基础设施层面实现与学科相关的各类数字化设备
的互联互通, 在应用层面要集成本学科与领域的
各种资源及服务, 实现资源的共享, 提高科研协
作的效率, 构建与学科和领域特点相适应的信息
化环境, 直接服务学科和领域的科技创新活动。
iFlora的建设与该计划十分契合, 因此, 基于信
息时代植物志编研的新需求和机遇, 我们提出
iFlora科技领域云的建设构想, 将多元化的植物
学知识、 新兴的物种鉴定技术与网络信息技术进
行融合, 支撑服务 iFlora的建设与应用。
1摇 iFlora对科技领域云的需求
iFlora研究需要与信息化实现真正的融合,
从该研究计划的提出, 到将来的工作实施, 以及
建设完成之后的服务, 都需要整合的信息化支
撑, 这些需要主要体现在以下几个方面:
1) 协同工作环境: 首先, 该研究不再是依
靠植物学单一学科, 而是与生物信息学、 分类
学、 分子生物学、 生态学、 生物地理学等学科密
切协作, 共同完成的多学科交叉。 其次, 该研究
的核心内容是植物和植物遗传信息的数字化内
容, 这些内容既在类型上高度重复, 又在研究过
程中相互印证和补充。 这些特征迫切需要一个高
效的协作环境。
2) 超级计算环境: 一方面人们为了充分利
用和保护植物资源, 需要尽可能准确、 全面地获
取生物多样性信息, 在海量遗传信息和生物多样
性信息的数字化过程中, 不得不用到关联规则、
决策树、 神经网络、 粗糙集法、 分类、 聚类、 序
列模式等算法, 这些模型和计算需要超算环境来
进行。 另一方面, 生命之树的构建即是 “植物
志冶 构建的指导原则, 又是科学家研究生命起
源的重要基础和途径 (彭奕欣和黄诗笺, 1997;
于黎和张亚平, 2006), 但若要构建全球 180 万
种, 或者中国 3 万余种植物在属级和种级水平的
生命之树, 没有超算是根本无法进行的 (王雨
华和李德铢, 2009; 段光文等, 2011)。
3) 分布式认知环境: 分布式认知认为认知
的本性是分布式的, 认知不仅包括个人头脑中所
发生的认知活动, 还涉及人与人之间, 以及人与
技术工具之间通过交互实现某一活动的过程
(周国梅和傅小兰, 2002;蒲倩, 2011)。 iFlora就
是这种分布式认知的最佳体现, 一旦构建了 iF鄄
lora这样的领域云, 人们就可以通过与计算机
(设备) 的交互快速地实现对植物的认知。
4) 分布式存储: 一方面, 研究自身需要共
同参与的科学家贡献各自的大量信息和数据, 另
一方面, 需要使用国内外如 GBIF (http: / / www.
gbif. org / )、 GENBANK ( http: / / www. ncbi. nlm.
426摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 植 物 分 类 与 资 源 学 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 34 卷
nih. gov / genbank / )、 BOLD ( http: / / www. barcod鄄
inglife. com / ) 等生物多样性和遗传信息的海量
数据, 因此, 分布式存储技术是必须的。
5) “云端-客户端冶 服务环境: 未来的植物
志阅读终端将不再是传统的纸张, 而是各种移动
互联终端设备的屏幕 (王琳琳, 2012; 刘燕红,
2012), 个人电脑、 平板电脑、 智能手机等移动
设备需要便捷、 易用的客户端程序以获取植物志
信息服务。
总之, iFlora研究计划的实施和服务需要整
合的信息化基础设施支持: 涉及下一代互联网、
超级计算、 海量存储、 科学数据库和科技文献库
等, 如此众多的信息资源和基础设施, 必需要一
个统一的、 易用的信息化集成环境来支持运行和
维护。
2摇 iFlora相关的信息化现状
近年来, 生物多样性信息学快速发展, 自 1992
年环境与发展大会召开以来, 各国政府和从事生
物多样性保护的国际组织普遍提高了对生物多样
性信息收集和管理的重视程度, 开发建立了大量
的联网数据库和网站 (钟扬等, 2000; 王利松
等, 2010)。 比较著名的就是 “物种 2000冶 (http:/ /
www.sp2000. org / ), 是全球生物多样性信息设施
(GBIF, http:/ / www.gbif. org / ) 核心目录, 综合分
类信息系统 ( ITIS, http: / / www. itis. gov / ) 和世
界生物多样性数据库 (ETI鄄WBD, http: / / www.
eti. uva. nl / database / wbd. html) 都是物种 2000 的
重要合作伙伴, 其目的是要建立起一个涵盖所有
主要生物类群的数据库集合, 对每一部分数据库
的数据使用相同的分类系统, 并尽可能多地包括
它所辖类群的所有已知物种。 植物志信息化方
面, 世界上主要的植物志, 基本实现了数字化和
网络化, 2011年 “第十八届国际植物学大会冶 决
议通过, 力争在 2020年完成 “世界已知植物网络
在线版植物志冶 (online flora of all known plants)
(李德铢和陆露, 2011; Knapp等, 2011)。
在我国, 随着 《中国植物志》 以及 Flora of
China的完成和接近完成, 同时也开启了一个研
究新起点。 在中国科学院科学数据库 ( http: / /
www. csdb. cn / )、 国家科技基础条件平台基础科
学数据共享网 (http: / / www. nsdc. cn) 以及国家
科技基础条件平台项目的陆续支持下, 以中国植
物物种信息数据库 (www. db. kib. ac. cn)、 中国
西南野生生物种质资源数据库 ( http: / / www.
genobank. org)、 中国数字植物标本馆 ( Chinese
Virtual Herbarium) 等为代表的网络应用系统完
成了植物物种、 种质资源、 标本、 图片、 文献等
植物多样性本底资料与实物材料的数字化, 构建
了在线服务的数据库系统, 为植物学相关研究提
供了重要支持。 传统的纸质版植物志已发展成为
内容更加丰富、 信息获取更加方便的网络植物志
服务系统, 基本实现了植物志 “数字化冶 和
“网络化冶 的转变 (表 1)。
除了信息系统, 下一代互联网、 超级计算中
心、 海量存储中心、 科学数据库和科技文献库的
完善 (http: / / www.cnic. cas. cn / zcfw), 也为 iFlora
的建设提供了必要的信息化基础设施, 这些信息
化基础设施将从基层支撑该研究的实施, 同时也
将进一步体现学科研究与信息化的融合。
3摇 iFlora科技领域云的结构和功能
3. 1摇 iFlora科技领域云功能定位
1) 支撑服务 iFlora 计划的研发: 利用现有
成熟的协同工作环境开发技术, 整合 iFlora 建设
涉及的信息化基础设施, 为 iFlora 的研究打造一
个高效的工作平台, 将有利于这一目标的实现。
2) 支撑 iFlora 计划完成后的信息服务: 基
于云服务的共享和应用平台将实时发布和更新
iFlora建设进展; 整合机器、 网络和分类学家的
认知能力, 成为公众便捷、 准确了解与获取植物
多样性和遗传信息全新的认知手段和平台; 建设
成为中国植物分类、 植物多样性和可持续利用、
植物资源开发、 植物功能研究和分析的平台。
3. 2摇 iFlora科技领域云结构设计
针对 iFlora系统建设和应用时涉及的 “多源
海量数据冶、 “多人协作冶, 以及 “智能检索冶、
“网络化应用冶 等需求和特点, iFlora 科技领域
云的设计采用现代流行的云服务端、 多平台客户
端、 核心用户群相结合的网络架构设计 (图 1)。
1) 云服务端: 整合多元的信息资源和服务,
包括植物 DNA条形码数据、 植物生物多样性数据
等核心资源数据资源、 超级计算资源、 计算分析
模型软件、 存储以及网络应用服务器等软硬件信
5266 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 庄会富和王雨华: iFlora科技领域云的建设构想摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
表 1摇 中国主要植物生物多样性信息化基础设施
Table 1摇 List of main plant biodiversity information infrastructure in China
摇 系统名称 Name 摇 摇 摇 摇 URL 摇 摇 主要建设单位摇 Developing institute 摇 摇 摇 摇 说明 Remarks
中国植物物种信息数
据库 http: / / db.kib. ac. cn 中国科学院昆明植物研究所 数字化的中国植物志服务系统
中国西南野生生物种
质资源数据库 http: / / www.genobank. org 中国科学院昆明植物研究所
中国野生生物种质资源库的信息管
理系统
中国数字植物标本馆
(CVH) http: / / www.cvh. org. cn 中国科学院植物研究所
科技基础条件平台项目———植物标
本标准化整理、 整合及共享平台
重要生物类群 DNA
条码数据库 http: / / www.genobank. org 中国科学院昆明植物研究所
DNA条码数据管理、 共享和信息服
务平台
中国植物主题数据库 http: / / www.plant. csdb. cn / 中国科学院植物研究所、 昆明植物研究所
植物物种相关的名录、 图片、 文
献、 药用植物、 古植物名录、 古植
物标本等整合信息服务平台
BHL中国节点 http: / / www.bhl鄄china. org 中国科学院生物多样性委员会 生物多样性历史文献数据库
植物园主题数据库 http: / / www.bgdb. csdb. cn 中国科学院武汉植物园、 华南植物园、 西双版纳植物园
中国科学院武汉、 华南和西双版纳
植物园引种、 栽培、 保育植物的数
据共享服务平台
物种 2000 中国节点 http: / / www. sp2000. cn / 中科院生物多样性委员会 中国植物物种名录
国家农作物种质资源
平台 http: / / icgr. caas. net. cn / 中国农业科学院作物科学研究 作物种质资源管理平台
中国植物图像数据库 http: / / www.plantphoto. cn / 中国科学院植物研究所 植物图像
西南战略生物资源昆
明超算分中心
http: / / www.kib. ac. cn / zyfw /
jsfw / 201004 / t20100406_281
3281.html
中国科学院昆明植物研究所 生物信息学超级计算服务平台
息资源, 提供整合的植物物种信息数据、 物种鉴
定引擎 (Reference Key库)、 植物多样性信息网
络发布平台, 在分类学家构成的核心用户群支持
下, 形成 iFlora协同工作平台。 核心数据库整合
植物物种信息、 标本数据、 图片库、 文献库、 资
源利用信息库等植物生物多样性及其利用相关的
各类数据集。 收集整合的植物物种信息, 并与鉴
定引擎链接, 用户在检索和鉴定时可以整合的获
取相关信息, 并提供多元的物种辅助鉴定工具。
摇 摇 2) 服务核心用户的 iFlora 协同工作平台: 该
研究不再是依靠植物学单一学科, 而是与多学科
密切协作、 共同完成的交叉工作。 同时, 该研究
的核心内容都是植物和植物遗传信息的数字化内
容, 这些内容既在类型上高度重复, 又需要在研
究过程中相互印证和补充。 这些特征迫切需要一
个高效协作环境。
摇 摇 3) 多平台客户端: 移动互联网设备 (智能
手机、 平板电脑) 现已成为人们日常生活的随
身设备, 智能手机的普及率、 来自移动设备的信
图 1摇 iFlora 科技领域云结构示意
Fig. 1摇 The architecture of Scientific鄄Cloud for iFlora
626摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 植 物 分 类 与 资 源 学 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 34 卷
息订阅量、 搜索引擎流量、 广告等均处于迅速上
升的状态, 移动设备已经成为获取信息的主要媒
介 (尹浩等, 2012; 叶成林, 2004)。 iFlora 也
需要顺应信息化发展潮流, 分别开发基于 (PC、
andriod、 iOS、 macOS、 WP8 等) 移动互联设备
的应用程序, 提供主流移动操作系统均兼容的客
户端程序, 服务终端用途, 提供数据服务。
4摇 云服务平台的主要建设内容
4. 1摇 信息化资源 (云端) 的整合与建设
1) 核心数据库: 围绕 iFlora 计划, 整理整
合多元植物生物多样性信息, 包括: 物种名称、
物种的文字描述、 照片、 遗传信息数据、 DNA
条码数据、 种质资源数据、 分布地图、 传统利用
知识, 以及音频、 视频、 业余爱好者的观测资料
等, 还有相关的基因库、 相关专业文献的数据、
链接等等, 实现对物种综合信息的 “一站式冶
综合收集, 搭建中国植物物种数据中心。
2) 云计算资源与服务工具: 开发植物信息
数据和遗传信息数据分析的核心工具和扩展工
具; 开发智能搜索引擎、 资源加工处理工具和存
储工具等, 为每一个物种建立更加整洁和清晰的
数据信息和服务。
核心工具包括: 用于形态比较的图形工具
(Image Library), 与空间地理数据交互的地图工
具 (Distribution Maps), 描绘树结构邻居关系的
分类树工具 (Taxon ID Tree), 比较物种序列相
似性的识别引擎 (Identification Engine) 等 (Su鄄
jeevan和 Paul, 2007)。
扩展工具包括: 浏览序列在多分类水平散度
的距离法 (Distance Summary), 探索密码子位置
变化的序列编写工具 ( Sequence Composition),
评估条码空隙的邻近工具 ( Nearest Neighbor
Summary), 查看样品质量的曲线工具 (Accumu鄄
lation Curve), 诊断序列整齐度的对齐工具 (A鄄
lignment Browser) 等 (BOLD Handbook, 2012)。
4. 2摇 iFlora协同工作平台建设
iFlora研究计划需要整合分类学家集体力量,
形成协同平台和工作团队处理海量的多元分类学
数据, 实现 “实物冶 和 “数据冶 的管理和审核操
作。 协同工作平台系统总体架构采用 “主系统+
子系统冶 的双系统模式, 子系统部署在每个用户
的本地计算机上, 为用户提供一个统一的数据管
理方案, 方便用户对自己的工作文档、 数据、 样
本进行管理。 用户在离线状态下可以对本地数据
进行处理, 在联网状态下可以与主系统进行数据
交换和信息处理。 主要包括以下几个方面:
1) iFlora “科技领域云冶 标准规范的编研:
在广泛调研的基础上, 通过借鉴国内外的先进经
验和技术, 在边建设边研制的过程中, 制订该领
域云建设的标准规范, 一方面指导和规范该领域
云的建设和持续发展, 另一方面推动该领域云的
推广和相关应用。
2) 个人工作空间及角色管理模块的建设:
结合中科院管理信息化所研发的 CA 认证中心
(http: / / ca. grid. cn / ), 开发基于用户角色的个人
工作空间 (Workbench)。 该空间是协同工作的
基础, 在该空间中, 用户根据系统赋予的角色与
其他用户进行交互, 同时也根据这个角色参与对
该领域云各类功能和模型的应用和建设。
3) 数据整合和管理模块的建设: 科学数据
是开展各类工作的核心, 该模块不仅要能够整合
和管理自己产生的科学数据, 还要能与互联网环
境中其它数据进行相互查询和调用。 基于数据管
理的一般形式, 为用户开发易于增加、 编辑和检
索的系统工具。 同时, 建设搜索引擎或网络爬
虫, 通过适当的数据整理、 分析和存储模型, 有
效地实现海量网络数据的保存、 分析和应用。
4) 文献服务模块的建设: 结合已初步开发
并应用的智能文献 (iLibrary), 重点定制与该科
技领域云相关的功能模块, 从而保证科技文献的
推介、 导读和分析, 进一步促进该领域云的科研
工作。
5) 文档管理模块的建设: 提供文档的共享、
共用、 协同编辑等功能, 加强文档的检索和分析。
6) 系统接口模块的建设: 为其它系统预留
接口, 从而形成一个整体的科技领域云。
4. 3摇 物种智能鉴定引擎 (Reference Library+Key)
开发
基于智能检索表、 图像识别技术、 以及 DNA
条形码技术 (Neto等, 2006; Wu等, 2007; 张宁
和刘文萍, 2011), 开发由中国植物物种智能检
索表、 植物图像识别引擎和 DNA Barcoding 比对
鉴定引擎多元构成的物种鉴定引擎。 该引擎作为
7266 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 庄会富和王雨华: iFlora科技领域云的建设构想摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
核心数据库和用户交互的连接程序, 辅助用户实
现快速检索和鉴定, 并实时获取整合的生物多样
性相关信息, 引擎由 Reference Library (标准图
片库、 中国植物物种 DELTA 标准库、 DNA 条形
码标准库) 和 Key (比对工具程序) 组成。
1) 中国植物物种智能检索表: 植物鉴定检
索表是植物学专家的重要工具, 但对一般用户来
说却如 “天书冶。 随着信息技术的应用, 以人机
交互的方式, 可以让 “天书冶 可读。 “中国植物
物种信息数据库冶 已经完成了 《中国植物志》
中检索表的全部内容, 进一步开发基于 DELTA
的中文版植物物种电子检索程序和数据库 (李
健钧, 1996; Anthony, 2005), 利用提问的模式
可以引导用户逐条地去比对拟鉴定物种的相关信
息, 从而可让用户给出一个初步的判断。 再加上
物种信息所提供的实景照片、 地理分布等具体信
息, 辅助用户实现物种快速检索鉴定。
2) 植物图像识别引擎: 图形相似性识别技
术已广泛应用于信息化领域的很多方面。 根据
Harris和 Harris (2001) 编著的 《图解植物学词
典》, 图形化植物学分类术语, 利用图形识别技
术, 结合植物物种相关信息, 植物地理分布信
息, 引导用户主动判断, 从而让基于感观的植物
分类, 在设备的辅助下, 变得更加形象、 更加具
体。 图像识别将作为植物物种辅助鉴定的手段,
为一般的植物学爱好者提供快捷的辅助鉴定检索
工具 (Neeraj等, 2012)。
3) 基于 DNA条码的物种鉴定: 根据 DNA条
形码的理念 (Hebert 等, 2003) 和植物 DNA条形
码 ITS、 rbcL 和 matK 的特点 (Li 等, 2011; He鄄
bert, 2003), 使用 BLAST 几何原理, 尽可能地
返回物种水平的鉴定结果。 在鉴定后台使用的数
据库, 将首先在本领域云中的中国植物 DNA 条
码数据库 (http: / / biodna. nsdc. cn / ) 进行识别,
然后再与国际上的 GenBank和 BOLD数据库进行
识别, 最后返回物种水平的鉴定结果。
4. 4摇 iFlora中智能生成系统的建设
人类对植物界的认识来源于对植物多样性信
息的获取。 随着信息技术的应用和发展, 不再是
停留在传统模式, 而是在对大量信息进行加工处
理过程中。 根据人们的意愿和需求, 或者程序根
据场景 (地理位置、 季节、 用户个人信息、 检
索习惯等) 的判断而智能产生的具有个性和智
能的 “iFlora模式的植物志冶, 因此需要重点开
展以下工作:
1) iFlora中智能生成系统的建设: 借用和研
发基于不同应用和集成的模型工具。 条码索引
指数系统 (BINs System) 是该系统构建的核心
模型, 它通过对 DNA 条码序列进行聚类算法
(Cluster) 来产生基于网络的分类系统。 该系统
一方面可以有效地在一个界面上定制化、 智能
化、 动态化展示物种的位置信息和其它各类分
类、 图像、 空间等信息, 另一方面通过精确注册
聚类信息, 进一步补充分类信息中因形态信息等
的缺失而带来的不足。
2) 智能展示系统的建设: 为了让用户更加
容易地读懂植物多样性信息, 良好地展示界面是
必须。 这个展示界面将包括: a) 距离统计; b)
分类信息; c) 采集信息; d) 公共出版信息; e)
参与用户信息; f) 序列系统树图; g) 标本图像;
h) 采样点; i) 分布图。 同时, 在植物学学科发展
过程中, 也产生了各大分类系统 (王文采, 1990),
对这些系统的理解也是人们对自然认识的深入,
因此, 也将其他各大分类系统相关地进行展示,
从而提供更多的参考信息。
4. 5摇 多平台移动客户端开发
随着 3G 网络、 iPhone 等智能手机的应用普
及, 移动互连设备逐渐成为了人们获取资讯的主
流平台 (江山, 2011)。 现在主流的移动平台有
iOS、 Android和 Win Phone, 相关的应用程序开
发技术已经十分成熟, 客户端程序将作为 iFlora
核心数据库的使用媒介, 实现以下功能: 1) 传
感器信息收集模块: 利用智能手机内置的相机、
GPS等传感器, 开发相应功能模块智能收集植物
相关信息, 如: 图像及视频采集、 位置信息、 季
节信息、 简单气候信息的获取。 2) 智能检索终
端: 语音检索、 图像检索、 位置检索、 文字
OCR识别检索等功能模块的设计开发。 3) 阅读
器: 提供信息浏览阅读界面。 4) 信息交流终端:
用户定制资讯的推送、 转发模块, 方便用户之间
交流植物多样性资讯。
4. 6摇 核心用户群的发展
随着信息技术的发展, 个人在信息传播、 资
讯交流中起到了越来越重要的作用, 并成为重要
826摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 植 物 分 类 与 资 源 学 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 34 卷
的信息发布、 传送、 接受节点。 Facebook (www.
facebook.com)、 微博 (http:/ / weibo.com/ )、 Twitter
(https: / / twitter. com / )、 人人网 ( http: / / www.
renren. com)、 Youtube (www. youtube. com) 等著
名网站, 用户和用户提供的信息成为了这些网站
的核心资源和竞争力 (Bakshy 等, 2011)。 植物
学相关的网站, 如 CVH (www. cvh. org. cn)、 PP鄄
BC (http: / / www. plantphoto. cn / ) 等也发展了自
己核心的用户群, 得益于核心用户群的支持,
PPBC迅速收集整合了 100 余万张植物图片, 形
成了植物图像共享和发布的交流圈。 核心用户群
的发展将有助于植物学分布式认知圈的形成,
iFlora科技领域云将分布的分类学认知能力通过
信息化环境整合起来, 人们就可以通过与计算机
(设备) 的交互, 快速地实现对植物的认知, 促
进植物学学科的发展和信息的交流。 除了参与
iFlora建设的分类学家, 也需要广泛发展植物学
相关领域专家、 植物学爱好者加入领域云环境。
5摇 分析与讨论
关键技术的发展为 iFlora 科技领域云的建设
提供了技术保障。 DNA 快速测序技术、 生物信
息学、 模糊搜索以及图像识别等 Web3. 0 技术的
快速发展将有力地推进 iFlora 研究的进展。 当前
新一代测序技术的发展, 测序成本迅速降低, 基
因组测序向个体化发展, 为生物学研究领域开辟
了新的视角 (王兴春等, 2012)。 而超算、 存储
和其他信息化基础设施的发展也将为 iFlora 计划
提供信息数据快速、 准确处理计算能力的保障。
此外, “Web 3. 0冶 (http: / / baike. baidu. com / view /
269113. htm) 向着全民互动、 移动互联、 智能检
索、 模糊检索的趋势发展, 与 iFlora 的细化需
求十分吻合, 尤其是基于语义的模糊检索技术、
基于多媒体数据的检索技术, 如 Google Goggles已
初步实现了基于图像的在线搜索 (http: / / www.
google. com / mobile / goggles / #text)。 在将来, 我们
设计中预留的数据接口将进一步与这些技术结合,
保障 iFlora科技领域云的建设实施和持续运行。
iFlora领域云推进新一代植物志的建设。 《中
国植物志》 经过众多植物科学家 45 年的通力合
作艰辛编研才得以完成, 而在科技高速发展的今
天, 信息化技术发展中的协同工作可以有效地促
进人们参与重大任务的完成。 利用现有成熟的协
同工作环境开发技术, 为 iFlora 的研究打造一个
高效的工作平台, 将有利于这一目标的实现。
iFlora科技领域云将改变人们对植物的认知
模式。 随着信息技术的发展和应用, 人们的认知
方式也发生着巨大的变化。 一个未知植物样本,
如果想准确鉴定和获取相关数据, 需要由专业人
员鉴定, 并根据学名检索相关信息。 而 iFlora 计
划将通过信息技术在植物学上的应用 (Kress等,
2005; 陈士林等, 2009), 将人脑与电脑 (设备)
结合起来, 期望使科研人员, 乃至普遍公众可以
轻松地认知植物。
6摇 结语
我国在植物生物多样性数据方面具有丰厚的
积累 (国际生物多样性计划中国委员会, 2011);
高速互联网、 超算、 海量存储等植物学相关信息
化基础设施的也日趋完善 (http: / / www. cnic. cas.
cn / zcfw)。 但众多的信息化服务设施尚缺乏统一
集成的运维服务信息化环境, 植物学信息化资源
与服务的整合程度还有待进一步加强。 iFlora 科
技领域云建设构想正是基于信息化资源与服务的
深度整合提出的设计方案, 开发集数据采集、 整
合、 浏览、 查询、 统计、 比对、 分析和科普学习
等功能于一体的基于云服务的共享与应用平台系
统。 本构想的实施将为科研工作者提供 iFlora 协
同工作平台, 将整合机器、 网络和分类学家的认
知能力, 为国家相关行业和部门以及公众认知植
物世界提供终端认知系统, 包括植物鉴定系统和
植物志智能生成系统。
也参摇 考摇 文摇 献页
国际生物多样性计划中国委员会, 2011. 国际生物多样性计划中
国委员会 2011 年报 [EB / OL]. URL: http: / / www. cncdiver鄄
sitas. org / cncdiversitas / file / 436#page / 1 / mode / 2up
江山, 2011. 3G时代移动互联网发展分析 [ J] . 信息通信技术,
2011 (04): 13—18
李德铢, 陆露, 2011. 第 18 届国际植物学大会要事记 [J] . 植物
分类与资源学报, 33: 518—520
刘燕红, 2012. 社会化阅读与阅读社会化 [EB / OL]. 雷锋网.
URL: http: / / www. leiphone. com / zaker鄄lyh. html? utm_source =
weibolife
9266 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 庄会富和王雨华: iFlora科技领域云的建设构想摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
蒲倩, 2011. 分布式认知理论与实践研究 [D]. 上海: 华东师范
大学
王琳琳, 2012. 智能移动终端产业的未来发展战略 [ J] . 传媒,
05. URL: http:/ / www.qikan.com.cn / Article / chma / chma201205 /
chma20120523.html
叶成林, 徐福荫, 许骏, 2004. 移动学习研究综述 [ J] . 电化教
育研究, 3: 12—19
Anthony RB, Hong S, 2005. ActKey: a Web鄄based interactive iden鄄
tification key program [J] . Taxon, 54 (4): 1041—1046
Bakshy E, Hofman JM, Mason WA et al., 2011. Everyone爷s an in鄄
fluencer: quantifying influence on twitter [C]. WSDM忆11 Pro鄄
ceedings of the Fourth ACM International Conference on Web
Search and Data Mining, 65—74
BOLD System, 2012. BOLD Handbook [ EB / OL]. URL: http: / /
v2.boldsystems. org / docs / handbook.php? page
Chen SL (陈士林), Song JY (宋经元), Yao H (姚辉) et al.,
2009. Strategy and key technique of identification of Chinese
Herbal Medicine Using DNA Barcoding [J] . Chinese Journal of
Natural Medicines (中国天然药物), 7 (5): 322—327
Duan GW (段光文), Jiang P (江鹏), Meng Z (孟珍) et al.,
2011. On the data management system of plant DNA barcode
[J] . e鄄Science Application (科研信息化技术与应用). URL:
http: / / escj. cnic. cn / EN / article / downloadArticleFile. do?attach
Type=PDF&id=12576
Harris JG, Harris MW, 2001. Plant Identification Terminology: An
Illustrated Glossary [M]. Spring Lake Pub
Hebert P, Cywinska A, Ball SL et al., 2003. Biological identi覱cations
through DNA barcodes [J] . Proceedings of the Royal Society of
London Series B, 270 (1512): 313—321
iBOL [EB / OL]. URL: http: / / www.barcodeo覲ife. org
Knapp S, McNeill J, Turland NJ, 2011. Changes to publication re鄄
quirements made at the XVIII International Botanical Congress in
Melbourne—what does epublication mean for you? [J] . PhytoK鄄
eys, 6: 1—5
Kress WJ, Kenneth JW, Elizabeth AZ et al., 2005. Use of DNA bar鄄
codes to identify flowering plants [J] . Proceedings of the Nation鄄
al Academy of Sciences of the United States of America, 102
(23): 8369—8374
Kumar N, Belhumeur PN, Biswas A, 2012. Leafsnap: A computer
vision system for automatic plant species identification [ A].
In: Fitzgibbon A, Lazebnik S, Perona P et al. ( eds.), Com鄄
puter Vision鄄ECCV 2012 [M]. Heidelberg Bertin: Springer
Li DZ, Gao LM, Li HT et al., 2011. Comparative analysis of a large
dataset indicates that internal transcribed spacer (ITS) should be
incorporated into the core barcode for seed plants [ J] . Proceed鄄
ings of the National Academy of Science of the United States of
America. URL: http: / / www.pnas. org / content / 108 / 49 / 19641
Li DZ (李德铢), Wang YH (王雨华), Yi TS (伊廷双) et al.,
2012. The next鄄generation Flora: iFlora [ J] . Plant Diversity
and Resources, 34 (6): 525—531
Li JJ (李健钧), 1996. DELTA system—An International standard
for processing plant taxonomic descriptions [J] . Acta Phytotaxo鄄
nomica Sinica (植物分类学报), 34 (4): 447—452
Neto JC, Meyer GE, Jones DD et al., 2006. Plant species identi覱cation
using Elliptic Fourier leaf shape analysis [ J] . Computer and
Electronics in Agriculture, 50 (2): 121—134
Peng YX (彭奕欣), Huang SJ (黄诗笺), 1997. Evolutionary Biol鄄
ogy [M]. Wuhan: Wuhan University Press
Sujeevan R, Paul DN, 2007. BARCODING BOLD: The Barcode of
Life Data System [J] . Molecular Ecology Notes, 7: 355—364
Wang LS (王利松), Chen B (陈彬), Ji LQ (纪力强) et al.,
2010. Progress in biodiversity informatics [ J] . Chinese Biodi鄄
versity (生物多样性), 18 (5): 429—443, 13
Wang WC (王文采), 1990. An introduction to four important cur鄄
rent systems of classification of the angiosperms [ J] . Chinese
Bulletin of Botany (植物学通报), 7 (2): 1—7
Wang XC (王兴春), Yang ZR (杨致荣), Wang M (王敏) et al.,
2012. High鄄throughput sequencing technology and its applica鄄
tion [J] . China Biotechnology (中国生物工程杂志), 32
(1): 109—114
Wang YH (王雨华), Li DZ (李德铢), 2009. The e鄄Science envi鄄
ronment for conservation and innovation of germplasm resources
of wild species [J] . e鄄Science Application (科研信息化技术
与应用), URL: http: / / www.cnic. cas. cn / qkbg / kyxxh / kq / 3q
Wu SG, Bao FS, Xu EY et al., A Leaf Recognition Algorithm for
Plant Classi覱cation Using Probabilistic Neural Network [ J] .
Signal Processing and Information Technology, 2007: 11—16
Yi H (尹浩), Zhan TY (詹同宇), Li C (林闯), 2012. Multime鄄
dia networking: from content delivery to future internet [ J] .
Chinese Journal of Computer (计算机学报), 35 (6): 1120—
1130
Yu L (于黎), Zhang YP (张亚平), 2006. Phylogenomics—an at鄄
tractive avenue to reconstruct “Tree of Life冶 [J] . Hereditas (遗
传), 28 (11): 1445—1450
Zhang N (张宁), Liu WP (刘文萍), 2011. Plant leaf recognition
technology based on image analysis [J] . Application Research of
Computers (计算机应用研究), 28 (11): 4001—4007
Zhong Y (钟扬), Zhang L (张亮), Ren WW (任文伟) et al.,
2000. Biodiversity informatics: a new direction of bioinformatics
and biodiversity science and related key techniques [ J] . Chi鄄
nese Biodiversity (生物多样性), 8 (4): 397—404
Zhou GM (周国梅), Fu XL (傅小兰), 2002. Distributed cogni鄄
tion: a new cognition perspective [J] . Advance of Psychological
Science (心理科学进展), 10 (2): 147—153
036摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 植 物 分 类 与 资 源 学 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 34 卷