全 文 :基于 ArcSDE 的小麦苗情远程监测
多源数据库设计与实现
张 琴,许童羽,孙 鹏
(沈阳农业大学,辽宁 沈阳 110866)
摘 要:小麦苗情远程监测系统是在分析了小麦苗情数据的多源性及特点的基础上,介绍了基于 ArcSDE技术和 Oracle
技术的小麦苗情监测诊断的多源数据库的构建和技术思路,并对数据库建设中的关键问题进行了探讨。
关键词:ArcSDE;空间数据库;多源性
中图分类号:TP392 文献标识码:A 文章编码:1672-6251(2012)03-0013-04
Design and Implementation of Diagnosis Multi-source Database Based
on ArcSDE for Wheat Growth Remote Monitor
ZHANG Qin, XU Tongyu, SUN Peng
(Shenyang Agriculture University, Liaoning Shenyang 110866)
Abstract: Based on the requirements of the remote monitoring system for wheat growth, in this paper, the multi -source and
character in wheat growth monitoring and diagnosis system were analyzed, and then the design and implementation of multi-source
database based on ArcSDE and Oracle were introduced. In addition, the key problems on the database construction were discussed.
Key words: ArcSDE; spatial database; multi-source
作者简介:张琴(1986-),女,硕士,研究方向:农业 GIS应用研究。
通信作者:许童羽,男,副教授,研究方向:农业 GIS研究。
收稿日期:2012-02-20
1 引言
小麦是我国第二大粮食作物, 其生长过程中经历
的环境复杂多变。 其中, 冬小麦整个生命期不仅要经
过漫长的严冬, 而且经历次年早春处于冷热剧烈交替
的环境, 干旱、 霜冻害等发生频繁, 对小麦苗情影响
巨大。 如何针对小麦生长发育过程, 准确预测环境胁
迫和气象灾害、 作物长势等重大农情, 实现远程异地
诊断管理, 是目前农业精准管理中亟待解决的重大技
术难题[1]。
公益性行业 (农业) 科研专项小麦苗情遥感监测
技术就是针对小麦苗生长环境进行远程监测研究。 本
研究的小麦生长环境信息既包括有关地理特征的位置
关系信息, 又包括小麦生长的属性信息, 及大量遥感
影像信息、 气象数据、 监测数据等, 数据库作为系统
数据的全部载体, 对系统的运营与实施起着至关重要
的作用。
当前, 空间数据库技术中处于核心位置的是空间
数据库引擎 (SDE) 技术, 利用它可以把空间数据和属
性数据有机地集成起来, 实现有效的存储和管理, 并在
此基础上, 实现便利的空间检索、 查询和各种分析操
作[2]。
2 数据的多源性
2.1 多源数据特点
系统数据来源包括空间数据和属性数据, 数据多
源性主要体现在空间数据的多源性。 地理学科是一门
交叉性的学科, 随着地理信息系统的发展, 使得各部
门、 各系统内部, 由于采用不同的 GIS 软件, 导致数
据格式和结构不同, 而决定了空间数据的多源性[3]。 空
间数据多源性的产生和表现主要可以概括为以下几个
层次:
(1) 多语义性。 由于地理系统的研究对象的多种
类特点决定了地理信息的多语义性。 对于同一个地理
农业网络信息
AGRICULTURE NETWORK INFORMATION
·研究与开发· 2012 年第 3 期
13— —
图 1 多源数据库设计
信息单元, 对应着多种语义, 如地理位置、 海拔高
度、 气候、 地貌、 土壤等自然地理特征; 行政区界
限、 人口、 产量等社会经济信息。 不同系统解决问题
的侧重点也有所不同, 因而会存在语义分异问题。
(2) 多时空性和多尺度。 GIS 数据具有很强的时
空性。 有同一时间不同空间的数据系列; 同一空间不
同时间序列的数据 ; 不同尺度对空间数据系列等 。
GIS 数据集成包括不同时空和不同尺度数据源的集成。
(3) 获取方法多源性。 获取地理空间的数据的方
法有多种多样 , 包括来自现有系统 、 图表 、 遥感 、
GPS、 统计调查、 实地勘测等。 这些不同方法获得的
数据其存储格式及提取和处理方法都各不相同。
(4) 存储格式多源性。 GIS 数据源包含有图形数
据 (又称空间数据) 和属性数据两部分。 图形数据又
可以分为栅格格式和矢量格式两类。
2.2 系统的多源数据
系统有多种数据源, 如图 1所示。
(1) 小麦苗情基础地理数据。 基础地图包括全国
行政区划 (省、 县) 和全国主要农作物种植区, 采用
ArcView 软件对其矢量化, 得到的 .shp 文件格式以矢
量数据集形式存储; 全国 DEM、 小麦长势遥感监测影
像以及遥感监测专题数据等分别以栅格数据集中所支
持的 DEM数据集、 影像数据集格式存储。
(2) 长势、 冻害、 干旱相关数据。 主要包括野外
调查数据、 生境数据、 田间试验数据、 监测模型、 诊
断信息等 , 如详细记录的小麦生育期 、 小麦品种 、
NDVI 指数、 土壤、 水文、 生物条件和野外调查或者
田间试验的测量数据, 对小麦长势、 冻害、 干旱提供
的诊断措施指导。 其中, 表格形式记录的数据用常规
表的形式存储, 包含地理信息数据以矢量或者栅格数
据集形式存储。
(3) 气象数据。 气象数据以全国气象站点日数据
为主, 记录日平均温度、 最高温度、 最低温度、 降水
量、 风速、 日照时数等气象信息, 并根据需要计算生
成月数据 、 年数据 。 全国气象站点分布图采用
ArcView 软件对其矢量化, 得到的 .shp 文件格式以矢
量数据集形式存储。
(4) 用户信息。 记录用户注册信息、 角色信息以
及历史浏览信息等。
3 小麦苗情数据库设计
3.1 建设目的
(1) 有效地组织与管理数据。 项目区数据量巨大
且复杂, 必须对数据进行科学合理的划分, 采用有效
的途径与方法存储、 管理。 传统的基于文件的管理方
式已经无法满足有效管理和应用的需要, 数据的安全
性、 一致性也难以得到保证。 当前关系型数据库技术
已经很成熟, 实现上述目的具有很大的优势。
(2) 提供多用户并发访问的能力。 课题 “小麦苗
情遥感监测技术” 的主要预期成果——小麦苗情远程
监测与诊断系统 , 结构上采用 B / S (Browser / Server)
《农业网络信息》2012 年第 3 期 研究与开发
14— —
图 3 数据库逻辑结构
模式。 外部用户能够通过计算机网络或者其他通信设
施访问该系统, 进行专题查询、 业务检索、 数据更
新、 分析处理等分布式操作。 这就要求该系统的数据
库具有处理多用户并发访问的能力, 同时也对数据库
的安全性提出了更高的要求。
3.2 构建平台
小麦苗情环境数据设计大量空间数据且类型复
杂、 时效性强, 目前一般数据库软件很难满足苗情环
境数据的高效存储和管理, 空间数据库引擎技术很好
地解决了这个问题。 美国 ESRI 公司推出的空间数据
引擎 ArcSDE 是目前使用最广泛、 性能最稳定的空间
数据库引擎之一, 它本身并不存储数据, 而是在 GIS
平台 (用户) 和关系数据库管理系统 (RDBMs) 之间提
供了一个存储和管理多用户空间数据的通路, 是生态
环境数据出入数据库的桥梁。
数据库使用 0racle 数据库, 是 0racle 公司推出的
十分优秀的数据库管理系统, 功能强大, 性能优越,
适合于极大数据量, 对数据库的可靠性、 安全性和可
扩展性有很高要求的应用。 同时, 能有效地进行分布
式处理, 为结构空间数据库互操作和信息共享提供技
术支持。
3.3 关键问题
3.3.1 数据处理
把分幅分层的基础地理数据 (地形图数据、 影像
数据等) 进行整理, 使之符合统一的规范和标准, 并
对数据进行有效组织、 管理, 便于空问数据的查询、
分发及其他应用。 使建库之后的数据是标准化、 规范
化的, 采用统一的编码和统一的格式, 数据是有效组
织的。 在平面方向, 分幅的数据要组织成逻辑上无缝
的一个整体; 在垂直方向, 各种数据通过一致的空间
坐标定位能够相互叠加和套合。
3.3.2 数据分类及编码
将复杂的数据明确地分类、 编码, 可以使数据类
型清晰、 层次分明, 数据存取方便、 高效, 直接影响
到数据库的应用水平和效率[4]。 系统数据包括小麦苗情
基础数据、 长势相关数据干旱相关数据、 冻害相关数
据、 气象数据、 用户信息等, 为便于数据库中海量信
息的组织和管理, 在总体上将数据库分为空间数据库
和属性数据库。 空间数据库主要包含用于 GIS 空间分
析、 可视化分析应用的带有明显空间位置信息的地理
信息库。 属性数据库主要用于存储和管理与小麦生长
环境相关的描述性数据及诊断数据。
导入数据库的空间数据是以数据集 (Feature
Datasets) 的形式存储 , 栅格数据以栅格数据集
(Raster Datasets) 的形式存储。 要素数据集是具有相同
的空间参考的要素类的集合。 将导入的数据按数据
集、 时间等进行编码能节省存储空间、 便于理解使
用。 研究里采用了以不同的命名对数据集进行分类的
方法, 用户名和数据集属性间用 “.” 分隔, 数据集的
各个属性问使用 “-” 分隔。 简单的数据集命名方式
如图 2所示。
图 2 数据命名方式
3.3.3 数据库逻辑设计
要保证小麦苗情远程监测与诊断系统数据的独立
性、 安全性以及快速的数据存取能力, 需要合理设计
数据库的逻辑存储结构。 系统数据库的逻辑结构如图
3所示。
(1) 空间数据库逻辑设计。 根据空间数据表达地
理信息方式的不同, 分为矢量存储方式和栅格存储方
式。 本系统数据中, 基础地理数据、 长势分布图、 遥
感影像等空间数据大部分是二维的矢量数据。 在空间
《农业网络信息》2012 年第 3 期 研究与开发
15— —
数据库中, 矢量数据是以一种分区、 分层的组织形式
进行管理的。 对于栅格数据, 考虑矿区栅格数据要存
储多时段以便查询分析以及可以分区显示等特点, 在
数据库中采用栅格目录容器进行理。
(2) 属性数据库逻辑设计。 对于相关的属性数
据, 较为简单或与空间要素密切相关的信息, 如名
字、 长度、 面积等, 直接作为空间要素的扩展属性项
存在, 而更多的一般性信息存储在另外的属性数据表
中, 即在属性数据库中进行, 再通过特征码与空间数
据关联实现互通。
(3) 不同类型数据库之间的逻辑关系。 在数据库
中, 存储着各种不同的数据, 这些数据之间发生着各
种逻辑上的关系, 所以要在数据库中建立关系类来表
示这种关系。 例如: 监测区与种植区之间是一对多依
赖型关系, 即主从表关系, 监测区表是主表, 作物表
是从表, 作物表某一实例必须依对应预测区某一实
例; 工作人员根据工种分为两类, 一类为行政区苗情
管理人员, 另一类为采样人员, 因而与行政区、 采样
点均为一对多的关系; 气象站点、 苗情采样点与采样
点表均为继承关系, 继承了采样点表的主键。
4 应用实例
基于以上数据库多方面的设计, 系统采用以下流
程构建了系统数据库: ①将收集获取的影像数据等空
间数据采用统一坐标系统、 地图投影分类处理, 使用
数据集命名方式分类编码。 ②逻辑设计方面, 根据以
上数据库的数据类型划分, 给每种类型数据分别创建
索引表空间和数据表空间, 表空间的大小和增长方式
视该类型数据量的大小而定。 ③数据库建成后, 能实
现在客户端查看小麦生长遥感影像, 远程监测小麦苗
生长状况, 并查看诊断信息。
5 结束语
空间数据库是 GIS 的重要组成和应用资源, 它的
建立和维护是一项非常复杂的工作, 其技术还在不断
的完善中, 空间数据库引擎 (SDE) 代表着这一技术的
最新进展。 由于 ArcSDE 具有海量数据存储、 多用户
并发访问、 支持长事务处理和版本管理等强大优势,
且 Oracle 是成熟的关系数据库。 因此基于 ArcSDE 和
Oracle 技术构建的数据库能满足小麦苗情远程监测与
诊断系统的功能需求, 并对存在空间数据的系统数据
库建设具有一定的指导意义。
参考文献
[1] 张琴,黄文江,许童羽,等.小麦苗情远程监测与诊断系统[J].农业
工程学报,2011,27(12):115-119.
[2] 刘洪岐,宫辉力.基于 ArcSDE 和 SQLServer2000 的洪涝灾害救
助决策支持系统空间数据库设计研究 [J].首都师范大学学报
(自然科学版),2008,29(2).
[3] 北京超图地理信息技术有限公司 .理解 SuperMap IS.NET[Z].北
京,2006.
[4] 张涛,汪云甲,束立勇.基于 ArcSDE 的矿区资源环境数据库建
设研究[J].金属矿山,2009,(3).
[5] 赵秀怡,熊庆文,涂建光.GIS 应用数据库设计二阶分析模式[J].
武汉大学学报(信息科学版),2003,28(1).
[6] 肖乐斌,钟耳顺,刘纪远,等.GIS 概念数据模型的研究[J].武汉大
学学报(信息科学版),2001,26(5).
[7] 郭朝辉,齐清文,邹秀萍,等.基于 ArcSDE 的云南沿边境地带生
态环境数据库建设研究[J].测绘通报,2007,(3).
《农业网络信息》2012 年第 3 期 研究与开发
16— —