免费文献传递   相关文献

Research and Application of Forest Resource Multidimensional Data Model

森林资源多维数据模型研究及应用



全 文 :第 wu卷 增刊 t
u s s y年 | 月
林 业 科 学
≥≤Œ∞‘׌„ ≥Œ∂ „∞ ≥Œ‘Œ≤„∞
∂²¯1wu o≥³qt
≥ ³¨qou s s y
森林资源多维数据模型研究及应用
陈 艳 雷振宇 张 旭
k中国林业科学研究院资源信息研究所 北京 tsss|tl
摘 要 } 针对目前森林资源规划设计调查数据管理与应用中存在的问题 o将多维数据模型的理论和技术引入森
林资源管理中 o建立以森林资源二类调查数据为基础的包括空间 !属性 ut个维度的多维森林资源数据模型 ∀并在
此基础上研究多维数据模型在林业管理决策中的应用 o实现了如下功能 }tl对资源数据的多级聚合 !上卷r下钻 !嵌
套 !旋转等操作 ~ul空间与属性数据的结合 o通过维度的层次结构 o建立面向国家 !省 !县等不同数据粒度的林业专
题图 ~vl实现多层次 !多角度组合进行数据分析的功能 ∀
关键词 } 森林资源规划设计调查数据 ~多维数据模型 ~维表 ~事实表 ~应用
中图分类号 }≥zxz1u 文献标识码 }„ 文章编号 }tsst p zw{{kussyl增 t p stuz p sy
收稿日期 }ussx p sy p uw ∀
基金项目 }国家 {yv课题/数字林业平台技术研究与应用0kussv„„us|sysl ∀
Ρεσεαρχη ανδ Αππλιχατιον οφ Φορεστ Ρεσουρχε Μυλτιδιµενσιοναλ ∆ατα Μοδελ
≤«¨ ± ≠¤± ¨¬«¨ ±¼∏ «¤±ª÷∏
k Ρεσεαρχη Ινστιτυτε οφ Φορεστ ΡεσουρχεσΙνφορµατιον Τεχηνιθυεσo ΧΑΦ Βειϕινγ tsss|tl
Αβστραχτ } „ °∏¯·¬§¬°¨ ±¶¬²±¤¯ §¤·¤ °²§¨¯¬¶¥∏¬¯·¬±²µ§¨µ·²¶²¯√¨ ·«¨ ³µ²¥¯ °¨¶²©©²µ¨¶·µ¨¶²∏µ¦¨¶¬±√¨ ±·²µ¼¤±§³¯¤±±¬±ª§¤·¤
¶·²µ¤ª¨ ¤±§∏¶¤ª¨ q׫¨ °²§¨¯¥¤¶¨§²±©²µ¨¶·µ¨¶²∏µ¦¨¶¬±√¨ ±·²µ¼¤±§³¯¤±±¬±ª§¤·¤¬¶¦²°³²¶¨§²©·º¨ ±·¼p²±¨ §¬°¨ ±¶¬²±¶¤¥²∏·
¶³¤·¬¤¯ ¤±§¤·µ¬¥∏·¨ §¤·¤q׫¨ °∏¯·¬§¬°¨ ±¶¬²±¤¯ §¤·¤ °²§¨¯¦¤± ¥¨ ∏¶¨§¬± ¶²°¨ §¬µ¨¦·¬²±¶}tl ƒ²µ¨¶·µ¨¶²∏µ¦¨¶§¤·¤¦¤± ¥¨
³µ²¦¨¶¶¨§·«µ²∏ª«¤ªªµ¨ª¤·¬²±o§µ¬¯¯¬±ª§²º±oµ²¯ ¬¯±ª∏³o³¬√²·qul ƒ²µ¨¶·°¤³³¬±ª¬± §¬©©¨µ¨±·¯ √¨¨ ¯¦¤± ¥¨ °¤§¨ ¥¤¶¨§²±·«¨
§¬°¨ ±¶¬²±¯¨ √¨ ¯¶·µ∏¦·∏µ¨ qvl ׫¨ ©∏±¦·¬²± ²©¬±·¨ªµ¤·¨§¤±¤¯¼¶¬¶¥¤¶¨ ²±·«¨ °∏¯·¬§¬°¨ ±¶¬²±¤¯ §¤·¤ °²§¨¯¬¶§¨√¨ ²¯³¨ §q
Κεψ ωορδσ} ©²µ¨¶·µ¨¶²∏µ¦¨¶¬±√¨ ±·²µ¼ ¤±§ ³¯¤±±¬±ª §¤·¤~ °∏¯·¬§¬°¨ ±¶¬²±¤¯ §¤·¤ °²§¨¯~ §¬°¨ ±¶¬²± ·¤¥¯¨~©¤¦··¤¥¯¨~
¤³³¯¬¦¤·¬²±
t 问题的提出
111 需求分析
森林资源规划设计调查k简称二类调查l是经营单位k县 !林业局 !林场l为掌握森林资源现状和动态 !分
析与评价经营活动效果 o编制或修订经营方案或总体设计而进行的森林资源清查 ∀森林资源规划设计调查
数据是森林资源规划设计调查的主要成果之一 o描述了小班内乔木 !灌木 !草本 !地形 !地貌 !土壤 !病虫害等
情况 o通常涉及 xs个以上的字段 o包含非常丰富的属性信息 ∀因此 o作为林业生产 !管理 !科研的基础数据 o
它有着极其重要的作用和意义 ∀它是经营单位制定森林资源采伐限额 !林地林权管理 !实行森林资源资产化
管理及获得森林生态效益补偿基金等的重要依据 ~是政府制定有关方针 !政策 !林业区划规划的重要依据 ∀
目前 o我国森林资源二类调查数据的管理主要是在省级以及县级林业主管部门 o而到国家级则没有完整的二
类调查数据 o这使国家要基于二类调查数据做出宏观决策缺少依据 ∀
112 存在问题
如果把全国所有小班数据按部就班统一到国家 o将会产生如下问题 }tl 数据量巨大 我国森林资源二
类调查小班数据都是以传统关系型数据库来管理的 o这些数据若在数据库中每个小班用一条记录来表示 o则
需少则几十多至近百个字段来描述 ∀假设每个字段用 w个字节 o每条记录 xs个字段 o则每个记录约 uss字
节 o一个县 u ∗ v万个小班 o则每个县 x ∗ y  数据量 o全国有 v sss多个县 o总数据量将达到 u万  ∀ul 数据
库冗余增加 我国森林资源分布广泛 o各地区林木生成的条件不同 o林业经营管理所需的数据内容也不完全
相同 o因此森林资源调查的内容也不完全相同 ∀如果要把全国的数据纳入到一个统一结构的数据库中 o每条
记录还将增加若干字段 o若每个省多 u个不同字段 o则全国将增加 ys个字段 o总数据量将成倍增加 o而数据
图 t 传统的数据管理方法
ƒ¬ªqt ×µ¤§¬·¬²±¤¯ ° ·¨«²§²©§¤·¤¶·²µ¤ª¨
库的冗余也在成倍扩大k图 tl ∀显然用一个集中
统一的数据库结构管理全国森林资源调查数据
是不合理的 o同样也是难以实现的 ∀vl 不能实现
综合分析 传统的关系型数据库系统可以高效
地实现数据录入 !查询 !统计等功能 ∀但是 o在实
际决策过程中 o决策者往往希望能从多层次多角
度观察某个指标或多个指标的值 o并且找出这些
指标之间的关系 o传统的二维数据模型很难实现
这种功能k杨倩等 ousswl ∀自 us世纪 {s年代初
以来全国各省陆续开发了一批用于森林资源调
查 o特别适用于二类调查的森林资源管理信息系
统 ∀他们绝大部分都是基于关系型数据库 o显然
用简单的二维数据模型来描述森林资源中复杂
的数据关系是困难的 o例如要研究坡度 !土层厚
度 !经营措施类型等多个属性作用下对优势树高
的影响 o基于传统的小班二维模型就很难得出完
整结论 ∀
为了解决国家迫切需要二类调查数据而按传统数据管理方法又难以实现这一需求的矛盾 o以及如何充
分利用森林资源调查数据进行多角度的数据分析的问题 o本文引入了多维数据模型的方法 ∀
u 多维数据模型相关概念及实现
211 多维数据模型
数据模型一般有 u个层次 }概念层k逻辑层l和物理层 ∀逻辑数据模型是从概念角度抽象出现实世界的
内在规律 o如业务流程 !数据架构等 ~物理数据模型则侧重于特定环境下的具体实现 o如效率 !安全性等 ∀多
维数据模型是一个逻辑概念 o该模型主要解决如何对大量数据进行有效管理 !快速查询和多角度展示 o以便
得出有利于管理决策的信息和知识k刘义等 ousssl ∀
多维模型的概念来源于联机分析处理k’„° o²± ¬¯±¨ ¤±¤¯¼·¬¦¤¯ ³µ²¦¨¶¶¬±ªl o’„°由 ≤²§§等kt||vl提出 o
认为联机事务处理k’×° o²± ¬¯±¨ ·µ¤±¶¤¦·¬²±¤¯ ³µ²¦¨¶¶¬±ªl不能满足终端用户对数据库查询分析的需要 o≥±对
大数据库进行的简单查询也不能满足用户分析的需求 ∀决策分析需要对关系数据库进行大量计算才能得到
结果 o而查询的结果并不能满足决策者提出的需求 ∀因此 ≤²§§提出了多维数据库和多维分析的概念 o即
’„°∀
多维数据模型是数据仓库和多维分析的基础 o数据模型的正确选择往往在很大程度上影响和决定着分
析系统的最终性能k¬ετ αλqot||yl ∀
212 多维数据模型的相关概念
多维数据模型通过引入维 !维分层和度量等概念来描述数据间的复杂关系 ∀维 }是人们观察数据的特定
角度 o是考虑问题时的一类属性 ∀属性的集合构成一个维k如时间维 !机构维等l ∀维成员 }维的一个具体取
值 o是数据项在某维中位置的描述k例如/某年某月某日0是在时间维上位置的描述l ∀维分层 }同一维度还可
以存在细节程度不同的各个描述方面k如时间维可包括年 !季度 !月 !旬和日期等l o这些多个描述方面为维的
层次 ∀度量 }立方体中的单元格 o用以存放数据 ∀多维分析操作 }’„°的基本多维分析操作有钻取及旋转
等 ∀钻取包含向下钻取和向上钻取 o上卷操作钻取的深度与维所划分的层次相对应 o上卷操作通过维层次在
数据立方体上进行聚集 ~下钻操作是上卷操作的逆操作 o由不太详细的数据到更详细的数据 ~旋转k转轴l
是变换维的方向 o即在表格中重新安排维的放置k如行列互换l o通过旋转得到不同视角的数据 ∀
213 多维数据模型的实现
目前多维数据模型主要采用星型和雪花型模式来实现k谢民主等 oussul ∀星型模式通常由一个中心表
k事实表l和一组维度表组成 ∀星型模式的事实表与所有的维度表相连 o而每一个维度表只与事实表相连 o维
{ut 林 业 科 学 wu卷
度表与事实表的连接是通过键来实现的 o事实表中存储各个维度表的主键 o就将事实表和维度表连接在一
起 o形成星型模式 ∀雪花模式是星型模式的扩充 o将星形模式的某个或几个维度表进行分解 o分解成多个具
有层次关系的维度表 o比如地域维可以细化为省分表 !地市表 !县行政区划表等 o结果模式图形呈类似于雪花
的形状 ∀
由于目前建立的森林资源多维数据的维度都是由一张表来存储的 o同时基于系统的响应速度 !系统的复
杂度 !系统的维护工作量等方面考虑 o多维数据模型的逻辑结构采用星型结构 ∀
v 森林资源多维数据模型的实现
森林资源二类调查小班数据虽然是用二维表来存储 o但实际上是一种多维数据 o包括时间 !经营单位 !林
种 !树种 !起源 !地类等各类信息 ∀本文以 t|||年广西壮族自治区森林资源规划设计调查数据为基础 o说明
多维数据模型的建立过程 ∀
311 建立多维源数据
建立模型的关键是维度的选取 !维度的分割 !维度属性的选取 !事实数据项的选取k谭明金 oussvl o把森
林资源二类调查数据分为空间数据和属性数据 o空间数据表明小班所在地理位置和形状的描述空间信息 o即
林相图数据 ~属性数据表明小班所具有的各种特性 o将属性数据又分为维度数据和事实数据 ∀各部分的关
系如图 u ∀
图 u 多维数据逻辑结构
ƒ¬ªqu ∏¯·¬§¬° ±¨¶¬²±¤¯ §¤·¤ ²¯ª¬¦¤¯ ¶·µ∏¦·∏µ¨
图 w 不均衡层次结构
ƒ¬ªqw ˜±¥¤¯¤±¦¨§«¬¨µ¤µ¦«¼
图 v 均衡层次结构
ƒ¬ªqv …¤¯¤±¦¨§«¬¨µ¤µ¦«¼
v1t1t 创建维度表 在维度体系
设计中 o要详细定义维度类型 !维
度名称 !维度成员及维度说明k李
琪等 oussul o将林业决策部门和生
产部门关注程度较高的各种二类
调查数据中的分类信息如权属 !地
类 !林种等建立维度数据表 o每个
维度是有级别的 o如经营单位的
省 !县 !乡 ∀林种有商品林和生态
公益林之分 o同时还有更细的用材
林 !防护林等 o因此按照维度的层
次建立维度表 ∀其中星形维度表
是描述常见的平衡层次维度的k图
vl ~而父子维度表是描述不定层
次数且层次不平衡的维度的k图
wl o具体实现是通过维度表中的父
Œ§键k°p¬§l来标明它们之间的隶
属关系 ∀总共设计了 ut个分类的
维度表 o其中星形维度表包括 }坡度 !坡向 !
坡位 !经营单位等 tx个表 o父子维度表包
括 }经营单位 !土地种类 !树种分类 !林种 !
起源 !龄组 !散生木主要树种 z个表 ∀由于
各省二类调查技术规程中都对分类信息的
代码作了统一规定 o因此以5广西壮族自治
区森林资源规划设计调查技术规程6中规
定的代码作为个维度标的主键 ∀如针叶林
代码 ttt !阔叶林代码 ttu等 ∀
由于林业数据具有特殊性 o同时由于
主客观原因也存在很多漏查数据 o为保证
|ut 增刊 t 陈 艳等 }森林资源多维数据模型研究及应用
数据的完整性 o本文对这些特异性的地方做了些规定 o把一些和本分类无关的成员定义为/非此类0 o例如某
小班的土地种类是/农业用地0 o它在龄组分类中无意义 o分类就应为/非此类0 ~还有一些是未做调查的空
值 o把它定义为/ ÷÷ 分类未细分0k图 v !wl ∀
v1t1u 创建事实数据表 事实数据指各种表示量度的信息如面积 !蓄积 !树高等 ∀事实数据表以小班调查
表为基础 o除量度值外 o其中的分类信息字段内容用相应维度表的键值填写 o这些键的组合构成事实表的主
键 ∀以主外键的形式建立事实表和各维度表之间的关系 o形成多维数据模型的源数据基础 ∀
图 x 多维数据模型构架
ƒ¬ªqx ∏¯·¬§¬°¨ ±¶¬²±¤¯ §¤·¤ °²§¨¯©µ¤°¨
图 y 多级维度结构
ƒ¬ªqy ∏¯·¬¯¨ √¨¯ §¬°¨ ±¶¬²± ¶·µ∏¦·∏µ¨
312 建立多维数据模型
以元数据为基础 o利用微软公
司提供的数据仓库管理体统 „±¤¯¼¶¬¶
≥¨ µ√¬¦¨¶k邵勇 oussvl构建多维数据模
型 ∀选择事实表以及所需的量度
值 o根据维度表确定多维数据模型
的维度 o对多维数据进行聚合处理
和存储分析 o建成雪花构架的多维
数据模型k图 xl ∀
w 森林资源多维数据模型应用
411 逐级汇总
由于国家 !省 !县级关心的数据粒度不同 o国家级用户的职能主要是宏观控制与全局决策 o对数据粒度要
求较粗 ~县级用户的职能主要是制订任务 !计划实施 o对数据粒度的要求要细得多 ∀因此可根据需要分别建
svt 林 业 科 学 wu卷
图 z 上卷功能
ƒ¬ªqz • ²¯ ¬¯±ª∏³©∏±¦·¬²±
立各级维度 ∀国家级可根据国家的
分类需求 o建立国家层的标准维度
数据 ~各省可按本省的具体情况结
合国家标准的维度 o增加或加深维
度的层次 o建立各省的标准维度 ~在
省级标准维度不能满足要求时 o各
县也可根据自身生产实践的需求增
加省级标准维度的深度 o建立县级
维度 ∀这样就形成了自上而下不断
扩充的多级树状维度结构k图 yl ∀
县级数据的维度及维度成员
多 o划分细密 o便于指导具体的林业
生产设计 ∀虽然维度单元较多 o但
由于小班数量相对不多 ku 万 ∗ v
图 { 下钻功能
ƒ¬ªq{ ⁄µ¬¯¯¬±ª§²º±©∏±¦·¬²±
万l o所以数据量并不大 ∀省级数据
的维度及维度成员较少 o划分稍粗 o
虽然数据包含的面积扩大了 o但由
于对数据进行了维度的减少和维度
层次的浅化 o使得维度单元减少很
多 o相对于原始小班数据 o数据量小
了很多 ∀国家级的维度及维度成员
则更少 o它是为国家的林业等部门
提供宏观决策使用的 o数据量将小
于各省级数据量的总和 ∀
县级数据的维度及维度成员
多 o划分细密 o便于指导具体的林业
生产设计 o而县级系统多维数据的
图 | 不同层次的专题图
ƒ¬ªq| ƒ²µ¨¶·°¤³³¬±ª¬± §¬©©¨µ¨±·¯ √¨¨ ¯
维度是在上级维度的基础上
增加或深化的 o通过减少维度
或数据仓库的上卷功能浅化
维度就可以满足省级的维度
需求 ~同样 o通过减少或浅化
省级维度也可以满足国家级
维度的需求k图 zl ∀另一方
面 o通过数据仓库的下钻功能
从国家级可以下钻到县级小
班数据k图 {l ∀
412 生成不同层次专题图
生成各种林业专题图是森林资源二类调查的重要成果之一 o用维度数据结合事实数据可生成各种统计
分析信息 ~再结合空间数据 o将相邻属性信息相同的斑块融合 o可生成各种专题图 ∀选择不同的维度层次 o
可生成不同层次深度的专题图k图 |l ∀
413 多维分析
多维数据模型的重要应用之一就是进行多角度 !多层次的数据汇总分析 ∀利用森林资源多维数据模型
可以对二类调查各因子之间的关系进行分析 ∀例如 o在森林资源分类经营中 o分析生态公益林按起源 !事权 !
保护等级等因素的分布情况 o就可以通过多维数据查询语句 ⁄÷ 的设计k°¨ §¨µ¶¨± ετ αλqousstl o以多维表
tvt 增刊 t 陈 艳等 }森林资源多维数据模型研究及应用
图 ts 基于多维数据的多维分析
ƒ¬ªqts ∏¯·¬§¬°¨ ±¶¬²±¤¯ ¤±¤¯¼¶¬¶¥¤¶¨§²± °∏¯·¬§¬°¨ ±¶¬²±¤¯ §¤·¤
k图 tsl的形式将结果显示出来 ∀
x 结论及讨论
通过对森林资源二类调查数据的管理 !利用方面存在
问题的分析 o将多维数据模型引用森林资源管理 o建立了
森林资源二类调查多维数据模型 ∀基于多维数据模型实
现了对森林资源二类调查数据的高效 !灵活 !便捷访问 o同
时解决了以下应用问题 }tl实现了对资源数据不同层次 !
级别数据的统计汇总 o以及聚合 !上卷r下钻 !嵌套 !旋转等
操作 o可以满足用户任何可能的数据查询请求 o在最大限
度挖掘数据信息的同时 o保证使用的简单性 ~ul通过多维属性数据和空间数据结合 o通过维度的层次结构可
以生成不同层次粒度的林业专题图 ~vl实现了多层次 !多角度组合进行数据分析的功能 ∀
对数据进行合理有效的组织 o有利于提高森林资源管理信息系统的效率和解决问题的能力 o但目前多维
数据的应用还只是停留在联机分析的较浅层次 o而更深层次的分析要通过数据挖掘来实现 o因此 o研究针对
林业特定应用的数据挖掘方法是下一步的重点 o而目前对多维数据模型的探索为今后的森林资源数据挖掘
研究创造了有利条件 o具有十分重要的意义 ∀
参 考 文 献
李 琪 o白英彩 qussu1 数据仓库中维的建模和查询 q计算机研究与发展 okxl }ytu p ytw
刘 义 o李 亮 qusss1 基于关系数据库构造多维数据模型 q计算机工程 ouyk|l }ut p uv
邵 勇 qussv q≥±≥ µ¨√ µ¨uss数据仓库与 „±¤¯¼¶¬¶≥¨ µ√¬¦¨¶q北京 }中国电力出版社
谭明金 qussv q数据仓库工具箱 }维度建模的完全指南 q北京 }电子工业出版社
谢民主 o王加阳 o蒋外文 qussw1 数据仓库的多维数据模型的研究 q计算机工程与应用 ows kuxl }t{u p t{x
杨 倩 o邵伟民 o徐启健 qussw q ’„°中一种多维数据模型 q计算机工程 ovsktl }t|u p t|w
≤²§§∞ ƒ o≤²§§≥ …o≥¤¯¯¨ ¼ ≤ × q |¯|v1°µ²√¬§¬±ª ’„°k²±¯¬±¨ ¤±¤¯¼·¬¦¤¯ ³µ²¦¨¶¶¬±ªl ·²∏¶¨µp¤±¤¯¼¶¬¶}„± °¤±§¤·¨
¬≤«¤±ªo • ¤±ª ÷ ≥ qt||y1 „ §¤·¤ °²§¨¯©²µ¶∏³³²µ·¬±ª²±p¯¬±¨ ¤±¤¯¼·¬¦¤¯ ³µ²¦¨¶¶¬±ªq°µ²¦≤²±©²± Œ±©²µ°¤·¬²± ¤±§Ž±²º¯ §¨ª¨ ¤±¤ª¨ ° ±¨·o…¤¯·¬°²µ¨ o ⁄}
{t p {{
°¨ §¨µ¶¨± × …o¨ ±¶¨± ≤ ≥ o⁄¼µ¨¶²± ≤ ∞qusst1 „ ©²∏±§¤·¬²±©²µ¦¤³·∏µ¬±ª¤±§ ∏´¨µ¼¬±ª¦²°³¯ ¬¨ °∏¯·¬§¬°¨ ±¶¬²±¤¯ §¤·¤qŒ±©²µ°¤·¬²± ≥¼¶·¨°¶ouy }v{v p suv
k责任编辑 朱乾坤 石红青 于静娴l
uvt 林 业 科 学 wu卷