免费文献传递   相关文献

Land use simulation and landscape assessment by using genetic algorithm based on cellular automata under different sampling schemes.

不同样本方案下遗传元胞自动机的土地利用模拟及景观评价


利用元胞自动机(cellular automata,CA)模拟土地利用情景,有助于理解其变化机理,并为土地资源持续利用提供空间决策支持.本文基于生物进化过程的遗传算法(generic algorithm,GA)将CA参数编码成为染色体,在模拟结果与真实结果差异值的引导下,通过选择、杂交和变异算子使最优的染色体得以遗传和保留,从而建立智能优化的元胞自动机模型.以浙江省嘉兴市1992—2008年土地利用变化为例,分别利用6%(66个·km-2)和3%(33个·km-2)两种样本方案构建遗传CA模型进行土地利用变化模拟,并通过混淆矩阵、Kappa系数和景观指数对模拟结果进行评估.结果表明: 遗传CA模拟结果能在数量、位置和景观格局上以超过80%的水平接近真实分类,且大样本量构建的遗传CA的模拟精度更高;2008年的模拟精度和景观综合指数低于2001年,表明遗传CA的模拟精度和景观综合指数随模拟时间而衰减.

Simulating land use change scenarios with cellular automata (CA) can help to the policy makers in understanding the mechanisms of land change, and support the spatial decision-making for the sustainable use of land resources. Genetic algorithm (GA), an intelligent approach originally conceived from the biological process of evolution, has the capability of minimizing the difference between simulated and observed land use patterns with optimum chromosomes (i.e., feasible CA parameters) obtained through a set of selection, crossover, and mutation operations. In this paper, GA-based CA model was developed, and applied to simulate the land use change in Jiaxing City of Zhejiang Province in 1992-2008. This model was calibrated with 6% (66 samples·km-2) and 3% (33 samples·km-2) samplings, and the simulation results were evaluated based on confusion matrix, Kappa coefficient, and landscape metrics analysis. Over 80% of the land use features generated by the GA-based CA model matched the observed classification of land features geographically, and much higher simulation accuracy could be obtained with a larger sample. The simulation accuracy and the landscape metrics for 2001 were better than those for 2008, suggesting a tendency that the model’s accuracy decreased over the simulating process.


全 文 :不同样本方案下遗传元胞自动机的土地
利用模拟及景观评价*
冯永玖1**摇 刘摇 艳2 摇 韩摇 震1
( 1 上海海洋大学海洋科学学院, 上海 201306; 2 昆士兰大学地理、规划与环境管理学院, 澳大利亚布里斯班 4072)
摘摇 要摇 利用元胞自动机(cellular automata,CA)模拟土地利用情景,有助于理解其变化机理,
并为土地资源持续利用提供空间决策支持.本文基于生物进化过程的遗传算法(generic algo鄄
rithm,GA)将 CA参数编码成为染色体,在模拟结果与真实结果差异值的引导下,通过选择、杂
交和变异算子使最优的染色体得以遗传和保留,从而建立智能优化的元胞自动机模型.以浙
江省嘉兴市 1992—2008 年土地利用变化为例,分别利用 6% (66 个·km-2)和 3% (33 个·
km-2)两种样本方案构建遗传 CA 模型进行土地利用变化模拟,并通过混淆矩阵、Kappa 系数
和景观指数对模拟结果进行评估.结果表明: 遗传 CA模拟结果能在数量、位置和景观格局上
以超过 80%的水平接近真实分类,且大样本量构建的遗传 CA 的模拟精度更高;2008 年的模
拟精度和景观综合指数低于 2001 年,表明遗传 CA的模拟精度和景观综合指数随模拟时间而
衰减.
关键词摇 土地利用模拟摇 元胞自动机摇 多重样本摇 遗传算法摇 景观评价
文章编号摇 1001-9332(2011)04-0957-07摇 中图分类号摇 Q149;U945. 23摇 文献标识码摇 A
Land use simulation and landscape assessment by using genetic algorithm based on cellular
automata under different sampling schemes. FENG Yong鄄jiu1, LIU Yan2, HAN Zhen1
( 1College of Marine Sciences, Shanghai Ocean University, Shanghai 201306, China; 2School of Ge鄄
ography, Planning and Environmental Management, University of Queensland, Brisbane QLD 4072,
Australia) . 鄄Chin. J. Appl. Ecol. ,2011,22(4): 957-963.
Abstract: Simulating land use change scenarios with cellular automata (CA) can help to the policy
makers in understanding the mechanisms of land change, and support the spatial decision鄄making
for the sustainable use of land resources. Genetic algorithm (GA), an intelligent approach original鄄
ly conceived from the biological process of evolution, has the capability of minimizing the difference
between simulated and observed land use patterns with optimum chromosomes ( i. e. , feasible CA
parameters) obtained through a set of selection, crossover, and mutation operations. In this paper,
GA鄄based CA model was developed, and applied to simulate the land use change in Jiaxing City of
Zhejiang Province in 1992-2008. This model was calibrated with 6% (66 samples·km-2) and
3% (33 samples·km-2) samplings, and the simulation results were evaluated based on confusion
matrix, Kappa coefficient, and landscape metrics analysis. Over 80% of the land use features gen鄄
erated by the GA鄄based CA model matched the observed classification of land features geographical鄄
ly, and much higher simulation accuracy could be obtained with a larger sample. The simulation
accuracy and the landscape metrics for 2001 were better than those for 2008, suggesting a tendency
that the model爷s accuracy decreased over the simulating process.
Key words: land use simulation; cellular automata; multi鄄samples; genetic algorithm; landscape
assessment.
*上海市教育委员会科研创新项目(11YZ154)、上海高校选拔培养优秀青年教师科研专项基金项目(SSC09018)和上海海洋大学校博士启动
基金暨环境工程重点学科基金项目(A鄄2400鄄10鄄0134)资助.
**通讯作者. E鄄mail: yjfeng@ shou. edu. cn
2010鄄08鄄26 收稿,2011鄄01鄄27 接受.
应 用 生 态 学 报摇 2011 年 4 月摇 第 22 卷摇 第 4 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
Chinese Journal of Applied Ecology, Apr. 2011,22(4): 957-963
摇 摇 土地利用情景模拟能够为土地资源可持续利用
提供技术手段,同时有助于提高区域空间、生态、环
境和资源等的安全性[1-2] .地理元胞自动机(cellular
automata,CA)因其具有“自下而上冶(从底层交互而
呈现全局结构)的能力,被广泛应用于土地利用变
化的情景模拟[3-4] . 研究认为,CA 建模的核心问题
是转换规则的确定. 该规则由元胞邻域、空间变量、
限制因素和随机变量等组成[5] . 影响土地利用变化
的空间变量通常存在严重的相关性,如何消除相关
性并确定模型参数是 CA 转换规则的首要问题[6] .
当变量相当复杂且存在多重相关性时,传统方法如
多准则判别分析(MCE) [7]、Logistic 回归[8-9]和偏最
小二乘回归(PLS) [10]并不能完全消除其负面影响,
通过这些方法获取的参数欠合理[11] . 因此,近年来
发展了多种智能方法,可自动获取空间直观模型的
CA参数,如支持向量机[12]、神经网络[13]、蚁群智能
算法[14]、粒子群智能算法[15]和普通遗传算法[16-18]
等.
将 CA模拟结果与分类结果的累积差异值构建
为目标函数,用以引导遗传算法(generic algorithm,
GA)对 CA参数的随机搜索,从而可构建基于遗传
算法的 CA模型.通过对土地利用的初始状态、末期
状态和空间变量图层的采样可完成目标函数的构
建.不同的采样方案将导致不同的目标函数,遗传搜
索结束时的函数值也将不同,导致获取的 CA 参数
不同[16,19] . 在元胞自动机建模中,小样本量对计算
资源的要求较低,却不能全面反映研究区域;大样本
量能够较好地代表研究区域,但对计算资源的要求
较高.基于遗传智能 CA模型,以模拟结果与真实结
果的平均差异值构建目标函数,可以统一目标函数
值的量级,有利于不同采样方案的比较.本文应用基
于遗传算法的地理元胞自动机模型,分别采用 6%
和 3%两种样本方案,模拟 1992—2008 年浙江省嘉
兴市土地利用变化过程,利用混淆矩阵、Kappa 系数
和景观指数测算模拟结果的精度,验证了遗传 CA
模型对土地利用分类的模拟效果,旨在推动模型建
立者和决策者对土地利用变化动力学过程的理解,
为土地资源可持续利用与空间决策支持提供科学依
据和参考案例.
1摇 研究区域与研究方法
1郾 1摇 研究区概况
嘉兴市位于浙江省东北部、长江三角洲杭嘉湖
平原 腹 心 地 带 ( 30毅 21忆—30毅 2忆 N, 120毅 18忆—
121毅16忆 E),是长江三角洲的重要城市之一.嘉兴市
下辖南湖、秀洲两个行政区和平湖、海宁、桐乡 3 个
市以及嘉善、海盐两个县,是上海通往杭州和湖州的
交通要道,区位优势非常明显.本文以嘉兴市南湖区
为中心,以向东 12郾 5 km、向西 10郾 3 km、向南 9郾 7
km、向北 9郾 1 km所覆盖的范围作为研究区域,是嘉
兴市的核心区域,总面积 429郾 55 km2 . 改革开放以
来,嘉兴市经济快速发展,综合实力显著增强,并进
入快速城市化时期,土地利用变化剧烈;尤其是
2001—2008 年间,嘉兴市城市建成区面积增加了
1郾 5 倍.利用智能化地理 CA 模型,能够准确揭示该
市土地利用变化的规律,并模拟其未来情景.
利用 1992、2001 和 2008 年的 TM / ETM+遥感影
像,作为建模与检验模型正确性和有效性的原始数
据,影像为 760 行、628 列.以往的研究中,建模者为
了兼顾运行效率,通常将空间分辨率为 30 m 的 TM
影像重采样为 40 m 或 50 m,而本研究保留原始 30
m空间分辨率.地理 CA 模型具有尺度(粒度)敏感
性在对原始数据进行重采样时,不同的采样方法会
导致不同的结果,甚至会破坏原始数据的结构[20],
并且较高分辨率的影像数据能够更好地呈现研究区
域的真实状态,因此本文保留原始空间分辨率不变.
1郾 2摇 遗传元胞自动机模型
1郾 2郾 1 土地利用变化的驱动因素摇 地理 CA 模拟模
型是在深入理解土地利用变化机理的基础之上构建
的.一般情况下,土地利用演变的根源可概括为正距
离、负距离、自然地理属性、社会经济环境和限制条
件等 100 余种因素[7] . “正距离冶因素对土地利用产
生“推力冶作用,如公路、铁路、居住区、工业区等;
“负距离冶对土地利用产生“阻力冶作用,如耕地、水
域、特殊用地等;自然属性指地形和地质条件,如高
程、坡度和土质等;社会经济环境指对土地利用影响
重大的经济、人口、政策等因素;限制因素指限制土
地元胞发生状态改变的条件,如土地可开发总量和
基本农田保护区等[8,21-22] . 由于研究区域的具体情
况不同,常以到市中心的距离(duc)、到镇中心的距
离(dtc)、到主要道路的距离( dmr)、到耕地的距离
(dpl)和到水域的距离(dwt)作为建模需要考虑的主
要因素[7,10] .本文在遗传 CA 模型中,基于正距离、
负距离、自然地理属性、社会经济环境和限制条件这
5 个影响因素进行转换规则的参数挖掘和土地利用
模拟.
1郾 2郾 2 元胞自动机基础模型 摇 一般情况下,任意元
胞 k在时刻 t 从“未开发冶状态转换为“已开发冶状
859 应摇 用摇 生摇 态摇 学摇 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 22 卷
态的全局概率可以表达为 P tk,采用 Logistic 回归方
程建立模型如下[7-9]:
P tk = 1 / [1 + exp( - a0 + a1d1 + … + amdm)]


n伊n
cell( sk = Dev) t
n 伊 n - 1 伊 con( s
t
k = Dev)
伊 (1 + ( - ln酌) 琢 (1)
式中:P tk 为元胞 k在时刻 t的全局转换概率;1 / [1 +
exp( - a0 + a1d1 + … + amdm)] 为受空间变量驱动
的转换概率;d1,d2,…,dm 为空间变量;a0 为常数;
a1,…,am 为各对应空间变量的权重;[移
n伊n
cell( sk =
Dev) t] / (n 伊 n - 1) 为元胞邻域的影响概率;con
( stk =Dev) 为元胞状态转化的限制条件; (1 +
( - ln酌) 琢 为土地利用变化的随机影响因素;酌 为
0 ~ 1之间的随机实数;琢为随机因素大小的控制因
子,其值为[0,10] 之间的整数.
将元胞全局转换概率P tk与设定的阈值P thr(0 ~
1) 进行比较,以确定下一时刻元胞 k 的状态是否发
生转变.当土地元胞 k的转换概率 P tk 大于设定阈值
P thr 时,该元胞转化为已开发土地类型,否则元胞保
持未开发状态不变.
1郾 3摇 遗传智能 CA挖掘模型
模拟实验表明,基于 CA 的空间直观模拟结果
与区域真实形态通常存在差异,当两者无限接近时
表明模型误差较小,即计算所得的 CA 模型参数较
好[18] .在 CA全局转换概率中,待定的常数和空间
变量的权重 a0,a1,…,am 一般通过空间统计方法确
定.但空间统计方法存在无法消除变量多重共线关
系的不足,故获取的模拟结果与真实形态不可避免
地存在偏差.本文利用遗传进化计算方法,自动挖掘
和随机搜索获得模型误差(模拟值与真实值的差
异)为最小值的 CA 参数组合,从而达到 CA 优化建
模的目的.
为了利用 GA优化 CA参数,需要将 CA建模问
题映射到 GA算法空间中,即用数学模型将待解决
的问题表达出来.根据模拟值与真实值的累积平均
差异值,构造 GA待优化的目标函数 F(a):
F(a) = 1n移
n
k = 1
| P tk - fk | (2)
式中:F(a)为模拟值与实际值之间的平局差异或误
差,F(a)越小表明模型精度越高、获取的参数值越
可靠;n为采集的样本点数量;模拟值 P tk 由式(1)计
算获取;fk 为样本元胞 k 对应的真实值,fk = 1 表示
土地已开发,fk = 0 表示土地未开发[18] . a = {琢0,琢1,
…,琢 j,…,琢m},琢 j缀R 为参数空间所有可行解(或状
态)构成的集合,目标函数 F(a)取得最小值时对应
的状态 a*即是 GA挖掘所得的 CA 参数组合. 通过
遗传算法挖掘 CA参数的模型由染色体编码与种群
初始化、染色体评估函数以及选择、杂交和变异算子
等几部分构成.
1)染色体编码与种群初始化. 在遗传 CA 模型
中,染色体即是问题的可行解,其编码方式会对杂交
和变异操作产生影响[19] . 采用浮点数编码方法,定
义染色体的长度为有效解的变量长度,染色体的每
个个体相当于解的一维变量,因此染色体编码可定
义为:a={琢0,琢1,…,琢 j,…,琢m},琢 j缀R,与 CA参数的
构成方式一致.在地理元胞自动机模拟中,某特定空
间变量的权重即是遗传算法(GA)的“基因冶,所有
空间变量权重的组合就是一个可行的 CA 参数,即
GA的染色体“个体冶;一组可行的 CA 参数即是 GA
的“种群冶.遗传算法在一个随机给定的初始种群中
进行迭代搜索,为了保证初始种群一定程度上的优
良性,可以采用在传统空间统计 CA 参数的附近产
生初始种群.
2)染色体评估函数. 利用评估函数 Eval(A)评
价染色体的优劣,规定 Eval(A)值越小,则对应的染
色体越优[19] .
Eval(A)= F(a) (3)
式中:Eval为评价函数;A 为染色体;F 为差异函数;
a为可行的 CA参数.
3)种群的选择、杂交和变异. 选择算子是根据
染色体评估值,对种群中的个体进行优胜劣汰操作,
在 CA参数挖掘中保留父代群体中评估值低的个
体,遗传到下一代群体.杂交算子指两个相互配对的
染色体按某种方式相互交换部分个体,形成两个新
的个体,从而产生进化程度更高的种群.变异算子是
随机地对基因进行强制变化,改变搜索方向、扩大搜
索空间,可提高遗传算法的局部搜索能力.基因交叉
的百分数由基因交叉概率控制,交叉概率越高,收敛
于最优解区域的速度越快.
2摇 CA参数的挖掘
通过 ENVI软件对获取的 3 组遥感影像进行预
处理,主要包括图像增强、几何校正和图像分类,利
用 ArcInfo软件的空间分析功能获取空间距离图层.
在 VB郾 NET编程环境下,结合 GIS 嵌入式组件 Arc鄄
GIS Engine开发了模拟软件包来执行样本选取、地
理 CA 模拟和结果评估等功能. 元胞自动机参数的
9594 期摇 摇 摇 摇 摇 摇 摇 摇 摇 冯永玖等: 不同样本方案下遗传元胞自动机的土地利用模拟及景观评价摇 摇 摇 摇 摇 摇 摇
遗传算法获取功能则利用 Matlab 开发完成,并集成
在前述 CA模拟软件包中.
为了挖掘 CA参数,需要从影响因素图层、初始
状态图层和末期状态图层中分别获取一定比例的样
本量,有研究认为 20%比较适合[18] . 实际模拟中,
各案例采用的空间尺度不尽相同,因此以采样密度
(即单位面积采集的样本数量)作为标准更客观.从
目标函数的构造可知,由于不同样本量产生的累积
误差值存在很大差异,造成挖掘所得的 CA 参数值
存在一定差异.因此,本文利用两种采样方案作为遗
传 CA 参数挖掘和模型建立的基础,采样量分别为
6% 和 3% , 对 应 的 采 样 密 度 分 别 是 66 和
33 个·km-2 .
在遗传 CA模型中,遗传算法的参数设置如下:
1)选择算子:采用锦标赛选择法( tournament selec鄄
tion)从种群中随机挑选一定数目的个体,将最好的
个体选作父代染色体,这个过程重复 n 次完成个体
的选择,选择参数为竞赛规则,其值在[2,n];2)杂
交算子:采用单点算子,在个体编码串中随机设置一
个杂交点,然后在该点相互交换两个配对个体的部
分基因;3)变异算子:采用换位变异算子,即在染色
体上随机产生 2 个变异点,交换两点上的基因;4)
初始种群 50,迭代次数 500,CA 参数的上下界为
[-1郾 6,1郾 6],初始染色体为 [ 0郾 01, 0郾 01, 0郾 01,
0郾 01,0郾 01,0郾 01]. 利用上述优化策略,对嘉兴市
6%和 3%样本量构成的染色体评估函数进行优化,
以挖掘 CA参数(图 1).
从评估值的改善过程来看,GA 收敛速度较快,
3%样本在 315 次迭代时已获取到最佳评估值
(0郾 21) ,而6%样本在350次迭代时才获得最佳评
图 1摇 利用遗传算法挖掘 CA参数的过程
Fig. 1摇 Process of mining CA parameters with genetic algorithm.
玉:3%样本量 3% samples;域: 6%样本量 6% samples.
估值(0郾 22),可见大样本量产生目标函数的收敛速
度稍慢,且获取的评估值更大.根据染色体评估函数
的定义,最佳评估值即是传统方法计算所得的元胞
转换概率与实际转换概率之间的平均差值,可见评
估值越小则误差越小.但影响评估值的因素较多,包
括目标函数和遗传优化策略等. 由于本文采取了相
同的优化策略,因此影响评估值的主要因素为目标
函数,而目标函数主要由样本量决定,所以 6%样本
量获取的评估值大于 3%样本量.由表 1 可以看出,
3%和 6%样本量获取的 CA 参数在量级上非常接
近,在“正距离冶和“负距离冶的判断上均比较准确,
但在具体数值上还存在一定差异. 差异较明显的参
数为到镇中心距离(a2)、到主要道路距离(a3)和到
耕地距离(a4),3%样本量认为,a2 和 a4 对嘉兴市
土地利用变化的作用较大,而 6%样本量认为 a3 的
作用较大.根据嘉兴市 1992 年以来的土地利用变化
情况分析,该区域城市建成区和农村居民点的增长
主要发生在主要道路的两侧和交通便捷之地,但并
不否认镇中心作为次要增长点的有效作用. 这与
6%样本量计算的结果较符合.
3摇 结果与分析
在地理 CA模拟程序包中,利用循环测试方法
设置阈值(P thr)和模拟次数( Iter)的组合. 首先,遗
传 CA模型中阈值选择范围设置为[0郾 42,0郾 92],以
0郾 42 为初始值,经过一定模拟次数产生 2001 和
2008 年模拟结果,并与分类结果进行比较,通过总
体精度和 Kappa系数评价模拟结果的优劣;然后,以
0郾 04 的步长增加阈值,通过一定模拟次数得到模拟
结果.该系列模拟结果中,一定存在 P thr和 Iter 的最
佳组合,可得到最佳模拟结果.通过测试发现,P thr =
0郾 58 与 Iter为 9 和 16 分别可得到 2001 和 2008 年
的最佳模拟结果(图 2).
本研究重点在于检测和模拟土地利用从非城市
表 1摇 基于不同样本量获取的遗传 CA参数
Table 1 摇 CA parameters achieved by GA with different
samples
样本方案
Sampling schemes
a0 a1 a2 a3 a4 a5
3%样本
3% samples
0郾 61 0郾 81 0郾 57 0郾 20 -0郾 45 -0郾 79
6%样本
6% samples
0郾 55 0郾 64 0郾 38 0郾 81 -0郾 28 -0郾 80
a0:常数 Constant; a1:到市中心的距离 Distance to city center; a2:到
镇中心的距离 Distance to town center; a3:到主要道路的距离 Dis鄄
tance to main road; a4:到耕地的距离 Distance to cropland; a5:到水域
的距离 Distance to water.
069 应摇 用摇 生摇 态摇 学摇 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 22 卷
图 2摇 利用遗传 CA模型模拟的嘉兴市 2001 和 2008 年土地利用变化
Fig. 2摇 Simulation of urban land use changes of Jiaxing City in 2001 and 2008 using the GA based on CA model.
a)1992; b)2001; c)2008郾 玉:SVM分类 SVM classifier;域:3%样本量模拟 Simulated result with 3% samples;芋:6%样本量模拟 Simulated result
with 6% samples.
向城市的转变,因此图 2 将土地类型分为已开发、未
开发和水域 3 类.利用遥感软件 ENVI 的 SVM 分类
器对 1992 年遥感影像进行分类的结果,作为模拟的
初始状态(图 2a);利用遥感软件 ENVI的 SVM分类
器对 2001 年和 2008 年遥感影像分类的结果,分别
作为 2001 年(图 2b玉)和 2008 年(图 2c玉)的基准
图;利用遗传元胞自动机得到 3%和 6%样本量下
2001 年(图 2b域和图 2b芋)和 2008 年(图 2c域和图
2c芋)的模拟结果.
研究认为,地理 CA 的模拟结果检验通常有逐
点对比和整体对比两种方法. 前一种方法是将模拟
结果和实际分类进行叠加,通过逐点对比计算其精
度,即计算混淆矩阵[23];后一种方法是检验模拟结
果的空间格局与实际空间格局的符合程度[18] .
本文通过模拟图层的叠加对比,评价了 3%和
6%两种样本量在 2001 和 2008 年模拟结果的精度
(表 2),结果显示,对于 3%样本量构造的遗传 CA
模型, 2001 年总体精度 ( 80郾 1% ) 高于 2008 年
(78郾 9% ),而 2001 年表征一致性的 Kappa 系数
(0郾 51)小于 2008 年(0郾 60);对于 6%样本量构造的
遗传 CA模型,2001 年总体精度(83郾 9% )大于 2008
年(82郾 5% ),而 2001 年的 Kappa 系数(0郾 61)小于
2008 年(0郾 66). 表明遗传 CA 模拟的总体精度和
Kappa系数随模拟时间而衰减. 6%样本量优化的遗
表 2摇 遗传 CA空间直观模拟结果的混淆矩阵
Table 2摇 Confusion matrices between classifications from remote sensing and simulation outcomes generated by the GA based
on CA model
年份
Year
样本量
Samples
遥感分类结果(像元)
Remote sensing based classification (pixels)
土地类型
Land type
A B C
生产者精度
Producer爷s
accuracy
(% )
使用者精度
User爷s
accuracy
(% )
总体精度
Overall
accuracy
(% )
Kappa
系 数
Kappa
coefficient
2001 3% A 73696 51607 1833 71郾 2 58郾 0 80郾 1 0郾 51
B 27208 302863 3774 83郾 5 90郾 7
C 2587 8142 5570 49郾 8 34郾 2
6% A 85481 44245 1895 82郾 6 64郾 9 83郾 9 0郾 61
B 15151 309668 3939 85郾 4 94郾 2
C 2859 8699 5343 47郾 8 31郾 6
2008 3% A 204077 37639 1964 78郾 8 83郾 8 78郾 9 0郾 60
B 48610 166063 3847 80郾 6 76郾 0
C 6197 2400 6483 52郾 7 43郾 0
6% A 220797 36968 2392 85郾 3 84郾 9 82郾 5 0郾 66
B 34413 167196 4288 81郾 1 81郾 2
C 3674 1938 5614 45郾 7 50郾 0
A:已开发 Developed; B:未开发 Non鄄developed; C:水域 Water.
1694 期摇 摇 摇 摇 摇 摇 摇 摇 摇 冯永玖等: 不同样本方案下遗传元胞自动机的土地利用模拟及景观评价摇 摇 摇 摇 摇 摇 摇
表 3摇 遗传 CA模拟结果与分类结果的景观格局比较
Table 3摇 Comparison of landscape pattern between simulation outcomes derived by the GA based on CA model and classified
results
景观指数
Landscape
index
2001
分类结果
Classified result
3%样本
3% samples
6%样本
6% samples
2008
分类结果
Classified result
3%样本
3% samples
6%样本
6% samples
NP 4413 4804 4813 4801 5013 4917
PD 14郾 79 16郾 10 16郾 13 16郾 54 17郾 27 16郾 94
LSI 33郾 02 39郾 44 37郾 32 47郾 69 43郾 00 45郾 11
FRAC 1郾 40 1郾 44 1郾 43 1郾 41 1郾 46 1郾 43
CONTAG 41郾 45 33郾 34 34郾 98 21郾 70 23郾 45 22郾 57
AI (% ) 90郾 8 88郾 9 89郾 5 86郾 5 87郾 9 86郾 8
Eland(% ) - 12郾 5 9郾 9 - 5郾 9 3郾 1
NP:斑块数量 Patch number; PD:斑块密度 Patch density; LSI:景观形状指数 Landscape shape index; FRAC:斑块分维数 Patch fractal dimension;
CONTAG:景观蔓延度指数 Landscape spread index; AI:聚合性指数 Cohesiveness index; Eland:景观综合评价指数 Landscape comprehensive evalua鄄
tion index.
传 CA模型模拟结果的总体精度高于 3%样本量所
构建模型,且前者 Kappa 系数表征的一致性程度较
高.在地理 CA建模过程中,建议选取尽可能大的样
本量,以更好地代表整个研究区域,同时又要兼顾模
型运行效率及对计算资源的要求,在两者之间取得
平衡.
摇 摇 为了多角度评价模拟结果,进一步从景观格局
视角分析土地利用空间结构的差异. 通过 6 个景观
指数[斑块数量(NP)、斑块密度(PD)、景观形状指
数(LSI)、斑块分维数 ( FRAC)、景观蔓延度指数
(CONTAG)和聚合性指数(AI) [24] ]多角度评价模
拟结果的景观特征,并与实际分类结果的景观指数
进行对比.同时,为了评价模拟结果,本文提出了综
合评价指标:
E land =
1
n移
n
i = 1
[(Si - C i) / C i] 2 (4)
式中:E land 为模拟结果与实际分类结果的综合景观
差异指数;n为景观指数的数量;Si为模拟结果的第 i
种景观指数;C i 为第 i种景观指数的实际值.
摇 摇 2001—2008 年,嘉兴市土地利用总斑块数量
(NP)和斑块密度(PD)均呈增加态势,土地利用结
构趋于复杂化;表征斑块形状复杂程度的景观形状
指数(LSI)增大,表明斑块破碎化程度增加;表征斑
块自相似和复杂程度的斑块分维数(FRAC)呈增加
趋势,显示景观形态趋于复杂;景观蔓延度指数
(CONTAG)呈减小趋势,说明景观中不同斑块类型
的团聚程度越来越高;聚合性指数(AI)呈减少趋
势,表明相同斑块类型的聚集程度越来越低. 2001
年 3% 和 6% 样本量的 E land值分别为 12郾 5% 和
9郾 9% ,2008 年 3% 和 6% 样本量的 E land值分别为
5郾 9%和 3郾 1% ,表明 6%样本量产生的模拟结果与
分类结果差异较小,即 6%样本量构造的遗传 CA模
型较好.因此,在构建遗传 CA 模型时,不仅要考虑
遗传智能的优化策略,更要考虑被优化的目标函数,
该函数通过样本数据产生,以致样本数据对智能优
化和参数挖掘均有较大影响,需要多少样本量应该
根据研究区域而定.
4摇 结摇 摇 语
地理元胞自动机模型在土地利用、城市生长和
生态格局等具有空间特征的复杂系统中广泛应用,
不仅能追溯其历史格局,也能根据不同限制条件预
测其未来情景. 然而,在构建 CA 模型过程中,涉及
的空间变量复杂且具有多重共线性关系,普通方法
获取的模型所产生的模拟结果与真实分类结果之间
存在差异.这种差异大则表明模型性能较差,而差异
小则表明模型性能较优.根据 CA模型的构建原理,
可以将累积差异值通过离散的数学函数表达出来.
利用生物信息学中的遗传智能算法,以上述函数为
优化目标,利用其函数值评价染色体的优劣,并逐步
寻找到最小差异值,经过遗传算法自动搜索,能够随
机优化并挖掘地理 CA 模拟模型. 本文以嘉兴市为
例,随机获取 6%和 3%的样本点构建目标函数并挖
掘 CA参数,模拟了该区域 1992—2008 年的土地利
用变化过程,并利用混淆矩阵、Kappa 系数和景观指
数对模拟结果进行评价,结果表明,在既定遗传优化
策略的情况下,与小样本量获取的模拟结果相比,大
样本量的遗传 CA 模型的精度较高,景观格局更接
近遥感分类结果.
根据既定区域计算 CA模型参数受到遗传优化
策略和样本量的影响,并不能确定是否适合于其他
区域.但通过遗传智能优化地理 CA 模型的方法和
269 应摇 用摇 生摇 态摇 学摇 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 22 卷
框架,对各区域的土地利用变化和城市生长均具有
普适性.
参考文献
[1]摇 Liu X鄄P (刘小平), Li X (黎摇 夏), Peng X鄄J (彭晓
鹃). Niche鄄based cellular automata for sustainable land
use planning. Acta Ecologica Sinica (生态学报 ),
2007, 27(6): 2391-2403 (in Chinese)
[2]摇 He CY, Okada N, Zhang QF, et al. Modeling urban
expansion scenarios by coupling cellular automata model
and system dynamic model in Beijing, China. Applied
Geography, 2006, 26: 323-345
[3]摇 Seppelt R, Voinov A. Optimization methodology for land
use patterns using spatially explicit landscape models.
Ecological Modelling, 2002, 151: 125-142
[4] 摇 Liu Y鄄L (刘耀林), Liu Y鄄F (刘艳芳), Ming D鄄P
(明冬萍). Urban expansion model based on cellular
automata of decision鄄making with grey situation. Geo鄄
matics and Information Science of Wuhan University (武
汉大学学报·信息科学版), 2004, 2(1): 7-13 ( in
Chinese)
[5]摇 Zhou C鄄H (周成虎), Ou Y (欧摇 阳), Ma T (马摇
廷), et al. Theoretical perspectives of CA鄄based geo鄄
graphical system modeling. Progress in Geography (地
理科学进展), 2009, 28(6): 833-838 (in Chinese)
[6]摇 Kathleen PB, Elena GI. Spatially explicit micro鄄level
modelling of land use change at the rural鄄urban inter鄄
face. Agricultural Economics, 2002, 27: 217-232
[7]摇 Wu F, Webster CJ. Simulation of land development
through the integration of cellular automata and multi鄄
criteria evaluation. Environment and Planning B: Plan鄄
ning and Design, 1998, 25: 103-126
[8]摇 Wu F. Calibration of stochastic cellular automata: The
application to rural鄄urban land conversions. Internation鄄
al Journal of Geographical Information Science, 2002,
16: 795-818
[9]摇 Wu G鄄P (吴桂平), Zeng Y鄄N (曾永年), Zou B (邹
滨), et al. Simulation on spatial land use patterns using
autoLogistic method: A case study of Yongding County,
Zhangjiajie. Acta Geographica Sinica (地理学报),
2008, 63(2): 156-164 (in Chinese)
[10]摇 Feng Y鄄J (冯永玖), Tong X鄄H (童小华), Liu M鄄L
(刘妙龙). Modelling urban growth with geographical
cellular automata and partial least squares regression.
Journal of Tongji University (Natural Sciences) (同济
大学学报·自然科学版), 2010, 38(4): 608 -612
(in Chinese)
[11]摇 Sant佴 I, Garc侏a AM, Miranda D, et al. Cellular autom鄄
ata models for the simulation of real鄄world urban proces鄄
ses: A review and analysis. Landscape and Urban Plan鄄
ning, 2010, 96: 108-122
[12]摇 Yang Q鄄S (杨青生), Li X (黎摇 夏). Cellular autom鄄
ata for simulating land use changes based on support
vector machine. Journal of Remote Sensing (遥感学
报), 2006, 10(6): 836-846 (in Chinese)
[13]摇 Li X, Yeh AGO. Neural鄄network based cellular automa鄄
ta for simulating multiple land use changes using GIS.
International Journal of Geographical Information Sci鄄
ence, 2002, 16: 323-343
[14]摇 Liu X, Li X, Liu L, et al. A bottom鄄up approach to
discover transition rules of cellular automata using ant
intelligence. International Journal of Geographical Infor鄄
mation Science, 2008, 22: 1247-1269
[15]摇 Feng Y鄄J (冯永玖), Tong X鄄H (童小华), Liu Y (刘
艳), et al. A particle swarm intelligence based cellular
model for urban morphology evolution modelling: A case
study in Jiading District of Shanghai. Journal of Geo鄄In鄄
formation Science (地球信息科学学报), 2010, 12
(1): 17-25 (in Chinese)
[16]摇 Karafyllidis I. Acceleration of cellular automata algo鄄
rithms using genetic algorithms. Advances in Engineering
Software, 1999, 30: 419-437
[17]摇 Feng C (冯摇 春), Ma J鄄W (马建文), Dai Q (戴摇
芹), et al. A cellular automata model based on genetic
algorithm simultaneously retrieving factor weights. Geo鄄
Information Science (地球信息科学), 2005, 7(1): 71
-75 (in Chinese)
[18]摇 Li X, Yang QS, Liu XP. Genetic algorithms for deter鄄
mining the parameters of cellular automata in urban sim鄄
ulation. Science in China Series D: Earth Sciences,
2007, 50: 1857-1866
[19]摇 Sivanandam SN, Deepa SN. Introduction to Genetic Al鄄
gorithms. Berlin: Springer, 2009
[20] 摇 Kocabas V, Dragicevic S. Assessing cellular automata
model behaviour using a sensitivity analysis approach.
Computers, Environment and Urban System, 2006, 30:
921-953
[21]摇 Liu Y. Modelling Urban Development with Geographical
Information Systems and Cellular Automata. Boca Ra鄄
ton: CRC Press, 2008
[22]摇 Han J, Hayashi Y, Cao X, et al. Application of an in鄄
tegrated system dynamics and cellular automata model
for urban growth assessment: A case study of Shanghai,
China. Landscape and Urban Planning, 2009, 91: 133
-141
[23]摇 Pontius RG, Huffaker D, Denman K. Useful techniques
of validation for spatially鄄explicit land鄄change models.
Ecological Modelling, 2004, 179: 445-461
[24]摇 Turner MG, Gardner RH. Quantitative Methods in
Landscape Ecology. New York: Springer鄄Verlag, 1991
作者简介摇 冯永玖,男,1981 年生,博士,讲师. 主要从事遥
感与 GIS应用、生态安全评估与空间直观模拟研究. E鄄mail:
yjfeng@ shou. edu. cn
责任编辑摇 杨摇 弘
3694 期摇 摇 摇 摇 摇 摇 摇 摇 摇 冯永玖等: 不同样本方案下遗传元胞自动机的土地利用模拟及景观评价摇 摇 摇 摇 摇 摇 摇