全 文 :第 34 卷第 15 期
2014年 8月
生 态 学 报
ACTA ECOLOGICA SINICA
Vol.34,No.15
Aug.,2014
http: / / www.ecologica.cn
基金项目:国家自然科学基金(41276156); 国家发改委产业化专项(2159999);上海市自然科学基金面上项目(13ZR1419300);教育部高等学校
博士学科点专项科研基金新教师类项目(20123104120002);上海市一流学科水产学(A类)共同资助
收稿日期:2012鄄12鄄17; 摇 摇 网络出版日期:2014鄄03鄄03
*通讯作者 Corresponding author.E鄄mail: xjchen@ shou.edu.cn;
DOI: 10.5846 / stxb201212171813
冯永玖,陈新军,杨晓明,高峰.基于遗传算法的渔情预报 HSI建模与智能优化.生态学报,2014,34(15):4333鄄4346.
Feng Yongjiu1,2,3, Chen X J, Yang X M, Gao F.HSI modeling and intelligent optimization for fishing ground forecasts using a genetic algorithm.Acta
Ecologica Sinica,2014,34(15):4333鄄4346.
基于遗传算法的渔情预报 HSI建模与智能优化
冯永玖1,2,3,4,陈新军1,2,3,4,*,杨晓明1,2,3,高摇 峰1,2,3
(1. 上海海洋大学海洋科学学院,上海摇 201306; 2. 大洋渔业资源可持续开发省部共建教育部重点实验室,上海摇 201306
3. 国家远洋渔业工程技术研究中心,上海摇 201306; 4. 远洋渔业协同创新中心,上海摇 201306)
摘要:鱼类栖息地适宜性指数模型(HSI)基于鱼类分布与海洋环境之间存在的非线性关系而构建。 然而,海洋环境因子之间存
在着传统方法无法消除的相关性,导致获取的 HSI参数较难准确表达环境因子与渔场之间的复杂关系。 基于遗传算法(GA),
自动消除海洋环境因子之间的相关性,构建了一种通用的鱼类 HSI 建模与智能优化框架(GeneHSI)。 GeneHSI 框架的核心是
HSI建模空间向遗传算法空间的映射以及 GA适应度函数的构建。 该函数构建的思想是 HSI预测的渔场概率与商业捕捞获取
的渔场概率之间的累计误差值达到最小化。 GeneHSI由待解问题构建、GA初始化和 GA 优化策略 3 部分组成。 利用随机生成
的标准化海洋环境数据与渔场概率数据,验证了 GeneHSI模型框架的有效性。 研究表明,GeneHSI能够有效优化 HSI的建模并
能自动获取 HSI参数。 不同限制条件下,遗传算法获取的 HSI具有较大的差异,其中一般优化策略下获取的 HSI 参数最差;不
等式、等式和上下界条件下,GeneHSI优化过程显著地更加合理,因此获取的 HSI参数也更准确。 此外,100、1000、5000和 10000
样本量下的优化建模表明,GeneHSI具有处理海量样本数据的能力。
关键词:渔情预报;栖息地适宜性指数;遗传算法;智能优化;模拟数据
HSI modeling and intelligent optimization for fishing ground forecasts using a
genetic algorithm
FENG Yongjiu1,2,3,4, CHEN Xinjun1,2,3,4,*, YANG Xiaoming1,2,3, GAO Feng1,2,3
1 College of Marine Sciences, Shanghai Ocean University, Shanghai 201306, China
2 The Key Laboratory of Sustainable Exploitation of Oceanic Fisheries Resources ( Shanghai Ocean University ), Ministry of Education, Shanghai
201306, China
3 National Distant鄄water Fisheries Engineering Research Center (Shanghai Ocean University), Shanghai 201306, China
4 Collaborative Innovation Center for Distant鄄water Fisheries, Shanghai 201306, China
Abstract: The construction of a habitat suitability index (HSI) model is a crucial problem in fishing ground forecasts. In
general, the HSI model is established by estimating the relationship between marine environmental factors and fishing
ground probabilities. However, the environmental factors observed by remote sensing technology and commercial fishing
investigations are usually highly correlated, and conventional methods such as the continued product model, minimum
model, maximum model, arithmetic mean model, and geometric mean model cannot eliminate the harmful effects caused by
the correlation of fishing data. As a result, it is difficult for them to capture the complex relations between environmental
factors and fishing ground probabilities. Based on the widely used intelligent optimization method of genetic algorithms
(GAs), this paper presents a general framework called GeneHSI for HSI modeling and intelligent optimization. Most
importantly, the GeneHSI framework can remove the harmful effects of correlation, allowing the automatic retrieval and
http: / / www.ecologica.cn
optimization of the HSI parameters. The core of GeneHSI modeling is the construction of a fitness function. This function was
built by projecting the logistic regression鄄based HSI space to that of a GA, and is used to guide the optimization process of
GeneHSI. Specifically, the fundamental concept of the projection is to minimize accumulative errors between the computed
ground probabilities and the observed probabilities converted from commercial fishing data. The proposed GeneHSI
framework is composed of three elements. These are the construction of the problem to be solved, the initialization of the
GA, and the optimization strategy of the GA. The validation and effectiveness of the GeneHSI framework have been
demonstrated using simulation data, that is, randomly generated normalized marine environmental factors and fishing ground
probabilities range from 0 to 1. Research shows that the GeneHSI framework is effective and efficient in retrieving and
optimizing HSI parameters for fishing ground forecasts. Because of the stochastic characteristics of GAs, however, there is a
high requirement for modelers and scientists to better control the implementation of the GeneHSI framework. The HSI
parameters retrieved by the GeneHSI framework vary under different constraints. Such constraints used in GAs commonly
include linear inequalities and linear equality constraints on the underlying relations between marine environmental factors
and fishing ground probabilities, as well as constraints on the bounds of HSI parameters. Compared with the results under
optimization strategies using these constraints, the results under a general optimization strategy are inferior in that the
GeneHSI framework cannot obtain a good match between the best鄄fitness and mean鄄fitness curves. In theory, the fitness
value is the accumulative error of the GeneHSI model; hence, a smaller value indicates a better result. However, a good
convergence process does not necessarily lead to a minimum fitness value amongst fitness functions under different
constraints. In this paper, therefore, an evaluation of the convergence process, instead of a minimum fitness value, is
considered the fundamental standard for the assessment of a good set of HSI parameters. In addition, experience and
professional knowledge are required for an exact assessment of the HSI parameters. Overall, the above constraints,
especially those on the parameter bounds, greatly help the optimization of the GeneHSI framework to retrieve better HSI
parameters. In addition, the implementation of the GeneHSI framework with 100, 1 000, 5 000, and 10 000 samples
demonstrates its strong capability for processing the mass data of fishing grounds. It is expected that the GeneHSI framework
can enrich the modeling methods and theories of fishing grounds, and hence guide the application of intelligent optimization
methods in fishing ground HSI modeling.
Key Words: fishing ground forecasts; habitat suitability index; genetic algorithm; intelligent optimization; simulation data
摇 摇 栖息地适宜性指数(HSI)模型最早由美国科学
家于 20世纪 80 年代提出,用来模拟生物体对周围
栖息环境要素的反应[1]。 目前已广泛应用于物种分
布与管理等领域[2],并逐渐在海洋渔场的分析与预
测中得到了应用[3鄄5],如印度洋大眼金枪鱼[6鄄8]、大西
洋及太平洋的鱿鱼[9鄄11]、以及鲐鱼、秋刀鱼等[12]。 从
研究方法来看,主要有权重求和法、几何平均法[6鄄7]、
分位数回归方法[13]和主成分分析法[14]等。 HSI 的
研究不仅是为了从理论上认知渔场分布与海洋环境
要素的关系,也是为了向捕捞生产和渔业资源管理
者提供信息参考。
海洋环境要素与中心渔场之间存在动态交互关
系并构成一个复杂的系统,环境要素之间通常存在
一定的相关性。 经典数理统计方法在构建 HSI 模型
时,由于无法消除环境要素固有的多重相关性,分析
预报的精度受到极大的限制。 因此,如何建立高精
度的渔情预报模型,降低预报的不确定性,便成为了
鱼类 HSI建模需要解决的关键科学问题。
从最小化中心渔场预测值与实测值之间的差异
的角度出发,利用人工智能方法进行自动优化,则可
望提高渔情预报的精度和降低预报的不确定性。 作
为一种著名的组合优化算法,遗传算法(GA)常用于
求解复杂函数的极值[15]。 遗传算法源自对达尔文
生物进化论的模拟计算,是一种通过模拟自然进化
过程搜索最优解的方法,目前已成为一种成熟的进
化智能算法[16]。 近 20 年来,遗传算法在众多领域
得到了广泛应用,例如在复杂地理系统的建模中遗
传算法被用于建立非线性元胞自动机模型[17],与之
4334 摇 生摇 态摇 学摇 报摇 摇 摇 34卷摇
http: / / www.ecologica.cn
类似的组合优化算法粒子群优化算法和模拟退火算
法也得到了较好的应用[18鄄19]。 鉴于此,本研究基于
遗传算法构建一种能够获取和优化中心渔场 HSI 参
数的智能建模框架 GeneHSI,并利用模拟数据进行该
框架的执行测试。 同时,验证 GeneHSI 模型框架在
一般优化策略、不等式、等式和上下界限制条件下对
渔业模拟数据的建模优化,并测试了 GeneHSI 模型
框架对于不同样本量数据的优化解算能力。 该基于
遗传算法的 GeneHSI 框架将有助于实现渔情预报
HSI 的优化建模,并可望引导智能方法在渔业 HSI
建模中的应用。
1摇 GeneHSI模型构建
1.1摇 遗传算法简介
遗传算法(GA)是一种基于生物自然选择与遗
传机理的随机搜索算法。 与传统搜索算法不同,GA
从一组随机产生的“种群冶 (初始可行解)开始搜索
过程[15]。 待解问题的每一个参数即是一个“基因冶,
一组基因构成了问题的一个可行解,解是种群中的
个体,称为“染色体冶。 在遗传算法中,染色体被编码
为一串符号(二进制字符串),这些字符串在在后续
迭代中根据遗传规则不断进化[16]。 遗传算法在适
应度函数的引导下进行迭代搜索,通过适应度值来
判断染色体的优劣并进行优胜劣汰;在未达到算法
终止条件时,通过选择、交叉和变异 3 个算子产生下
一代染色体。 在形成新一代过程中,根据适应度值
的大小选择部分后代,淘汰部分较差后代同时保持
种群大小为常数,并继续进行随机搜索和迭代,直到
算法收敛从而得到最优解(最优染色体) [15鄄16]。
1.2摇 HSI与遗传算法空间的映射关系
以综合栖息地基本模型(如连乘模型、算术平均
模型、几何平均模型、logistic回归模型等)为基础,以
实际作业换算的 HSI 为基准[20],构建 GA 算法的适
应度函数[15]。 利用遗传算法自动寻找该适应度函
数的最小值,其意义为 GA 获取的参数能够使模型
预测值与实际作业换算的 HSI 值之间的差异达到最
小化[16]。 对应于最小适应度函数值的染色体,就是
一组通过 GA 优化所得的栖息地指数模型的参数,
而对应的“基因冶则为各海洋渔业环境要素的权重。
由这样一组染色体构建的 HSI模型,即为 GA优化的
渔场预报模型。
1.3摇 GeneHSI模型中 GA的适应度函数与优化策略
(1)染色体编码与种群初始化摇 染色体即是一
组参数的可行解,采用浮点数编码方法,定义染色体
的长度为有效解的变量长度,定义染色体编码为 a =
{a0,a1,…,aj,…,am},aj是 HSI 模型参数,即 GA 算
法中的基因,m表示基因个数。
(2)适应度函数摇 适应度函数是渔场预报建模
向遗传算法映射的核心,只有构建适应度函数才能
够理解遗传算法的本质,也才能够进行遗传算法的
渔情预报 HSI 建模。 基于我们前期对元胞自动机、
模拟退火算法和粒子群算法的大量研究[16鄄19],构建
了渔情预报 HSI 建模的适应度函数。 在遗传算法
中,利用适应度函数 F(a)评价染色体(可行解)的优
劣,规定 F(a)的值越小则对应的染色体越优:
F(a) = 移 ni = 1(HSIc - HSIa)
2
i
/ n (1)
式中,HSIc表示通过海洋环境因素计算所得的渔场
概率,即 HSIc = 1 / [1+exp(-(a0+a1x1+…+amxm))],
HSIa表示通过商业捕捞数据计算而得的渔场概率,n
表示样本点的数量。 其中,HSIc的表达式是一种
logistic回归方程式,虽然目前为止这种表达形式在
渔业栖息地研究中并未发现,但是 logistic 回归在野
生动物的栖息地建模中广泛使用,一些经典论文的
引用频次更是达到数百次之多,这表明 logistic 回归
在动物栖息地建模中理论上是成立的[21鄄22]。
国际上利用 logistic回归进行野生动物栖息地建
模的经典案例很多,包括格雷厄姆山红松鼠、高温蚱
蜢和布什蟋蟀、高海拔稀有物种以及麂和喜马拉雅
斑羚等[22鄄25]。 海洋鱼类是典型的水生野生动物,其
栖息地模式与文献中野生动物非常接近,从生态学
上可以判定 logistic回归符合海洋鱼类。 在一项关于
鱼类种群判别的研究中,认为 logistic 回归比判别分
析的效果要好,这直接证明了 logistic 回归可以用于
渔业资源与渔场学领域[26]。 在此将 logistic 回归方
程作为核心构建适应度函数,但是在 GeneHSI 建模
中并不需要真正执行 logistic 回归,只需要借用这种
在理论上成立的方程式,通过遗传算法自动获取 HSI
参数从而完成 HSI的建模。
(3)种群的选择、交叉与变异摇 确定适当的选择
算子、交叉算子、变异算子以及算法终止条件,作为
GA算法的优化策略[15鄄16]。
(4)最优染色体的获取摇 最后获取的最优染色
5334摇 15期 摇 摇 摇 冯永玖摇 等:基于遗传算法的渔情预报 HSI建模与智能优化 摇
http: / / www.ecologica.cn
体即为需要确定的权重参数[15鄄16],用于建立基于遗
传算法的综合 HSI模型框架 GeneHSI。
基于遗传算法的基本理论以及从渔场预报向遗
传算法的映射关系,构建用于渔情预报 HSI 参数获
取与优化的建模框架 GeneHSI(图 1)。 GeneHSI 模
型框架通过 Matlab“Optimization Tool冶中的 GA 工具
进行构建。 由于该 GA 工具主要针对连续函数,而
渔业 HSI的适应度函数却是一种遍历所有样本点的
离散函数,因此需要将该离散函数编写成为 Matlab
代码供 GA工具调用和执行[16]。
图 1摇 遗传算法用于渔情预报 HSI参数获取与优化的建模框架
Fig.1摇 A general framework for retrieving and optimizing fishing forecast HSI parameters based on generic algorithm
摇 摇 图 1表明 GeneHSI由 3个部分组成:(1)待解问
题构建,即 HSI模型向遗传算法空间的映射,通过海
洋环境因子、商业捕捞数据、以及基于 logistic回归的
渔场概率方程构建遗传算法的适应度函数;(2)GA
初始化,即确定 GA产生初始 HSI 参数的方案和 GA
初始种群数量等;(3)GA优化策略,即确定适应度函
数优化过程中的迭代方法,包括可行解判断方法、新
解产生的选择、交叉和变异算子以及算法终止规则
等。 其中,选择概率 Ps一般通过比例选择和保存策
略等方法自动确定,交叉概率 Pc一般选取 0.4—0.99
之间的值,而变异概率 Pm一般选取 0郾 0001—0.1 之
间的值[15]。 模型终止准则包括以下几个方面[15鄄16]:
1)GeneHSI 最大计算时间 (与计算机硬件关系较
大),超出设定的时间则模型终止;2)最大迭代次数,
达到该迭代次数则模型终止;3)适应度函数极限值,
当达到极限值则模型终止;4)两次计算所得的适应
度函数值的差值(计算精度),当该差值小于某阈值
则模型终止。
2摇 GeneHSI框架的模拟数据应用与分析
2.1摇 渔业模拟数据
摇 摇 为验证该 GeneHSI 模型框架的正确性和有效
性,更进一步探测其使用和控制方法,使用模拟数据
进行测试。 在模拟数据中,假设与渔场概率相关的
海洋环境因素有温度、盐度、叶绿素、溶解氧、温差以
及海面高度距平均值等。 由于各种海洋环境因素的
值域范围不一致,为了能够在同一个方程式中进行
换算,将其进行归一化处理,所有环境因子的值域范
围归一化到 [ 0, 1] 之间。 在实际操作中,利用
EXCEL的随机数发生器 RAND( )产生模拟数据,
6334 摇 生摇 态摇 学摇 报摇 摇 摇 34卷摇
http: / / www.ecologica.cn
RAND()随机产生的数值均在[0—1]之间(表 1)。
根据研究要求,分别产生了 50、100、1000、5000 和
10000等 5种样本数据,用于检验 GeneHSI模型的有
效性以及模型对样本量的响应。
表 1摇 归一化海洋环境因子与渔场概率的模拟数据
Table 1摇 Normalized simulated data for fishing ground probability and corresponding marine environmental factors
数据项
No. of
samples
海表温度
Sea surface
temperature
(SST)
盐度
Sea salinity
(SS)
叶绿素
Chlorophyll鄄a
(CHA)
溶解氧
Dissolved
oxygen
(DO)
温差
Temperature
difference
(TD)
海面高度
距平均值
Sea surface
height anomaly
(SSHA)
渔场概率
Fishing ground
probability
(FGP)
1 0.3003 0.2628 0.8899 0.2849 0.4754 0.8627 0.1919
2 0.6112 0.7253 0.5983 0.4180 0.9300 0.5017 0.7640
3 0.4074 0.8635 0.1323 0.5995 0.4017 0.7001 0.7629
4 0.2157 0.2779 0.2720 0.5612 0.2196 0.7543 0.6644
5 0.1506 0.4958 0.4862 0.3367 0.7677 0.9388 0.9665
6 0.7711 0.4506 0.4589 0.7334 0.1176 0.0071 0.9236
7 0.0386 0.6371 0.9703 0.0621 0.6235 0.6795 0.0886
8 0.1304 0.9272 0.6833 0.6298 0.6442 0.8488 0.8426
9 0.5302 0.1758 0.9313 0.2705 0.7852 0.8672 0.4537
10 0.5512 0.6660 0.3100 0.8085 0.3702 0.2512 0.0952
… … … … … … … …
2.2摇 HSI参数获取
在 GeneHSI 模型执行之前,首先必须确定模型
的优化策略,即确定遗传算子与终止准则。 本文使
用轮盘赌法自动确定选择概率 Ps,选取交叉概率 Pc
为 0.6,而变异概率 Pm为 0.1。 由于模型计算时间与
适应度极值的影响较小,本研究设置模型终止准则
为最大迭代次数 500 次和最优适应度函数差值(计
算精度)为 1e-6,达到其中任何一个条件则模型终
止。 在 GeneHSI模型实际执行中,均由于计算精度
达到 1e-6而终止模型运行。 根据 GeneHSI 模型以及
模型优化策略,首先利用 50 个模拟数据样本点建立
了适应度函数,从而获取 HSI 的参数。 遗传算法在
获取 HSI 参数的过程中,受到适应度函数的引导并
进行优化,随着优化的推进适应度函数值不断降低,
最终达到最小值(图 2)。 该最小值即为在最终获取
的 HSI 参数下,预测渔场概率与真实渔场概率之间
差异的最小值。
遗传算法对 HSI参数进行计算与优化的适应度
收敛过程。 最佳适应度值收敛到 0郾 250918,平均适
应度值收敛到 0.27452,根据适应度函数的构造理
论,适应度值越小表明 HSI 参数导致的预测预报误
差越小。 最佳适应度值和平均适应度值均随迭代而
减小,最佳适应度值在第 16 次迭代时收敛,但平均
适应度值上下波动,未呈现收敛趋势(图 2)。 直到
迭代结束,最佳、最差(Worst)与平均适应度值之间
的差异仍较大,表明 GeneHSI 在没有限制参数的条
件下收敛性较差,结果并不理想(图 2)。 因此,获取
的 HSI参数与真实情况存在一定的差异(表 2)。
表 2摇 一般优化策略下遗传算法获取的 HSI参数
Table 2摇 HSI parameters retrieved using genetic algorithm under a general optimization strategy
常数项
Constant
海表温度
SST
盐度
SS
叶绿素
CHA
溶解氧
DO
温差
TD
海面高度距平均值
SSHA
-1.1925 -0.8240 0.2412 1.8855 0.9745 1.0139 -0.8059
2.3摇 限制条件及样本量对优化结果的影响
2.3.1摇 不等式限制条件
由于一般优化策略下获取的 HSI 参数并不理
想,因此需对 HSI 的参数范围进行限制,使 GeneHSI
在有限的范围内进行搜索,确保结果更加准确。 遗
传算法中,不等式、等式和参数范围限制条件较常
7334摇 15期 摇 摇 摇 冯永玖摇 等:基于遗传算法的渔情预报 HSI建模与智能优化 摇
http: / / www.ecologica.cn
图 2摇 一般优化策略下利用遗传算法获取与优化 HSI参数的收敛过程
Fig.2摇 Fitness track and scores of the corresponding fitness of GeneHSI model under a general optimization strategy
用,其中不等式和等式限制条件指的是多种海洋环
境因子(温度、盐度、叶绿素、溶解氧、温差以及海面
高度距平均值)符合的某种关系,而参数范围限制条
件指的是 HSI 参数上下界范围。 一般地,不等式条
件可以表达为:
A伊x 臆 b (2)
式中,A和 b是待定的限制条件,若 A为矩阵,则 b为
向量;若 A为向量,则 b为数值;x是海洋环境因子向
量。 在 GeneHSI优化执行中,x 是既定的样本数据,
A和 b的设置需经过理论探讨和经验分析加以确定,
可以源于传统方法的计算结果、也可以源于对研究
对象和研究区域的认知。
为了探测不等式限制条件对 GeneHSI 结果的影
响,设 A=[1 1 1 1 1 1 1]、b= 5进行 GeneHSI模型执
行,优化过程和 HSI参数结果分别如图 3和表 3。
图 3表明,在不等式条件下最佳适应度值收敛
到 0.256759,平均适应度值收敛到 0.264893。 在迭
代 30次之后,平均与最佳适应度的收敛曲线较为接
近,呈现较为明显的收敛状态(图 3)。 当适应度函
数曲线开始收敛,最佳与平均适应度值开始接近,而
最差适与平均适应度值之间的差异仍较大(图 3)。
表 3摇 不等式限制条件下遗传算法获取的 HSI参数
Table 3摇 HSI parameters retrieved using genetic algorithm under linear inequalities
常数项
Constant
海表温度
SST
盐度
SS
叶绿素
CHA
溶解氧
DO
温差
TD
海面高度距平均值
SSHA
-0.7064 -1.3827 -0.1444 1.0329 1.2298 0.7182 -0.0905
2.3.2摇 等式限制条件
与不等式限制条件类似,等式限制条件可以表
达为:
Aeq伊x = beq (3)
式中,Aeq 和 beq 是待定的限制条件,若 Aeq 为矩阵,
则 beq为向量;若 Aeq 为向量,则 beq 为数值;x 是海
洋环境因子向量。 与不等式条件类似,x是既定的样
本数据,Aeq和beq通过理论和经验分析加以确定。
8334 摇 生摇 态摇 学摇 报摇 摇 摇 34卷摇
http: / / www.ecologica.cn
图 3摇 不等式限制条件下利用遗传算法获取与优化 HSI参数的收敛过程
Fig.3摇 Fitness track and scores of the corresponding fitness of GeneHSI model under linear inequalities
为探测等式限制条件对 GeneHSI 结果的影响,设置
Aeq=[0 1 1 1 1 1 1]、beq = 3.5 进行优化。 根据上述
等式限制条件进行 GeneHSI 模型执行,其优化过程
和 HSI参数结果分别如图 4和表 4。
等式限制条件下, 最佳适应度值收敛到
0郾 284878,平均适应度值收敛到 0.284905。 在迭代
25次之后,平均与最佳适应度值完全重合,说明适应
度函数曲线完全收敛,且效果较好。 随着适应度函
数开始收敛,最佳、最差和平均适应度值完全一致,
表明 GeneHSI优化效果非常理想(图 4)。
2.3.3摇 上下界限制
除了不等式和等式限制条件,在 GeneHSI 算法
中也常用到上下界限制限制条件。 研究表明,传统
HSI 建模中获取的 HSI 参数值域均为 0 到 1 之
间[10鄄13],因此在 GeneHS 优化控制中可利用这个关
键的信息对适应度函数进行引导。 为此,设置 HSI
参数的上界为 [1 1 1 1 1 1 1],而下界为[0 0 0 0 0 0
0],优化过程如图 5。
从图 5 可知,上下界限制条件下 GeneHSI 在迭
代到 34 次时开始收敛,最佳适应度值收敛到
0郾 252479,平均适应度值收敛到 0.253145,收敛后最
佳与平均适应度曲线重合较好。 随着优化进程最差
和最佳适应度值之间的范围不断缩小,开始收敛到
最优适应度值,但是优化中最差适应度值仍有局部
反弹迹象(图 5)。 总体评估来看,GeneHSI优化的效
果相对较好,最终获取的 HSI参数如表 5。
2.3.4摇 综合限制条件
为达到 GeneHSI 模型的最佳优化效果,通常同
时使用不等式、等式和上下界 3 种限制条件,形成综
合限制条件。 图 6显示了 3 种限制条件同时使用的
适应度函数优化过程,具体限制条件与前述设置保
持一致。
表 4摇 等式限制条件下遗传算法获取的 HSI参数
Table 4摇 HSI parameters retrieved using genetic algorithm under linear equalities
常数项
Constant
海表温度
SST
盐度
SS
叶绿素
CHA
溶解氧
DO
温差
TD
海面高度距平均值
SSHA
-1.3584 -0.4125 0.9702 0.1394 0.7752 1.7820 0.1041
9334摇 15期 摇 摇 摇 冯永玖摇 等:基于遗传算法的渔情预报 HSI建模与智能优化 摇
http: / / www.ecologica.cn
图 4摇 等式限制条件下利用遗传算法获取与优化 HSI参数的收敛过程
Fig.4摇 Fitness track and scores of the corresponding fitness of GeneHSI model under linear equalities
图 5摇 上下界限制条件下利用遗传算法获取与优化 HSI参数的收敛过程
Fig.5摇 Fitness track and scores of the corresponding fitness of GeneHSI model under parameters忆 bounds
0434 摇 生摇 态摇 学摇 报摇 摇 摇 34卷摇
http: / / www.ecologica.cn
表 5摇 上下界限制条件下遗传算法获取的 HSI参数
Table 5摇 HSI parameters retrieved using genetic algorithm under parameters忆 bounds
常数项
Constant
海表温度
SST
盐度
SS
叶绿素
CHA
溶解氧
DO
温差
TD
海面高度距平均值
SSHA
0.7356 0.8166 0.2455 0.9838 0.7269 0.9995 0.5973
图 6摇 综合限制条件下利用遗传算法获取与优化 HSI参数的收敛过程
Fig.6摇 Fitness track and scores of the corresponding fitness of GeneHSI model under comprehensive constraints
表 6摇 综合限制条件下遗传算法获取的 HSI参数
Table 6摇 HSI parameters retrieved using genetic algorithm under comprehensive constraints
常数项
Constant
海表温度
SST
盐度
SS
叶绿素
CHA
溶解氧
DO
温差
TD
海面高度距平均值
SSHA
0.5077 0.7074 0.2709 0.5500 0.5668 0.6124 0.1986
摇 摇 综合限制条件下 GeneHSI 模型在迭代到 27 次
时开始收敛,最佳适应度值收敛到 0.380855,平均适
应度值收敛到 0.380919,收敛曲线表明优化效果非
常理想。 随着优化进程最差和最佳适应度值之间的
范围收缩较快且非常彻底,收敛后曲线未发现任何
波动(图 6),说明综合限制条件下 GeneHSI 取得了
较佳的优化效果,获取的 HSI参数如表 6。
2.4摇 样本量对优化结果的影响
除了各种限制条件,样本量对 GeneHSI 建模同
样具有重要的影响。 在渔场预报分析中,样本是通
过商业捕捞而产生的,因此对于研究区的特定鱼种,
样本量并不是研究者主观决定的。 但是对于一种智
能建模框架而言,应该具有处理大样本的能力。 因
此,本文进一步分析 GeneHSI 模型对于各种样本量
的处理能力,并分析优化过程与优化结果对于不同
样本量的响应。 为此,产生了 100、 1000、 5000 和
10000四种样本量,样本产生的方法如 3.1 节所述。
选择在综合限制条件下进行 GeneHSI 模型执行,具
体限制参数和前述设置一致,最终模型优化过程如
图 7。
1434摇 15期 摇 摇 摇 冯永玖摇 等:基于遗传算法的渔情预报 HSI建模与智能优化 摇
http: / / www.ecologica.cn
图 7摇 不同样本量下利用遗传算法获取与优化 HSI参数的收敛过程
Fig.7摇 Fitness tracks and scores of the corresponding fitness of GeneHSI model under different samples
摇 摇 图 7表明各种样本量在 GeneHSI 模型中均得到
了优化处理,其中 100 样本量收敛于第 21 次迭代,
最佳适应度值 0. 283916,平均适应度值 0. 283916;
1000样本量收敛于第 16 次迭代,最佳适应度值
0郾 288048,平均适应度值 0.300328;5000 样本量收敛
于第 13 次迭代,最佳适应度值 0.310632,平均适应
度值 0.311132;10000样本量收敛于第 11 次迭代,最
佳适应度值 0.308201,平均适应度值 0.309327。 模
型优化过程与收敛曲线显示,10000 样本量收敛最
快,收敛效果最好;1000 和 5000 样本量收敛效果次
之;而 100样本量收敛的效果较晚,完全收敛出现在
第 30 次迭代。 4 种样本量在收敛之后,最差与平均
适应度值之间存在局部的波动,其中大样本量 10000
的波动最为严重,而小样本量 100 的波动最小。 优
化结果表明,GeneHSI 模型具有处理各种样本量的
能力,同时对于样本量的响应也不尽一致,各种样本
量下 GeneHSI获取的参数如表 7所示。
3摇 讨论
3.1摇 GeneHSI应用效果与模拟数据测试情况
遗传算法用于渔场渔情预报,其核心思想在于
可以使计算渔场概率值与真实渔场概率值的累计误
差达到最小化。 研究表明,遗传算法本质上是一种
具有智能特性的随机优化算法[15],能够行之有效地
效优化鱼类 HSI 的建模并获取 HSI 参数。 由于遗传
算法的随机特性[15],在对它进行控制并引导算法有
效执行的过程中,对建模者有较高的技术要求(如对
Matlab工具的熟练程度和 Matlab代码编写的能力),
2434 摇 生摇 态摇 学摇 报摇 摇 摇 34卷摇
http: / / www.ecologica.cn
表 7摇 不同样本量下遗传算法获取的 HSI参数
Table 7摇 HSI parameters retrieved using genetic algorithm under different samples
样本数
Number of samples
常数项
Constant
海表温度
SST
盐度
SS
叶绿素
CHA
溶解氧
DO
温差
TD
海面高度距平均值
SSHA
100 0.0413 0.0703 0.0134 0.0268 0.1669 0.0854 0.0010
1000 0.1316 0.0180 0.0273 0.0097 0.0631 0.1302 0.0512
5000 0.0605 0.1808 0.2788 0.0830 0.1148 0.0926 0.0229
10000 0.0999 0.1191 0.0142 0.0024 0.4149 0.0141 0.0524
需要研究者对研究区域与研究对象有较高的熟悉程
度[16鄄17]。 本研究所采用的数据是随机产生的模拟数
据,模拟数据的作用和关键在于:(1)模拟数据比之
真实数据,其数据中存在的规律性要差,因此如果
GeneHSI 能在该模拟数据上得到很好的应用,那么
证明 GeneHSI模型具有很强的普适性,当应用于规
律性更强的渔业真实数据时可望得到更好的结果;
(2)遗传需要较强的人工干预与良好的参数控制经
验[16鄄17],模拟数据有利于从多角度探讨 GeneHSI 算
法的控制与使用方法。 这些使用控制方法为真实渔
业数据的建模应用奠定了技术基础。
3.2摇 几种限制条件下 GeneHSI优化效果的比较
与一般优化策略下的 GeneHSI 比较,不等式条
件下最佳适应度值要大、而平均适应度值要低,表明
整体优化结果稍好。 但是不等式条件下的 GeneHSI
优化效果并未达到最佳状态,表明在不等式条件下
虽然效果优于一般优化策略,因此仍需对算法进行
深入的优化控制。 与一般优化策略和不等式优化策
略比较,等式限制条件下 GeneHSI 参数的获取效果
更好,优化曲线收敛更加彻底。
与一般优化策略和不等式优化策略比较,上下
界限制条件下 GeneHSI 模型取得了更好的收敛效
果;但比之等式条件,上下界条件下优化曲线的收敛
情况却较差,表现为收敛较晚且最佳适应度曲线与
平均适应度曲线重合性较差,但是却获得了更小的
最佳和平均适应度值。 综合限制条件与几种单项优
化限制条件比较,GeneHSI 模型取得了更好的收敛
效果,适应度函数的收敛更早、且最佳与平均适应度
值重合得非常一致。
总体来看,在不同的限制条件下,遗传算法获取
的 HSI 具有较大的差异,其中一般优化策略下获取
的 HSI参数最差,加以限制的不等式、等式和上下界
条件下其优化过程显著地更加合理,因此获取的 HSI
参数也更准确。 理论上,适应度函数值是渔场概率
计算值与真实值的累计误差[15鄄17],但是函数优化收
敛过程较好时,最终对应的适应度值并不是所有限
制条件下可能得到的最低值。 因此,评价 HSI 参数
结果是否合理和准确,并不是以适应度值的高低为
唯一标准的[18鄄19];应当同时考虑到适应度函数的优
化收敛过程,并结合对研究区渔场的专业知识进行
判断。 综合来看,对 GeneHSI的优化过程加以限制,
尤其是上下界等限制条件的使用将使 HSI 参数优化
结果更加合理[8鄄10]。
3.3摇 GeneHSI处理样本数据的效率
针对于渔场预报 HSI 建模,增加样本量并不会
显著增加遗传算法需要迭代的次数,也不会增加遗
传算法的实际解算时间。 这与地理复杂系统中的建
模有所不同,后者会显著增加遗传算法的迭代次数
和解算时间[18鄄19]。 这可能由两个原因造成的:本文
使用的海洋环境因子相对较少,或渔业 HSI 建模与
经典地理系统建模比较数据复杂程度稍低,因此遗
传算法解算起来效率更高。
在对 GeneHSI 有效控制的前提下,大样本量反
而有可能使遗传算法更早地收敛于合理的适应度
值[15]。 研究表明,大样本量得到的适应度值一般会
大于小样本量得到的适应度值[16鄄17]。 但是这种情况
并不是绝对的,当用于建模的数据规律性较强时,大
样本量反而能够得到更小的适应度值[15]。 在真实
渔情预报中,受到商业捕捞数据的限制,一般很少能
够获取到大样本量数据[6鄄11],这进一步表明了
GeneHSI能够高效地对渔场预报进行优化处理。
3.4摇 GeneHSI与传统 HSI模型的比较
传统 HSI模型在渔业科学中应用广泛,主要用
于栖息地质量评估、资源量估算、分析选择渔场和渔
情预报等,但各自有不同的特点。 针对不同目的和
研究区,各种模型的适用性和效果则不同。 与传统
HSI 模型比较, GeneHSI 模型存在诸多不同之处
(表 8)。
3434摇 15期 摇 摇 摇 冯永玖摇 等:基于遗传算法的渔情预报 HSI建模与智能优化 摇
http: / / www.ecologica.cn
表 8摇 GeneHSI模型与传统 HSI模型的比较
Table 8摇 A comparison between the GeneHSI model and conventional HSI models
模型
Models
单变量
Single
variable
多变量
Multi鄄variable
变量相关性
Correlation of
variables
复杂性鄄智能化
Complexity and
intellectualization
参数意义明确
Explicit meaning
of parameters
模型特点
Model features
连乘法 姨 伊 不考虑 低鄄低 伊 计算结果保守,对零值敏感
最小值法 姨 伊 不考虑 低鄄低 伊 估计结果保守,决定于最小 SI ( suitabilityindex) 因子
最大值法 姨 伊 不考虑 低鄄低 伊 估计结果乐观,决定于最大 SI 因子
算术平均法 姨 伊 不考虑 低鄄低 伊 估计结果折中,不受 SI 极值的影响,未考虑单因素 SI的权重
几何平均法 姨 伊 不考虑 低鄄低 伊 估计结果折中,效果较算术平均法差,参数越少则效果越优,受 SI 零值影响较大
分位数回归法 姨 伊 不考虑 中鄄低 伊
能提供多种不同分位数的 SI估计结果,阐
释因变量的整体分配,结合前述几种模型
计算最终 HSI值,估计结果的保守或乐观
程度决定于 HSI计算模型的选取
遗传算法 姨 姨 自动消除 高鄄高 姨
同时考虑多种海洋环境因素、对因素的权
重进行自动赋权与智能优化,估计结果的
保守或乐观程度决定于 GA限制参数
摇 摇 关于连乘法、最小 /最大值法、算术 /几何平均法和分位数回归法的“模型特点冶参见文献[27]
摇 摇 研究表明,经典的相关和回归分析方法并不适
合于生态学领域的相关因素关系研究[27]。 因此,渔
业 HSI建模一般地先采用单因子构建 SI 函数,再通
过几何平均法[6鄄7]、分位数回归方法[13]和主成分分
析法[14]等计算 HSI值。 与表 8中的连乘法等 6种模
型不同,GeneHSI模型通过适应度函数直接搜索、优
化并获取海洋环境因素的权重,进而直接计算得到
HSI值。 传统渔业 HSI 的应用研究实际上将各种不
同类型的因素进行等值赋权,虽然这些方法都是经
过渔业专家知识而获得的,但显然带有主观判断的
成分[27]。 在等值赋权中,海洋环境因子的相关性通
常被忽略,而这种相关性将对 HSI 的建模具有负面
的影响。 GeneHSI 模型同时考虑海表温度、盐度、叶
绿素、溶解氧、温差和海面高度距平均值等不同类型
的海洋环境因素,在遗传优化中自动消除这些因素
相关性的负面影响。 这表明,GeneHSI 模型是一个
典型的多变量 HSI 模型,且 HSI 参数的含义就是海
洋环境因素的权重,而传统 HSI 模型是对 SI 曲线的
一种拟合,其参数不具备物理意义。
比较而言,传统 HSI模型的复杂性较低,因此其
建模难度和智能化程度较低[6鄄7, 27];而 GeneHSI 模型
复杂性和建模难度均较高,但其具有高度的智能化
程度。 GeneHSI模型估计结果的保守或乐观程度决
定于 GA限制参数,在应用方面较适合于栖息地质
量评估、渔场分析和渔情预报等。
4摇 结论
基于广泛应用于各领域的遗传算法,本文提出
了一种渔情预报 HSI参数获取与智能优化的方法框
架 GeneHSI,并对该模型框架的使用和参数控制进行
了分析与讨论。 本研究的目的在于提供一种基于遗
传算法的渔业 HSI建模框架和行之有效的智能建模
方法与思路,因此侧重于模型建立的整体框架、模型
建立的思路以及模型执行过程中的人为控制。
基于遗传算法的 HSI建模有助于发展现有的渔
情预报的理论和方法。 但在以后的研究中,应将该
GeneHSI 模型框架应用到实际的渔情预报分析中,
同时通过实际的应用与反馈来优化 GeneHSI模型。
References:
[ 1 ] 摇 U. S. Fish and Wildlife Service. Habitat Evaluation Procedures
(HEP). Washington: U. S. Fish and Wildlife Service, 1980.
[ 2 ] 摇 U. S. Fish and Wildlife Service. Standards for the development of
habitat suitability index models [ R]. U. S. Fish and Wildlife
Service, 1981: 1鄄81.
[ 3 ] 摇 Store R, Jokim覿ki J. A GIS鄄based multi鄄scale approach to habitat
4434 摇 生摇 态摇 学摇 报摇 摇 摇 34卷摇
http: / / www.ecologica.cn
suitability modeling. Ecological Modelling, 2003, 169(1): 1鄄15.
[ 4 ] 摇 Jin L R, Sun K P, He H S, Zhou Y F. Research advances in
habitat suitability index model. Chinese Journal of Ecology, 2008,
27(5): 841鄄846.
[ 5 ] 摇 Zielinski W J, Dunk J R, Yaeger J S, LaPlante D W. Developing
and testing a landscape鄄scale habitat suitability model for fisher
(Martes pennanti) in forests of interior northern California. Forest
Ecology and Management, 2010, 260(9): 1579鄄1591.
[ 6 ] 摇 Fan W, Cui X S, Shen X Q. Progress in fishing鄄ground analysis
and fishing condition forecasting. Journal of Fisheries of China,
2005, 29(5): 706鄄710.
[ 7 ] 摇 Chen X J, Feng B, Xu L X. A comparative study on habitat
suitability index of bigeye tuna, Thunnus obesus in the Indian
Ocean. Journal of Fishery Sciences of China, 2008, 15 ( 2):
269鄄278.
[ 8 ] 摇 Fan J T, Chen X J, Qian W G, Liu B L. Distribution of fishing
ground of Thunnus Alalunnus and its relationship with sea suderace
temperature in the waters around Vanuatu. Transactions of
Oceanology and Limnology, 2011, (1): 71鄄78.
[ 9 ] 摇 Song L M, Zhou Y G. Developing an integrated habitat index for
bigeye tuna ( Thunnus obesus) in the Indian Ocean based on
longline fisheries data. Fisheries Research, 2010, 105 ( 2 ):
63鄄74.
[10] 摇 Chen F, Chen X J, Liu B L, Qian W G, Tian S Q. Relationship
between fishing ground of Ommastrephes bartramii and vertical
temperature structure in the northwestern Pacific Ocean. Journal of
Shanghai Ocean University, 2010, 19(4): 495鄄504.
[11] 摇 Chen X, Tian S, Chen Y, Liu B. A modeling approach to identify
optimal habitat and suitable fishing grounds for neon flying squid
( Ommastrephes bartramii ) in the Northwest Pacific Ocean.
Fishery Bulletin, 2010, 108(1): 1鄄14.
[12] 摇 Tian S Q, Chen X J, Chen Y, Xu L X, Dai X J. Evaluating
habitat suitability indices derived from CPUE and fishing effort
data for Ommatrephes bratramii in the northwestern Pacific Ocean.
Fisheries Research, 2009, 95(2 / 3): 181鄄188.
[13] 摇 Li G, Chen X J, Guan W J. Stock assessment and risk analysis of
management strategies for Scomber japonicus in the East China Sea
and Yellow Sea using a Bayesian approach. Journal of Fisheries of
China, 2010, 34(5): 740鄄750.
[14] 摇 Feng B, Tian S, Chen X J. The habitat suitability index of Illex
argentinus by using quartile regression method in the Southwest
Atlantic. Transactions of Oceanology and Limnology, 2010, (1):
15鄄22.
[15] 摇 Hu Z M, Chen X J, Zhou Y Q, Qian W G, Liu B L. Forecasting
fishing ground of Dosidicus gigas based on habitat suitability index
off Peru. Acta Oceanologica Sinica, 2010, 32(5): 67鄄75.
[16] 摇 Xuan G N, Cheng R W. Genetic Algorithm and the Engineering
Optimization. Yu X J, Zhou G G, translate. Beijing: Press of
Tsinghua University, 2004.
[17] 摇 Feng Y J, Liu Y, Han Z. Land use simulation and landscape
assessment by using genetic algorithm based on cellular automata
under different sampling schemes. Chinese Journal of Applied
Ecology, 2011, 22(4): 957鄄963.
[18] 摇 Feng Y, Liu Y. An optimised cellular automata model based on
adaptive genetic algorithm for urban growth simulation / / Yeh A,
Shi J W, Leung Y, Zhou C, eds. Advances in Spatial Data
Handling and GIS, Lecture Notes in Geoinformation and
Cartography. Berlin, Heidelberg: Springer鄄Verlag, 2012: 27鄄38.
[19] 摇 Feng Y J, Liu Y. A heuristic cellular automata approach for
modelling urban land鄄 use change based on simulated annealing.
International Journal of Geographical Information Science, 2013,
27(3): 449鄄466.
[20] 摇 Feng Y J, Liu Y, Tong X H, Liu M L, Deng S S. Modeling
dynamic urban growth using cellular automata and particle swarm
optimization rules. Landscape and Urban Planning, 2011, 102
(3): 188鄄196.
[21] 摇 Tian S Q, Chen X J. Impacts of different calculating methods for
nominal CPUE on CPUE standardization. Journal of Shanghai
Ocean University, 2010, 19(2): 240鄄245.
[22] 摇 Keating K A, Cherry S. Use and interpretation of logistic
regression in habitat鄄selection studies. Journal of Wildlife
Management, 2004, 68(4): 774鄄789.
[23] 摇 Pereira J M C, Itami R M. GIS鄄based habitat modeling using
logistic multiple regression: A study of the Mt. Graham Red
Squirrel. Photogrammetric Engineering and Remote Sensing,
1991, 57(11): 1475鄄1486.
[24] 摇 Hein S, Voss J, Poethke H J, Boris S. Habitat suitability models
for the conservation of thermophilic grasshoppers and bush
crickets鄄simple or complex? Journal of Insect Conservation, 2007,
11(3): 221鄄240.
[25] 摇 Singh N J, Yoccoz N G, Bhatnagar Y V, Fox J L. Using habitat
suitability models to sample rare species in high鄄altitude
ecosystems: a case study with Tibetan argali. Biodiversity and
Conservation, 2009, 18(11): 2893鄄2908.
[26] 摇 Singh A, Kushwaha S P S. Refining logistic regression models for
wildlife habitat suitability modeling: A case study with muntjak
and goral in the Central Himalayas, India. Ecological Modelling,
2011, 222(8): 1354鄄1366.
[27] 摇 Prager M H, Fabrizio M C. Comparison of logistic regression and
discriminant analyses for stock identification of anadromous fish,
with application to striped bass (Morone saxatilis) and American
shad ( Alosa sapidissima ) . Canadian Journal of Fisheries and
Aquatic Sciences, 1990, 47(8): 1570鄄1577.
[28] 摇 Gong C, Chen X J, Gao F, Guan W J, Lei L. Review on habitat
suitability index in fishery science. Journal of Shanghai Ocean
University, 2011, 20(2): 260鄄269.
参考文献:
[ 3 ] 摇 金龙如, 孙克萍, 贺红士, 周宇飞. 生境适宜度指数模型研究
5434摇 15期 摇 摇 摇 冯永玖摇 等:基于遗传算法的渔情预报 HSI建模与智能优化 摇
http: / / www.ecologica.cn
进展. 生态学杂志, 2008, 27(5): 841鄄846.
[ 5 ] 摇 樊伟, 崔雪森, 沈新强. 渔场渔情分析预报的研究及其进展.
水产学报, 2005, 29(5): 706鄄710.
[ 6 ] 摇 陈新军,冯波,许柳雄. 印度洋大眼金枪鱼栖息地指数研究及
其比较. 中国水产科学, 2008, 15(2): 269鄄278.
[ 7 ] 摇 范江涛, 陈新军, 钱卫国, 刘必林. 瓦努阿图周边海域长鳍金
枪鱼渔场分布及其与表温关系. 海洋湖沼通报, 2011, (1):
71鄄78.
[ 9 ] 摇 陈峰, 陈新军, 刘必林, 钱卫国, 田思泉. 西北太平洋柔鱼渔
场与水温垂直结构关系. 上海海洋大学学报, 2010, 19(4):
495鄄504.
[12] 摇 李纲, 陈新军, 官文江. 基于贝叶斯方法的东、黄海鲐资源评
估及管理策略风险分析. 水产学报, 2010, 34(5): 740鄄750.
[13] 摇 冯波,田思泉,陈新军. 基于分位数回归的西南太平洋阿根廷
滑柔鱼栖息地模型研究. 海洋湖沼通报, 2010, (1): 15鄄22.
[14] 摇 胡振明, 陈新军, 周应祺, 钱卫国, 刘必林. 利用栖息地适宜
指数分析秘鲁外海茎柔鱼渔场分布. 海洋学报, 2010, 32
(5): 67鄄75.
[15] 摇 玄光男, 程润伟. 遗传算法与工程优化. 于歆杰, 周根贵, 译.
北京: 清华大学出版社, 2004.
[16] 摇 冯永玖,刘艳,韩震. 不同样本方案下遗传元胞自动机的土地
利用模拟及景观评价. 应用生态学报, 2011, 22(4): 957鄄963.
[20] 摇 田思泉,陈新军. 不同名义 CPUE计算法对 CPUE标准化的影
响. 上海海洋大学学报, 2010, 19(2): 240鄄245.
[27] 摇 龚彩霞, 陈新军, 高峰, 官文江, 雷林. 栖息地适宜性指数在
渔业科学中的应用进展. 上海海洋大学学报, 2011, 20(2):
260鄄269.
6434 摇 生摇 态摇 学摇 报摇 摇 摇 34卷摇