全 文 :中国生态农业学报 2009年 11月 第 17卷 第 6期
Chinese Journal of Eco-Agriculture, Nov. 2009, 17(6): 1273−1277
孙丽娅(1960~), 女, 博士, 副教授, 主要从事系统工学、环境保护和生物能利用的研究。E-mail: sunliya@jssve.edu.cn
收稿日期: 2009-05-08 接受日期: 2009-07-10
DOI: 10. 3724/SP.J.1011.2009.01273
基于遗传算法(GA)解甘蔗收割顺序最优化问题的研究*
孙丽娅 1 上野正实 2 大岭政朗 3
(1. 苏州市职业大学 苏州 215104; 2. 日本琉球大学 日本 冲绳 9010213;
3. 日本农林水产省九州冲绳农业试验中心 日本 宫崎 8850091)
摘 要 本研究以已建立的栽培方法、收割时期预测甘蔗单产和含糖量的数学模型为基础, 提出将寻求最佳
收割顺序、收割期归结为最优化组合问题, 并探讨了遗传算法(GA)的解题适用性, 同时进行了几种基本设定的
栽培方法推移、栽培方法构成项量、行列式特性的定性分析, 为求最佳的甘蔗收割顺序、收割期、不同栽培
方法的面积等提供解析方法。为不使栽培方法的构成比例发生变化, 与通常 GA算法采用交叉在不同个体间互
相交替进行不同, 开发了适用本研究的 GA的自己交叉具体解析法。将收割第 1年期作为过渡状态, 第 2年期
为安定状态, 将两期目的函数的合并作为一个适应度进行评价。
关键词 甘蔗 收割顺序 收割期 遗传算法(GA) 自己交叉 最优化
中图分类号: S5047; S566.1 文献标识码: A 文章编号: 1671-3990(2009)06-1273-05
A genetic algorithm methodology for optimized harvesting
sequence of sugarcane
SUN Li-Ya1, Masami UENO2, Masaaki OMINE3
(1. Suzhou Vocational University, Suzhou 215104, China; 2. University of the Ryukyus, Okinawa
9010213, Japan; 3. National Agricultural Research for Kyushu Okinawa Region, Miyazaki 8850091, Japan)
Abstract New mathematical models capable of predicting sugarcane sugar content based on planting method and harvest time
were used to develop a methodology for optimizing harvesting sequence, and harvesting time of sugarcane. The applicability of GA
was discussed too. The methodology based on Genetic Algorithm (GA) was used to qualitatively analyze the determinant variables of
planting mode to obtain optimized combination harvest sequence, harvest time and area of different planting methods under several
setted planting mode transitions. Self-crossing, as opposed to conventional GA crossing methods, was used to retain the structural
ratio of planting modes. In this study, first year harvest was used for the transition state and that of the second year for the
steady-state runs, while the combination of the two were formed the objective function.
Key words Sugarcane, Harvest sequence, Harvest time, Genetic Algorithm, Self-crossing, Optimization
(Received May 8, 2009; accepted July 10, 2009)
不同甘蔗栽培方法与收割时期对甘蔗产量、含
糖量及与收割同期进行的春植作业的劳力及机械分
配等带来影响。即使是在收获期间, 不同栽培方法
的甘蔗也以不同程度生长, 因而单产及含糖量也在
持续变化[1]。新植甘蔗从种植到收割、宿根甘蔗从
上茬甘蔗收割到宿根甘蔗收割的生长期长短是影响
单产的重要因素之一。如将收割期延迟谋求当年最
大收益 , 有可能造成下年产量降低; 其次 , 未完全
成熟的春植甘蔗收获过早也将给整体带来损失。因
此, 寻求最佳的收割顺序、收割期对提高甘蔗产量
和收益及劳动效率具有重要意义。
在不同栽培法对甘蔗单产和含糖量影响研究中,
对不同栽培法的种植期及收割期与甘蔗产量和含糖
量的关系进行了分析, 提出新植蔗及宿根蔗产量和
含糖量的预测数学模型[1]。本研究根据以上结果, 对
甘蔗栽培最佳收割期、收割顺序、不同栽培方法的
最佳栽培面积等进行了模拟计算 , 应用遗传算法
(Genetic Algorithm, GA)解决甘蔗生产中收割顺序最
1274 中国生态农业学报 2009 第 17卷
优化的问题, 以期为我国甘蔗产业的生产管理提供
依据。
1 研究方法
决定收割顺序时要考虑当年及下年的栽培方法
以及收割田至制糖厂距离、田块间距离、劳动力状
况、机械利用等诸多因素的影响[2,3]。把所有这些因
素同时作为变量求最佳收割顺序是非常困难的, 因
此, 分别求出各个因素下最佳收割顺序, 然后再综
合进行分析。
在不同栽培法种植期、收割期与单产、含糖量
关系以及新植、宿根甘蔗产量、含糖量数学模型的
基础上, 为确定最佳收割顺序、收割开始期、不同
栽培方法面积, 利用 GA进行了解析。为了使 GA计
算能够较快收敛, 对问题进行了格式化、基本设定;
对栽培方法推移、栽培方法构成项量、行列式的特
性进行了定性分析, 开发了适用本研究的自己交叉
具体解析法。
2 结果与分析
2.1 收割顺序最优化问题及解析法
2.1.1 收割顺序设定
对数年甘蔗收割顺序进行分析, 其推移状态如
图 1 所示。由图 1 可知, 收获顺序与某一个年份无
关, 可用一个定数代表。为便于解析, 首先将问题简
单化。收割期将每天收割多种栽培方法的甘蔗设定
为只收割 1种栽培方法的甘蔗。总收割天数 n, 沿收
割日期用字符格式编码来表示收割顺序(图 2)。收割
顺序最优化最终归结为怎样组合才能得到最大目的
图1 从多年种植及收割考虑收割顺序最佳化
Fig. 1 Optimization of harvesting sequence on the base of
planting and harvest of several years
图2 问题模式化
Fig. 2 Modeling of the problem
N: 夏植 New-planting in summer; H: 春植 New-planting in
spring; F: 宿根 1次 Ratoon once; S: 宿根 2次 Ratoon twice. 下同
The same below.
函数值(以下称适应度), 也就是组合最优化的问题。
从过去的数据得知 [4], 甘蔗栽培方法中 , 新植
的春植、夏植及宿根 1 次、宿根 2 次占甘蔗总种植
面积 90%以上, 因此本研究对象限定为这 4 种栽培
方法, 分别用 H、N、F、S 表示; 收割天数分别用
nH、nN、nF、nS表示, 总收割天数用 n表示。4种栽
培方法收割天数中总有 3 个是独立的。因此, 收割
顺序可排列的组合数 L如下:
!
! ! ! !H N F S
nL
n n n n
= (1)
由式(1)得知, 可组合数巨大, 一般很难求出最
佳解。
2.1.2 利用 GA解收割顺序最优化
GA 是一种有效的解决最优化问题的方法[5,6]。
利用 GA 算法解收割顺序最优化问题, 首先随机挑
选一些按收割顺序配置的字符串, 将其视为第一代
个体, 并计算每个解的目标函数值。利用选择机制
从个体中随机挑选配置的字符串作为繁殖过程前的
样本。选择应保证适应度较高的能够保留较多的样
本; 而适应度较低解的个体则被淘汰。其次进行交
叉操作, 这个操作形成下一世代的个体群; 交叉是
将所对应的位置字符进行替换, 在一般 GA 算法中,
交叉是在不同个体间进行。由于此方法不适合本研
究, 故采用交叉在同一个体内进行。在世代交替中,
将适应度高的个体样本进行复制, 向具有更佳解的
个体群推移。由此反复进行适应度评价、个体排列、
选别、交叉等操作。在反复计算中, 有可能会出现
第 6期 孙丽娅等: 基于遗传算法(GA)解甘蔗收割顺序最优化问题的研究 1275
陷入一个局限的极大值里(局部解)。因此, 时常发生
突然变异, 脱出局部解。具有最大优化度特征的个
体向下世代推移。趋于一定值时, 再使其发生突然
变异, 突然变异又相当于生成了新的个体, 反复多
次, 当解完全安定时, 终结计算。
2.2 GA算法求收割程序最优化
2.2.1 栽培方法的推移
栽培方法推移的表示法 GA 计算前应先明确
个体推移状态, 本年期第 i 日收割的栽培方法推移
到下期第 j 日的另一种栽培方法, 这种持续下去的
个体之间有相对应关系; 其次确定下年期新植春植
甘蔗的种植日、宿根开始日。以 AN、AH、AF、AS表
示不同栽培法的收获面积, 下年期这些值依栽培方
法而延续、变化。不同年份收割面积用 AN(1)、AN(2)、
AN(3)∧∧表示, 括号内的数值为年份。夏植甘蔗种
植后的第 2 个收割期收割, 即本期收割的夏植甘蔗
是去年夏天种植。为易区别, 前者用 N、后者以 M
表示, 如今年不收割的夏植甘蔗面积为 AM(1), 本期
其他栽培法收割后今年夏植的甘蔗面积为 AM(2)。不
同栽培法的栽培面积一般以下面的关系式表示:
)2()2()2()2()2(
)1()1()1()1()1(
MSFHN
MSFHN
AAAAA
AAAAA
++++≠
++++
(2)
但就全地区而言, 甘蔗种植面积一定时, 下式
成立:
(1) (1) (1) (1) (1)
(2) (2) (2) (2) (2)
N H F S M
N H F S M
A A A A A
A A A A A
+ + + +
= + + + + (3)
从本期栽培方法推移到下期栽培方法, 以下的
行列式成立:
11 12 13 14 15
21 22 23 24 25
31 32 33 34 35
41 42 43 44 45
51 52 53 54 55
(2) (1)
(2) (1)
(2) (1)
(2) (1)
(2) (1)
N N
H H
F F
S S
M M
t t t t tA A
t t t t tA A
t t t t tA A
t t t t tA A
t t t t tA A
⎡ ⎤⎧ ⎫ ⎧ ⎫⎢ ⎥⎪ ⎪ ⎪ ⎪⎢ ⎥⎪ ⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪⎢ ⎥=⎨ ⎬ ⎨ ⎬⎢ ⎥⎪ ⎪ ⎪ ⎪⎢ ⎥⎪ ⎪ ⎪ ⎪⎢ ⎥⎪ ⎪ ⎪ ⎪⎩ ⎭ ⎩ ⎭⎣ ⎦
(4)
A(2)=TA(1) (5)
式中, A为栽培方法构成的矩阵, A= A(AN, AH, AF, AS,
AM); T 为栽培方法推移的行列式, 其数列要素 tij是
从栽培方法 j推移到栽培方法 i的比例, i、j为栽培
方法, 其中栽培方法 N、H、F、S、M分别用 1、2、
3、4、5表示。即使宿根次数增加, 只需相应地将行
列式次元增加, 表达式仍然成立。从栽培方法完全
没有推移时 tij=0, 全推移时 tij=1。除去 tij<0及 tij>1,
栽培方法推移行列式的元素 tij应满足以下条件:
0≤tij≤1 (6)
式(5)和式(6)表示本年期向下年推移的栽培方法, 对
数年推移的状态, 可用下式表示:
A(n)=T(n−1)∧∧T(2)T(1)A(1) (7)
T(i)为从 i年期向第 i+1年期推移的行列式, 对一
个地区来说, 当每年甘蔗栽培面积一定时下式成立:
A(n)=T n−1A(1) (8)
栽培方法推移行列式的特性 栽培方法向下年
期推移时具有特定的方向性, 如宿根 2→宿根 1(→
表示推移方向)(S→F)、夏植→宿根 2(N→S)、春植→
宿根 2(H→S)的推移不符合逻辑。其次今年不收割夏
植甘蔗, 只能明年收割夏植即 M→N。由栽培方法特
性决定了行列式的多个要素, 推移式(4)可改为:
21 22 23 24
31 32
43
51 52 53 54
(2) 0 0 0 0 1
(2) 0
(2) 0 0 0
0 0 0 0(2)
0 (2)
N
H
F
S
M
A
A t t t t
A t t
tA
t t t tA
⎧ ⎫ ⎡ ⎤⎪ ⎪ ⎢ ⎥⎪ ⎪ ⎢⎪ ⎪ ⎢=⎨ ⎬ ⎢⎪ ⎪ ⎢⎪ ⎪ ⎢⎪ ⎪ ⎣ ⎦⎩ ⎭
(1)
(1)
(1)
(1)
(1)
N
H
F
S
M
A
A
A
A
A
⎧ ⎫⎪ ⎪⎪ ⎪⎥ ⎪ ⎪⎥ ⎨ ⎬⎥ ⎪ ⎪⎥ ⎪ ⎪⎥ ⎪ ⎪⎩ ⎭
(9)
其次由式(4), 本期构成数列中的要素向下年期
数列要素推移时, i最大为 5(N, H, F, S, M),所有的
列 j应使下式成立:
1ij
i
t =∑ (10)
由式(9)、式(10)得出未知数比方程式多, 因此还
需再加条件限定决定推移行列式。从经济性上, 夏
植→新夏植(N→M)、春植→新春植(H→H)、春植→
新夏植(H→M)的栽培方法不合理, 应被排除。从经
济性和甘蔗栽培方法的最优化等方面考虑 [7], 对栽
培方法推移作更进一步限定。
⎪⎪⎩
⎪⎪⎨
⎧
→
→
→
→
MHS
MHSF
FH
HFN
,
,,
,
(11)
栽培方法矩阵构成 栽培方法的构成矩阵 A 的
各元素值由经济性、劳动力、品种特性等要素决定。
虽然其构成每年都有变化, 但变化量较小, 可以常
量推移。
A(1)= A (2) (12)
夏植甘蔗栽培面积每年基本保持一定, 因此可
认为 AM=AN。其次, 在整个收获期间, 将每天收割面
积作为单位面积, 此处设定为 10 hm2, 总收割天数
为 n, 收割总面积为 10n, 下式关系成立:
)2()2()2()2(
)1()1()1()1(01
SFHN
SFHN
AAAA
AAAAn
+++=
+++=
(13)
各栽培方法的收割天数 nN、nH、nF、nS分别成
为 AN /10、AH /10、AF /10、AS /10。由此, 各栽培方
法的收割天数相当于栽培方法构成行列式的要素。
与之相结合, 栽培方法构成行列式的要素作如下改
变, 用 aN、aH、aF、aS及 aM=(aN)表示。
1276 中国生态农业学报 2009 第 17卷
个体的产生 给产生随机数区间赋予不同系数
选择栽培方法, 随机产生按收割天数排列的个体。
整个收割期各个栽培方法的收割天数与设定值一
致。此外, 计算机识别数字比识别文字更方便, 因此,
计算时, 将栽培方法 N、H、F、S分别用 1、2、3、
4来替换, 生成的个体为数字列。每次计算发生的个
体数 m由计算机随机产生。
栽培方法推移的决定 在具体表述栽培方法推
移时 , 必须首先决定推移行列式中的未知元素 tij,
式(9)可改写为下式:
21 23 24
31
43
53 54
0 0 0 0 1
0 0
1 0 0 0
0 0 0 0
0 0 0
N N
H H
F F
S S
M M
a a
t t ta a
a t a
a at
a at t
⎡ ⎤⎧ ⎫ ⎧ ⎫⎢ ⎥⎪ ⎪ ⎪ ⎪⎢ ⎥⎪ ⎪ ⎪ ⎪⎢ ⎥⎪ ⎪ ⎪ ⎪=⎨ ⎬ ⎨ ⎬⎢ ⎥⎪ ⎪ ⎪ ⎪⎢ ⎥⎪ ⎪ ⎪ ⎪⎢ ⎥⎪ ⎪ ⎪ ⎪⎢ ⎥⎩ ⎭ ⎩ ⎭⎣ ⎦
(14)
参考(11)式得到以下联立方程:
21 23 24
31
43
53 54
21 31
23 43 53
24 54
1
1
1
N M
N F S H
N H F
F S
F S N
a a
a t a t a t a
a t a a
a t a
a t a t a
t t
t t t
t t
=⎧⎪ + + =⎪⎪ + =⎪⎪ =⎪⎨ + =⎪⎪ + =⎪⎪ + + =⎪ + =⎪⎩
(15)
解后得到以下关系:
t43=aS/aF (16)
t31=(aF −aH)/aN (17)
t21=1−t31 (18)
aFt23+aSt24=aF −aN (19)
t54=1−t24 (20)
t53=1−t23−t43 (21)
式(19)中含 2个未知元素, 是宿根→新植春植(F
→H, S→H)的推移式, 未知元素 t23和 t24若不能决定,
t53和 t54也不能决定。由式(7)和 t23、t24的关系(图 3),
aF和 aN为非负的整数, 式(19)中 aFt23和 aSt24分别在
等于 aF −aN非负的整数中选取。
推移行列式各元素一旦决定, 可决定本期的某
栽培方法向下年期推移的栽培方法面积或收割天数。
个体的定常性 从整个地区甘蔗栽培出发, 不
同年份的栽培方法构成项量, 构成行列式相对是一
个定常的量。因此, 可以认为每一年度任意个体排
列都是相同的。
本期: K(1)=(413112223244⋯) (22)
下年期: K(2)= (413112223244⋯) (23)
K(1)=K(2) (24)
图3 t24与t23的关系
Fig. 3 Relationship between t24 and t23
栽培方法在推移时的优先顺序 计算中同一栽
培方法推移中, 有推移至春植和夏植时, 设定移至
春植的早期收割, 夏植的收割期后移。如 N→F, H
中, 早收获的使其优先向春植推移。把个体的世代
间所对应的项量用 V =(v1 v2 v3∧∧)表示。vi为第 i
日的栽培方法向下年第 j日期推移(图 4)。向宿根(F,
S)推移时宿根的开始日、向春植 H 推移时春植的种
植日期可以指定。
图4 栽培方法推移
Fig. 4 Transitions of planting modes
2.2.2 应用 GA算法的说明
适应度 适应度可以是总收量、产糖量(单产×
甘蔗含糖量)或是粗收益的总和。总产量为每天收割
量的总合, 产糖量与每天收割量和收割甘蔗的含糖
量有关, 呈非线性关系; 粗收益可分为蔗农总粗收
益(∑单价×甘蔗总重量)和制糖厂总粗收益(∑单价
第 6期 孙丽娅等: 基于遗传算法(GA)解甘蔗收割顺序最优化问题的研究 1277
×甘蔗总重量×含糖量)。设收割第 i天的单产为 yi,
含糖量为 si, 下式可计算当天的产糖量(粗收益):
pi=yi f (si) (25)
适应度 Z为整个收获期间产糖量的总和:
∑=
n
ipZ (26)
以多年期(j年期)产糖量进行最优化度评价时:
Z=Z(1)+Z(2)+Z(3)+⋯+Z(j) (27)
设定个体 K 在世代间是定常量[式(17)~式(25)],
用式(27)可以满足评价适应度 , 本研究将两年期的
合计作为适应度, 仅考虑单产不考虑糖度的适应度
计算方法如下:
consti
n
Z y f= ∑ (28)
fconst为不计含糖量的 1 t甘蔗的单价。
个体的选择 所有个体适应度算出后, 按高值
向低值进行排列, 为使适应度高值的易被选择留下,
对其中的复数排列进行复制 , 并替换到部分个体
中。由此操作, 将适应度高的个体遗传子容易遗传
给下一世代。
自己交叉 与通常 GA 算法不同, 本研究的交
叉如式(29)所示, i与 j在同一个体内进行交替的操作,
称为自己交叉。
)(
)(
1
1
LLL
LLL
ij
ji
kkkk
kkkk
⇓ (29)
通常 GA 算法中, 交叉在不同个体间互相交替
进行。这样使栽培方法的构成比例发生变化, 破坏
计算的前提条件。除了最大适应度的个体不进行交
叉外, 按顺序设定不同的交叉次数。
过渡状态和定常状态 进行模拟计算的前提条
件是收割期、个体、栽培方法构成及栽培方法推移
恒定。但 GA最初的计算条件不明确, 只能赋以特定
值使计算开始, 从第 2年期才能进入安定状态(图 5)
称定常状态。因此, 第 1年期作为过渡状态, 进行评
价时将两期的合并作为一个适应度。
3 结论
本文探讨了收割顺序及收割时期最优化问题 ,
从栽培方法特性的角度出发归结为组合最优化问题
图5 过渡状态到安定状态
Fig. 5 Shift from transition state to steady state
以及遗传算法(GA)的适用性。在对几个基本设定及
对栽培方法推移、栽培方法构成项量、行列式的特
性进行了定性分析基础上, 开发了适用本研究的自
己交叉, 设第 1 收割期为过渡状态、第 2 收割期为
定常状态的目标函数值的和为适应度, 建立遗传算
法(GA)的具体解析法。解析法的建立, 结合不同栽
培方法下甘蔗单产及含糖量相应的数学模型, 为确
定甘蔗栽培最佳收割期、收割顺序、不同栽培方法
的最佳栽培面积等模拟计算提供了解析方法。
参考文献
[1] 孙丽娅 , 上野正实 , 永田雅辉 . 不同栽培法对甘蔗单产和
含糖量影响的研究 [J]. 中国生态农业学报 , 2009, 18(5):
992−996
[2] 佐木隆显 , 古谷立美 , 南善行 . 遗传算法在饲料多目的配
合设计中[J]. 农业设施, 1999, 30 (2): 163−171
[3] 大土井克明, 笈田昭, 焾山崎 , 等. 有关农作业计划最优化
的研究[J]. 农业机械学会志, 1999, 61 (1): 91−97
[4] 冲绳糖业振兴会. 甘蔗品质测定结果汇集报告书[R]. 冲绳:
冲绳糖业振兴会, 1995−2007
[5] 古田均 , 山本博之 . 遗传算法在构造工学的应用 [M]. 东
京: 森北出版社, 1997: 5-35
[6] 周明 , 孙树栋 . 遗传算法原理及应用[M]. 北京: 国防工业
出版社, 2002: 12−30
[7] 金城铁男 . 甘蔗栽培方法的最优化[R]//甘蔗关系试验成绩
概要书. 冲绳: 冲绳农林水产部, 1997: 87−92