全 文 :文章编号:1001-4829(2010)05-1644-04
收稿日期:2010-06-03
基金项目:西藏自治区一般科技计划研究项目 “西藏野生果树
种质资源及其多样性研究 ”
作者简介:李荣钦(1966-),女 ,副教授 ,硕士 , 主要从事果树生
理生态及种质资源研究与教学 , Tel:13618942002, *为通讯作
者。
两种蔷薇属植物果实品质质量的综合评价
李荣钦 1 ,关法春 1* ,贺延国 2 ,邢 震3 ,王忠红1 ,朗 杰 1
(1.西藏农牧学院植物科学技术学院, 西藏林芝 860000;2.中水东北勘测设计研究有限公司科学研究院 ,吉林长春 130061;3.
西藏农牧学院资源与环境学院 ,西藏林芝 860000)
摘 要:针对果实品质质量难于客观评定的问题 ,提出基于加速遗传算法的投影寻踪模型用于解决果实品质质量高低的判定问
题 ,该模型通过优化指标投影方向 ,将多维数据指标(样本评价指标)转换到低维子空间 ,并根据投影函数值的大小评价出各样本
的优劣 ,最大限度避免了权重矩阵取值的人为干扰。在 2种蔷薇属植物果实品质质量综合评价中的应用结果表明:采用投影寻踪
法来确定权重 ,减小了人为因素的干扰 ,分析结果更加科学 、准确。
关键词:蔷薇;品质;评价;遗传算法;投影寻踪
中图分类号:S685.12 文献标识码:A
EvaluationonFruitQualityofTwoSpeciesofRosaL.
LIRong-qin1 , GUANFa-chun1* , HEYan-guo2 , XINGZhen3 , WANGZhong-hong1 , LANGJie1
(1.PlantScience-TechnologyDepartment, TibetAgricultureandAnimalHusbandryColege, TibetLinzhi860000, China;2.ChinaWater
NortheasternInvestigationandDesignResearchCo.Ltd, JilinChangchun130061, China;3.ResourcesandEnvironmentDepartment, Tibet
AgricultureandAnimalHusbandryColege, TibetLinzhi860000, China)
Abstract:Inordertoassessthefruitqualityobjectivelyinpracticalproduction, PPC(ProjectionPursuitClassification)modelbasedonRA-
GA(RealcodingbasedAcceleratingGeneticAlgorithm)wasappliedtotheassessmentonit.Projectiondirectionwasoptimizedandhigh-di-
mensiondatawereconvertedintolow-dimensionspacewithPPC, valueofprojectionindexescouldbeobtained.Basedontheseprojection
functionvalues, thesequenceofsamplesfromthebigtothesmallwasgained, atthesametime, subjectiveimpactonweightmatrixfarthest
couldbeavoidedwithPPCmodel.Asthesubjectivefactorwasavoided, theevaluationresultswasscientificandprecise.
Keywords:RosaL.;Quality;Evaluation;RAGA;PPC
蔷薇属(RosaL.)植物在中国约 95种 ,自北温
带至亚热带高山地区均有分布[ 1] ,其果实成熟时瘦
果包于萼筒内 ,果实含有多种维生素 、Zn、皂甙等多
种营养物质 ,综合利用价值较高。西藏蔷薇属植物
资源丰富 ,西藏复杂的气候 、地理条件下 ,经过漫长
的自然选择 ,西藏的蔷薇属植物演化出具有不同适
应性的各种类型 ,具有丰富的遗传多样性 ,有些特殊
的种质在世界上都是独一无二的。对其果实营养品
质进行准确 、科学的分析和评价 ,是西藏野生果树资
源利用过程中的重要一环 ,选择合理分析方法是准
确 、科学地分析和评价果实营养品质质量的关键。
投影寻踪模型(ProjectionPursuit, PP)[ 2 ~ 3]是一
种针对非线性 、非正态高维数据的新兴统计方法 ,该
方法将高维数据(产量指标 、营养指标等)投影到低
维子空间上 ,借助基于实数编码的加速遗传算法
(RealcodingbasedAcceleratingGeneticAlgorithm,简
称 RAGA),建立投影寻踪模型 ,经多次运算寻找最
佳投影方向 ,寻找能反映原高维数。与主成分分
析[ 4 ~ 5] 、多元统计 [ 6 ~ 8] 、聚类分析 [ 9 ~ 10]和经验判断等
方法相比 ,对无用干扰数据和缺失的数据敏感性较
低[ 11 ~ 12] ,具有稳健性好 、抗干扰性强和准确度高等
优点 ,而且投影寻踪模型可以避免以上方法专家赋
权的人为主观因素干扰 ,可以定量 、准确地对高维数
据进行分析 ,以往广泛地用于图象处理[ 13] 、评价预
测[ 14]等领域 。本文运用投影寻踪模型对西藏两种
蔷薇属植物成熟期的果实营养品质进行综合评价 ,
以期定量 、准确地实现对这两种蔷薇属果实营养品
1644
西 南 农 业 学 报
SouthwestChinaJournalofAgriculturalSciences
2010年 23卷 5期
Vol.23 No.5
质质量之间的比较 ,为合理利用西藏的野生蔷薇属
植物资源提供依据。
1 果实品质质量综合评价模型的构建
1.1 PP模型建模步骤[ 14]
由于 PP方法的基本原理及方法 ,可以将多维
数据降为一维 ,且形成的新指标具有整体分散和局
部凝聚的特征 ,故可以根据其投影值大小来做聚类
分析 ,这种将 PP用来做聚类分析的模型 ,即为 PPC
模型(ProjectionPursuitClassificationModel),其建模
过程包括如下几步:
步骤一:评价指标集的归一化处理。
设果实品质评价指标的样本集为{x*(i, j) i=
1 ~ n, j=1 ~ p},其中 x*(i, j)为第 i个样本第 j个
指标值 , n、p分别为样本的个数和评价指标的数目 。
为消除各指标值的量纲和统一各指标值的变化范
围 ,可采用下式进行极值归一化处理 。
对于越大越优的指标:
x(i, j)=x
*(i, j)-xmin(j)
xmax(j)-xmin(j) (1-a)
对于越小越优的指标:
x(i, j)=xmax(j)-x
*(i, j)
xmax(j)-xmin(j) (1-b)
式中 , xmax(j)、xmin(j)分别为第 j个指标值的最大值
和最小值 , x(i, j)为指标特征值归一化的序列 。
步骤二:构造投影指标函数 Q(a)。
PP方法就是把 p维数据{x*(i, j) j=1 ~ p}综
合成以 a={a(1), a(2), a(3), … , a(p)}为投影方
向的一维投影值 z(i)。
z(i)=∑pj=1a(j)x(i, j) (i=1 ~ n) (2)
然后根据{z(i) i=1 ~ n}的一维散布图进行
分类。式(2)中 a为单位长度向量。
综合投影指标值时 ,要求投影值 z(i)的散布特
征应为:局部投影点尽可能密集 ,最好凝聚成若干个
点团;而在整体上投影点团之间尽可能散开 。因此
投影指标函数可以表达成:
Q(a)=SzDz (3)
式中 , Sz为投影值 z(i)的标准差 , Dz为投影值 z(i)
的局部密度 ,即:
Sz=
∑ni=1(z(i)-E(z))2
n-1 (4)
Dz=∑ni=1∑
n
j=1(R-r(i, j))·u(R-r(i, j)) (5)
式中 , E(z)为序列{z(i) i=1 ~ n}的平均值;R为
局部密度的窗口半径 ,它的选取既要使包含在窗口
内的投影点的平均个数不太少 ,避免滑动平均偏差
太大 ,又不能使它随着 n的增大而增加太高 , R可以
根据试验来确定 ,一般可取值为 0.1Sz;r(i, j)表示
样本之间的距离 , r(i, j)= z(i)-z(j) ;u(t)为一
单位阶跃函数 ,当 t≥0时 ,其值为 1,当 t<0时其函
数值为 0。
步骤三:优化投影指标函数。
当各指标值的样本集给定时 ,投影指标函数 Q
(a)只随着投影方向 a的变化而变化。不同的投影
方向反映不同的数据结构特征 ,最佳投影方向就是
最大可能暴露高维数据某类特征结构的投影方向 ,
因此可以通过求解投影指标函数最大化问题来估计
最佳投影方向 ,即:
最大化目标函数:Max:Q(a)=Sz·Dz (6)
约束条件:s.t:=∑pj=1a2(j)=1 (7)
这是一个以{a(j) j=1 ~ p}为优化变量的复杂
非线性优化问题 ,用传统的优化方法处理较难。因
此 ,应用模拟生物优胜劣汰与群体内部染色体信息
交换机制的基于实数编码的加速遗传算法(RAGA)
来解决其高维全局寻优问题 。
步骤四:分类与优序排列 。
把由步骤三求得的最佳投影方向 a*代入式
(2)后可得各样本点的投影值 z*(i)。将 z*(i)与
z*(j)进行比较 ,二者越接近 ,表示样本 i与 j越倾
向于分为同一类。若按 z*(i)值从大到小排序 ,则
可以将杂交组合样本从优到劣进行排序 。
1.2 基于实数编码的加速遗传算法(RAGA)
基于实数编码的加速遗传算法 (Realcoding
basedAcceleratingGeneticAlgorithm,简称 RAGA)包
括以下几个步骤:
求解如下最优化问题:Max:f(X)s.t.:aj≤xj≤bj
步骤 1:在各个决策变量的取值变化区间随机
生成 组均匀分布的随机变量(实数);步骤 2:计算
目标函数值 ,从大到小排列;步骤 3:计算基于序的
评价函数(用 eval(V)表示);步骤 4:进行选择操作 ,
产生新的种群;步骤 5:对步骤 4产生的新种群进行
交叉操作;步骤 6:对步骤 5产生的新种群进行变异
操作;步骤 7:进化迭代;步骤 8:进入步骤 1,重新运
行 SGA,
上述 1 ~ 7步骤构成标准遗传算法 (Standard
GeneticAlgorithm,简称 SGA)。由于 SGA不能保证
全局收敛性 ,在实际应用中常出现在远离全局最优
点的地方 SGA即停滞寻优工作 。为此 ,可以采用第
一次 、第二次进化迭代所产生的优秀个体的变量变
16455期 李荣钦等:两种蔷薇属植物果实品质质量的综合评价
表 1 两种蔷薇属植物的营养成分
Table1 NutritionalcomponentsoftwospeciesofRosaL.
种类
Species
总糖
Totalsugar
(%)总酸
Totalacids
(mg· 100g-1)
粗蛋白
Crudeprotein
(%)
Ca
(mg· 100g-1)
Zn
(mg· 100g-1)
长果蔷薇 Longrosebud 58.3271 14.5674 1.1931 11.5031 2.0618
圆果蔷薇 Roundrosebud 57.7735 16.1703 1.0798 10.4227 2.2269
化区间作为变量新的初始变化区间[ 13] ,算法进入步
骤 1 ,重新运行 SGA,形成加速运行 ,则优秀个体区
间将逐渐缩小 ,与最优点的距离越来越近 。直到最
优个体的优化准则函数值小于某一设定值或算法运
行达到预定加速次数 ,结束整个算法运行。此时 ,将当
前群体中最佳个体指定为 RAGA的结果。
将 PPC模型中投影指标函数 Q(a)求最大作为
目标函数 ,各个指标的投影 a(j)作为优化变量 ,运
行 RAGA上述 8个步骤 ,即可求得最佳投影方向
a*(j)及相应的投影值 z(i),将 z(i)按其值大小进
行比较 ,从而求得评价结果 。
2 实例分析
2.1 试验地概况与试验设计
采样地点位于西藏自治区吉隆县 (N28°22′
67″, E85°19′62″),试验于 2009年 10月中旬果实成
熟季节 ,在该县吉隆镇南的原始森林中的多个样点
随机采集多株两种蔷薇属植物的果实 ,果实外形要
求具备本品种特征 ,且无病斑 ,采集的样品风干后进
行测定 ,选取了样品的总糖 、总酸 、粗蛋白 、Ca、Zn含
量 ,以及果实糖酸比作为评价指标 ,果实营养成分指
标测定结果见表 1。
2.2 结果与分析
首先将评价指标的测定值进行归一化处理 ,对
于总糖 、总酸 、粗蛋白 、Ca、Zn、糖酸比指标 ,采用公
式(1-a)归一化处理 。采用 MATLAB6.5软件编
A:长果蔷薇 Longrosebud;B:圆果蔷薇 Roundrosebud
图 1 营养成分指标综合评判函数投影值排序
Fig.1 Comprehensivevalueofprojectionvaluesofnutritionalcomponents
程处理数据 ,选定父代初始种群规模为 n=400,交
叉概率 Pc=0.80,变异概率 Pm=0.80,优秀个体数
目选定为 20个 , α=0.05,加速次数为 20,得出最大
投影指标值为:0.4570,各个状态变量的最佳投影方
向 a* =(0.2274, 0.2356, 0.4013 , 0.1278, 0.4552),
将 a*代入式 (2)后即得各个实验样本综合评价的
函数投影值 z*(j)=(2.5267, 2.4321)样本优序关
系见图 1。
不同蔷薇属植物的营养成分指标综合评判函数
投影值的排序结果表明(图 1):长果蔷薇果实品质
质量的综合评价结果(投影值 2.5267)略高于圆果
蔷薇(投影值 2.4321)。从单个指标来看 ,虽然长果
蔷薇果实的总酸含量 、Zn指标数值低于圆果蔷薇 ,
但总糖 、粗蛋白 、Ca等指标数值高于圆果蔷薇 ,综合
各指标的数值结果 ,长果蔷薇果实的综合评价结果
略高于圆果蔷薇。
3 讨论与结论
在进行植物果实品质评价时 ,指标的选取直接
影响到果实品质质量评价的真实性 、合理性和科学
性 ,因此 ,果实品质评价指标应全面 、综合地反映果
实品质质量的各个方面 ,既能反映果实的口感和营
养特征 ,又能反映出果实加工方面的性能。在确定
土壤肥力评价指标时 ,应针对生产和应用现实 ,减少
评价者的主观性 ,使指标能真实 、客观地反映一定社
会状态下的果实品质质量;同时果实品质评价指标
选取应避免指标间多重共线性问题 ,如果选取的指
标间存在多重共线性 ,既增加了不必要的计算量和
分析量 , 又影响到果实品质评价结论的真实
性[ 5, 7, 10] 。
在果实品质质量评价过程中 ,不同指标选取 ,其
结果也不尽相同 ,本文在业界内对蔷薇属植物果实
品质质量评价指标尚没有确定的情况下 ,提供综合
评价果实品质质量的一种新的方法和思路。
投影寻踪模型只是对果实品质质量进行了总体
上的评价 ,单一营养指标的高低并不能从根本上影
响到最终的评价结果 ,最终的分析结果依赖筛选出
来的全部评价指标数值的高低 。因此 ,在评价指标
的选择上需要遵循完全性原则 、简捷易得性原则 、相
1646 西 南 农 业 学 报 23卷
对独立性原则和客观性原则[ 14] ,这样运用投影寻踪
模型分析出的结果才能更加准确的指导实际生产 ,
也更有实用价值 。
运用基于遗传算法的投影寻踪模型对果实品质
质量进行评价 ,为果实品质指标的分析提供了一种
新的数学研究方法。该方法对果实品质各指标具有
的模糊性 、不确定性的高维数据进行降维处理 ,从而
实现定量 、准确地分析高位数据的目的。今后还可
以根据生产实际需要引入生产投入等其他方面的指
标进行分析 ,以期能够更加准确地指导生产实践。
参考文献:
[ 1] 《中国植物志 》编辑委员会.中国植物志(第三十七卷)[ M] .北
京:科学出版社 , 1985.360-453.
[ 2] FriedmanJH, TurkeyJW.Aprojectionpursuitalgorithmforexplor-
atorydataanalysis[ J] .IEEETrans.onComputer, 1974, 23(9):881
-890.
[ 3] FuQ, XieYG, WeiZM.Applicationofprojectionpursuitevalua-
tionmodelbasedonreal-codedacceleratinggeneticalgorithmineval-
uatingwetlandsoilqualityvariationsintheSanjiangPlain[ J] .China
Pedosphere, 2003, 13(3):249-256.
[ 4] BaoJF, XiaRX, DengXX, etal.Thequalityevaluationfactors
selectionofNewhalorangebytheprincipalcomponent[ J] .Journal
ofHuazhongAgriculturalUniversity, 2004(12):663-666.
[ 5]鲍江峰 ,夏仁学 ,邓秀新 ,等.用主成分分析法选择纽荷尔脐橙品
质的评价因素 [ J] .华中农业大学学报 , 2004(12):663-666.
[ 6] WeiQP, ChengSH, DingDD.Selectionoffactorsforevaluating
apple(MaluspumilaMil)fruitquality[ J] .ChinaFruits, 1997,
(4):14-15.
[ 7]雷 莹 ,张红艳 ,宋文化 ,等.利用多元统计法简化夏橙果实品质
的评价指标 [ J] .果树学报 , 2008, 25(5):640-645.
[ 8] LeiYL, ZhangHY, SongWH, etal.Utilizationofmultivariate
statisticsinsimplifyingtheindicesoffruitqualityevaluationonlate
orangecultivars[ J] .JournalofFruitScience, 2008, 25(5):640-
645.
[ 9] ZhangHY, HanT, WangYN, etal.Selectionoffactorsforevalua-
tingpeach(Prunuspersica)fruitquality[ J].JournalofAnhuiAgri
Sci, 2006, 22(8):235-239.
[ 10]张海英 ,韩 涛 ,王有年 ,等.桃果实品质评价因子的选择 [ J].
农业工程学报 , 2006, 8(22):235-239.
[ 11]张礼兵 ,程吉林 ,金菊良 ,等.农业灌溉水质评价的投影寻踪模
型 [ J] .农业工程学报 , 2006, 22(4):15-18.
[ 12] José AM, JuanGR, MaríaCA.Aprojectionpursuitalgorithmfor
anomalydetectioninhyperspectralimagery[ J] .PatternRecognition,
2008, 41(11):3313-3327.
[ 13] LesaMK, MitraB.Applicationofprojectionpursuitlearningto
boundarydetectionanddeblurringinimages[ J] .PaternRecogni-
tion, 2000, 33:2019-2031.
[ 14]金菊良 ,刘永芳 ,丁 晶 , 等.投影寻踪模型在水资源工程方案
优选中的应用 [ J] .系统工程理论方法应用 , 2004, 13(1):81-
84.
[ 15]王业成 , 雷 溥 ,权龙哲 ,等.基于投影寻踪法的稻米品质综合
评价 [ J] .东北农业大学学报, 2006, 37(2):211-214.
(责任编辑 陈 虹)
16475期 李荣钦等:两种蔷薇属植物果实品质质量的综合评价