免费文献传递   相关文献

基于Fisher判别分析的9种柳属植物鉴别模型构建



全 文 :基于Fisher判别分析的9种柳属植物鉴别模型构建
周晓星, 孙振元, 韩 蕾, 巨关升, 钱永强, 刘俊祥
(中国林业科学研究院林业研究所/国家林业局林木培育重点实验室, 北京 100091)
摘 要:以银芽柳、垂柳、旱柳、蒿柳、杞柳、沙柳、苏 172、苏 799、垂爆柳 9 种柳属植物为材料,对其叶长、叶宽、叶最宽处距叶
尖距离、叶柄长、腋芽长、叶片密度和叶序比等 7 个指标进行分类统计分析和 Fisher 判别分析,得出这 9 种柳属植物的判别函数,
构建判别模型。再将这 9 种柳属植物的形态指标数据代入相应判别模型,检验其判别效果。结果表明,判别模型对柳属植物种间的
识别正确率高于 95%,可用于柳属植物的种间判别。
关键词:柳属植物; 分类; 判别分析
中图分类号:S687.9 文献标识码:A 文章编号:1004-874X(2012)07-0073-03
9 species of Salix identification model construction
based on Fisher Discrimination Analysis
ZHOU Xiao-xing, SUN Zhen-yuan, HAN Lei, JU Guan-sheng, QIAN Yong-qiang, LIU Jun-xiang
(Research Institute of Forestry, Chinese Academy of Forestry/Key Laboratory of Tree Breeding and
Cultivation, State Forestry Administration, Beijing 100091, China)
Abstact: Taking 9 species of Salix (Salix gracilistyla, S. babylonica, S. matsudana, S. viminalis, S. integra, S. psammophila, S.
Jiangsuensis CL. ‘172’, S. Jiangsuensis CL. ‘799’, S. babylonica×S. fragilis) as materials, 7 indexes including leaf length, leaf width,
distance from the widest to the tip, petiole length, axillary bud length, leaf density and phyllotaxis ratio were analyzed under classification
statistical function and Fisher discriminate function, resulted the discriminate function equation of the 9 species of Salix and constructed
identification model. Then put morphological indexes data of the 9 species of Salix into the corresponding identification model to test its
discriminate results. The results indicated that precision of the 9 species of Salix recognition was higher than 95%, and it has provided a
technical support for the recognition of Salix species.
Key words: Salix; identification; discrimination analysis
柳树是杨柳科(Salicaceae)柳属(Salix)植物的总称,
为我国重要的阔叶植物,是防护林、水土保持林、风景林
及用材林的重要组成树种,具有较高的生态和经济价值。
柳属种类繁多,全世界有 520 多种,在我国有 257 种 122
变种[1]。 柳属植物天然变异丰富,有性和无性繁殖容易,且
种间易杂交, 因此, 很多种或变种的形态特征差异不明
显, 利用传统的植物分类学方法已无法对其进行准确分
类 [2]。 数量分类方法摆脱了传统分类的主观性,能够对大
量生物学性状进行全面的综合分析, 得出更加正确的分
类结果,使植物分类走向客观化、定量化[3]。 判别分析是植
物数量分类学中应用的主要数学方法, 它要求已知一系
列反映事物特征的数值变量的值和各个体的分类, 首先
根据表明事物特点的变量值及其所属的类求出判别函
数,再根据判别函数对未知所属类别的事物进行分类,可
使植物分类在数量化的同时减少人为因素的干扰[4]。
判别分析方法在植物的分类 [5-8]、病害识别 [9-12]、品质检
测[13-14]和抗性鉴定[15]等领域已有广泛应用。研究对象主要集
中在小麦、水稻、烟草、蔬菜、果树等作物,而用于柳属植物
分类方面的研究未见报道。 本文拟用判别分析方法,对已
知分类的 9种柳属植物构建判别模型,建立判别函数,并以
参试柳树样本为训练集,评价模型的鉴别准确率,为进一步
完善和优化大样本柳属植物的数量分类提供参考[16]。
1 材料与方法
1.1 试验材料
供试材料为银芽柳(细柱柳,S. gracilistyla M.)、垂柳
(S. babylonica L.)、旱柳(S. matsudana K.)、蒿柳(S.viminalis
L.)、杞柳(S. integra T.)、沙柳(北沙柳,S. psammophila C.)、
苏 172﹝S. Jiangsuensis CL.‘172’,(S. babylonica×S.alba)×S.
matsudana﹞、苏 799(S. Jiangsuensis CL.‘799’)(S. matsudana×
S. alba)、垂爆柳(S. babylonica×S. fragilis)2 年生植株的扦
插苗,均种植于中国林科院实验基地(年均降水量 644 mm,
年平均气温 10~12℃,无霜期 180~200 d)。
1.2 试验方法
1.2.1 测定方法和指标 每种柳属植物随机抽取 3 株,每
个植株取中部成熟枝条 10个, 每个枝条上随机取 2 片完
全展开叶,测量叶长(X1)、叶宽(X2)、叶最宽处距叶尖距离
(X3)、叶柄长(X4)、腋芽长(X5),同时测量此叶片所在枝条
的叶片密度(X6)和叶序比(X7)。叶片密度指从侧枝顶端的
第 1片完全展开叶开始到基部 30 cm的枝条上的叶片数[17]。
枝条完全展开叶部分,从一片叶开始沿枝条方向环绕
到下一片同一叶向的叶(不包括)为一个循回。 叶序比=每
一个循回的叶片数/叶子旋转圈数[18]。
1.2.2 Fisher判别模型 Fisher判别分析采用了方差分析的
收稿日期:2012-02-13
基金项目:中央级公益性科研院所基本科研业务费专项(RIF20
10-07)
作者简介:周晓星(1980-),男,在读博士生,E-mail:zhouxiaoxing
3995@yahoo.com.cn
通讯作者:孙振元(1964-),男,博士,研究员,E-mail:sunzy@263.net
广东农业科学 2012 年第 7 期 73
DOI:10.16768/j.issn.1004-874x.2012.07.068
表 1 9种柳属植物的形态特征分析
种类
银芽柳
垂柳
旱柳
蒿柳
杞柳
沙柳
苏 172
苏 799
垂爆柳
叶长
(cm)
13.365±1.417a
10.508±1.249d
12.275±1.261bc
12.017±2.102c
9.626±1.113e
9.019±1.164f
12.337±1.476bc
12.781±1.558b
10.286±0.950d
叶宽
(cm)
1.349±0.130d
1.096±0.141e
1.323±0.218d
1.076±0.184e
1.064±0.111e
0.476±0.041f
1.872±0.250a
1.563±0.226b
1.440±0.151c
最宽处距尖距
(cm)
9.528±1.118a
7.258±0.912d
7.499±0.992d
8.440±1.558b
4.852±0.671e
4.678±0.714e
8.393±1.233b
7.912±0.998c
7.365±0.761d
叶柄长
(cm)
0.733±0.109b
0.753±0.166b
0.722±0.093b
0.938±0.129a
0.631±0.123d
0.678±0.120c
0.472±0.078e
0.746±0.147b
0.962±0.120a
腋芽长
(cm)
0.474±0.083b
0.329±0.066de
0.322±0.049de
0.591±0.180a
0.403±0.142c
0.260±0.039f
0.398±0.076c
0.348±0.077d
0.301±0.035e
叶片
密度
25.200±3.308c
12.533±2.127g
17.300±1.788e
27.700±3.376b
38.300±4.673a
21.600±4.529d
13.833±1.648f
17.200±1.990e
17.133±1.214e
叶序比
2.500±0.000d
2.661±0.228bc
2.702±0.181b
2.620±0.075c
2.540±0.073d
2.500±0.000d
2.784±0.213a
2.670±0.075bc
2.769±0.157a
注:表中同列数据后小写英文字母不同者表示差异显著。
方法,即利用已知样本的分类和多元函数极值解法,使类间
方差达到最大而类内方差达到最小,来求取判别函数[19]。
设从 k个总体 Gt(t=1,…,k)中分别抽取 nt个样本,每
个样本用 m个特征值描述,组成 m元向量 x(i)(t)=(xi1(t),…,
xim(t)),(t=1,…,k;i=1,…,nt),其中 nt 为从总体 Gt 中抽取
的样本个数。设 a=(a1,…,am )为 m维空间的某指定向量,
那么 u (x)= a’·x为样本 x向以 a为法线方向上的投影。
每个样本投影后由多元数组转为一元数据, 一个总体含
有 nt个一元投影,k个总体有 k组投影, 对这 k组一元数
据进行一元方差分析,其组间平方和为:
B0=
k
t = 1
Σnt(ax(t)a)2=a〔
k
t = 1
Σnt(x(t)-x)(x(t)-x)〕a=aBa
其中 Gt的 nt个样本均值向量为:x(k)= 1nk
nk
j = 1
Σxj(k)
k个总体的样本均值向量为:x(k)= 1nk
k
t = 1
Σ
nk
j = 1
Σxj(k)
而 B为组间离差阵:B=
k
t = 1
Σnt(x(t)-x)(x(t)-x)
合并的组内平方和为:A0=
k
t = 1
Σ
nt
j = 1
Σ(axj(t)-ax(t))2
=a 〔
k
t = 1
Σ
nt
j = 1
Σ(xj(t)-x(t))(xj(t)-x(t))〕a=aAa
其中合并的组内离差阵 A为:
A=
k
t = 1
Σ
nt
j = 1
Σ(xj(t)-x(t))(xj(t)-x(t))
因此,若 k 组总体(类)的均值有显著差异,则比值
aBa
aAa =Δ
(a)应充分大。 利用方差分析,此问题变为求投影
方向 a,使 Δ(a)达到极大值。 因为使 Δ(a)达到极大值的 a
不唯一,因此对 a附加一个约束条件,即选取 a=1。 因此,以
上条件极值问题就转化为求 B
A
的最大特征值和相应特征
向量的问题。设B
A
的非零特征值为 λ1≥λ2≥…λr>0,其相应
的满足约束条件的特征向量为 a1,a2,…,ar,称 P1= λ1r
i = 1
Σλi

线性判别函数 u1(x)=a1’·x的判别能力,称 P(l)= (λ1+…+λl)r
i = 1
Σλi
为前 l 个(l≤r)线性判别函数 ul(x)=a1·x,…,ul(x)=alx 的
累积判别能力。 判别能力越强,判别准确率越高[19]。
1.2.3 数据分析 数据处理与分析采用 SPSS13.0。先将所
取的 9种柳属植物(各 60个叶片)的形态指标数据进行分
类统计。 再将每种各随机抽取 50个叶片(训练样本集)的
数据进行 Fisher 判别分析,得出判别函数系数,构建判别
模型。 最后,用每种柳属植物剩下的 10个所取叶片(测试
样本集)对鉴别模型进行验证。
2 结果与分析
2.1 分类统计
对 9种柳属植物的形态学指标进行分类统计分析,结
果(表 1)表明,除叶序比(X7)外各指标的取值区间均较
大,稳定性较差;但不同种柳属植物各指标间存在显著差
异,银芽柳的叶长和最宽处距叶尖距离显著大于其他 8种
柳属植物; 沙柳的叶长和叶宽显著小于其他 8 种柳属植
物; 蒿柳的叶柄长和腋芽长显著大于其他 8种柳属植物;
杞柳的叶片密度显著大于其他 8种柳属植物;苏 172 的叶
片密度显著小于其他 8种柳属植物,而叶序比显著大于其
他 8种柳属植物。
2.2 鉴别模型构建
用 9 种柳属植物叶片训练样本集在 SPSS 13.0 程序
下进行 Fisher 判别分析,得出判别函数系数,构建不同柳
树的判别模型,具体见表 2。
将训练样本集中 9 种柳属植物的形态指标代入相应
判别模型,检验其判别效果,结果如表 3。
从 9 种柳属植物训练样本集分类结果的判别散点图
(图 1,封二)可以看出,垂柳的分类中心(2)和垂爆柳的分
类中心(9)相对接近,旱柳的分类中心(3)和苏 799 分类中
心(8)也相对接近,因此垂柳与垂爆柳、旱柳与苏 799 之间
的鉴定判别中正确率较低。
进一步用 9 种柳属植物的测试样本集对鉴别模型进
行验证,结果如表 4。
9 种柳属植物的训练样本集预测分类结果和测试样
本集验证结果均表明,Fisher 判别分析建立的鉴别模型可
用于对垂爆柳、垂柳、旱柳、苏 799、蒿柳、杞柳、沙柳、苏
74
种类
银芽柳
垂柳
旱柳
蒿柳
杞柳
沙柳
苏 172
苏 799
垂爆柳
表 4 基于判别模型的 9种柳属植物测试样本集分类
银芽

10
0
0
0
0
0
0
0
0
垂柳
0
10
0
0
0
0
0
0
1
旱柳
0
0
9
0
0
0
0
5
0
蒿柳
0
0
0
10
0
0
0
0
0
杞柳
0
0
0
0
10
0
0
0
0
沙柳
0
0
0
0
0
10
0
0
0

172
0
0
0
0
0
0
10
0
0

799
0
0
1
0
0
0
0
5
0
垂爆

0
0
0
0
0
0
0
0
9
总计
10
10
10
10
10
10
10
10
10
注:本原群样本的分类正确率为 92.2%。
注:本原群样本分类的正确率为 95.1%。
表 3 9种柳属植物的训练样本集预测分类
种类
银芽柳
垂柳
旱柳
蒿柳
杞柳
沙柳
苏 172
苏 799
垂爆柳
银芽

49
0
0
6
0
0
0
0
0
垂柳
0
50
0
0
0
0
0
0
0
旱柳
0
0
45
1
0
0
0
9
0
蒿柳
1
0
0
43
0
0
0
0
0
杞柳
0
0
0
0
50
0
0
0
0
沙柳
0
0
0
0
0
50
0
0
0

172
0
0
0
0
0
0
50
0
0

799
0
0
5
0
0
0
0
41
0
垂爆

0
0
0
0
0
0
0
0
50
总计
50
50
50
50
50
50
50
50
50
172和银芽柳的判别, 但是垂爆柳与垂柳、 旱柳与苏 799
之间判别准确率较低。 其中,测试样本集中 10%的垂爆柳
被错判为垂柳,50%的苏 799 被错判为旱柳,10%的旱柳
被错判为苏 799。
3 结论与讨论
本文对 9 种柳属植物叶片的训练样本集进行 Fisher
判别分析,构建了鉴别模型,整体判断正确率为 95.1%。用
9 种柳属植物的测试样本集对鉴别模型进行验证,整体判
断正确率为 92.2%。说明用 Fisher判别分析方法鉴别柳属
植物方便快捷、处理简单、识别精度高。 构建的鉴别模型
可用于柳属植物种间判别。
在本研究中,垂柳与垂爆柳、旱柳与苏 799 之间存在
较高的误判率,其原因可能是由于垂爆柳的母本为垂柳、
苏 799的母本为旱柳,种间亲缘关系较近而导致误判。
综上所述,构建 Fisher判别模型对柳属植物进行识别
与分类具有一定的可行性,且相比于传统分类方法,判别
效率明显提高。 垂柳与垂爆柳、旱柳与苏 799之间因存在
较近的种间亲缘关系, 在判别性状有限的情况易导致误
判。 因此,可通过增加茎干皮孔、维管束等性状指标对鉴
别模型进行完善与优化, 为最终构建理想的柳属植物鉴
别模型、提高柳属植物分类效率与准确度奠定基础。
参考文献:
[1] 中科院《中国植物志》编委会.中国植物志[M].北京:科学出版社,
1984,20(2):81-381.
[2] 王源秀,徐立安 ,黄敏仁 .杞柳和簸箕柳候选杂交亲本 SSR 指纹
分析[J].南京林业大学学报,2008,32(2):1-5.
[3] 徐克学.数量分类学[M].北京:科学出版社,1994.
[4] 熊咏梅,朱纯,何仲坚.我国植物群落数量分类的研究进展[J].广
东园林,2008,30(4):49-51.
[5] 张正斌 ,王德轩 .小麦生态类型的判别分析 [J].西北植物学报 ,
1989,9(2):110-115.
[6] Zhang N, Chaisattapagon C. Effective criteria for weed identifi-
cation in wheat fields using machine vision[J].Transactions of the
ASAE,1995,38(3):965-974.
[7] Sako Y, Emilie E R, Daoust T, et a1. Computer image analysis
and classification of giant ragweed seeds[J].Weed Sci, 2001, 49:
738-745.
[8] 尹克林.蛇龙珠与赤霞珠葡萄品种的判别鉴定研究[J].西南农业
大学学报,1998,20(3):207-211.
[9] 黄德崇,张大业,刘宗镇.逐步判别分析法在小麦品种抗赤霉病性
评价中的应用[J].上海农业学报,1991(7):71-78.
[10] 陈刚,王海光,马占鸿.利用判别分析方法预测小麦条锈病[J].植
物保护,2006,32(4):24-27.
[11] Pydipati R, Burks T F, Lee W S. Identification of citrus
disease using color texture features and discriminant analysis[J].
Comp& Electron Agric,2006,52:49-59.
[12] 柴阿丽,廖宁放,田立勋,等.基于高光谱成像和判别分析的黄瓜
病害识别[J].光谱学与光谱分析,2010,30(5):1357-1361.
[13] 毕淑峰,朱显灵 ,马成泽 .判别分析在烤烟品质鉴定中的应用 [J].
中国农学通报,2005,21(1):79-80.
[14] 范璐,吴娜娜,霍权恭,等.模式识别法分析 5 种植物油脂[J].分析
化学研究简报,2008,36(8):1133-1137.
[15] 程建峰,潘晓云,刘宜柏,等.水稻抗旱性鉴定的形态指标 .生态学
报[J].2005,25(11):3117-3125.
[16] 梁一池,邱葵东.杉木、台湾杉、香杉逐步判别分析[J].亚热带植物
通讯,1995,24(2):16-21.
[17] 刘凌燕,张明理,李建强,等.国产青冈属的数量分类学研究[J].武
汉植物学研究,2008,26(5):466-475.
[18] 王兰州,柴中林,马志娟,等.植物叶序的几何计量分析[J].中国计
量学院学报,2006,17(2):99-102.
[19] 吴立洲,晋欣桥,杜志敏.基于 Fisher 判别分析法的空调系统传感
器故障诊断[J].能源技术,2007,28(1):45-48.
判别模型
Y1=9.875X1+9.948X2+3.414X3-25.356X4+37.342X5+6.013X6+134.025X7-333.819
Y2=5.371X1+14.851X2+3.384X3-2.256X4+9.341X5+3.626X6+138.571X7-258.805
Y3=12.562X1+17.195X2-3.476X3-19.232X4+12.570X5+4.719X6+141.874X7-306.654
Y4=9.393X1-3.278X2+2.549X3+4.569X4+48.384X5+6.382X6+135.934X7-349.039
Y5=19.147X1+5.649X2-11.199X3-11.687X4+41.409X5+7.903X6+131.279X7-394.237
Y6=17.363X1-25.130X2-8.755X3+4.604X4+12.204X5+5.164X6+124.994X7-268.748
Y7=5.717X1+57.966X2+3.031X3-60.182X4+29.066X5+3.883X6+150.820X7-331.630
Y8=11.502X1+31.109X2-3.153X3-21.179X4+13.498X5+4.675X6+140.412X7-310.210
Y9=0.909X1+37.366X2+5.749X3+25.320X4-0.854X5+4.237X6+144.539X7-304.449
表 2 9种柳属植物的判别模型
种类
银芽柳
垂柳
旱柳
蒿柳
杞柳
沙柳
苏 172
苏 799
垂爆柳
75