全 文 :林业调查规划 2002.Sept.27 (3):4 ~ 8
Forest Inventory and Planning
CN 53-1172/ S ISSN 1671-3168
云南野生余甘子单株选优的协方差分析
吴 睿1 谷 勇2
(1.云南省旅游学校 云南 昆明 650223;中国林业科学院资源昆虫研究所 云南 昆明 650216)
摘要:为快速选择余甘子优良单株 , 项目组于 1991 年初在滇中 、 滇西北余甘子分布区按不同海拔 、 坡向 、 年龄
随机抽取 247株样木 , 并设立树龄 、 株高 、 地径 、 冠幅等 18 项变量因子进行协方差分析 、 逻辑斯谛回归 、 因子
分析以及评估选优等估算过程 , 筛选出影响余甘子品质的主导因子 , 结果为果实横径 、 坡向 、 郁闭度 、 冠幅 、
生长级 、 土层厚度等 6 项因子对单株选优具有重要指导意义。
关键词:余甘子;单株选优;协方差分析
中图分类号:O212.4 文献标识码:A 文章编号:1671-3168 (2002)03-0004-05
Covariance Analysis of Individual Selection of
Phyllanthus emblica of Yunnan
WU Rui
1 , GU Yong2
(1.Tourism Vocational School of Yunnan P rovince , Kunming Yunnan 650223 , P.R.China;
2.Kunming Institute of Resource Insects , Chinese Academy of Forestry , Kunming Yunnan 650216 , P.R.China)
Abstract:Phyl lanthus emblica was one of the important economic tree species of Yunnan province.
From 1991 , the wo rking g roup conducted the observation and determinat ion of 18 factors including
tree age , height , diameter at ground , crow n mean width , on 247 sample t rees which were randomly
selected based on the integrated considerat ion on different elevation , aspect , forest age.Covariance
analy sis , logistic reg ression , factor analysis and superior assessment and selection were carried out
based on the determination data.Six facto rs quite important and critical fo r the selection of superior in-
dividual were screened , namely fruit transection diameter , slope aspect , crown densi ty , crow n mean
w idth , grow th class and soil layer thickness.
Key words:Phyl lanthus emblica;individual selection;covariance analy sis
1 前言
余甘子又名滇橄榄 , 为亚热带果树 。云南省是
全国野生余甘子分布最广 、 产量最高的省份之一。
我省除地处高寒的迪庆州外 , 凡年平均气温在
20℃以上 , 降水量在 1 000mm左右 , 海拔在600 ~~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~
4.4 鸟瞰图中的远景部分的淡化和虚化
在鸟瞰图中的远景部分一般用喷枪在远景处喷
一些灰绿色来虚化和淡化 , 但是为了更好和更细腻
的效果 , 可以用 PHTOSHOP 中的通道等功能进行
处理 。具体方法可以参考其它的著作。
参考文献
[ 1] 方可 , 等.电脑建筑画创作技法与实例精选.北京:
清华大学出版社.
[ 2] 雪威多媒体工作室.跨越 Phtoshop5.0 超级使用手册.
北京:北京希望电脑公司.
[ 3] 王琦 , 等.3D Studio MAX R2 超级使用手册<上>.
北京:北京希望电脑公司.
收稿日期:2002-05-10 修回日期:2002-06-10
作者简介:吴睿 (1966- ), 女 , 工程师 , 从事计算机教学工作。
1 800m 的广大地区均有分布。以金沙江 、 怒江 、
澜沧江 、 红河 、 珠江 、伊洛瓦底江上游等流域较
多。其果实初食味酸涩 , 后回甘 , 余甘果实含丰富
的维生素 C (400 ~ 1 814mg/100g)、 多种氨基酸和
微量元素 , 许多营养学家把余甘子 、弥猴桃 、山楂
并列为我国三大高营养水果。除保鲜食用外 , 目前
国内市场上多加工制成蜜饯 、 果酱 、果脯 、 保健饮
料等销售 。另外 , 余甘子在医学方面有很高的药用
价值:它可以用于治疗血热 、 血瘀 、肝胆病 、消化
不良 、 咽干喉痛等;也有用盐浸渍 , 用于治疗口
干 、咳嗽等 。同时余甘果汁如同中华猕猴桃 、 刺
梨 、 大蒜 、绿茶等食品一样 , 具有防癌保健作用 。
它能阻断致癌物 N -亚硝基化合物 (NNC)在人
体内的合成。因此大力发展与种植余甘子果树有着
广阔的发展前景 , 一些地区已将种植余甘子作为发
展地区经济 、尽快脱贫致富的有效途径之一 。
目前扩大我省野生余甘子的种植面积普遍采用
的是余甘子的人工繁殖栽培 、 嫁接等技术 , 其中嫁
接方法在改良品种 、 稳定品质的优良性上有着较满
意的效果。因此如何快速 、准确地选取那些产量
高 、 口感好 、树势强 、无病虫害 、 树龄 5年以上的
优良单株作为接穗母株 , 成为开发余甘子的一项重
要环节。
2 数据来源与指标量化
1991年初项目组在滇中 、 滇西北余甘子自然
分布区域内对不同海拔 、 坡向 、年龄的余甘子单株
进行抽样调查 , 随机抽取余甘子单株样本 247株 ,
每株指标数据有 18项。这 18个指标因子分别是:
年龄 、株高 、地径 、 冠幅 、生长等级 、 果纵径 、 果
横径 、海拔 、坡向 、 郁闭度 、 植被总盖度 、 立地条
件 、 腐质殖层厚度 、 土层厚度 、口感 、 单果重 、 果
肉厚度 、 结实量 。为计算方便 , 分别用变量来表示
(见表 1)。
在 18项指标因子中 , 生长等级 、坡向 、 立地
条件 、土层厚度 、 口感这 5个指标为离散型数据 ,
其余的 13项指标数据均为实际观测值。表 2 是对
5个离散型指标因子的量化处理。在需量化指标
中 , 评分的标准是愈优则级别愈高 , 其中值得注意
的是立地条件与土层厚度需要反向评分 , 因为我们
需要筛选的是那些在环境条件恶劣的地区仍能达到
良好生长状况的优良单株 , 也即具有遗传增益性的
单株 。
表 1 本次调查中所收集到指标因子的变量表示
指标因子 变量 指标因子 变量 指标因子 变量
树龄 X 1 果横径 X 7 腐质殖层厚度 X 13
株高 X 2 海拨 X 8 土层厚度 X 14
地径 X 3 坡向 X 9 口感 Y 1
冠幅 X 4 郁闭度 X 10 单果重 Y 2
生长等级 X 5 植被总盖度 X 11 果肉厚度 Y 3
果纵径 X 6 立地条件 X 12 结实量 Y 4
表 2 离散指标的量化评分
指标 Ⅳ级 Ⅲ级 Ⅱ级 Ⅰ级
生长等级 优 良 中 差
坡向 SW;S SE;W;E;WE N;NW
立地条件 差 一般 较好 好
土层厚度 薄 中 中厚 厚
口感 最好 好 中 差
在以上的 18个因子变量中 , 最后 4 个为余甘
子的产量指标 , 这是我们关心的重点 , 前面 14个
是有关生长环境的指标因子 , 因此我们可以将前面
的 14个与环境因素有关的指标 X 1 , X 2 , …X 14
划为自变量 , 将后面 4 个产量指标 Y 1 , Y 2 , …
Y 4划分为因变量。记本次计算的原始数据集为
X , 则有
X=(X1+X2 ∧X14Y1 ∧ Y4)
存放在数据文件 s2.sav中 。
3 研究方法
在林业上选优目前普遍采用的是因子分析法。
即将所采集的指标因子数据全部放入因子分析模型
计算 , 得出每株单株的评分值 , 并按此得分确定其
是否为优良单株。在本次收集数据中由于口感 、果
肉厚 、 单果重 、结实量 4个与产量有关的指标数据
需要在果树成熟期间获得 , 因此相应进行分析及得
出结果的时间将滞后于果树的成熟时间。能否在果
树的成熟以前对所采集的样本做出一个评估呢 ?这
便是本次分析研究的目的
此次分析中运用到的分析方法有:协方差分
析 、 Logist ic回归 、 因子分析 。
·5·第 3期 吴 睿等:云南野生余甘子单株选优的协方差分析
3.1 协方差分析
协方差分析模型是方差分析模型与线性回归模
型的混合 , 它的模型中含两部分:一部分自变量一
般是取连续值的连续变量 , 是模型线性回归部分 ,
另一部分自变量是只能取不连续的水平值的离散变
量 , 是模型中的方差分析部分 。其模型的一般形式
为:
Y =X β+Zγ+e (1………………………… )
其中 X β是模型的方差分析部分 , 而 Zγ是其
回归分析部分 , γ是协变量的回归系数 , e 为剩余
向量 。
3.2 逻辑斯谛 (Logistic)回归
通常适合应用于预测一个因变量为二值 (0 ,
1)时的值 , 它的目的是找出这个因变量取 1 的概
率 p 与一组连续变量之间的线性关系 , 这个线性
关系的表示可用 p 的对数奇数比单位 (Logit)、 常
态数单位 (Normit)、 或双对数单位 (Log -Log)
三类函数法来表示。本次计算中采用的是对数奇数
比单位来表示 , 模型形式为:
log i t (p)=log [ p/ (1-p)] =α+β′X
(2)
…
………………………………………………
3.3 因子分析
因子分析的方法首先是由 Choles Spearman 于
1900年提出的 , 即找出因子中的公共因子 , 用较
少的公共因子来反映原来的全部变量信息的一种方
法。本文运用因子分析中的主成分因子分析方法 。
因子分析的模型为
xi=ai 1 f 1=a i2 f 2 +∧ +a im f m +ε, i=1 , 2 ,
∧ p (3…………………………………………… )
x = (x1 , x2 ∧ x p)′为已观测向量 , f =
(f 1 , f 2 ∧ fm)′m ≤p 是我们所要找的公共因子 , ε
为误差 。
4 计算过程
在本次余甘子的选优分析中 , 首先需要找出对
因变量影响大的自变量指标 , 并建立与那些自变量
的关系 。解决这一问题的一个有效的方法就是方差
分析模型。由于我们收集的样本数据中含有连续和
离散型的两类数据 , 因此我们选用协方差分析模型
来建立所有因变量与自变量的关系。
步骤 1-对因变量 Y 1 , Y 2 , Y 3 , Y 4进行协
方差分析估计
模型 1 --Y 1 , Y 2 , Y 3 , Y 4/ X 1 , X 2 ,
X 3 , X 4 , X 5 , X 6 , X 7 , X 8 , X 9 , X 10 , X 11 ,
X 12 , X 13 , X 14的协方差分析
因变量:Y 1 , Y 2 , Y 3 , Y 4
自变量:X 1 , X 2 , X 3 , X 4 , X 5 , X 6 , X 7 ,
X 8 , X 9 , X 10 , X 11 , X 12 , X 13 , X 14
具体操作为在 SPSS 环境下 , 打开数据文件
s2.sav , 选择分析方法 〔General L iner Model〕 在
〔Fixed〕 一项中放入离散变量 , 在 〔Covariate〕 一
项中放入所有连续变量 , 结果列表 3。
表 3 Dependent Variable:Y1 , Y2 , Y3 , Y4
Source
(变异来源)
Dependent
Variable
(因变量)
Type II I Sum of
Squares
(III 型平方和)
Df
(自由度)
Mean Square
(均方差)
F
(F 值)
Sig.
(显著性)
Corrected Model Y 1 107.337 69 1.556 4.245 0.000
Y 2 673.698 69 9.764 46.285 0.000
Y 3 4.123 69 5.976E-02 23.400 0.000
Y 4 476955259.89 69 6912395.07 3.884 0.000
To tal Y 1 956.000 247
Y 2 4285.320 247
Y 3 59.750 247
Y 4 1088780734.0 247
·6· 林 业 调 查 规 划 第 27卷
从表 3的结果可以看到:模型对变量 Y 2 、 Y 3
而言 , 模型的显著性明显 (F =46.285 和 F =
23.40);而且线性关系较强 (调整后的 R2 分别为
0.927和 0.863), 对变量 Y 1 、 Y 4离散变量而言 ,
模型的显著性不明显 , 另用 Logistic 回归模型估
计。从该模型单变量的显著性 F 值看 , 对因变量
Y 2有显著影响的自变量只有 X 7 、 X 9 、 X 10 , 对
因变量 Y 3有显著影响的自变量有 X 7 、 X 11 、 X 9
*X 14 (X 9*X 14表示 X 9与 X 14的交互效应)。
步骤 2--分别对 Y 1 , Y 2 , Y 3 , Y 4建立模
型估计
模型 2--对 Y 2/ X 7 , X 10 , X 9单变量的方
差分析
因变量:Y 2
自变量:X 7 , X 10 , X 9
具体操作同上 , 得到表 4
表 4 Dependent Variable:Y2
Dependent
Variable
(因变量)
Type III Sum of
Squares
(III 型平方和)
Df
(自由度)
Mean
Square
(均方差)
F
(F 值)
Sig.
(显著性)
Corrected Model 651.868 4 162.967 666.545 0.000
Intercept 184.095 1 184.095 752.961 0.000
X7 641.145 1 641.145 2622.322 0.000
X10 2.767 1 2.767 11.316 0.001
X9 2.700 2 1.350 5.522 0.005
Error 59.168 242 0.244
Total 4285.320 247
a R Squared =0.917 (Adjusted R Squared =
0.915)
结果分析:F 值 =666.545 , 显著性明显 , R
Squared =0.917说明线性关系也显著。 X 7的 F 值
为2622.322 , 说明 X 7 对因变量 Y 2 的影响最显
著。
从该模型的参数估计结果中我们可以得到对变
量 Y 2的线性估计方程为:
Y 2=-5.54+5.356*X 7-0.565*X 10+a
*X 9
其中 a为离散变量 X 9的参数估计 B值.
表 5 参数估计 (Parameter Estimates)
Parame ter
B Std.Error T(t值)
Sig.
(显著性)
95% Confidence Interval
(95%置信区间)
Lower
Bound
Upper
Bound
Intercept -5.540 0.213-25.981 0.000 -5.960 -5.120
X7 5.356 0.105 51.209 0.000 5.150 5.562
X10 -0.565 0.168 -3.364 0.001 -0.896 -0.234
[ X9=1.00] -0.358 0.108 -3.323 0.001 -0.569 -0.146
〔X9=2.00〕-6.851E-02 0.068 -1.005 0.316 -0.203 6.580E-02
〔X9=3.00〕 0 . . . . .
模型 3 --对 Y 3/X 7 , X 10 , X 11 , X 9 *
X 14的协方差分析
因变量 (Response):Y 3
自变量 (Independent) X 7 , X 10 , X 11 , X 9
*X 14
在 SPSS9.0 环境下 , 同上操作 , 运行得到对
Y3的计算结果 , 模型的 P 值小于 0.01 , 模型显
著 , 自变量中最显著的仍然是变量 X7 , 调整后的
R
2=0.853 , 说明线性关系有所下降 , 但仍是一个
可行的模型 。从模型的参数估计表得到 Y 3与 X 7 ,
X 10 , X 11 , X 9 , X 9*X 14 (X 9*X 14表示 X 9
与 X 14的交互效应)的线性回归方程为:
Y 3=-0.326+0.421*X 7+0.083*X 10-
0.047*X 11+a*X 9+b* [ X 9] * [ X 14]
其中 a 为变量 X 9 的参数估计值 , b 为变量
[ X 9] * [ X 14] 的参数估计值 。
对 Y 1 、 Y 4运用 Logistic回归模型进行估计后
可得到对变量 Y 3 、 Y 4的估计值。
步骤 3--评估选优
在前二步操作以后 , 可以获得对实测值 Y 1 、
Y 2 、 Y 3 、 Y 4 (即口感 、 单果重 、 果肉厚 、 结实
量)的估 计值 Y Y 1 、 Y Y 2 、 YY 3 、 YY 4。用
Y Y 1 , Y Y 2 , YY 3 , Y Y 4 代替原来的 Y 1 , Y 2 ,
Y 3 , Y 4 , 再加入所有 14个环境指标因子 , 用主
成份分析法剔除不显著因子 , 最后确认地径 、 果横
径 、海拔 、 坡向 、 腐殖层厚 、口感 、 单果重 、 果肉
厚 、结实量共 9个指标因子作为此次分析的数据来
源 , 记为Z1 , … , Z9。再次主成份分析 , 得到表
7。
·7·第 3期 吴 睿等:云南野生余甘子单株选优的协方差分析
表 7 特征根及其贡献率
主成份
Component
Initial Eigenvalues (特征根)
To tal
(特征根)
%of Variance
(贡献率)
Cumulative %
(累计贡献率)
y1 4.129 45.879 45.879
y2 1.368 15.201 61.080
y3 1.107 12.302 73.382
y4 0.961 10.676 84.058
y5 0.757 8.413 92.471
y6 0.484 5.374 97.846
y7 0.148 1.649 99.495
y8 4.0E-02 0.441 99.935
y9 5.8E-03 6.5E-02 100.000
从表 7看出 , 只需选取其中的前 5 个主成份
Y 1 , …, Y 5就已经反映所有 9个变量的 85%的
信息。对主成份值 Y 1 , …, Y 5取加权后平方和
即得到每个余甘子单株的优良得分值。设优良得分
向量为 R , 有
R=(45.879×Y 1+15.201×Y 2+12.302×
Y 3+10.676×Y 4+8.413×Y 5)/92.471
将所有单株的得分值从大到小排序 , 按此结果
进行选优。
5 结果与意义
从以上分析我们可以得出:
①影响余甘子产量的最主要因子有 X 7 、 X 9
(果横径 、坡向), 当然还有 X 10 、 X 4 、 X 3 、 X 14
(郁闭度 、冠幅 、 生长等级 、土层厚度)也是影响
余甘子产量的因子;
②从以上计算过程我们还得到对余甘子的选优
计算只需要横径 、 坡向 、 郁闭度 、 冠幅 、 生长等
级 、土层厚度这 6个指标的数据我们就可以估计出
这一棵单株的优良性得分值 , 这对选优监测工作有
着重要的指导意义;
表 8 成份矩阵 (Component Matrix)
指标
因子 Component (主成分)
y1 y2 y3 y4 y5
Z1 0.907 0.178 0.116 -8.82E -02 6.16 E-03
Z2 0.968 6.13 E-02 -7.49E-02 -0.178 -3.15 E-02
Z3 0.937 -6.904 E-02 -0.181 -0.206 -2.09 E-02
Z4 0.335 -0.718 0.320 0.236 -0.334
Z5 0.518 -0.254 0.489 0.362 1.244 E-02
Z6 0.972 3.824 E-02 -0.128 -0.154 -4.82
Z7 0.226 0.643 -0.162 0.463 -1.244 E-02
Z8 0.126 0.564 0.674 0.108 0.422
Z9 0.316 -0.118 -0.466 0.666 0.463
③模型估计的可靠性高 、计算结果十分满意 。
与完全用实测数据的因子分析选优方法的结果相比
较 , 选出单株的相同率达 93%;
④计算中剔除大量不显著的因子 , 大大减少了
需要测量的样本数据 , 分析计算可在任何时间内完
成 , 增强了选优评分的预估性;
⑤其缺点是计算上要复杂一些 , 同时由于该方
法的选优是预估性选优 , 因此结果有待实际数据的
检验 。
说明:所有的计算在 SPSS 10软件支持下完
成 。
参考文献
[ 1] 钟祥.开发余甘资源 发展山区经济 [ J] .云南果树 ,
1996 , (5).
[ 2] 何于琦.微型计算机统计分析软件包 [ M] .北京:航
空工业出版社.
[ 3] 王松桂.线性模型的理论及其应用 [ M] .合肥:安徽
教育出版社.
·8· 林 业 调 查 规 划 第 27卷