免费文献传递   相关文献

杉木、台湾杉、香杉逐步判别分析



全 文 :凡 产一b r r o尹 . P l a n t R 尸凡 · r ’ 。 了I r 了I凌尹一 ,产
1 9 9 5
,
2 4 ( 2乡: 1 6~ 2 1
杉木 、 台湾杉 、 香杉逐步判别分析
梁 一池 邱葵东
(福建林学院林学系 , 南平 35 30 01 )
摘 要 通过对衫木 、 台湾衫 、 香彩 2 个种源的 叶长 、 叶宽 、 叶厚 、 维管
束的宽与厚 、 栅栏组织厚 、 机械组织厚 、 表 皮厚和气孔数等 9 个叶性状进行逐
步判别分析 , 选取橱栏组织厚 ( X 。 ) 、 叶长 ( X I ) 和叶厚 ( X 3 ) 三个重要 因子 ,
建立优化判别 方程 :
F , ( 台湾衫 ) = 一 2 3 5 . 8 7 1 4 + 1 7 . 3 1 0 4X 6 + 2 6 . 3 5 8 7 X L+ 5 . 9 0 4 6 X 3
F Z材 ; 木 ) = 一 5 6 4 . 9 2 5 9 + 7 8 . 4 2 5 4X 6 + 9 3 . 1 9 2 3 X I + 0 . 6 2 9 5 X 3
F 3 (香 衫 ) = 一 3 4 9 . 4 2 0 5 + 6 4 . 1 9 2 6X 6 + 6 2 . 6 4 7 9 X I + 0 . 8 9 6 9X 3
定量地 区分这三个树种 , 旨在对逐 步判别分析法在树种分类上的应用进行探讨 。
关键词 衫木 , 台湾衫 , 香彩 , 逐步判别分析
传统的植物分类只是对植物进行定性的分类 , 往往受主观因素影响而不统一 。 为了
使植物分类走向客观化 、 定量化 , 产生了数量分类学 。 数量分类有多种数学方法 , 本文
用逐步判别分析方法 , 对杉木 、 台湾杉 、 香杉进行定量分类 , 取得较好的结果 。
一 、 材 料 和 方 法
香 杉 [峦 大 杉 C 之` , : n i n g 人a m i a za n c e o za r a ( L a m b . ) H o o k . v a r . 走o n i s i i ( H a y . )
F u ji t a 〕 6 个种源 , 台湾杉 (了’ a iw a n i a 。 尹) 沪t o o e r i o i己e : H a y a t a ) s 个种源 由美国爱达荷大
学 王启无教授赠送 , 同时收集杉木 ( C . lan ,e ol at “ ( l _ a m b . ) H o k . ) 8个地理种源进行
种源引种试验 。 1 9 8 4年育苗 , 1 9 8 5 年造林 , 采用裂区设计 , 10 次重复 。 8 年生时 , 进行
每木调查 , 每个种源随机抽取 3 株徉本 , 每株取 20 片叶进行解剖 , 测定 9 个数量性状 :
叶 长 ( X , ) 、 叶宽 ( X Z ) 、 叶厚 ( X 3 ) 、 维管束宽 ( X ; ) 、 维管束厚 ( X S ) 、 栅栏组织厚
( X
6
)
、 机械组织厚 ( X 7 ) 、 表皮厚 ( X , ) 和气孔数 ( X 。 ) 等 9 个性状 。 以种源平均值为计
算量 , 组成数值矩阵 {Xj k、 : 1 , … , p ; k ~ 1 , … , n ; l一 1 , · 一 m o}
其中 , P 为变量个数 , n 为第 ! 类样品个数 ; m 为分类数 , N 为徉品总数 (艺n ~ N ) 。
收稿 日期 : 19 9 5一 。 7 c 3
·
1 6
·
计算各变量的分类均值和总均值 :
X
卜 ,
= (艺X Jk l ) / n j= 1 , … , p , l = 1
X
J二
= (艺艺X Jk l ) / N j= 1 ,… , p 。
计算变量的组 内离差阵 W 和总离差阵 T
W = [。 i J〕p 、 p
叭 , = 艺艺 ( X . k一 X 一 ) ( X Jk一 X , . 一)
T = 「t i J〕P 又 p
t i ,一艺艺 ( X i、 l一 X ,二 ) ( X J k l一 X J . . )
逐步计算过程见 [ Z j , 剔除和 引入变量的矩阵变换公式 :
` r J / 。 r r
叭 J一 ` 、 r“ r j /。 r r
1 / 。 r r
一叭 r /。 r r
( i = r
,
j共 r )
( i笋 r , i举 r )
( i一 r , j = r )
( i护 r , i = r )
/
l|丈t
一+ll[叭、夕L了气
T 矩 阵变换与上式类似 。
建立判别函数方程进行判别分类 :
。`
( Y ) 一 ’ n q , + C 、 + 。歇C一 ` y ·
式 中 q : 为第 1组的先验概率 , 爪一 n洲N
C
· 。一 ,孰d邓 x 、 ( a 任 L , g 一 ` , 2 ,一 m ,
aoC一 。戮,驴` 一 x 。 · : 2/
- 一 艺 C二
a任 I
: x 二 g / 2
上述判别式的判别效果用 B at d e b 近似式进行检验 :
x Z
[ L ( G一 i ) j 、 [ ( N 一 l ) 一 ( L + G ) / 2〕 In u
_
.
Iw !具甲 u 一 六不丫
1 1 1
以上计算过程均 在 BI M P C / X T 计算机上编程进行 。
二 、 结 果 与 分 析
分组平均值 、 总平均值 、 总离差阵 T 和组内差阵 W 列于表 1 。
表 1 中间结果矩阵
分 组 平 均 值 和 总 平 均 值变量—1 2 3 4 5 6 7 8 91 l . 2 0 0 9 0 . l 3 8 9 6 2 . 0 0 0 0 1 9 . 0 0 0 0 23 . 62 5 0 4 . 2 7 2 5 4 . 1 87 5 4 . 2 7 5 0 6 2 . 3 7 5 02 4 . 4 8 1 8 0 . 2 9 6 6 3 6 . 5 7 5 0 4 0 . 4 8 7 5 2 0 . l 5 0 0 8 . 7 87 5 4 . 3 3 7 5 4 . 5 7 5 0 1 0 4 . 7 5 0 03 2 . 3 9 8 2 0 . 2 2 l 5 3 4 . 2 8 3 3 3 0 . 6 6 6 7 1 8 . l 8 3 3 8 . 0 6 6 7 3 . 9 6 6 7 4 . 5 0 OO l 0 9 . 5 0 0 0总平均值 2 . 7 2 0 5 0 . 2 2 1 9 4 5 . 1 9 5 5 2 9 . 9 9 5 5 2 0 . 8 7 7 3 6 . 9 5 0 0 4 . 1 0 0 0 4 . 4 1 3 6 9 0 . 6 3 6 4
续表 1
总 离 差 阵 T
变量—1 2 34 5 7 68 91 4 5. 654 2 3. 1 2 05一 305. 7 1 02 38 0. 31 07 一 7 3. 631 055. 7 2 64 5. 7 8 3O 5. 3054 988. 4 5 682 2. 1 2 05 0. 1 069一1 5. 5 947 1 3. 5 9 68一 2. 1 31 2 6. 7 8 03 0. 2 64 6 0. 257 37 2. 7 3 923一 305. 7 01 3一 1 5. 5 947 374 6. 85 00一 221 8. 0600 62 6. 57 7 3一 55 0. 7 551 一 22. 4 2 00一 4 8. 44 87 一 605 9. 4 7 3 04 28 0. 1 3 07 1 3. 95 68一 221 8. 06001 944. 41 00一 4 33. 4 22 l 395. 4 65 02 3. 8 000 35. 4 52 l 39 36. 4 64O5一 7 3. 61 3 0一 2. 1 1 2 3 6 6 6. 77 5 3一 334 . 4 1 12 2 64 . 67 7 8一 84 . 04 5 0 0. 81 00一 5. 1 5 32一 11 225. 882 0655. 27 4 2 6. 87 0 3一 55 0. 77 5 l5 39. 64 5 084 . 4 05 0 94 . O 55 5 9. 63O 07. 4 5 3O 5 92. 2OO 07 5. 7 8 30 0. 4 2 6 6一 22. 4 2 00 32. 8O 0O O. 8 lO 05. 63O 0 l. 22 00 0. 7 8O 0 36. 4O O 08 5. 305 9 0. 27 5 3一 4 8. 44 87 5 3. 1 524 一 5. 1 5 72 3. 34 5 0 0. 7 8 1 00. 2 3 6071. 81 094 988. 5 64 2 67 . 7 3 92一 605 9. 4 37 0 3 93 6. 4 64 0一 25 l l. 882 052 9. 2 0 0 36. 4 0007 l. 8O 47 9l l l 9. O 90 0组 内 离 差 阵 W变量—1 2 34 5 67 8 91 1 . 74 08 0. 07 5 5一 1 . 05 03 0. 1 4 01 0. 81 0 3一 0. 7 94 3 0. 5 07 2 0. 4 51 0一 1 7. 2 97 62 0. 057 5 0. 0 07 3 0. 4 3 3 0 0. 38 31 0. 11 7 2一 0. 002 3 0. 031 0 0. 1 0 08 0. 1 21 63一 1. 05 0 3 0. 4 3 3 01 7 8. 7 2 6 337 . 644 2 3 0. 6 08 38. 674 2 3. 7 14 2一 1. 2 5 6 0一 1 5. 7 0 04 0. 1 4 01 0. 8 3 31 27 . 644 2 93. 84 1 2一 2 0. 8 8 l 3 l. 2 6 l l l. 37 0 l l. 7 7 I 5 38 9. 87 5 05 0. 1 8 0 3 0. 11 7 2 30. 608 3一 2 0. 81 8 5 3 6. 5 03 3 3. 4 7 96 3. 05 921. 7 2 95一 11 7. 625C6一 0. 97 4 3一 0. 002 8 3. 674 21. 1 1 2 6 3. 4 967 3. 1 27 1 0. 08 96一 0. 44 5 01 3. 55 0 07 0. 5 07 2 0. 0 31 0 3. 714 21. 3 07 1 3. 05 92 0. 08 9 6 0. 1 5 8 0 0. 2 97 3一 6. 4 1 258 0. 4 5 0 ] 0. 1 0 08一 1. 2 5 61 0. 7 7 351. 7 25 9一 0. 44 5 0 0. 27 9 3 0. 6 637 一 7 . 1 2 359一 17 . 7 2 9 6 0. 21 6 3一 51 . 7 00 01 8 9. 87 5 0一 11 7. 62 51 0 3. 55 00一 6. 4 1 2 5一 7 . 31 251 36 0. 87 5 0逐步进行变量的筛选过程见表 2。 经过三次引入 , 筛选出栅栏组织厚 ( X 。 ) , 叶长( X I ) 和 叶厚 ( X 3 ) 三个 “ 重要 ” 因子 , F 检验达极显著水准 。 于是就 由这三个因子 , 组成优化的判别函数方程 : 表 2 逐 步筛选变量过程l ( L = 0 ) 2 ( L = l ) 3 ( L = 2 )引入或剔除变量 + X 6 + X , + X 3F l r 或 F Z r 2 7 0 . 9 0 0 8 7 4 . 89 4 3 2 1 . 1 2 97塾竺(m 了` 、呀万少一 ’ + 1t之 F ( 2 , 1 9 ) 一 3 . ; 9 1 : F ( 2 , 1 5 ) 一 3 . 5 24 : F ( 2 , 1 7 ) 一 3 . : 6 1 5旦又 r o . o s 气n l一 1 , l丫一 n l一 L 少L (已引入的变量 ) l ( X 。 ) ` ’ 2 (X 6 , X I ) “ 3 (X 6 , X ; , X 3 ) ` ’注 : 引入变量用 “ + ” , 剔除用 “ 一 ” 表示 .选 入变量时 用 0F 。 5 ( m 一 l , N 一 L 一 m ) , 剔除时用 OF . 。 : ( m 一 1 , N 一m 一 L
+ 1) 检验 。

1 8

F
,
(台湾杉 ) = 一 2 3 5 . 8 7 1 4 + 1 7 . 3 l o 4X 。 + 2 6 . 3 5 8 7X ; + 5 . 9 0 4 6 X 3
F
Z
(杉 木 ) ~ 一 5 6 4 . 9 2 5 9 + 7 8 . 4 2 5 4X 6 + 9 3 . 1 9 2 3 X , + 0 . 6 2 9 5 X 3
F
3
(香 杉 ) = 一 3 4 9 . 4 2 0 5 + 6 4 . 1 9 2 6X 6 + 6 2 . 6 4 7 9X I + 0 . 8 9 6 9 X 3
用 B a t t l e t 卡方检验 X Z~ 2 7 7 5 . 7 6 ,查表值 X圣0 . 。 5 ) = 1 2 . 5 6 , 所建立的方 程对这三 个树
种的判别效果极显著 。 用已知分类的 2 个种源进行判别 , 若一样本其 F 。一 m a x{ F g ( X ) } ,
1 ( g镇 3 , 则把样本归为 g 类 , 结果 (表 3) 与原分类一样 , 后验概率接近 10 0 % 。 为 了检
表 3 已知种源的判别结果
树种 序号 种 源 lF F 3 原分类 计算后分类
后验
概率
11.
111
ù.工1
ABCA
( A )
台湾秀峦
台湾望乡
台湾远见
台湾台大
台湾大雪山
台湾观雾
台湾云雾溪
台湾台东
24 1
.
4 2 13 一 7 8 . 9 0 9 6
19 4
.
53 5 5 一 8 5 . 6 7 6 0
1 5 6
.
4 9 0 2
4 7
.
84 4 4
2 4 3
.
2 22 3 一 7 4 . 26 4 4 5 8 . 4 6 5 2
35 3
.
626 1 一 5 0 . 83 84 7 9 . 27 20
3 7 0
.
25 9 1 一 7 8 . 1 0 51 5 9 . 3 4 5 6

4
1勺台湾杉
23 9
.
28 60 一 6 6 . 21 26 6 4 . 55 18
2 6 8
.
2 60 6 一 9 4 . 9 1 77
23 6
.
36 0 0 一 10 1 . 97 1 2
4 3
.
3 6 0 2 A
3 3
.
0 598 A
福建建阳
湖南林校
广融糠杉
福建南平
广融油杉
湖南会同
贵州银屏
江西铜鼓
2 9 8
.
3 9 7 4 6 1 8
.
1 4 4 7 5 7 8
.
8 1 6 5 B
2 5 8
.
9 3 1 1 6 1 5
.
5 6 23 5 6 0
.
80 9 7 B
2 3 3
.
7 8 1 7 5 3 6
.
8 6 0 4 4 9 9
.
3 4 88 B
25 5
.
4 4 61 58 5
.
1 2 4 0 5 4 7
.
89 6 4 B
2 3 5
.
2 1 2 1 5 3 1
.
0 9 83 5 0 6

4 1 9 2 B
杉木(B)
23 3
.
3 88 7 5 4 0
.
3 3 57 5 0 6
.
3 2 2 7 B
2 3 5
.
2 2 7 2 5 4 8
.
2 5 56 4 9 8
.
9 8 9 4 B
2 5 2
.
3 5 5 0 5 4 4
.
0 2 6 0 5 1 2
.
6 2 1 0 B
台湾大雪山
台湾丹大
台湾肿溪
台湾观雾
台湾远见
台湾秀峦
1 8 9
.
3 4 3 4 3 7 4
.
4 8 86 3 9 5
.
0 7 0 0 C
1 6 1
.
7 3 6 7 3 1 9
.
0 9 9 2 3 5 8
.
0 3 5 1 C
678910n2354678
香 一9

( e ) 2 0
1 4 6
.
4 9 2 0 28 2
.
0 0 28 3 30
.
3 2 8 4 C
1 7 6
.
7 7 85 3 2 3
.
1 7 5 3 3 5 5
.
9 0 4 7 C
1 5 6
.
4 8 1 4 2 4 1
.
0 7 9 4 2 9 3
.
9 1 1 2 C
1 8 5
.
6 2 0 9 3 3 6
.
8 2 0 5 3 6 3
.
1 9 4 1 C
,91白Q山Qó
验判别 函数方程在实践中的判别效果 , 从各树种中随机抽出 5 株进行判别 , 结果也是理
想的 , 误判率为 。 % (表 4) 。
表 4 未知样本的检验
树种 样本号 计算分类 判别正 ( + )误 (一 )
+十A1 50. 0 13 8
2 9 5
.
4 588
2 10
.
7 382
2 0 7
.
2 588
2 3 9
.
7 4 3 1
一 7 4 . 6 9 4 5
一 7 5. 2 4 42
54
.
0 3 92
44
.
36 3 4
一 1 11. 57 95 2 9. 19 54
一 12 3. 87 32 2 0 . 9 2 59
台湾杉(A
一 6 1. 1 5 1 4 70 . 2 4 92
+
·十B2 0 6 . 9 1 52 4 9 9. 0 76 5 4 7 8 . 54 9 7
2 3 9
.
6 0 0 1
3 12
.
8 7 9 8
6 1 4
.
6 350 556

2 3 31
6 9 1
.
4 9 9 5 6 12

16 82
2A13AIS4B6Z7
杉木
(B )
2 3 5
.
1 8 7 3 5 3 7
.
2 6 5 9 51 1
.
0 55 0
16 6
.
9 8 96 6 5 1
.
3 8 76 6 0 7
.
2 0 7 0
十+CU1 5 7. 54 2 8 3 1 8 . 92 9 3 3 3 9 . 7 59 8
1 7 6
.
96 3 6 2 1 3
.
3 3 6 5 3 3 0
.
1 50 8
16 8
.
4 9 32 4 12
.
3 3 88 4 2 5
.
0 3 1 3 C
香杉
(C )
1 1 5
.
4 3 9 8 2 4 8
.
0 3 5 8 3 02
.
1 56 7 C
1 5 8
.
1 3 3 4 2 4 8
.
6 4 2 8 3 0 0
.
1 42 9 C
61沼3n208EBC已
三 、 结 论 与 讨 论
本研究通过对杉木 、 台湾杉 、 香杉 2 个种源的叶长 、 叶宽 、 叶厚 、 维管束的宽与厚 、
栅栏组织厚 、 机械组织厚 、 表皮厚和气孔数等 9个叶性状进行逐步判别分析 , 选取栅栏
组织厚 ( X 6 ) 、 叶长 ( X , ) 和叶厚 ( X 3 ) 三个重要因子 , 建立优化判别方程 :
F
;
(台湾杉 ) = 一 2 3 5 . 8 7 1 4+ 一7 . 3 1 0 4 X 6 + 2 6 . 3 5 8 7 X , + 5 . 9 0 4 6X 3
F
Z
(杉 木 ) = 一 5 6 4 . 9 2 5 9 + 7 8 . 4 2 5 4 X 6+ 9 3 . 1 9 2 3X , + 0 . 6 2 9 5X 3
F
3
(香 杉 ) = 一 3 4 9 . 4 20 5+ 6 4 . 1 9 2 6X 6+ 6 2 . 6 4 7 9X I + 0 . 8 9 6 9 X 3
B at t le t 卡方检验达极显著判别效果 , 用已知分类的 2 个种源进行 回判 , 后验概率接
近 1 0 % 。 从各树种中随机抽出 5 株进行判别 , 结果也是理想的 , 误判率为 。% (表 4 ) 。
用逐步判别分析方法对 “ 三杉 ” 分类 , 旨在探讨该方法在树木分类上的应用 。
参 考 文 献
「1 ] 中国科学院中国植物志编辑委员会 . 中国植物志 (第七卷 ) . 北京 :科学出版社 , 1 9 7 8 . 23 ~ 30
[ 2〕 杨 自强 . 判别分析与逐步判别分析 . 计算机应用及应用数学 , 1 9 7 6 , 9 ( 3 ) : 14 一 18

2 0
·
[ 3 j李林初 . 杉科的细胞分类学和系统演化研究 . 植物分类学报 , 19 86 , 30 (5 ) : 28 一 34
[ 4 ] 李帮达 . 赣中南产铀产钨两类花岗岩体的岩石化学成分数值的多元判别 . 地质评论 , 1 9 8 6 , 19
( 3 )
:
3 1一 3 7
[ 5〕 蒋明慧等 . 判别分析在玻璃分级标准制定中的应用 . 数理统计与管理 . 19 86 , 18 ( 1 ) : 35 一 42
[ 6〕 陈守良等 . 中国散生竹的分类和确定分类等级探讨 . 植物分类学报 . 1 9 8 3 , 25 (2 ) : 15 一 2 5
〔7〕 于兆英 . 中国柳属的数量分类的研究 . 植物研究 , 2 9 5 6 , 6 ( 4 ) : 9 3一 9 4 , 1 9 55 , s ( 2 ) : 1 1 5
~ 11 8
[ 8〕 王学仁 . 地质数据的多变量统计分析 . 北京 : 科学出版社 , 1 982 . 1 47 ~ 2 06
S u bt r OP
·
P l
a n t R
e s
·
C om m
u n
.
2 4 ( 2 )
:
1 6一 2 1 , 1 9 9 5
S t e p w i s e D i s e r im i n a n t A n a ly s i s o f C : ` n n i n g h a m i a
l a n c e o l a t a ( L a m b
.
) H o o k
. , 了’ a iw a n i a c愁 IP t o m e r i o i d e s H a y a t a
a n d C
.
l a n
c e o
l
a t a ( L a m b
.
) H o o k
.
v a r
.
k o n i s i i ( H a y
.
) F u」i t a
L i a n g Y i e h i a n d Q i u K u id o n g
( F u i i
a n F o r e s 一r y C o ll e g e , N a n p in g 3 5 3 0 0 1 )
A b s t r a e t S t e P w i s e d is e r im i n a n t a n a l y
s is w a s m a d e f r o m t h e d a t a o b t a i n e d f r o m g
t r a i t s o f l e a v e s ( 1
.
e
.
l e a f le n g t h
,
l e a f w i d t h
,
le a f t h i e k n e s s
,
w i d t h a n d t h i e k n e s s o f v a s e u l a r
b u n d l e
,
t h ie k n e s s o f p a l i s a d e t is s u e a n d m e e h a n i e a l t i s s u e
, t h ie k n e s s o f e P id e r m i s a n d
n u m b e r o f s t o m a t a )
, o r i g i n a t i n g f
r o m 2 2 p r o v e n a n e e s o f C : ` n n i n g h a m i a l a n c e ol a t a
( L a m b
·
) H o o k
,
7

a i w a n i a c 护’y P t o 从 e ir o i d e s H a y a t a a n d C . l a n c e o l a t a ( L a m b . ) H o o k . v a r ·
k o n i s ii ( H a y
.
) F u i i t a
.
T h e o P t im i z e d d i s e r im i n a n t f o r m u l a w a s d e v e l o p e d b y s e l e e t i n g
t h i e k n e s s o f p a l i s a d e t i s s u e ( X
6
)
,
l e a f le n g t h ( X
l
) a n d l e a f t h i e k n e s s ( X
3
) a s t h r e e im p o r
-
t a n t f a e t o r s
,
1
.
e
.
F I ( ,I ,a iw a n i a e弓沪 t o m e r i o i d e s H a y a t a ) =
一 2 3 5 . 8 7 1 4+ 1 7 . 3 l O 4X 6十 2 6 · 3 5 8 7 X一+ 5 . 9 0 4 6 X 3
F
Z
( C
: ` n n i n g h a m i a l a n e e o l a t a ( I J a m b
.
) H o o k ) =
一 5 6 4 . 9 2 5 9 + 7 8 . 4 2 5 4 X 6+ 9 3 . 1 9 2 3X ; + 0 . 6 2 9 5 X 3
F
3
( C
·
l a n c e o l a t a ( L a m b
·
) H o o k
·
v a r
.
k o n i s i i ( H a y
.
) F u ii t a ) =
一 3 4 9 . 4 2 0 5+ 6 4 . 1 9 2 6X 6+ 6 2 . 6 4 7 9X I+ 0 . 8 9 6 9 X s
a n d e a n b e u s e d t o d i f f e r e n t i a t e q u a n t i t i v e l y t h e s e t h r e e s p e e i e s
, a im i n g a t P r o b i n g i n t o
t h e a p p l ie a t i o n o f s t e p w i s e d is e r im i n a n t a n a l y s i s t o t h e e l a s s f i e a t i o n o f t r e e s p e e i e s
.
K e y W
o r d s C : ` n , Zi n g h a m i a l a n c e o l a t a ( L a m b
.
) H o o k
. ,
7公 iw a n i a c Z-y P t o m e r i o i d e s
H a y a t a
,
C
.
l a , Z c e o l a r e ( L a m b
.
) H o o k
.
v a r k o n i s i i ( H a y
.
) F u ii t a
,
S t e P w i s e d i s e r i m i n a r i t
a n a l y s i s
·
2 1
·