免费文献传递   相关文献

APPLICATIONS OF MULTIVARIATE STATISTICAL ANALYSIS IN FORESTRY AND ITS IBM-PC SOFTWARE PACKAGES

多元统计分析方法在林业中应用及IBM-PC系列程序集编制的研究



全 文 :第 3 卷 第 3 期
1 9 9 0 年 6 月
林 业 科 学 研 究
FO R E ST R E S E A R CH
V o l

3
,
N o

3
Ju n
。 ,
1 9 9 0
多 元 统 计分 析 方 法 在 林业 中应 用 及
IB M一PC 系列程序集编制的研究 ’
李 希 菲
(中国林 业科学研究 院资 源信息研究所 )
关锐词 多元 统计分析 , 矩阵运算 ; 软件 包
从 70 年代开始 , 随着微机的普及 、 推广 , 多元统计分析方法及其他数值分析方法在各个
领域得到越来越广 泛的应用。 这就产生了两种要求 : 一是系统总结多元统计分析方法理论和
应用情况 , 评价它在林业中应用的可能及前途 , 二是要为微机配置一套通用程序 , 使林业工
作者从繁重的计算工作中解放出来 , 使多元统计分析方法付诸实施 , 也有利于多元统计分析
方法及其他数值分析方法进一步推广和应用。 本课题的研究从1 9 8 2年开始 , 至 19 8 8年完成 。
今年元月通过中国林科院院级鉴定 , 并获得有关专家的好评。
一 、 理论部分—《多元统计分析方法》
我国70 年代末引进了多元统计分析方法 , 70 年代末 、 80 年代初在工业 、 医学 、 地质等方
面得到应用。 在林业中除在遥感 及生态方面有少量应用外 , 其他领域尚不多见。 《多元统计分
析方法》系统介绍 了多元统计分析这个学科和它的主要内容 、 计算方法及应用概况 , 分析了多
元统计分析方法在林业 中应用的可能性 , 并附有实例 , 方便初学者试 用。 同时 , 作者还对一
些多元统计的墓础理论 问题进行了研究 , 取得一些进展 。 例如关于主坐标分析的基础理论 ,
主坐标分析与距离的关系 , 数量化方法与数据结构及与其他统计方法的联系等 内容 。近年来 ,
林学界已普遍将多元统计分析方法作为科研 、 生产设计 、 数据分析的重要手段之一 , 许多高
等林业院校 已将它列入有关专业研究生的必修课之一 。
二 、 矩阵运算器 O PM A
矩阵运算器是处理矩阵数据的强有力工具 , 采用命令集方式编程 , 包含18 个命令 、 30 个
函数 , 可以直接用矩阵公式进行矩阵运算。 特别适用于学校作为教学及学生实习川 。 它与程
序集 (见下节 )提供的数据变换程序相结合 , 为数据处理提供了很方便的工具。
本文 于1匀9 0年 2 月 9 日收 到。
* 本课题由唐 守正 负贵 . 参加人有郎奎健 (东北林业大学 ) 、 刘继红 、 李希菲 , 洪 玲该 、 张淑妈、 蔡力平(东 北 林 业大
学 )等同志。 本文 由李希非执笔 。
3 期 李希菲 : 多元统计分析方法在林业中应用及IBM 一PC 系列程序集编制的研究 2 87
三 、 应用程序集
程序集有二种编制方法 : 一种是命令集式 , 例如欧美的 SA S 、 A N A L YST 、 B MO P、
N CSS 等 , 这类程序结合性能较好 , 但使用较复杂 。 另一种是人机对话式程序 , 比较适合对
计算机不太熟悉或初学者使用。 但这种程序没有组合联接功能 , 我们的程序集采用了人机对
话的编程方式 , 编制了90 个程序 。 它包括了较全面的多元统计分析方法程序 , 例如多元样本
的假设检查 、多变量回归及逐步回归 、聚类分析 、 判别分析 、 主成分分析、 主坐标分析 、 典型
分析 及 各 种数量化方法 。 除此之外 , 还包活线性规划 、 动态规划及经营管理的一些主要方
法 , 例如统计及矩阵运算的主要内容 , 均可由本系统处理。 数据变换程序有较强的数据变换功
能 : 可以追加 、合并 、变换 、条件处理己有的数据 , 为各程序使用同一组数据提供了有力手段 。
(一 ) 程序集的特点
1
. 通用性 在程序集里 , 通用曲面回归是一个功能很强的通用程序 , 它提供了 3 种估计
任意连续曲线参数值的方法 。 其中改进平行线法甚至可以计算样条回归以及不可微连续曲线
的回归参数估计问题 。 现在世界上只有少数几个为大型机配置的 大规模 程序包 , 如 SA S 才
具有这种功能 , 但仍然不能计算不可微曲线的回归问题 。 在微机上具有这种功能尚属少见 。
广义方差分析程序几乎可以处理单因变量的所有参数统计问题 , 包括回归分析、 数量化
方法 工、 平均数的假设检查 、 各种分组方法的方差分析 、 协方差分析 、 各种正交及非正交实
验设计的分析 、 区组实验 、 拉丁方实验等实验数据的分析 。
2
。 专用性 三次样条标准木法求树干材积是近代测树学的一项新技术 , 树千解析 I 型、
卫型 、 材积表法求生长量等是测树专业常用的方法。 立地指数 I 型、 亚型可以对经常使用的
各种线型的导向曲线同时算出立地指数族 , 在本专业内具有通用性 。
(二 ) 本程序集与同类程序集比较
表 1 列出了本程序集与国内外几个以统计为主的程序包的功能比较 。 仅统计部分而言 ,
从表中可见优于国 内一些地方的程序集 。 与国外微机上的程序集相比各有千秋 , 功能接近中
小型机上程序集 , 但曲面(包括曲线 )回归程序是本程序集特有的。 此外还包括有关林业 、 规
划及管理方面的内容 。
(三 ) 程序研制过程中的理论工作
在程序研制过程中 , 解决了计算方法及设计原理方面的两个理论问题 :
1
。 改进的平行线法计算曲面回归参数 , 这一方法是对华罗庚教授倡导的。. 6 18 法及平行
线法(二维。。 618 法)向多元回归问题的推广 , 并且在程序设计中加进了区间函数 FN T (A , B ,
x )
, 使这个方法可用于样条回归及不可微函数的回归问题 , 通用曲面回归之所以功能超过其
他软件包 , 主要依赖于这一理论间题的解决。
2
. 广义方差分析 , 是把 1 9 7 3 年 R a o 提出的一般线性模型理论具体用于方差分析及协方
差分析 , 因而解决了不平衡数据 、 样本丢失等资料的方差分析及协方差分析间题 。 这一理论
与计算机编程技术相结合 , 使广义方差分析程序成为一个非常通用的程序。 ’
(四 ) 应用效果及今后设想
《多元统计分析方法》出版后 , 书中介绍的方法已被广泛引用 , 但多元统计分析方法所涉
2 8 8 林 业 科 学 研 究 3 卷
表 卫
程 序
国内外部分统计程序包功能比较
名 { A N A I Y S ’f 训 (二5 5 R D ‘\S IB M ,心系列程序染
研制单位 富 士 通 J . L rlin t z e
黑翼 ⋯群文 。 {黑、 文 。 ⋯罗罗 · 翼、 文 件
数据变换 { 四 贝,
、 函数 、 IF语 } 四贝。
、 函数 、 IF语 { 运算
、 、卜数 、 IF语 } 四 贝lJ
、 函 数、 ; F语句、 变
⋯样本 、 合并文件 { ’ {样 本侧除 、 合并文件
{ 不 可 行 {
不 可 行
i
不 可 行
{⋯图笋翼尝夏嚣、 直” { ” ⋯ 无 ⋯直雾富图 、 曲线 图、 部分
⋯ 有 ⋯ 有 { 无 {
_⋯完 , 、 无双 : 筛选 全生塑终些, 一匕丝 :缨 ”生一⋯一宜叁迎鹦一
}
无 ⋯ 无 ⋯ 无 {
‘笋箕凳统 计 ’⋯ 有 ’ 有 } 有 ⋯
{
有 ⋯ 无 { 无 }
}
有 ⋯-一着一一万- - 有 { ~ 畜一- -一一} 有 ⋯ 无 } 无 {
{

}
部 分
1
部 分 {
”“平衡数据分析 ⋯ ” { 无 ⋯ 有 {
线性规划和动态规 { 无 { 无 } 无 ⋯ 有
划 1 { {
及的基础理论较深 , 还需进一步普及和推广 , 才能不断提高我们的科研和生产水平 。
程序集推出已 5 年 , 全国有 60 多个正式用户 , 确实给一些科研工作者和课题组解决了数
据分析问题 , 提高了科研水平 。 就我们森林经理和林业统计研究室来看 , 程序包对我们几年
来科研工作的顺利完成起了很大作用 。例如 “全国用材林发展趋势的研究”这一课题 , 共配置了
全国 40 多个树种 (组 )的生长过程 , 如用手工计算大约 30 人要半年才能完成 , 而用程序包 2 个
人半个月就完成了 。 在一些生长模型的建立和一些数表的编制方面 , 如编制可变密度收获表 ,
要建立林分断面积与立地、 年龄 、 密度等因子的相关模型 , 通常情况下很难解决 , 采用通用
曲面 回归可以完成这一模拟 , 使我们实现了利用先进技术编表和编制先进的生产用表 。
但是 , 比较高级的程序要求使用者有较高的水平 , 因此应当不断提高科研 、 生产人员的
素质 , 大力推广 和普及多元统计分析方法 , 对程序用户举办各种类型的学 习班 , 并对用户进
行跟踪调查 , 才能不断提高我们的科研和生产水平 , 不断完善我们的程序功能。
3 期 李希菲 : 多元统计分析方法在林业中应用及IBM一PC系列程序集编制的研究 2 89
参 考 文 献
〔1 〕 唐守 正 , 1 9 8弓, 多元统计分析方法 , 中国林业 出版社 。
〔2 〕郎奎健 等 , 19 89 , IBM 一PC 系列程序集 , 中国林业出版社。
APPLICAT !ONS OF MULT IV AR !ATE ST AT !ST ICAL ANALYSIS
!N FOR E ST R Y AND !T S !BM

PC SOF TW AR E PACKAG E S
L i X ife i
(T 人e R e s e o r e h Io s tft : to o f F o r e s t R e s o “r e e I t fo r o a tt’o : r e e h o fq o e s C A F )
A b str ac t A Pr o jec t o f a PP lic a t io ns o f m u lt iv a r认te s ta tist lca l a n a ly3 is in
fo res tr y and it
s so ft wa
r e Pa c ka g es ha s b e e n e n多 g ed fo r s ix ye a rs . T hr e
a eh lev em
elt s
, a bo ok
a
nd tw
o s o ftw ar e Pac k a g es ha
v e b e e n 叭b m itted .
1
.
T he bo o k “M e thO 山 o f m u ltiv a r ia t e s ta tis t ic a l a na lysis ” w as w r itte n to
p r o v ide
res ea re址r s , in v以i多to r s a n d w o r k e r s in fo res tr y a n d 昭r icu ltu r e
w it h a n e lem e n饭r y and im P0 rt a吐 m 住ltivar ia te tec h n iq ue 。 T he bo o k inc lu d es
m a叮 exa m PI巴 w hieh 加v e be n em Plo yed in fo res t r y a n d a g r icu ltu r e
s u o 。爹‘fu lly .
2

T h e IBM

PC P r o g r a m se t co ns is ts o f 9 0 Pr o多a ro s , w hie h in v o lv e
s饭tis tiCS , P r o盯am m in g a nd ma n a g em e址
.
T he Se t no t
o n ly in e lu des us ua l
da 恤 t r ans fo r m 吐io ns , st 就ist ica l and mu ltiv ar ia t e ana lys is P rog ra m s bu t a ls o
h a 3 so m e Po w er fu l Pro 盯a〔n s , e . 9 . 罗n e ra l m u lt iv a r in t e no n lin e a r r e g re ssio n
a
nd 卯ne ra l A NO V A . A ll the P ro g ra ms ar e ea sy 一t o 一us e a n d s our ee p ro g了am s
ar e Pr o v i么范 .
3
.
O PM A (MA tr ix O Per a to r ) 15 a so ft w ar e Pa ek a g e for d e a li鳍 w ith m a tr ix
o Per a t io n
.
OPMA m a k es m a tr ix OP er
a t io n e a sy

It 15 a us efu l to o l t o e o m Pu te
m a tr ix a nd 毗ita b le fo r the s tu d e n ts to lear n 姗tr ix o Per a t io n a n d e o m Pu tilg
m e tho ds o f m a lt iv ar ia t e ana ly
s is
.
K e y w o r d s m u lt iv a r ia t e s ta t is tics ; m a tr ix o Pe r a t io n : s o ftw a r e Pa e k昭璐