全 文 : 收稿日期: 2000-01-08
基金项目: 国家攀登计划预选项目子课题——人工林木材性质特点与规律研究的部分内容
作者简介: 侯祝强( 1956-) ,男,河北南宫人,副教授,博士.
文章编号: 1001-1498( 2001) 03-0271-07
马尾松管胞长度分布规律及
计 算机 随 机 模 拟
侯祝强, 姜笑梅, 殷亚方
(中国林业科学研究院 木材工业研究所,北京 100091)
摘要: 根据 20年生人工林马尾松早晚材管胞长度测量结果, 运用随机变量正态性检验的偏斜系
数和峰态系数方法, 系统地分析了 6 株马尾松标准试材测量样品不同组合的偏斜系数和峰态系
数。结果表明, 马尾松木材的管胞长度是服从正态的随机变量, 3株试材测量样品就可揭示出其正
态分布特性。另外,利用计算机直接随机抽样的方法对马尾松管胞长度进行了模拟,模拟结果的平
均值具有较高的精度, 由此可以获得一个关于研究木材细胞分子解剖结构参数的新方法。
关键词: 马尾松; 管胞长度; 随机抽样模拟
中图分类号: S781. 1 文献标识码: A
马尾松( P inus massoniana Lamb. )是我国南方大面积栽种的针叶材树种, 它在工业生产
特别是在造纸和人造纤维的生产中有着广泛的应用。马尾松作为一个较为重要的人工林树种,
曾经对其解剖性质展开了一系列研究工作。王章荣等 [ 1]研究了马尾松木材的密度、管胞长度和
晚材率等在林分间和林分内个体的变异情况;周志春等 [ 2]分析了马尾松幼林材密度和管胞长
度在种源内和种源间遗传变异及地理环境对其的影响;姜笑梅 [ 3, 4]对马尾松幼林材和成熟材的
多种解剖结构参数进行了系统全面的研究。上述有关的研究工作, 为马尾松材性的选育和木材
的加工利用提供了科学的参考和依据。
不论是在同一树种内还是在不同的树种之间,木材的解剖结构参数变异都很大。如何针对
木材解剖性质随机多变的特点, 在当前计算机应用及其技术不断普及和发展的条件下,寻求木
材解剖性质研究工作的新方法, 这是值得认真考虑的问题。本文将从分析讨论马尾松管胞长度
的分布规律出发,利用计算机随机抽样的方法, 对马尾松管胞长度的变化特性进行模拟,以探
索关于树木性状与木材解剖性质研究的新方法。
1 材料与方法
试材采集地点是广西自治区凭祥市中国林科院热带林业实验中心大青山林场, 在生长了
20 a的马尾松人工林中,选择6棵正常生长的树,从距地面 2. 3 m 处向上各截取1. 5 m 长的树
段,计 6根,各试材树干(湿材)大头直径 19~24 cm,小头直径 18~22 cm。试材自树干截锯之
林业科学研究 2001, 14( 3) : 271~277
For est Resear ch
后,马上在两端锯口处涂上防腐药物以避免霉变。试材自采集地点运回后,立即解锯成用作加
工测量试件的毛坯。用于管胞长度测量的各个测量样品,均是从 6棵试材下端的 10 cm 处开
始,按 50 cm 相等间隔在 3个不同的高度、距髓心第15~16个年轮处截取, 共计 18个样品,按
常规方法分早、晚材离析、测量。管胞长度的测量结果是根据 18个样品,分早晚材各随机选取
50根管胞进行测量所得。即每一棵试材随机选取测量早晚材各 150个管胞长度, 6棵试材共随
机选取测量了早材和晚材各 900个管胞长度。
2 马尾松管胞长度分布规律的确定
姜笑梅根据马尾松人工林和天然林解剖性质的研究结果指出 [ 3] , 其幼林材和成熟材管胞
长度分布频率呈正态分布。本文视马尾松管胞长度为一系列随机变量的集合,应用国家标准所
推荐使用的随机变量正态性检验的“偏斜系数和峰态系数法”[ 5] ,根据各株试材的样品以及由
不同数目试材的样品组合, 逐一对马尾松管胞长度的测量结果的偏斜系数和峰态系数度进行
分析计算,以确定马尾松管胞长度的分布规律。
根据随机变量正态性检验的偏斜系数和峰态系数法[ 5] ,若总体的偏斜系数和峰态系数都
接近于零,则从实用的角度来说,可以认为总体服从正态分布。反之,当总体的偏斜系数和峰态
系数有一个不接近零时,则总体不服从正态分布。此外, 当总体的偏斜系数和峰态系数不知道
时,可以通过样本来进行估计。若设随机变量 X 1 ,⋯, X n是总体的一个样本,则样本的偏斜系
数 m1和峰态系数 m2分别为
m1= B 3/ B 2
3/ 2 ( 1)
m2= B 4/ B 2
2
- 3 ( 2)
( 1)式和( 2)式中的 B2 是样本的方差(二阶中心距) , B3 和 B4分别是样本的三阶距和四阶距,
即
B 2=
1
n
n
i= l
( X i- X )
2 ( 3)
B 3=
1
n
n
i= l
( X i- X )
3 ( 4)
B 4=
1
n
n
i= l
( X i- X ) 4 ( 5)
( 3)式、( 4)式和( 5)式中的 n是样本的数目, X 是样本的平均值。
根据本文关于马尾松试材样品管胞长度的测量结果, 利用( 1)式、( 2)式、( 3)式、( 4)式和
( 5)式所得到的偏斜系数和峰态系数,如表 1~3所示。表 1为从 6株试材中随机抽取单株试材
组成的测量样品组,早材和晚材测量样品数各为 150, 早晚材测量样品总数为 300;表 2为从 6
株试材中随机抽取 3株试材组成测量样品组,早材和晚材测量样品数各为 450,早晚材测量样
品总数为 900; 表 3为从 6株试材中随机抽取 5株试材组成测量样品组,早材和晚材测量样品
数各为 750, 早晚材测量样品总数为 1 500;全部 6株试材组成的测量样品组合的偏斜系数和
峰态系数,早材和晚材测量样品数各为 900,早晚材测量样品总数为 1 800; 且早材的 m1和 m2
为- 0. 263和- 0. 343,晚材的 m1 和 m2为 0. 333和- 0. 293,早晚材的 m1 和 m2为- 0. 004和
- 0. 302。
272 林 业 科 学 研 究 第 14 卷
表 1 单株试材测量样品组合的偏斜系数 (m1)和峰态系数( m2)
样品组别 1 2 3 4 5 6
早 材 m1
m2
0. 297
- 0. 192
0. 305
- 0. 233
0. 196
- 0. 416
0. 008
- 0. 713
0. 912
1. 146
0. 271
- 0. 350
晚 材 m1
m2
0. 298
- 0. 348
0. 266
- 0. 465
0. 289
0. 702
0. 229
- 0. 644
0. 764
0. 045
0. 248
- 0. 618
早晚材 m1
m2
0. 201
- 0. 266
0. 324
- 0. 271
0. 115
0. 037
0. 027
- 0. 475
0. 768
0. 476
0. 244
- 0. 441
表 2 3 株试材测量样品组合的偏斜系数( m1 )和峰态系数(m2)
样品组别 1 2 3 4 5 6
早 材 m1
m2
0. 231
- 0. 511
0. 534
0. 452
0. 292
- 0. 257
0. 169
- 0. 305
0. 331
- 0. 150
0. 090
- 0. 479
晚 材 m1
m2
0. 399
0. 021
0. 424
- 0. 427
0. 175
- 0. 654
0. 220
- 0. 563
0. 399
- 0. 274
0. 449
0. 080
早晚材 m1
m2
0. 253
- 0. 044
0. 189
- 0. 408
0. 431
- 0. 148
0. 253
- 0. 044
0. 247
- 0. 316
0. 091
- 0. 495
表 3 5 株试材测量样品组合的的偏斜系数(m1)和峰态系数(m2)
样品组别 1 2 3 4 5 6
早 材 m1
m2
0. 188
- 0. 375
0. 389
- 0. 248
0. 314
- 0. 186
0. 180
- 0. 418
0. 225
- 0. 380
0. 292
- 0. 335
晚 材 m1
m2
0. 304
- 0. 304
0. 351
- 0. 306
0. 383
- 0. 255
0. 234
- 0. 437
0. 225
- 0. 380
0. 247
- 0. 426
早晚材 m1
m2
0. 211
- 0. 260
0. 349
- 0. 242
0. 210
- 0. 355
0. 312
- 0. 178
0. 192
- 0. 420
0. 079
- 0. 375
根据表 1的结果, 单株试材的早材测量样品中第 4组的 m2、第 5组的 m1与 m2 ,晚材测量
样品中第 3组的 m2、第 5组的 m1 ,早晚材测量样品中第 5组的 m1的绝对值均大于 0. 7。根据
文献[ 5]提出的一个实用标准,当 m1 和 m2的绝对值大于 0. 7时即可判定其偏离零较远,故可
推知单株马尾松管胞长度测量结果的分布与正态分布有差异。根据表 2和表 3的结果, 3株试
材的早材、晚材、早晚材测量样品组合中 m1和 m 2的绝对值均不超过 0. 7, 5株试材的早材、晚
材、早晚材测量样品组合中 m1和 m2的绝对值均不超过 0. 5,这表明选取 3株试材测量管胞长
度就已基本能反映出马尾松早材、晚材及整株管胞长度正态分布的特性,而使用 5株标准试材
则可较好地反映出马尾松早材、晚材及整株的管胞长度正态分布的特性。同时,根据 6株试材
测量样品的 m1和m2 ,可知其能更好地反映出马尾松管胞长度服从正态分布的特性。测量样品
越多则越能反映出马尾松管胞长度所服从的分布规律, 样品的偏斜系数和峰态系数随测量试
材数目增大而减小,这一结果证实了马尾松管胞长度变化服从正态分布的客观事实。
273第 3 期 侯祝强等: 马尾松管胞长度分布规律及计算机随机模拟
3 马尾松管胞长度的计算机抽样模拟
3. 1 正态分布随机数的计算机抽样
一株马尾松试材包含着数目巨大的管胞,各个管胞的长度都不相同而且是随机变化的,对
于这样数目巨大的随机变量系统,通常只能进行抽样测量并依据抽样测量结果对试材管胞长
度进行统计描述。随着科学的进步与发展, 越来越要求我们对于研究对象进行更为具体的量化
描述,而计算机随机模拟则是处理这类随机变量系统或随机现象的一个有效的方法和工具 [ 6] ,
计算机随机模拟(又称为蒙特卡罗方法)在包括木材科学在内的许多科学研究领域中已有广泛
的应用[ 5~8]。本节将在管胞长度服从正态分布的前提下,根据马尾松管胞长度的测量结果, 运
用样本参数的平均值和方差估算总体的平均值和方差,以构成管胞长度的正态分布密度函数。
然后,按照管胞长度的分布密度函数利用计算机进行直接随机抽样,其所得的随机数即代表着
马尾松管胞长度的值, 从而实现对于马尾松管胞长度的计算机抽样模拟。
当标准正态分布的随机数 U~N ( 0, 1)已知时,那么由正态分布样本的平均值 和方差 2
有X = U+ ,并且 X~N (, 2 ) [ 7]。本文关于标准正态分布随机变量的计算机抽样,是基于均
匀分布随机变量的抽样方法[ 7] ,所使用的均匀分布随机数发生器则为大部分统计软件包中常
用的素数模积式发生器;同时,本文采用抽样效率较高的“极坐标”抽样法实现标准正态分布的
随机数的抽样。用于计算机直接抽样的随机数发生器,使用T urbo C语言编写在 32位微机上
实现,其抽样序列的周期不小于 2. 147×109 [ 7]。
3. 2 马尾松管胞长度的抽样模拟结果
在 3株测量样品组、5株测量样品组、6株测量样品组中任意选取早材、晚材和早晚材管胞
长度的各一组平均值和标准差,使用正态分布随机数发生器进行管胞长度的计算机随机抽样
模拟。表4所列出的各测量样品组平均值与标准差, 作为估计值用作随机抽样的总体正态分布
密度函数的参数, 表8所列为计算机抽样模拟的平均值及其与测量结果平均值的比较。由于模
拟数据数目太大无法逐一列出, 表 5~7分别为早材、晚材、早晚材管胞长度模拟结果的分布频
率,为了比较也列出了相应测量结果的分布频率。
表 4 随机抽样的样品组管胞长度的平均值与标准差
样品组 项目 3株试材测量样品组 5株试材测量样品组 6株试材测量样品组
早材管胞 平均值/ m标准差
4 277. 40
785. 51
4 461. 80
815. 78
4 383. 90
816. 98
晚材管胞 平均值/ m标准差
4 678. 70
737. 55
4 874. 60
783. 01
4 721. 10
855. 31
早晚材管胞 平均值/ m标准差
4 484. 90
772. 07
4 672. 30
814. 68
4 581. 50
836. 63
将模拟结果与测量结果作一比较可知,在远离样品组管胞长度平均值的区域,模拟结果与
测量结果间有一定的差异; 而在较接近样品平均值的区域, 模拟结果与测量结果间差异不大。
另外, 各个样品组模拟结果的平均值与测量结果的平均值非常接近, 相对误差都不大于
0. 55% ,这表明马尾松管胞长度的计算机抽样模拟结果,具有足够的精度,完全可以满足实际
应用的需要。这也表明本文利用测量样品的有关参数,使用计算机随机抽样的方法模拟马尾松
管胞长度是可行的。
274 林 业 科 学 研 究 第 14 卷
表 5 早材管胞长度测量值和模拟值的分布频率
管胞长度/ m 3株试材测量样品组测量结果 抽样结果
5株试材测量样品组
测量结果 抽样结果
6株试材测量样品组
测量结果 抽样结果
X > 7 000 0 0. 002 0. 001 0. 001 0. 001 0. 001
6 500< X≤7 000 0. 009 0. 004 0. 020 0. 007 0. 019 0. 006
6 000< X≤6 500 0. 049 0. 031 0. 073 0. 024 0. 062 0. 017
5 500< X≤6 000 0. 060 0. 100 0. 096 0. 051 0. 083 0. 049
5 000< X≤5 500 0. 176 0. 207 0. 201 0. 145 0. 176 0. 114
4 500< X≤5 000 0. 256 0. 251 0. 248 0. 209 0. 226 0. 197
4 000< X≤4 500 0. 253 0. 218 0. 223 0. 213 0. 214 0. 198
3 500< X≤4 000 0. 149 0. 120 0. 105 0. 188 0. 140 0. 208
3 000< X≤3 500 0. 047 0. 060 0. 031 0. 096 0. 066 0. 122
2 500< X≤3 000 0. 002 0. 007 0. 001 0. 065 0. 012 0. 089
X≤2 500 0 0 0 0 0. 001 0
表 6 晚材管胞长度测量值和模拟值的分布频率
管胞长度/ m 3株试材测量样品组测量结果 抽样结果
5株试材测量样品组
测量结果 抽样结果
6株试材测量样品组
测量结果 抽样结果
X > 7 000 0 0 0. 001 0. 003 0. 001 0. 002
6 500< X≤7 000 0. 006 0. 001 0. 013 0. 010 0. 013 0. 009
6 000< X≤6 500 0. 030 0. 006 0. 047 0. 035 0. 041 0. 031
5 500< X≤6 000 0. 052 0. 021 0. 087 0. 106 0. 079 0. 089
5 000< X≤5 500 0. 137 0. 247 0. 168 0. 195 0. 152 0. 176
4 500< X≤5 000 0. 234 0. 227 0. 232 0. 224 0. 212 0. 222
4 000< X≤4 500 0. 254 0. 217 0. 226 0. 210 0. 228 0. 215
3 500< X≤4 000 0. 177 0. 164 0. 148 0. 127 0. 171 0. 146
3 000< X≤3 500 0. 090 0. 077 0. 067 0. 069 0. 088 0. 076
2 500< X≤3 000 0. 019 0. 032 0. 011 0. 021 0. 015 0. 034
X≤2 500 0. 001 0. 009 0. 001 0 0. 001 0
表 7 早晚材管胞长度测量值和模拟值的分布频率
管胞长度/ m 3株试材测量样品组测量结果 抽样结果
5株试材测量样品组
测量结果 抽样结果
6株试材测量样品组
测量结果 抽样结果
X > 7 000 0 0 0. 001 0. 003 0. 001 0. 002
6 500< X≤7 000 0. 006 0. 001 0. 013 0. 010 0. 013 0. 009
6 000< X≤6 500 0. 030 0. 006 0. 047 0. 035 0. 041 0. 031
5 500< X≤6 000 0. 052 0. 021 0. 087 0. 106 0. 079 0. 089
5 000< X≤5 500 0. 137 0. 247 0. 168 0. 195 0. 152 0. 176
4 500< X≤5 000 0. 234 0. 227 0. 232 0. 224 0. 212 0. 222
4 000< X≤4 500 0. 254 0. 217 0. 226 0. 210 0. 228 0. 215
3 500< X≤4 000 0. 177 0. 164 0. 148 0. 127 0. 171 0. 146
3 000< X≤3 500 0. 090 0. 077 0. 067 0. 069 0. 088 0. 076
2 500< X≤3 000 0. 019 0. 032 0. 011 0. 021 0. 015 0. 034
X≤2 500 0. 001 0. 009 0. 001 0 0. 001 0
275第 3 期 侯祝强等: 马尾松管胞长度分布规律及计算机随机模拟
表 8 管胞长度模拟结果和测量结果平均值
样品组 早材测量样品
3株 5株 6株
晚材测量样品
3株 5株 6株
早晚材测量样品
3株 5株 6株
测量值/ m 4 277 4 462 4 384 4 679 4 875 4 721 4 485 4 672 4 582
模拟值/ m 4 291 4 439 4 367 4 691 4 851 4 704 4 469 4 662 4 566
误差/ % 0. 31 0. 52 0. 38 0. 27 0. 48 0. 37 0. 35 0. 22 0. 35
4 小结与讨论
本文对 6株马尾松管胞长度不同的测量样品组合所进行的偏斜系数和峰态系数的分析表
明,马尾松管胞长度是一系列服从正态分布的随机变量。选取3株以上的标准木试材就可较好
地揭示其正态分布特性,选取5株标准木则能更好地描述其正态分布特性。根据马尾松管胞长
度抽样测量的样品平均值和标准差,使用计算机进行直接随机抽样的方法可以对马尾松管胞
长度进行模拟,且模拟所得的平均值具有极好的精度,可以实际用于科研与生产中。要指出的
是,除马尾松管胞长度服从正态分布之外, 以往的一些研究工作已经证明一些针叶材细胞分子
其它的几何参数[ 9, 10] ,如管胞的径向直径和弦向直径、纹孔和纹孔膜的大小也服从正态分布。
试材所包含的木材细胞分子数目巨大,同时其大小形状又是无规多变的,寻求木材细胞分
子几何参数的定量描述方法,具有理论和实际的应用意义。要指出的是,正因为木材细胞分子
数目巨大且其形状无规多变,从而可将其视为一个服从某一统计分布规律的随机变量系统。在
32位微机上进行直接抽样模拟,其不重复的抽样样本可达 20多亿个, 若以马尾松木材管胞数
目来计的话, 对应着平均胸径 30 cm、长 12 m 左右的木材所包含的管胞,这样的抽样模拟范围
完全能够满足实际应用的需要。本文所得到的模拟结果表明, 在确定木材分子的统计分布规律
后运用计算机进行直接抽样模拟,是定量描述木材细胞解剖结构参数的一个有效的方法和途
径。
参考文献:
[ 1] 王章荣,陈天华,周志春,等.马尾松木材性状在林分间和林分内个体间的变异[ J ] .南京林业大学学报, 1988, ( 2) : 38~
42.
[ 2] 周志春,金国庆,秦国峰.马尾松幼林材密度、管胞长度的地理遗传变异及形状相关[ J ] .林业科学研究, 1990, 3( 4) : 393
~397.
[ 3] 姜笑梅.人工林和天然林马尾松幼林材与成熟材解剖性质比较研究[ J] .世界林业研究, 1995, 8(专集) : 1~9.
[ 4] 姜笑梅.人工林和天然林马尾松木材解剖性质差异及在径向上的变异的比较研究[ J ] .世界林业研究, 1995, 8(专集) :
10~19.
[ 5] 方开泰,许建伦.统计分布[ M ] .北京:科学出版社, 1987. 321~332.
[ 6] 裴鹿成.蒙特卡罗方法及其应用[ M ] .长沙:国防科技大学出版社, 1993. 1~25.
[ 7] 高惠璇.统计计算[M ] .北京:北京大学出版社, 1995. 98~101, 146~148.
[ 8 ] T aylor S E , Triche M H, Bender D A, et al . Monte Carlo s imulat ion methods for engineerin g w ood sys tem [ J] .
Forest Prod J, 1995, 45( 7/ 8) : 43~50.
[ 9] Sirvio P, Karenlampi P. Pits as n atural irregu lar ities in s of tw ood f iber s [ J ] . Wood and Fiber Science, 1998, 30( 1) : 27
~39.
[ 10] Vysotskaya, Vaganov E A . Components of the variabi lit y of radial cell size in tr ee rings of conifers [ J ] . IA WA
Bul letin n. s . , 1989, 10( 4) : 417~428.
276 林 业 科 学 研 究 第 14 卷
The Probability Distribution and Sampling Simulation
of the Tracheid Length in Masson Pine
HOU Zhu-qiang , J I A N G X iao-mei, YIN Ya-f ang
( Research In st itute of Wood Indus t ry, CAF, Beijin g 100091, Chin a)
Abstract: The tr acheid leng th in six tested lo gs fr om 20-year-old plantation-g row n tree o f
masson pine ( P inus massoniana Lamb. ) w er e studied. T he skew factors and kur to sis factor s
w er e evaluated to test the probability dist ribut ion tow ards the t racheid length f rom the
measurements of dif ferent sample combinat ions. Resul ts show ed that the length of t racheid
in masson pine can be r egar ded as the random variable and is no rmally dist ributed. T he
pr operty of normal dist ribut ion could be r evealed just w ith three woods tested. T he
computer simulat ion o f tr acheid length w as made by means of random sampling . There w as
gr eat ag reement betw een the means o f t racheid length fr om the simulat ion and the ones fr om
measurement and the relat ive erro r w as below 0. 55% .
Key words : masson pine; t racheid length; sampling simulat ion
中国林科院惠刚盈研究员荣获台湾“刘业经教授奖励基金”
“刘业经教授奖励基金”每年奖励在林业中作出重要贡献的科技人员。在第五届的获奖名
单中,中国林科院惠刚盈研究员榜上有名, 是获奖者中最年轻的一位。
惠刚盈研究员 1961年 2月出生于陕西富平。1983年毕业于西北林学院,同年分配到中国
林科院从事科研工作。1996年在德意志学术交流中心的资助下赴德国留学,在不到两年的时
间里, 以优异的成绩获得了德国哥廷根大学林学博士学位。2000年荣获第 21 届国际林联
( IUFRO)杰出博士研究奖,成为国际上获此殊荣的七位杰出青年科学家之一。
惠刚盈研究员在林业科学研究方面成绩显著。在国内外著名期刊上发表了 30多篇科学论
文,在国外出版专著 3部;完善和发展了林分生长与收获模型理论,提出了人工林经营模型的
构建方法;在天然林林分空间结构研究方面取得重大突破,提出描述林分空间结构的新指标和
方法,特别是首次成功解决了不用测距就可获得林木在地域上的分布格局这一世界性难题。
277第 3 期 侯祝强等: 马尾松管胞长度分布规律及计算机随机模拟