全 文 :植物生态学报 2008, 32 (4) 967~976
Journal of Plant Ecology (Chinese Version)
——————————————————
收稿日期: 2007-12-10 接受日期: 2008-03-11
E-mail: jay@mdsm.us
植被监测及趋势分析
——植被数量生态学中几个理论问题的探讨
白·图格吉扎布 梁应权
(MDSM数据分析公司, 615 久安大街, 柯林斯堡, 科罗拉多州, 80524 美国)
摘 要 系统监测可以对危机发出预警, 是防治灾害的重要手段。生态监测的基础是植被监测。多物种×多样本×
多年的植被定位监测数据隐含着植被变化的信息。该文探索描述植被的数学工具, 提出植被监测数据的趋势分析
方法。植被是资源竞争系统, 可以用多维空间的向量来表示。在向量空间(射影空间), 不是“距离” , 而是“方
向”决定区别; 在植被科学, 不是“产量”, 而是“组成”决定区别。新方法用多维空间的位置向量来表示植被: 向
量的方向表示植被的组成、两向量夹角余弦值表示相似、向量长度表示植被总体。在简缩数据时, 用“中心化”
滤去样本噪音、“标准化”滤去系统噪音, 得到状态向量。在趋势分析时, 定义后、前状态向量的比值为变化趋
势; 用当年的状态和趋势的乘积来预测次年的状态。到次年, 再用实测数据修正、更新来自去年的预测, 是为“卡
尔曼滤波”。卡尔曼滤波能降低监测成本, 有效地使用历史数据, 提高分析精度。文章同时指出, 使用统计或(样
本物种)矩阵分析植被动态可能违背逻辑。
关键词 植被监测 趋势分析 时间系列 超球面模型 卡尔曼滤波
VEGETATION MONITORING AND TREND ANALYSIS: DISCUSSIONS ON
QUANTITATIVE VEGETATION ECOLOGY
BAI T. Jay and LIANG Ying-Quan
MDSM Data Analysis Services, LLC., 615 Joanne St. Fort Collins, CO 80524-3684, USA
Abstract Vegetation monitoring is important. This paper introduces a trend analysis method for
vegetation sciences. A unit of homogeneous vegetation can be treated as a point, so it can have dynamic
analysis. However, to carry enough information, this point has to be put into multi-variable space.
Vegetation can be expressed as a position vector in multidimensional space. Vegetation is a resource
competing system. All plant species compete for limited resources, and demands of all species can not
exceed available resources. This can be expressed as the sum of the squares of all species equals one.
Therefore, all the complementary plant species can be treated as mutually orthogonal. When using
position vectors to represent vegetation, the magnitudes of the vectors carry information of the total
biomass, while the directions of the vectors carry information of composition of vegetation; thus, the
position vectors have to be standardized. Vegetation growth based on cell duplication is expressed as
exponential growth. Changing trend is defined as present state over the past. The trend can be used to
monitor the vegetation changes and to predict future states. Kalman filter is used to increase accuracy
and lower monitoring cost.
Key words vegetation monitoring, trend analysis, time series, multi-dimensional sphere model (MDSM),
Kalman filter
DOI: 10.3773/j.issn.1005-264x.2008.04.027
1 前言
“植被在过去和现在都是人类生命的一部
分” (Whittaker, 1986)。植被还是生态环境变化
的重要指标。植被被破坏导致生态环境恶化的极
端例子, 是古代富饶的两河平原(美索不达米亚)
968 植 物 生 态 学 报 www. plant-ecology.com 32 卷
变成了今天的伊拉克荒漠。而主动防范生态灾害
的重要手段是监测。受气象监测网的启发, 人们
发起了生态监测网, 设立了许多生态定位站, 到
现在已经积累了大量的植被数据, 形成了多元数
据的时间系列。这些“多物种×多样本×多年的
数据”包含了植被变化的信息。监测项目的最终
目的是要从这些数据中发现植被变化动态, 并根
据变化的趋势、量度, 预测未来的植被状态, 为评
价、修订环境政策提供科学依据。而如何从多年
搜集到的多物种×多样本×多年的数据中分析发
现植被的变化趋势是植被数量生态学工作者所面
临的重大课题。本文探索描述植被的数学方法 ,
提出在物种空间使用向量(而非矩阵)、角度(而非
距离), 根据植物重要值的变化来监测植被的分
析方法; 并引入监控航天器的技术“卡尔曼滤波
(Kalman filter)” 来提高预测精度。
1.1 三下标数据
植被监测的数据, 是多物种×多样本×多年
的庞杂的数据库。它取一种特别的三下标变量的
形式Di,j,k。其中 , D是三下标变量。第一下标 ,
i=1,2,…m, 用来标识物种。因此在本文中, 物种
空间又称m空间。第二下标, j=1,2,…n, 标识样本。
在本文中 , 样本空间又称 n空间。第三下标 ,
k=0,1,2,…o, 取值从零到o, 标识时间, 单位是年。
三下标变量, 又称晶阵(Bai, 2006)、数据匣(Data
box)(Legendre & Legendre, 1998)、立体矩阵、或
三向数据(Three-way data matrix)(Gauch, 1989),
是我们过去, 特别是计算机普及前和生态系统监
测项目诞生前, 很少接触过的变量形式。它需要
特别的处理手段 , 它的分析需要特别的数学方
法。三下标变量Di,j,k的数据分析方法按3个下标两
两不同的排列可以分为O、P、Q、R、S、和T 6
种分析(Legendre & Legendre, 1998)。我们这里仅
讨论和植被趋势分析有关的Q和O分析。Q分析是
在物种空间分析样本之间的关系。“Q: among
objects, based on all observed descriptors (a single
instance)”, 是在j的方向, 分析j值不同的样本之
间的关系。O分析是分析一个多元实体沿时间的
变化。“O: based on all observed descriptors, among
time instances, (a single object)”, 是在k 的方向,
分析k值不同的植被实体之间的关系(Legendre &
Legendre, 1998)。Q分析的大师是美国的惠特克
(R. H. Whittaker)。在他主编的《植物群落分类》
和《植物群落排序》中, 矩阵成为生态学者进行
植被分析的主要工具。他们把m个物种n个样本的
“物种×样本表”作为m×n的初始矩阵, 通过矩
阵变换对样本进行聚类、排序, 探寻来自同一样
地、同一时间、不同样本之间的关系。而在O分
析方面也有一些使用矩阵的文献。中国兰州大学
的赵松岭, 把矩阵应用于不同时刻的样本关系的
研究。他使用植被状态矩阵(State matrix)和状态
转移矩阵(Transition matrix)的概念, 提出植被趋
势分析的基本模式如下: 设有两连续监测时刻植
被状态矩阵A1和A2不等, 可令A2=A1*X。命名X为
状态转移矩阵, 则有A3= A2*X。其中, A1、A2是植
被已知的两个连续状态。A3是对未来植被状态的
预测。X是状态转移矩阵, 下标表示时间。以上公
式也可以延伸, 并一般地表示为:
Yk=Y0*Xk (1)
其中, Yk是植被的未来状态, Y0是初始状态, X是状
态转移矩阵。下标是时间, 上标是乘幂。就是说,
植被的未来状态的预测等于初始状态矩阵乘状态
转移矩阵的幂的积。在文章中, 赵松岭给出了一
个解 , 平衡了方程式 , 预测了未来的植被状态 ,
但没有给出状态转移矩阵的通解, 没有给出根据
A1、A2求X的公式。几乎与赵松岭同时, 美国科罗
拉多州立大学的的杰姆森(Donald A. Jameson)在
他的讲义中介绍了使用伪逆 1) (Pseudo inverse)
来解状态转移矩阵的方法。在假定解出状态转移
矩阵后, 用卡尔曼滤波, 结合预测和现场实测来
降低监测成本, 提高预测精度。杰姆森来自中国
的学生, 白·图格吉扎布, 结合赵松岭和杰姆森的
工作, 提出植被趋势分析的多维空间模型, 给出
了使用连续变化的植被状态来计算状态转移矩阵
的公式:
X2=A2/A1 或
Xk=Ak/Ak-1 (2)
虽然, (2)式在逻辑上成立, 但实际的解并不
一定存在(见讨论3.2.3)。因此, 在最初的表达式
里, 植被状态、状态转移、和变化趋势都取“对
角矩阵”的形式 , 以确保方程有解 (Bai, 1984,
2006)。杰姆森对非对角元素为零的生态意义提出
了疑问。接受导师的建议, 白·图格吉扎布删掉非
对角元素的零, 结合卡尔曼滤波和指数增长方程,
提出了“多元向量”的指数增长模型。因为多元
1) Jameson DA (1993). Environmental Monitoring and Adaptive
Management. Colorado State University Fort Collins, USA, 45, 156,
317.
白·图格吉扎布等: 植被监测及趋势分析
4 期 ——植被数量生态学中几个理论问题的探讨 DOI: 10.3773/j.issn.1005-264x.2008.04.027 969
向量要标准化, 投影到单位球面, 所以又名“超球
面模型”。模型用多元向量来表示植被状态和变化
趋势, 并借用对角矩阵的概念, 扩展了向量的乘、
除、逆和幂运算的定义: 分量的积做积的分量、
分量的商做商的分量、分量的逆做逆的分量、分
量的幂做幂的分量(Bai et al.,1997; Bai, 2006), 使
模型的表达更简洁优美。白·图格吉扎布等(2001)
在《植物生态学报》发表《多维球面模型应用于
草原监测数据分析的探讨》, 向读者介绍了用多
元向量时间系列进行植被趋势分析的工作。本文
试图从植被数量生态学的角度, 从植被是系统这
个命题出发, 进一步探讨用向量取代矩阵表示植
被的必要性, 尝试回答“在数学上, 什么是植被,
如何表示植被?”的问题; 在导出用多元向量表
示的植被指数方程后, 引入向量版的、简易的卡
尔曼滤波, 最后完成植被趋势分析的整个过程。
1.2 植被是系统
赵松岭在他的论文中把植被演替归为系统的
思路对后人很有启发。据上海辞书出版社1979年
版《词海》的定义, 认植被为系统是不成问题的。
因为组成植被的所有植物互相作用, 并自成体系
协调完成一个共同的功能——固定日光能, 为生
态系统提供初始生产力。当然, 植被是天然系统,
和我们经常接触的物理系统、人工系统有不同。
物理系统的一个很重要的特性是“一加一大于二
(总体大于各分部之和)”。而且一加一大于二是人
们研究系统的重要目的。组成物理系统的元素之
间不是简单的堆积、叠加, 而是一种高度有序的、
互相支持的组合, 并能产生“相乘”的效果。而
植被是天然系统, 是资源竞争系统。所有组成植
被的植物竞争有限的资源, 它们之间的作用主要
表现为貌似互相妨碍, 实为互相补足。在植被系
统, 一加一不但不能肯定大于二, 甚至不一定大
于一。一个很明显的例子就是“合理密植”。当水
肥充足, 资源容量大于负荷时, 适当密植可以增
产。此时一加一大于一。但若密植超过一个限度,
超过资源的容量, 密植会减产。也就是说, 就植被
这个系统, 一加一可能大于一、等于一、也可能
小于一, 依资源容量和负荷的关系而定。只有在
负荷不超过资源容量时 , 一加一才可能大于一 ;
而在超过资源容量后, 一加一就要小于一。植被
是系统的另一个表述是“资源分享系统”。资源分
享是资源竞争的另一个说法。组成植被的所有植
物在不同层次分享有限的资源, 所有植物对资源
的需求不能大于现有资源容量。这个植被中各分
量利用资源“互余”的现象, 在多维空间可以表
示为所有植物的平方和等于1(Bai et al, 2001; Bai,
2006):
a2+b2+…=1 (3)
而平方和等于一的几何表达形式, 是各分量
互相垂直。我们都知道, 直径上的圆周角是直角。
这个数学表达式的生态学意义是说, 由于分享资
源 , 在植被分析中 , 我们可以 , 而且应当 , 假定
植被中的物种互相垂直, 互相独立。独立是竞争
的条件, 竞争导致独立。
即使对物种独立有保留, 物种空间还是被大
多数植被数量生态学工作者接受的。例如, Gauch
在介绍排序技术时 , 曾提到5个空间的概念 : 种
空间、样空间、种相异空间、样相异空间和生态
空间。他同时又指出, 两个相异空间是从原始数
据空间派生出来的。种空间, 样空间包含原始数
据 的 全 部 , 因 而 是 完 全 同 样 的 信 息 (Gauch,
1989)。原始数据表现为物种×样本表。而m-空间
和n空间, 两者互为矩阵的转置, 是对称的, 平等
的, 没有理由特别偏好哪一个。如果n空间能够成
立、样本可以被假定独立, 则m空间也可以成立、
物种也应当可以被假定独立 (Greig-Smith, 1983;
Jongman et al., 1995)。接受物种空间的结果和接
受物种独立的假定是一致的。
1.3 植被及其样本与多维物种空间的向量
如上面讨论的, 我们可以假定植被中的植物
种之间独立, 并用它们为轴构建物种空间。植被
样本可以表示为m空间的点、向量, 以便在物种空
间分析样本、分析植被。我们知道, 在植被样本
中, 每个物种都取一个大于、等于零的数。这样, m
个物种组成的植被 , 便有m个数字 , 称为m数组
(m-Array), 用来表示样本。在物种空间, 植被还
可以用“以此数组为坐标的空间的点”, 或“以
空间的点为端点, 以坐标原点为始点的向量”来
表示。在植被分析时, 我们约定, 表示植被样本的
多元数组(m-Array)、m空间中以多元数组为坐标
的点(Point)、连结空间点和原点所形成的向量(位
置向量Position vector), 和植被四者是一一对应
的、完全等同的、都同样可以表示植被。如下恒
等式成立:
m-Array ≡ Point in m-space ≡ Position
970 植 物 生 态 学 报 www. plant-ecology.com 32 卷
Vector ≡Vegetation
(4)
其中, 多元数组直接来自物种×样本表。用
数组表示植被的特点精确。而以数组为坐标的空
间点来表示植被, 也很常见。其特点直观, 特别适
用于排序, 聚类。用物种空间的点, 也使植被趋势
分析成为可能。简单地说, 趋势分析要求分析对
象是个质点, 有明确的运动轨迹。即使大如地球,
在地-日分析中也只能是质点 , 有唯一确定的运
动轨迹。而如上所述, 用向量表示植被其实和用
数组 , 用空间点实质上是一样的 (Gauch, 1989;
Whittaker et al., 1986)。
据高等教育出版社1979年出版, 2005年第十
一次印刷的《数学手册》(《数学手册》编写组,
1979), 向量又称矢量, 是既有“量值”又有“方
向”的变量, 而不是简单的一维矩阵。向量的二
重性, “量值”和“方向”, 能够深刻准确地刻画
植被, 因为植被也有数量和质量的二重性。植被
的数量, 一般说的是生物量、能量、或信息总量;
而质量说的是这个总量在各个物种之间的分配、
或植被的组成(Bai, 2006)。较之产量, 组成才是描
述植被的更基本的要素。比如我们描述植被为:
森林、或草原, 说的就是它们的组成, 而不说它们
是产量多少克/米2的植被。向量是用方向来表示
区别, 而植被是用组成来表示区别。向量的方向
和植被的组成也是一一对应的。在这里需要说明
的是, 《数学手册》所列举的向量是三维的。同
时, 在讨论多维空间的向量处明确说明“在三维
空间中讨论的许多结果 , 在多维空间中都成立 ,
只要把公式中所出现的指标认为从1到m就行
了。”
由于植被数据用发自原点的向量表示, 全体
植被数据便形成了类似点光源的射影空间
(Projective space)。向量空间, 或射影空间, 有个
特殊的性质:
bA//A, 或bA~A (5)
其中, A 是向量或图像, 用黑体表示, b 是非零标
量。这是说, 向量延长若干倍, 方向不变; 图像放
缩若干倍, 仍“是(严格地说为‘相似于’)”它自
己。在日常生活中, 幻灯机是射影空间的最典型
的例子。
虽说 , 多元向量和多维空间的点一一对应 ,
但向量空间的多元向量强调方向、角度, 与普通
欧氏空间的点使用座标、距离来表示还是有一定
区别的。加拿大的Orloci, 40年前就曾经提出过弦
距离(Chord distance)的概念, 提出把欧氏空间的
点投影到单位球面上来做聚类分析。然而, 他的
研究工作没有引起大家的足够重视。国内至今仍
有教材(内蒙古大学生物系, 1986)推荐用最小欧
式距离做植物群落分类。我们认为值得商榷。虽
说, “较小夹角对应较小距离”一般成立, 用距离
分类也往往能取得令人满意的结果 , 但有局限
性。在特殊情况下, 它不成立, 在Orloci的论文中
有比较详尽的理论说明。我们这里举一个灌-草二
维空间的例子来解释。灌 -草植被向量A=(0,1),
B=(1,0), C=(0,5)中, A和C, 是草地, B是灌丛。在
二维平面上, 点A与点B距离近, 但它们的位置向
量互相垂直, 属于不同的植被。点A和点C距离远,
但它们共线(Collinear), 位置向量夹角等于零。所
以我们应该依据角度把A和C分为一组。而不是依
据距离把A和B分在一组。A、C两向量量值所表
示的区别, 可能是来自润年/旱年的不同, 取样季
节 , 或取样面积的不同 , 属于系统噪音 (Bai,
2006)。
2 植被趋势分析
以上, 我们讨论了数学上如何模拟、表示植
被的问题。下面我们进一步讨论如何从三下标数
据中发现植被变化趋势的问题。
2.1 样本中心化
首先, 考虑简缩数据, 把三下标数据简缩为
二下标数据。我们使用聚类分析, 在第二下标j的
方向上, 对样本进行聚类、筛选、平均化, 归并n
个样本为一个实体。这个数据简缩过程被称为
“中心化(Centralization)”, 属于 Q分析(Jongman
et al., 1995; Legendre & Legendre, 1998)。中心化
的依据是“大数法则(Law of large number, LLN)”,
目的是用n个样本的平均值来取代n个样本, 从而,
把三下标数据Di,j,k简缩为二下标数据Di,k, 把m×n
的物种-样本矩阵简缩为m元向量(进一步讨论参
见3.2.3); 同时也把植被趋势分析问题化为多元
向量的时间系列问题。本文中特称这个数据简缩
过程为“中心化”有两层意思。首先因为它是个
很重要的滤波器 , 不但滤掉了n个样本带来的噪
音 , 而且导致引入多元向量来取代物种-样本矩
阵; 再是因为多维空间诸样本的“代数平均”等
白·图格吉扎布等: 植被监测及趋势分析
4 期 ——植被数量生态学中几个理论问题的探讨 DOI: 10.3773/j.issn.1005-264x.2008.04.027 971
同于诸向量的“几何形(中)心”。
植被样本聚类的关键是定义相似系数。既然
方向表示植被组成, 植被的相似系数应与夹角有
关。数学上, 空间两向量的关系, 可以用一向量在
另一向量的投影与该向量长度的比, 即两个向量
夹角余弦值来表示。因此, 定义两个植被向量的
夹角余弦值做相似系数是有数学基础的(Orloci,
1967; Bai, 1982, 2006; Gauch, 1989; Jongman et
al., 1995, Legendre & Legendre, 1998)。从植被学
的角度, 我们一致认为, 两个实体, 样本或植被,
共有种越多、越重要, 两个样本就越相似。这个
相似的程度最普遍的是用向量点积(分量积的和)
来度量:
A•B= ( )∑ •i ii ba mi ,...2,1= (6)
这个点积还要用可能最大值(可能最相似)来
标定, 化为百分比才便于互相比较。在长度确定
的情况下, 两个向量相同时点积取最大值(好比 ,
周长相同的矩形以正方形的面积最大),
A•A=A2= ( )∑ •i ii aa mi ,...2,1= (7)
相应的, 植被学中, 自己和自己最相似。而兼
顾到两个实体, 根据柯西不等式, A、B点积最大
值是两个向量自乘的几何平均(积的算术根):
几何平均 = ∑∑ • 22 )()( ii ba
mi ,...2,1= (8)
归纳以上讨论, 本文选择位置向量夹角余弦
值做相似系数(S.Cab)
),cos(..
22
ba
b
b
a
a
CS
i
i
i
i
ab =⎟⎟
⎟
⎠
⎞
⎜⎜
⎜
⎝
⎛
•= ∑ ∑∑
mi ,...2,1= (9)
公式(9)表示, 两个样本的相似系数是点积除
以两个样本向量长度的几何平均, 也可解释为两
个标准化向量的积(Cottrell et al., 2006)。
2.2 中心向量标准化
由于组成相同的植被所代表的点在空间共
线 , 因此 , 在植被趋势分析中 , 通过聚类得到的
中 心 向 量 要 标 准 化 (Standardization)(Orloci,
1967)。标准化是比较通用的植被数据处理方法之
一。一般泛指, 化绝对数为相对数, 以便于进行比
较。标准化可以有多种形式, 如除最大值、除总
和等。在本文中 , 我们采用Orloci的说法 , 特指
“除以向量长度, 投影到单位超球面上”(Orloci,
1967; Bai, 1982, 2006; Greig-Smith, 1983;
Jongman et al., 1995; Legendre & Legendre, 1998):
Y’=Y/|Y|, 或
∑= 2 iii YYY mi ,...2,1= (10)
式中, Y’是标准化了的植被向量, 是植被向量在
单位超球面上的投影。Y是植被向量。|Y|是向量
长度(各分量平方和的算术根)。我们称中心化+标
准化后的植被向量为植被状态向量。它表明当年
当地我们所监测的植被的组成。其分量是植物种
的重要值(Importance value, IV), 表明该植物种在
植被组成中的份额(赵松岭等, 1981; Bai, 2006)。
植被状态向量的长度是一, 所有分量的平方和等
于一。其数学意义是m个余弦值, 表示向量在多维
空间的指向。按我们现在的理解, 标准化在模型
中的作用是又一层的滤波器 , 滤去了系统噪音 :
取样面积大小差别所带来的噪音、取样季节差别
所带来的噪音 ; 从而滤掉了距离 , 突出了方向 ,
突出了植被的组成, 而显示出射影空间的特性。
另一方面, 虽然, 一般我们认为植被是相对稳定
的, 但组成植被的植物种显示出随机变量的特性,
难于分析。标准化把随机的变量除以所有随机变
量平方和的算数根, 得出相对稳定的“重要值”
用来表示植被组成, 为趋势分析提供了可能。
2.3 趋势分析
在完成以上数据简缩工作后, 三下标数据转
化成了二下标数据, 成为多元向量时间系列, 而
且, 向量都已经标准化, 突出了植被的组成。下
面, 我们进一步讨论植被的趋势分析。由于超球
面模型定义的向量运算法则和标量的运算法则形
式一致: 用分量的和/差 /积/商/逆/幂做和/差/积/
商/逆/幂的分量(Bai et al, 1997; Bai, 2006), 在以
下的讨论中, 在上下文清楚的条件下, 本文略去
第一物种下标( i ), 而突出第三时间下标(k), 用向
量时间系列的形式阐述植被趋势分析的过程, 在
必要时, 再加注分量表示法。
基于细胞分裂的植被增长本质上是指数增
长, 我们用指数增长方程来描述它:
Yk=Y0×Tk (11)
972 植 物 生 态 学 报 www. plant-ecology.com 32 卷
公式(11)表示, 植被k时刻的状态(Yk)是初始
状态(Y0)乘趋势(T)的k次幂的积。其中的Y、T分
别是植被状态和变化趋势, 是向量, 用黑体表示。
k和0是时间下标。这里的趋势(T)相当于公式(1)
中的状态转移矩阵X, 是变化率 , 等于两连续监
测时刻植被状态的商(Bai, et al.,1997; Bai, 2006),
也是被系统增率调整后的分种增率:
T k =Y’k/Y’k-1= (Yk/|Yk|)/(Yk-1/ |Yk-1|)
= (Yk/Yk-1 ) / (|Yk| / |Yk-1|) (12)
公式(13)是趋势向量计算公式的分量表示法:
mi
y
y
y
y
y
y
y
y
T
ki
ki
ki
ki
ki
ki
ki
ki
ki
,...2,1/
/
2
1,
2
,
1,
,
2
1,
1,
2
,
,
,
==
⎟⎟
⎟
⎠
⎞
⎜⎜
⎜
⎝
⎛
⎟⎟
⎟
⎠
⎞
⎜⎜
⎜
⎝
⎛
=
∑
∑
∑∑
−−
−
−
(13)
趋势向量的分量(Ti,k), 表明相应植物种在植
被中的重要值的变化(IV i,k/IVi,k-1)。其取值以1为
基准, 可以大于、等于或小于1。物种的趋势值等
于1, 表示连续两次监测期间植物种的重要值没
有变化。趋势值大于1表示物种重要值在增加, 小
于1表示减少。所有物种的变化趋势清楚了, 植被
组成变化的趋势也就清楚了。作为系统, 植被有
惯性。植被变化趋势值的期望值是1, 表示植被的
组成倾向于保持不变。如果趋势偏离1, 会有反
弹。另一方面, 如果偏离太多、且持续时间过长,
则会成为新时刻的趋势(见卡尔曼滤波); 表明在
具弹性的同时, 植被趋势也有可塑性。
为了更深刻地描述植被趋势, 我们进一步引
入二阶趋势的概念。通俗地说, 二阶趋势是趋势
值的趋势值。植被变化二阶趋势TTk, 定义为, 当
前趋势(Tk)和过去趋势(Tk-1)的比值:
TTk=Tk : Tk-1
=(Y’k/Y’k-1): (Y’k-1/Y’k-2), (14)
颠倒相乘得
TTk=(Y’k*Y’k-2)/(Y’k-1*Y’k-1) (15)
即二阶趋势TTk 是状态Y’k 和状态Y’k-2的积
与状态Y’k-1的平方的比。TTk的分量表示的是植物
种在多维空间运动轨迹投影的连续三点里, 中间
点和两个端点的比。是植物运动轨迹的转折状态
(“拐点”)。如果, 中间点的平方大于两个端点的
积, 则轨迹是凸; 反之, 轨迹是凹。如果, 中间点
的平方等于两个端点的积, 则没有转折, 轨迹是
直的。从这里我们看到, 指数增长包含了线性增
长。在二阶趋势值等于一时, 指数增长表现为线
性。所以, 模型既可以用于指数增长系统, 也可以
用于线性增长系统。
植被变化趋势是从两个端点看变化。植被及
其分量的变化有3种趋势: 上(升)、(持)平、下(降)。
二阶趋势是把中点和两端比较, 来表示变化的转
折。植被及其分量运动轨迹有3种转折: 凹、直、
凸。把一阶和二阶趋势结合起来, 我们得到9个组
合: 凹上、直上、凸上、凹平、直平、凸平、凹
下、直下、和凸下; 可以比较充分、深刻、细致
地描述植被组成的变化动态。
2.4 植被状态预测与卡尔曼滤波
趋势分析阐明了植被组成的变化方向、程度。
根据惯性原理, 我们可以假定植被系统会在一段
时间里保持这个变化势头, 因此, 趋势被进一步
应用于预测, 而不仅仅满足于准确描述历史。
可以如赵氏的公式(1), 预测k年后的植被状
态:
Pk=Y0*T0k (16)
公式(16)表示, 第k年的植被预测值(Pk)是初
始状态(Y0)和趋势值(T0)的k次幂的积。当没有其
它数据、手段时, 公式(16)可以用来预测多年后的
植被状态(当然会有很大误差)。这个公式的重要
意义在于, 它能够把捕捉到的偶然发生的细微变
化放大, 因而可以起到预警的作用。
当有长期监测计划时, 使用时间系列方法预
测次年的植被状态的公式表现为:
Pk+1|k=Yk*Tk (17)
其中 , Pk+1|k是根据当年(k)信息对次年(k+1)
的预测值 (在上下文清楚时 , 在本文中简化为
Pk+1)。Yk 是当年的植被状态向量, 它可以用实测
数据(Dk), 或期望值(Ek)来表示(关于实测数据、期
望值的关系详见下文)。Tk 是当年的趋势值。公
式(17)表示 , 可以用当年植被状态 (Yk)与当年的
趋势(Tk)的积来预测次年的植被状态(Pk+1|k)。
预测肯定会有误差, 是需要核实、修正的。
我们引入航天技术中使用的“卡尔曼滤波”, 一
种递归滤波的方法 , 用新的实测样本来更新预
测。具体作法是用预测值(P)和新实测值(D)的加
权平均做期望值(E)来表示真值:
白·图格吉扎布等: 植被监测及趋势分析
4 期 ——植被数量生态学中几个理论问题的探讨 DOI: 10.3773/j.issn.1005-264x.2008.04.027 973
Ek+1= α*Pk+1 +(1-α)*Dk+1 (18)
其中, Dk+1是次年(k+1)的现场实测值; Ek+1是次年
(k+1)的期望值, 是用次年现场实测数据(Dk+1)更
新了的预测值(Pk+1)。请注意区别k值的不同, 预
测值和期望值的不同。当年的植被状态(Ek)和当
年 趋 势 (Tk) 的 积 是 对 次 年 (k+1) 状 态 的 预 测
(Pk+1)(17); 当年的期望(Ek)是“依去年(k–1)的信
息, 对当年状态的预测(Pk|k-1 ,简做Pk)”和“当年
实测数据(Dk)”的加权平均(18)。这里的α是我们
给预测值的权, 一个小于一、大于零的标量。如
果监测历史长, 监测人员对植被的整个状况了解,
比较倚重历史数据, 可以给预测值较大, 高于0.5
的权; 相反, 如果缺乏历史数据 , 监测人员要倚
重现场取样, 则给预测值一个小些, 甚至等于零
的权(比如在刚开始监测, k=0, 没有历史数据时)。
一般情况下, α的默认值是0.5, 意味把预测(P)和
实测(D)平等看待。这里需要指出的是, 在典型的
卡尔曼滤波里,权重(α和1–α)是通过计算各自的
噪音来确定的。
根据卡尔曼滤波, 期望(E)有两个信息源: 根
据历史数据的预测(P)和现场实测数据(D)。两者
互相修正可以提高预测精度。卡尔曼滤波在数学
上是相当成熟的方法。数学上已经证明, 用期望
(E)做真值的误差要小于单用实测(D)或单用预测
(P)做真值的误差。也就是说, 单靠现场取样, 或
单靠历史经验都不能很好地把握植被的动态。只
有在总结经验的基础上, 再做现场调查, 才能较
好地把握植被动态。预测和实测, 两者不可偏废。
3 总结与讨论
本文主要探讨三下标植被监测数据的分析方
法。关于如何建立监测网, 选择样地, 布置永久样
本, 不属于本文的讨论范围。但从数据分析角度,
我们建议在初始的基本调查中一定要包括确定植
物名录的工作。因为, 确定欲监测植物的名录, 就
是确定多维空间。名录一旦确定, 就要贯彻整个
植被动态监测工作的始终。
为了更准确地传递信息, 方便读者编写计算
机程序开展植被趋势分析 , 现在把以上讨论总
结、提炼成如下流程:
现场取样, 并通过聚类, 将“m×n物种-样本
表”简缩为“m元植被向量”, 得到实测数据(D k)。
利用卡尔曼滤波计算期望值: E k= α*Pk +
(1-α)*D k。在初始(k=0)没有P0时, 用样本数据
D0来代替。
计算预测误差。这里暂定预测误差为: R k
=E k–Pk。用来评估、微调监测过程。
标准化: Ek’ =Ek/|Ek|=IVk。数学上求余弦, 投
影到超球面。植被学是求植物重要值IVk。
求趋势: Tk=IVk/IVk-1, 当前重要值和过去重
要值比。在k=0时, 令趋势值等于1。
使用现有的信息预测下一时段k+1的植被 :
Pk+1=Tk *E k。
时间下标值加1, k=k+1, 回到现场取样, 开
始下一轮循环。
其中:
D: 实测数据向量 , 分量是分种的植物实测
数据。
E: 期望值向量, 分量是植被分种期望值。
|E|: 期望值的向量长度, 各分量的平方和的
算术根, 是标量。
IV: 植物重要值向量, 分量是植物在植被中
的重要值。
T: 植被趋势向量, 分量是植被分种趋势值。
P: 植被预测向量, 分量是植被分种预测值。
R: 误差向量, 分量是分种的预测误差。
|R |: 误差的向量长度 , 各分量的平方和的
算术根, 是标量。
根据 |R |的大小 , 及 |R|和 |E|的比值(相对预
测误差), 可以评估整个监测及数据分析工作, 然
后做出相应调整, 使|R|尽可能小。
至此, 我们交代了植被动态监测的整个流程
和算法。由于篇幅限制, 本文偏重于理论推导, 没
有使用实例。习惯于通过实例来掌握新方法的读
者可以参考文献(Bai, 2006)。那是一个意大利网
友提供的5× 14的数据。读者根据本文介绍的方
法, 设α=0.2, 则可以重复那个实验, 得到与书中
基本相同的结果。在美国生态学会统计生态学分
会的网址上也可以找到这个例子。网址是:
http://atlantic.evsc.virginia.edu/Mailarch/stat_
ecol_mh/msg00067.html
3.1 与马尔科夫时间链的比较
进一步讨论卡尔曼滤波。现场实测数据(D)
系列是我们已知的 , 而植被状态(E)是我们所要
探求的。在实行植被监测过程中, 植被当前, 以至
974 植 物 生 态 学 报 www. plant-ecology.com 32 卷
未来的状态和实际测量样本系列之间是什么关系
呢?按经典的马尔科夫链, “将来”只和“现在”
有关, 而和“过去”无关, 所谓“无后效性” (《数
学手册》编写组, 1979)。但是, 如果植被未来状
态真的只和现状有关, 我们每年取样, 充实数据
库, 有什么意义呢?换句话说, 历史数据有什么
意义, 以及如何把所有的历史数据都用上呢?我
们尝试回答这个重要问题。根据我们的定义:
E k= α*Pk + (1-α)*D k , 和Pk+1 =Tk* Ek,
为了更清楚地表明变量之间的关系 , 略去
(默认)常量α=(1–α)=0.5, 则有:
Ek
=Dk+Pk
=Dk+Tk-1*Ek-1
=Dk+Tk-1*(Dk–1+Pk–1 )
=Dk +Tk-1*(Dk–1+Tk-2*Ek–2 )
=Dk+Tk–1*(Dk–1+Tk–2*(Dk–2+Tk–3*(Dk–3+…
+T0*D0))) (19)
从展开式(19)我们看到 , 在不断用Tk *Ek代
换Pk+1, 用Dk +Pk 代换Ek 展开后, 依据模型, 植
被现状是植被监测时间链的最后一环。植被现状
与历史上的每一个状态都有关。和现状越远的状
态 , 对现状的影响越小 , 呈指数衰减 (Fading
memory)1)。较之“无后效性”的马尔科夫链, 我
们认为本文提出的这个时间链可能比较适合用来
解释生物系统代代相传, 且接受外界影响而逐步
演变进化的史实。
回顾趋势定义公式(12), 我们用的是两个连
续植被状态向量的比, 虽然它包括了过去和现在
(k和k–1), 系统和分量(|Y|和Yi)的信息, 但还是令
人觉得困惑 : 仅凭两个点就确定趋势是否太草
率。在引入卡尔曼滤波后我们看到, 在计算趋势,
预测植被未来状况时, 我们用的是期望值(E)。据
公式(19), 期望(E)包含了“自始至今”的所有信
1) Jameson DA (1993). Environmental Monitoring and Adaptive
Management. Colorado State University, Fort Collins, USA, 45, 156,
317.
息, 所以趋势(T)是充分有效地利用了历史数据。
这不但解答了那个所谓“两点决定趋势”的困惑,
也符合我们建立定位站长期监测植被的初衷。而
且, 根据多年的测算经验, 在加入简易的卡尔曼
滤波后, 系统预测的相对误差, |R|/|E|, 就已经可
以小于10%。这虽然可能达不到其它系统, 如航
天、金融的要求, 但对于植被监测, 这样的误差应
该是可以被接受的。此法另一优点是在总预算不
变的情况下, 把n× k个样本纵向分布在k年, 使植
被的动态更清晰。而且把预算分摊给若干年, 可
以显著地减少当年的负担。监测工程一旦启动 ,
每年支付一个相对小的费用, 即可维持其运转。
3.2 方法的唯一性讨论
1)首先, 因为一个数字不可能携带生态监测
所需要的足够的信息, 植被动态监测的数学工具
不可能是标量的, 使我们放弃了许多强有力的、
基于标量的数学分析工具。生态监测数据分析的
数学工具必须是多元的。而传统的多元分析工具
是统计和矩阵。
2)统计不是为分析样本之间关系设计的。植
被监测是探索不同年代的样本之间的关系, 属于
O分析。与此相悖, 统计分析是在样本空间寻找变
量之间的关系, 属于R分析。按我们的理解, 统计
分析的前提假定是“样本独立”, 并通过随机取
样来保证之。换句话说, 从统计分析的角度, 样本
是已知的, 样本之间是独立的, 因此样本之间没
有关系, 不用分析。
3)矩阵与植被趋势分析。另一多元分析的重
要工具是矩阵, 但矩阵用于植被趋势分析至今是
不成功的。其技术原因是, 一般的“物种×样本
矩阵”没有逆, 不能做生物系统的趋势分析。所
谓的“伪逆”, 也不一定存在。简单的理由是“自
乘转置不增加矩阵的秩”。矩阵有逆的充要条件是
“满秩”, 而不仅仅“凡是方阵就有逆”。满秩的
另一说法是, m维方阵有m支线性无关的向量。这
个要求很严格。而多个随机向量, 尤其是高元随
白·图格吉扎布等: 植被监测及趋势分析
4 期 ——植被数量生态学中几个理论问题的探讨 DOI: 10.3773/j.issn.1005-264x.2008.04.027 975
机向量, 线性无关的可能性有, 但无法保证。特别
是植被监测的所有样本取自同一母体。我们一般
假定, 一块同质植被的实体只有一个, 却可以有
任意多个样本。对于同一片植被, 甲可以取这样
一组样本, 乙可以取另外一组样本。每个样本的
实现都是偶然的, 样本之间的差别也是偶然的。
偶然性使样本之间很难保证不相关。因此, 无法
用来作为植被趋势分析的基础。当然, 植被的“物
种×样本矩阵可能无逆”, 仅是矩阵用于植被趋
势分析至今不成功的表层原因。其更深层的原因
是, “用‘物种×样本矩阵’表示植被是不成立
的, 是违背‘大数法则’的”。请回顾一下, 我们
为什么舍简求繁, 要取多个样本来了解植被呢?
原因是“大数法则”。然而, “大数法则”不仅要
求我们对随机变量要多多取样, 取n个样, 而且进
一步要求我们在取样后要计算n个样本的平均值,
并用平均值来取代n个样本 , 因为大数法则的核
心是“平均值收敛于真值”。按大数法则, 能代表
植被的是n个样本的平均值, 而不是n个分列的样
本。我们在进行植被趋势分析前, 需要把数据“中
心化”, 把“物种×样本表”在j的方向上从n维简
缩到1维; 用平均值(一个数值)代替n个数值来表
示第i个物种 ; 用m个平均值(m元向量)来表示植
被(见2.1)就是为了满足大数法则。因此, 如果有
人告诉我们, 说某人不是用多元向量, 而是用物
种×样本矩阵方法, 如主分量分析(PCA)等, 取得
了植被趋势分析结果, 我们不必太认真, 把它当
作一个矩阵游戏好了。即使从结果看可能有一定
道理, 也不能说明分析方法正确, 因为它的前提
就不成立。
4)多元向量与植被的对应。通过以上的讨论,
我们看到, 向量空间(多元向量和向量的运算)为
我们提供了推动植被科学从定性描述走向定量分
析的有力工具。首先, 它回答了“植被在数学上
是什么”和“如何表示植被”的问题: “植被是
多维物种空间边界模糊的实体, 可以用向量空间
的多元向量来表示”。从而, 揭示了数学概念与植
被现象之间一一对应的关系。比如, 向量的“方
向”对应植被“组成”, “长度”对应“总量”;
向量的“夹角”对应植被的“相似”, 空间诸点
的“中心”对应众样本的“平均值”; 向量“加
法”对应样本“合并”, “减法(距离)”对应植被
的“差别”; “除法”对应变化“趋势”, 乘幂”
对应“预测”。而向量长度的结构, 各分量的平方
和的算术根, 则揭示了大自然赋予植被使之得以
生存进化, 繁衍万年而不息的精巧构造。它也是
植被给我们人类社会的重要启示 : 作为自然系
统, 和谐共荣的终极境界是“分量独立, 资源共
享”。这也正巧与中华古代文化所倡导的“和而不
同”相吻合, 与我们现在所倡导的“和谐社会”
和“科学发展”相通。
当然, 现在的植被监测模型仍然很粗糙, 有
待于更多的数量生态学工作者和专业数学工作者
共同合作, 来进一步探索、挖掘、完善。一般认
为, 植被演替可以被降解为若干线性系统来求解
(赵松岭等, 1981)。而且, 向量空间一般也是被归
入线性空间的。可是, 在线性空间里, 乘法运算是
不封闭的, 因此没有逆运算。为了监测、预测植
被, 我们在向量空间里定义了逆、除法、和幂。
这样定义后, 在描述植被监测的向量空间里, 乘
法运算是封闭的。而且, 向量的商在植被分析中
也有确定的意义, 是植被的“变化趋势”。因此, 按
我们现在的理解, 植被监测模型似乎已经超出线
性空间, 而应该属于群(Group)(《数学手册》编写
组, 1979)了。有关群的性质, 及其应用已经超出
了本文的讨论范围, 也超过了我们的专业能力。
我们希望专业的数学工作者参加这项重要工作 ,
来改进、完善、充实这个表示植被的代数系统, 以
实现王寿仁先生对我们的生态系统监测模型的期
许: “使模型更加精确, 发挥真正价值”。
参考文献
Bai TJ (白·图格吉扎布)(1982). Exploration of numerical
classification of Form Leymus chinensis in Silingol
River Basin. In: Bai TJ ed. Trend Analysis (趋势分析
及其在生态股市中的应用). Ethnic Publishing House,
Beijing, 1-23. (in Chinese)
Bai TJ (白·图格吉扎布)(1984). Numerical prediction of
rangeland succession trend. In: Bai TJ ed. Trend
Analysis (趋势分析及其在生态股市中的应用 ).
Ethnic Publishing House, Beijing, 24-30. (in Chinese)
976 植 物 生 态 学 报 www. plant-ecology.com 32 卷
Bai TJ (白·图格吉扎布)(2006). Trend Analysis (趋势分析
及其在生态股市中的应用). Ethnic Publishing House,
Beijing, 1-23, 24-30, 104-116, 117-122, 198-216,
222-243. (in Chinese)
Bai TJ, Cottrell T, Hao DY, Te TL, Brozka RJ (1997).
Multi-dimensional sphere model and instantaneous
vegetation trend analysis. Ecological Modelling, 97,
75-86.
Bai TJ (白·图格吉扎布), Hao DY (郝敦元), Aqi A (阿其拉
图 )(2001). Application of the Multi-dimensional
sphere model in rangeland monitoring data analysis.
Acta Phytoecologica Sinica (植物生态学报 ), 25,
687-692, 751-753. (in Chinese with English abstract)
Cottrell T, Shaner D, Bai TJ (2006). Multidimensional
sphere model and its application to vegetation
classification. In: Bai TJ ed. Trend Analysis( 趋势分
析及其在生态股市中的应用 ). Ethnic Publishing
House, Beijing, 254-269.
Department of Biology, Inner Mongolia University (内蒙古
大学生物系) (1986). Experiments of Plant Ecology
(植物生态学实验). Higher Education Press, Beijing,
188-193. (in Chinese)
Gauch HG (Translated by Yang C (杨持), Yang ZZ (杨再
中), Hao DY (郝敦元), Zeng SD (曾泗弟)) (1989).
Multivariate Analysis in Community Ecology (群落生
态学中的多元分析 ). Science Press, Beijing, 5-6,
69, 110-118,123. (in Chinese)
Greig-Smith P (1983). Quantitative Plant Ecology.
University of California Press, Berkeley and Los
Angeles, 231, 255.
Jongman RHG, ter Braak CJF, van Tongeren OFR (1995).
Data Analysis in Community and Landscape Ecology.
Cambridge University Press, Cambridge, UK, 178,
185.
Legendre P, Legendre L (1998). Numerical Ecology.
Elsevier, Amsterdam, 139-141, 247-258, 279.
Orloci L (1967). An agglomerative method for
classification of plant communities. Journal of
Ecology, 55, 193-205.
Whittaker RH (Translated by Wang BS (王伯荪)) (1986).
Ordination of Plant Communities (植物群落排序 ).
Science Press, Beijing, 1, 236. (in Chinese)
Writers of Hand book of Mathematics (《数学手册》编写
组)(1979). Hand book of Mathematics (数学手册).
Higher Education Press , Beijing, 428, 450, 871. (in
Chinese)
Zhao SL (赵松岭),Chen QC (陈庆诚), Li ZZ (李自珍),
Wang G (王刚), Wang XA (王孝安) (1981). Linear
and non-linear of plant community succession and
numerical prediction. Acta Ecologica Sinica (生态学
报), 1, 235-240. (in Chinese with English abstract)
责任编委: 张金屯 责任编辑: 姜联合