全 文 :第 10卷第 3期 呼伦贝尔学院学报 No. 3 Vol. 10
2 0 0 2年 6月 Jour nal o f Hulunbeir Co lleg e Published in Jun. 2002
缘毛雀麦各株系间穗部性状的聚类分析
王明莹
呼伦贝尔学院生化系 呼伦贝尔市海拉尔区 021008
摘 要: 利用多元分析方法中的最短距离法 ( Minimum Distance M ethod)和类平均法 ( Gr oup Average
Method)对 14个缘毛雀麦株系间的 7个穗部性状进行聚类分析 ( Cluster Analy sis)
关键词: 最短距离法 类平均法 聚类分析 缘毛雀麦株系 穗部性状
引言:缘毛雀麦 ( Bromus ciliatus L. )蒙
名:西伯日 - 扫高布日 ,禾本科雀麦属 ,具短
根茎的多年生优良牧草①。 返青早 ,分蘖多 ,
叶量丰富 ,草质柔嫩 ,结实期干草产量为
9975kg /hm
2
,粗蛋白质等营养成分含量、再生
速度和叶量大多优于无芒雀麦的栽培品种。
为了充分开发和利用这一优良的种质资源 ,
我们在呼和浩特地区栽培驯化了原产于锡林
郭勒盟宝格达山的缘毛雀麦野生种 ,经选育
获得了十几个外部形态差异较大的株系②
③。根据利用途径不同 ,对这些株系进一步选
育可育出更符合生产需要的缘毛雀麦新品
系 ,这对丰富我国牧草品种资源具有重要意
义。此外 ,缘毛雀麦具短根茎的多年生禾草 ,
栽培 2— 3年后 ,其根茎易结成草皮 ,在坡地
绿化、防止水土流失以及在草地生态建设和
植被恢复等方面有重要的利用价值。
本文采用的系统聚类法 ( Hierachical
Clustering Methods)是聚类分析中采用最多
的一种聚类法 ,这种方法的基本思想是先将
每个样品各自看成一类 ,然后定义样品间的
距离和类与类间的距离。 聚类过程是首先选
择距离最小的两类 ,将其合并成一新的类 ,再
按各类之间的距离定义计算新类与其他类的
距离 ,直到所有的样品都聚为一类为止。类与
类间的距离有多种定义方法 ,本文选择了众
多方法中的最短距离法和类平均法对材料进
行对比分析 ,试图通过对缘毛雀麦的 14个株
系的整穗重、小穗数、每小穗的结实数、百粒
重、种子长度、芒长等 7个性状进行数据聚类
分析。根据结果对相似性状的株系予以聚类 ,
以获得株系进一步入类的依据 ,为今后缘毛
雀麦的选育、充分合理的利用这一种质资源
提供科学依据。
1、试验地自然概况
本试验地设在原内蒙古农牧学院牧草实
验站内。该站位于东经 111°41′,北纬 40°49′,
海拔为 1063米 ,属典型大陆性气候 ,年平均
气温为 5. 4℃ , 7月份极端气温为 39. 7℃ , 1
月份极端气温为 - 32. 8℃ ,日平气温> 10℃ ,
年积温 2500℃ ,年降水量 400mm左右 ,冬委
积雪不多 ,无霜期 130- 140天 ,初霜期在 9
月下旬 ,终霜期在 5月末。试验地土壤为栗钙
土 ,质地为砂壤土 ,肥力中等 , PH值为 7. 5左
右 ,具灌溉条件。
2、材料与方法
2. 1、材料
在栽培驯化第四年的缘毛雀麦种子生产
田中 ,于种子完熟随机采集每个株系的 30个
完整穗子进行穗部性状的数据测量。
2. 2、聚类因子 (测量项目 )
整穗重 ( X1)、小穗数 ( X2)、每小穗的小
36
花数 ( X3)、每小穗的结实数 ( X 4)、百粒重
(X5)、种子长度 ( X6)、芒长 ( X7)
2. 3、数据测定每个株系分别测定各聚类
因子 30个重复 ,取其平均数 ,如表 ( 1)
原始数据表 ( 1)
2. 4、方法
2. 4. 1、采用最短距离法和类平均法进行
聚类分析 ,各计算分析过程均采用国际公认
的标准统计分析软件 SAS完成④
2. 4. 2、最短距离法。 两类之间的距离等
于两类之间的最短距离 ,这样定义类间距离
的方法称: 由于当两类样品合并为新一类后 ,
新类与其他类的距离是取两类样品间所有距
离最小者 ,这样就缩小了新类与其他样品间
的距离 ,因而具有空间收缩的作用 ,只是表现
不同而已。
2. 4. 3、类平均法。 类平均法是 1986年
Sokal和 Michene提出的 ,用两类样品两两之
间的距离平方和的平均值为两类样品间距离
的平方 ,这种聚类方法称为类平均法 ( Group
Average M ethod ) , 也 称 为 平均 联 结 法
( Average Linking Method)。它是系统聚类法
中聚类效果较好的方法之一 ,目前被广泛使
用。⑤⑥。
3、结果与分析
3. 1、最短距离法聚类分析。
为消除指标量纲的影响 ,先对原始数据
进行标准差标准化即正规化处理 ,然后再分
类④。 标准化程序中把标准化的数据集名取
为原始数据集名 QM , NONORM选择是防
止距离被正态化。 POS= 37表示输出的图形
占 37行。标准化结果如表 ( 2, 3, 4)。处理后经
SAS系统分析 ,结果如表 ( 5) ,输出图形直接
显示了分类结果: 当取阈值 T= 3时 ,系统没
把各株系进行分类 ;当 T= 2. 5时 ,因为 a6、
a13每小穗结实数最小 ,所以系统首先把 a6、
a13聚为一类 ,把 a8单独分为一类 ,其他的分
成一类 ;当 T= 2时 ,系统把 a0、 a10聚成一
类 ,把 a5、 a11聚成一类 ,把 a3、 a4a、 a17聚成
一类。 这样聚类是因为它们的多数性状比较
接近 ,报以系统会输出如下结果 (见下表 )。
37
3. 2、类平均法。标准差标准化处理 ,见表 ( 6、
7) ,由 SAS系统输出分类结果见表 ( 8) ,据定
义类间距离 ,在不同阈值 T下 ,分类结果不
同。T越小分类越细 ;当 T> 4时 ,系统没能把
株系之间聚成新类 ;当 T= 4时系统把所有株
系划分成两类 ,除 a6以外把其他所有的聚为
一类 ,因为 a6的小穗数多达 50. 6,明显的大
于其它的株系 ,故 a6没与其它的株系聚为一
类 ;当 T= 3时 ,系统把 a0、 a10、 a9、 a12聚为
一类 ,把 a3、 a4、 a7、 a13聚为一类 ,把 a1、 a2、
a5、 a11聚为一类 ,也是因为它们的多数性状
比较相似 ,而 8与 13没被聚为一类是因为 8
的整穗重明显大于其他的株系。13的整穗重、
结实数、百粒重是所有株系中最小的 ;当 T=
2时 ,系统把 a0、 a10聚为一类、把 a9、 a12聚
为一类、把 a3、 a4、 a7聚为一类、把 a5、 a11聚
为一类是因为其聚成一类的株系之间的性状
差异最小。
3. 3、两种方法的比较。应用类平均法分
类要比用最短距离法来得精确 ,结果更清楚
易分。两者结果大致统一:虽然定义类间距离
的方法不同 ,但结果都把 a0与 a10、 a3、 a4与
a7、 a11与 a5分别聚成一类。但类平均法划分
的更细 ,比用最短距离法多聚成一类: a9与
a12。
4、讨论
4. 1、对缘毛雀麦各株系穗部性状聚类分
析方法的探讨。通过 SAS系统对缘毛雀麦穗
部性状分析结果来看 ,由于各株系之间的穗
部性状差异的大小不同 ,但按照聚类分析的
主旨 ,本文采用两种不同方法所聚类的效果
还是很理想的。 株系之间的差异小的聚为一
类 ,但聚类分析的思想就是对各材料聚类因
子全面综合分析 ,故其结果是相对于该种的
整体分类 ,是比较概括的 ,而不如相对于各株
系各性状划分来的具体 ,这就是聚类分析与
其他方法的根本不同。
4. 2、对缘毛雀麦穗部性状的对比分析。
从 14个缘毛雀麦株系各聚类因子 (见表 1)可
以看到: 在自然条件下生长的 (下转第 25页 )
38
社会历史发展的趋向 ,集中反映了与社会共
命运的当代青年人的思想、性格、行为。 作品
中的人物由“比较单纯的人”到“复杂的人” ;
由“工厂的人”到进入“社会的人”。 从《开拓
者》的丰兆丽— 《赤橙黄绿青蓝紫》的解净、刘
思佳—— 《锅碗瓢盆交响曲》的牛宏 ,独立地
看每一个都是性格鲜明的典型形象 ;联系起
来看 ,就会看到他们的性格、思想、行为是一
脉相承的。作家塑造的青年人形象逐渐丰满 ,
性格逐渐复杂 ,这正是现实社会政治、经济生
活的变化 ,给予当代青年在思想和行为的影
响的艺术再现。作家及时地观察到并反映在
自己的创作实践中。但是 , “完全一样的人是
没有的 ,每个人不论在外表或内心方面都有
自己的东西” (《高尔基与电影》 p14)。蒋子龙
的青年形象塑造在有些方面就缺少“自己的
某种东西” ,还需要像恩格斯所说的那样:
“每个人都是典型 ,同时又是一定的单个人。”
(《致哈克奈斯的信》 )要在“一定的单个人”上
努力。 “蒋子龙刻画人物 ,不但试图对我国新
时期的现实关系作深刻的描述 ,带读者领略
世相 ,而且力图启发读者在当前情况下怎样
处事、做人 ,他的笔下 ,喷薄着思想解放先驱
者的火一般的热。” (阎纲《谈蒋子龙的中篇小
说》《工人日报》、 l981、 8、 24)这段话 ;精确地
概括了蒋子龙的创作特色。蒋子龙在谈创作
《锅碗瓢盆交响曲》的体会时说: “我在生活
中找到了牛宏 ,似乎也明白了自己所追求的
是什么: 应该让文学成为当代人生活的透视
镜。作家的责任就是让自己笔下的每个人物
都能唱出他们的歌 ,和在一起 ,再配上和弦 ,
就是当代人的命运交响曲。”这是作家对自己
追求的确定 ,因此 ,广大读者也热切地期待着
他在新的创作实践中 ,奏出更多更好的时代
交响曲。
(上接第 38页 )a 2结实数和小花数均较高 ,结
实率也高达 52. 6% ,是这些株系中最高的 ,其
他性状也较好 ,所以 a2适用于种子生产 ,而
a13的各性状均较差 ,结实率、百粒重均最低 ,
可见其有性繁殖能力差 ,种子质量低。这可能
是由于抽穗不整齐、授粉不集中等原因所造
成的。所以对 a12株系 ,如果有良好的栽培措
施 ,配以人工辅助授粉 ,提高它的结实率 ,其
种子增产的潜力可能很大 ,故提高 a12株系
的种子产量可作为今后的研究方向之一。
5、小结
5. 1、用最短距离法与类平均法对缘毛雀
麦 14个株系进行穗部性状的聚类分析 ,结果
基本一致 (见表 5、 8): 把 a0与 a10, a3、 a4与
a7, a5与 a11分别聚为一类。
5. 2、两种方法中类平均法的聚类效果比
用最短距离法好。
5. 3、 a2的结实率最高 ,自然条件下各性
状较好 ,适用于种子生产 ; a13株系不适用于
种子生产 ; a 12的种子增产潜力较大。
参考文献:
①《内蒙古植物志》第二版第五卷 ,内蒙古人民出版社。
②王立群、石风翔等 ,《缘毛雀麦优良品系形态解剖学结构的观察与研究》 (《中国草地》 ) 2000, 3; 17— 21, 28。
③《内蒙古农业大学学报》 1999, 4: 55— 57。
④裴喜春、薛河儒《 SAS及应用》中国农业出版社 , 1997。
⑤唐守正《多元统计分析方法》中国林业出版社 , 1991。
⑥裴鑫得《多元统计分析及其应用》北京农业大学出版社 , 1991。
25