免费文献传递   相关文献

Cluster analysis methods appropriate for classification of drought-resistant wheat ecotypes

小麦抗旱生态分类中适合性聚类方法的研究



全 文 :小麦抗旱生态分类中适合性聚类方法的研究 3
柴守玺 3 3  (中国科学院水土保持研究所黄土高原土壤侵蚀与旱地农业国家重点实验室 ,杨凌 712100)
【摘要】 探索了适合于小麦品种抗旱生态分类的聚类方法. 选用 21 个农艺性状和 15 个冬小麦品种 (系) ,在聚
类分析的各环节上 ,通过采用不同的策略 ,大规模进行了各种分类结果的比较. 结果表明 ,在与专家经验分类接
近程度上 ,数据转换方法中 ,原始数据法依次大于普通相关阵基础上的方差极大正交旋转法、Promax 斜交旋转
法、主成份法 ;相似性度量上 ,欧氏距离大于马氏距离 ; 聚类方式上 ,对应分析法和模糊聚类法大于最短距离法、
最长距离法、类平均法 ; 所有可组合的方法中 ,以对应分析法和直接用原始数据的模糊聚类法的分类结果最接
近专家经验分类. 结合各方法理论上优缺点的分析与检验 ,认为这两种方法也是较理想的方法.
关键词  聚类分析  抗旱生态分类  小麦
Cluster analysis methods appropriate for classif ication of drought2resistant wheat ecotypes. CHAI Shouxi ( S tate Key
L aboratory of Soil Erosion and Dry L and Farming on L oess Plateau , Institute of Soil and W ater Conservation , Chi2
nese Academy of Sciences , Yangling 712100) . 2Chin. J . A ppl . Ecol . ,2000 ,11 (6) :833~838.
The appropriate cluster analysis methods for classification of drought2resistant wheat ecotypes were investigated ,based
on the analysis of 21 morphologic and agronomic characters of 15 winter wheat cultivars. According to the proximity
degree to the results from experts experiences ,the cluster results using original data were orderly better than those us2
ing Varimax orthogonal rotation , Promax skew intersection rotation ,and principal component analysis with phenotypic
mean’s correlation matrix. The results using Euclidean distance were greater than those using Mahalanobis distance.
The clustering methods of correspondent analysis and fuzzy cluster were better than those of nearest distance , furthest
distance or group average method (U PGMA) . Among all cluster results from various methods combined ,the two clus2
ter results from the fuzzy cluster using original data and from the correspondence analysis method were closest to the
results of experts’experience. Based on both comparisons of results and examination of the performance of different
strategies with several statistical properties , the two methods mentioned above were also acceptable.
Key words  Cluster analysis , Ecotype of drought resistance , Wheat .
  3 中国科学院水土保持研究所黄土高原土壤侵蚀与旱地农业国家
重点开放实验室资助项目 (98212) .
  3 3 现在甘肃农业大学农学系 ,兰州 730070.
  1999 - 12 - 06 收稿 ,2000 - 05 - 26 接受.
1  引   言
抗旱生态分类是小麦抗旱育种中亲本选配、不同
抗旱基因型的鉴定筛选、杂种优势利用、核心种质资源
收集利用及因地配置品种的基础 ,采用数学分类法 (或
数值分类)是克服育种盲目性、提高育种水平的必然选
择. 但数学分类方法很多 ,同样的数据 ,采用不同的方
法 ,其分类结果可能不尽一致、甚至相差很大. 到底哪
种方法更好 ,数学上很难建立起一致的判优标准 ,况且
数学上的最优并不等于生物学意义上的最优. 因此 ,在
选择适合的数值分类法时 ,一般都结合具体专业特点 ,
从理论分析和结果比较两个方面进行摸索. 虽然在数
值分类的各环节上不断有比较选优方面的报道 ,如数
据转 换 方 式[9 ,13 ,14 ,16 ] 、相 关 阵[8 ,12 ,21 ] 、相 似 性 度
量[1 ,2 ,7 ,15 ] 、聚类方法[3~6 ,10 ,11 ,17~20 ] ,但总的来说 ,比
较规模偏小 ,也没有形成普遍适用的判优标准. 在作物
品种分类上 ,近年的研究主要集中在用新型指标 (如
RFL Ps、酶谱等)的数学分类结果与血缘、地理类群等
接近程度的比较上.
本研究拟在专家经验分类的基础上 ,对目前流行
的一些主要数学分类法进行分类结果的比较和优缺点
的评价与检验. 在探索适合于作物品种分类的数学方
法上 ,小麦的抗旱生态分类具有独到的优异之处 ,便于
检验分类结果的合理性. 首先 ,在外形上 ,小麦的两种
典型生态型 (抗旱类型和湿地类型) 是比较容易区分
的 ;第二 ,小麦抗旱生态分类的专业背景已很雄厚. 尽
管一般认为传统的经验分类不是基于严格的数学计
算 ,受人为主观因素的影响较大 ,但大量实践证明 ,专
家的经验分类仍具有相当的可靠性 ,因为目前旱地种
植的优良品种基本都是依据经验分类搭配亲本、选育
而来的. 因此 ,一个数学分类结果如果与专家比较一致
的经验分类相差太大 ,要么是数学方法本身不适合 ,要
么是分类性状选用的不准确. 那些将经验分类中两种
典型的生态类型能基本明晰分开、理论上又较完备或
没有重大缺陷的数学分类法应该是比较客观、理想的.
应 用 生 态 学 报  2000 年 12 月  第 11 卷  第 6 期                                 
CHIN ESE JOURNAL OF APPL IED ECOLO GY ,Dec. 2000 ,11 (6)∶833~838
2  材料与方法
211  供试材料
挑选有代表性差异、遗传上稳定的冬小麦品种 (系) 15 个.
名称和代号如下 :1. 渭麦 4 号 ; 2. 陕合 6 号 ; 3. 秦麦 3 号 ; 4. 72
(11) 4 ; 5. 丰抗 13 ; 6. 小偃 6 号 ; 7. 辐矮 8 号 ; 8. 长江 3 号 ; 9.
丰产 3 号 ; 10. 西育 7 号 ; 11. 渭水丰 ; 12. 77 (123) ; 13. 咸农
151 ; 14. 郑引 1 号 ; 15. 7859.
212  研究方法
21211 实验设计  材料种植于陕西杨凌大田自然干旱条件下 ,
随机区组 ,3 次重复. 行、株距均为 25cm ,播前施足复合肥 ,各小
区田间管理措施均在同质水平上进行. 生育期间除表现出不同
程度的受旱症状外 ,无倒伏、缺肥、病虫等现象发生 ,生长成熟
正常. 测取了在专家经验分类中所着重的 21 个分类性状 ,性状
测取按常规法. 每小区样本量 20 株.
21212 分类方案  1)专家经验分类. 邀请国内一些该领域著名
的老专家 ,基于他们所公认的 21 个较重要的抗旱分类性状 ,让
他们单独对 15 个材料进行经验分类. 根据比较一致的分类意
见 ,供试材料可分为 3 大类 ,分类结果、性状名称、代号及三重
复均值见表 1. 2)数学分类方案. 对同样的 21 个分类性状采取
不同的数学分类策略. ①相关阵 :遗传相关阵 ,普通相关阵. ②
数据转换方式 :主成分法、方差极大正交旋转法、Promax 斜交
旋转法、原始数据法. ③相似性度量 :欧氏距离、马氏距离、模糊
等价矩阵. ④聚类方法 :模糊聚类法、最短距离法、最长距离法、
类平均法、对应分析法.
标准化方式均采用标准差标准化. 各分析方法的原理、方
法、程序见文献[15 ] . 在主成分和两种因子分析法基础上进行
聚类分析时 ,均选取方差累计贡献率 ≥85 %的前几个主成分子
样值 (简称主成分值) 、正交旋转因子得分值 (简称正交值) 、斜交
旋转因子得分值(简称斜交值) ,方差分析采取小区均值法 [6 ] .
表 1  性状均值及专家经验分类
Table 1 Average value of traits and classif ication based experiential system of experts
性状
Traits
抗旱类型 Drought resistance ecotype
1 2 3 4 5
中间类型 Middle ecotype
6 7 8 9 10
湿地类型 Wet ecotype
11 12 13 14 15
X1  (g) 21. 39 23. 05 23. 69 23. 77 18. 69 18. 14 15. 08 20. 45 21. 90 21. 38 16. 49 16. 03 21. 46 21. 72 18. 54
X2  (g) 20. 03 23. 53 25. 18 20. 51 15. 09 15. 03 13. 57 15. 00 20. 30 23. 83 16. 85 13. 13 19. 38 16. 66 16. 86
X3   12. 19 13. 37 14. 99 10. 80 13. 40 13. 23 11. 53 13. 10 9. 90 12. 30 11. 37 8. 57 11. 87 11. 90 10. 86
X4   49. 90 54. 03 51. 30 65. 90 55. 37 61. 66 63. 53 59. 07 64. 15 64. 10 57. 17 74. 33 71. 37 60. 10 49. 36
X5  (g) 2. 54 2. 51 2. 41 2. 99 2. 23 2. 41 2. 51 2. 85 2. 83 2. 78 2. 52 2. 68 3. 03 2. 41 2. 69
X6  (g) 50. 10 44. 90 43. 50 44. 36 38. 64 36. 72 41. 86 46. 30 45. 20 36. 76 42. 02 36. 56 37. 64 41. 60 47. 20
X7  (cm) 101. 03 115. 09 97. 09 99. 51 77. 29 67. 18 58. 77 73. 78 91. 27 82. 71 76. 51 66. 55 71. 00 77. 37 64. 13
X8  (cm) 10. 02 10. 03 9. 01 10. 07 9. 18 7. 64 6. 38 9. 82 8. 99 11. 27 8. 24 7. 66 9. 61 8. 61 8. 09
X9  (ml) 4. 78 5. 92 5. 89 6. 46 5. 50 7. 08 6. 45 6. 00 7. 18 6. 19 6. 65 6. 96 6. 66 6. 59 7. 00
X10  ( %) 32. 41 26. 73 26. 57 23. 22 21. 26 18. 31 20. 62 22. 62 21. 12 14. 67 21. 04 13. 93 12. 26 16. 83 26. 98
X11  ( %) 47. 20 52. 34 57. 01 38. 85 40. 56 28. 23 29. 69 35. 16 28. 53 31. 61 24. 21 37. 25 25. 03 28. 96 41. 90
X12  ( %) 12. 87 13. 53 9. 78 35. 42 31. 51 36. 99 39. 15 25. 80 33. 23 35. 68 35. 20 25. 97 31. 99 39. 98 16. 71
X13  ( %) 0. 40 0. 81 0. 12 1. 21 1. 43 8. 74 5. 68 9. 63 10. 92 13. 08 9. 88 29. 16 29. 40 8. 27 1. 65
X14  ( %) 0. 00 0. 00 0. 00 0. 00 0. 00 1. 56 0. 00 0. 00 1. 56 0. 00 0. 55 6. 50 2. 36 0. 15 0. 00
X15  ( %) 7. 13 6. 60 6. 52 5. 30 5. 23 6. 17 4. 86 6. 62 6. 21 4. 93 9. 13 5. 15 1. 86 5. 81 12. 80
X16  (cm) 0. 51 0. 57 0. 58 0. 60 0. 54 0. 63 0. 59 0. 58 0. 62 0. 59 0. 62 0. 63 0. 66 0. 61 0. 63
X17 13. 44 14. 07 15. 99 11. 50 13. 97 14. 11 12. 33 14. 30 10. 51 15. 90 12. 23 9. 05 13. 57 12. 53 11. 80
X18  (days) 229. 3 229. 0 232. 0 229. 0 228. 3 224. 0 224. 0 227. 0 228. 3 229. 0 223. 0 223. 7 228. 3 229. 0 229. 0
X19  (cm2) 49. 25 57. 52 58. 56 69. 52 51. 01 77. 53 67. 73 54. 54 77. 31 78. 20 77. 17 76. 95 70. 48 66. 28 74. 37
X20  (°) 105. 1 142. 4 101. 0 119. 1 62. 1 34. 8 55. 8 85. 0 134. 7 67. 1 28. 9 87. 8 70. 2 56. 6 64. 3
X21  (°) 38. 93 16. 95 36. 75 32. 46 23. 79 68. 17 71. 70 43. 00 18. 68 67. 60 64. 75 48. 20 53. 10 83. 05 55. 31
X1 :株粒重 Grain weight per plant ,X2 :株干重 Dry weight per plant ,X3 :株穗数 Spike number per plant ,X4 :穗粒数 Grain number per spike ,X5 :穗粒重
Grain weight per spike ,X6 :千粒重 1000 grains weight ,X7 :株高 Plant height ,X8 :穗长 Spike length ,X9 :穗体积 Spike volume ,X10~15 :2 粒、3 粒、4 粒、5 粒、
6 粒、1 粒小穗占总小穗的比率 Percentage of spikelets with two , three , four , five ,six ,or one grain (s) to total spikelets ,X16 :茎粗 Diameter of stem ,X17 :主
茎数 Number of stem per plant ,X18 :生育期 Growth duration ,X19 :顶部三叶面积 Total area of three leaves adjacent to spike ,X20 :旗叶基角 Basal angle of
flag leaf ,X21 :旗叶弯曲度 Bent degree of flag leaf .
3  结果与分析
311  遗传相关阵基础上的主成分法
主成分分析是一种将多维相关指标转化为少数非
相关综合指标的多元分析法. 利用遗传相关阵基础上
的主成分值进行聚类分析 ,是 70 年代以来作物品种分
类中报道最多的方法 ,遗传相关可以剔除环境的干扰 ,
便于揭示性状之间本质的联系.
在本研究中出现了遗传相关系数大于 1 和负的特
征根 , 例如单株粒重和生育期遗传相关系数为
110181 ,21 个特征根中有 12 个负值 (尽管其值很小) ,
这从理论上是讲不通的 , 不仅难以给出生物学解释 ,
而且使得后续进行的遗传距离及相应的聚类分析丧失
了严格的数学基础 ,应该放弃该法的聚类结果. 在一
些研究报告中也常出现大于 1 和负特征根的的情况 ,
这主要是由于常规的方差 - 协方差分析所得的遗传相
关系数偏差较大 ,更重要的是遗传相关阵的正定性不
能得到保证 ,因此有可能出现负的特征根. 有人常借籍
438 应  用  生  态  学  报                    11 卷
所研究问题的随机性而采取一些勉强处理的办法 ,如
将遗传相关系数看成期望绝对值小于 1 而接近于 1、
舍弃负的特征根 ,则是一种使用数学方法而违背其理
论的做法. 另外 ,在主成分分析时 ,选用何种矩阵 (协方
差阵和相关阵)更好也是值得探讨的问题[21 ] .
312  普通相关阵基础上的主成分法、方差极大正交旋
转法和 Promax 斜交旋转法
为了解决遗传相关阵基础上分析时所出现的困
境 ,有人通过理论研究提出了用表现型值的均值作为
基因型值的估计值、并由此建立普通相关阵以代替遗
传相关阵进行分析[12 ] ,该法可以有效地消除随机效
应 ,误差较遗传相关系数小 ,不会出现相关系数大于 1
和负特征根现象 ,因此可保证全部多元分析的顺利进
行. 另外 ,遗传相关系数的估算还会因实验设计的不同
而变化 ,其误差估计很复杂. 为此 ,在普通相关阵基础
上用欧氏距离进行聚类分析 (见图 1~3) .
比较图 1~3 ,以正交值的模糊聚类最接近经验分
类 ,斜交值的模糊聚类次之. 在相似度较大时 ,图 2a 和
图 3a 都明显分为 3 类 ,各类所含材料基本一致 ,但在
相似度较小时聚为两大类情况看 ,图 3a 中将抗旱类型
(1~3 ,5) 与湿地类型材料 (11 ,12 ,14 ,15) 并为一类 ,
考虑到抗旱湿地类型间差异应大这一设想 ,显然图 2a
图 1  主成分值分类
Fig. 1 Classification based on eigenvalue by principal component analysis.
Note :Abscissa : Codes of cultivars or lines ; Ordinate :λDegree of subordination or D( Euclidean distance) . a. 模糊聚类 Fuzzy cluster ,b. 最短距离法 Nearest
distance ,c. 最长距离法 Furthest distance ,d. 类平均法 Group average. 下同 The same below.
图 2  正交值分类
Fig. 2 Classification based on factorial score by Varimax orthogonal rotation analysis.
图 3  斜交值分类
Fig. 3 Classification based on factorial score by Promax skew intersection rotation analysis.
5386 期                柴守玺 :小麦抗旱生态分类中适合性聚类方法的研究          
图 4  原始性状分类
Fig. 4 Classification using directly original traits.
更接近.
因子分析是主成分分析的进一步发展 ,作为聚类
分析中的一种数据转换方式、方差极大正交旋转也始
终保持着因子间不相关的特点 ,因此作为综合指标的
正交值和主成分值一样 ,更适合于用欧氏距离聚类. 而
斜交旋转因子间有相关 ,具有更大任意性.
313  原始数据法
以上分析中 ,均选取方差累计贡献率 ≥85 %的前
几个主成分值、正交值、斜交值 ,这从克服性状间的相
关以去掉重叠信息、减少分类指标 (但能代表大部分变
异信息) 方面考虑无疑极有意义 ,但丢掉约 15 %的变
异信息并不是一个小概率的事件. 聚类分析倒不一定
非用经过转换的综合性状不可. 为了不丢失变异信息 ,
直接利用原始性状值 (不通过主成分或因子分析转换 ,
但要标准化处理) 进行同上聚类分析. 1) 欧氏距离法.
用原始性状聚类时 ,因性状间存在相关 ,理论上不宜采
用欧氏距离 ,但该距离在应用上仍最广泛 ,被认为分类
效果较好. 比较 4 种欧氏距离聚类图 (图 4) ,仍以模糊
聚类法最接近经验分类. 从图 4a 可见 ,当λ为 0. 66 左
右时 ,材料明显分为两大类 ,抗旱和湿地类型的各 5 个
材料分别被包含在两大类中 ,从两典型类型被完全分
开来讲 ,与经验分类完全一致. 2) 马氏距离法. 考虑到
直接用原始性状进行聚类时欧氏距离的缺点 ,用马氏
距离 (可以克服性状间的相关性) 进行 3 种系统聚类
(图略) . 发现材料间链接聚合趋势比用欧氏距离明显
得多 ,其中以马氏距离的最短距离法最明显 ,材料间很
难明晰归类 ,不是一个理想的距离 ,这也验证了对它缺
点的评价[15 ] . 然而 ,有些学者用马氏距离也取得了理
想的结果[7 ,12 ] . 在复杂的生物现象面前 ,度量差异的
办法也许不是单调的.
314  对应分析法
对应分析法具有很多优点. 首先 ,它集缩性强、在
选取同样主因子数时 ,往往比主成分法和因子分析法
方差累计贡献率更大 ,便于二维作图 ;第二 ,判分能力
好 ,减少了由于标度所引起的一些问题 ,具有分布等价
的性质等. 该法的理论和专业应用已逐渐引起人们的
重视[11 ,12 ] .
用 21 个性状进行对应分析 (图 5) ,在代表大部分
变异信息的二维平面空间中 (两主因子占总变异信息
量的 80. 39 %) ,供试材料被分为较明晰的 3 类. 第 Ⅰ
类 (1~4 ,9)含 4 个抗旱类型材料 (1~4) ,第 Ⅲ类 (6 ,7 ,
10~14)含 4 个湿地类型材料 (11~14) , Ⅱ类 (5 ,8 ,15)
可看作介于 Ⅰ和 Ⅲ之间的过渡类型.
由于第一主因子占了总变异信息的一半以上
(54156 %) ,因此在第一主因子轴上还可以将过渡类型
范围再缩小到原点附近 ,则过渡类型只剩一个材料
(15) ,材料 5 和 8 归属于 Ⅰ类 ,这样 5 个抗旱类型材料
(1~5)和 4 个湿地材料 (11~14)分别归属于 Ⅰ和 Ⅲ类
中. 从两种典型类型材料的归类来看 ,和经验分类近乎
图 5  对应分析因子载荷
Fig. 5 Factory load on correspondence analysis.
▲品种 (系) Cultivars(lines) ,ο性状 Traits.
638 应  用  生  态  学  报                    11 卷
一致. 对应分析法虽然具有很多优越性 ,但在具体应用
中还存在一些问题有待于探讨和完善[16 ] .
  比较所有聚类图 (图 1~5) ,在与经验分类接近程
度上 ,总体来看 ,在数据转换方式上 ,原始数据法依次
大于正交法、斜交法、主成分法 ;聚类方法上 ,模糊聚类
大于 3 种系统聚类 ;相似性度量上 ,欧氏距离大于马氏
距离. 在所有可组合的分类方案中 ,以原始数据的模糊
聚类法和对应分析法的分类结果最接近经验分类.
315  其它实验的验证
为了验证以上分析结果的可靠性 ,用 15 个材料 ,
种植在不同的年份、土壤环境和密度条件下 (株距、行
距分别为 5 和 25cm) ,测取了 22 个分类性状 ,其中大
部分与上述 21 性状相同 ,然后进行同上的各种聚类分
析. 环境不同 ,可能对分类性状的方差和相关产生非均
衡的影响 ,进而造成分类结果的差异.
结果表明 ,在与专家经验分类的接近程度上 ,与上
述 21 性状的分类结果趋势基本相同 ,其中仍以对应分
析法和直接用原始数据的模糊聚类法最接近 ,说明在
一定环境差异下 ,小麦性状间的相关性是相对稳定的.
限于篇幅 ,图略.
316  3 种分类的表征性状比较分析
通过对经验分类和两种较优异数学分类结果的逐
步判别分析 ,从 21 个性状中筛选出了 3 种分类各自的
主要作用性状或表征性状 (表 2) . 经验分类的主要作
用性状为 :株高 (X7)和茎粗 (X16) ,以茎粗最为重要 ,秆
高秆细通常也是人们对抗旱类型的主要印象 ;对应分
析分类的为 :千粒重 ( X6) 、X7 、旗叶弯曲度 ( X21) ;原始
表 2  3 种分类的性状值
Table 2 Mean of traits for groups on three results of classif ication
分类组别 (材料代号)
Groups(Code of samples)
X6
(g)
X7
(cm)
X16
(cm)
X19
(cm2)
X21
(°)
专家经验分类 Classification based experiential system of experts
(1~5) 44. 3 98. 0 0. 56 57. 2 29. 8
(6~10) ) 41. 4 74. 7 0. 60 71. 1 53. 8
(11~15) 41. 0 71. 1 0. 63 73. 1 60. 93 3 3
对应分析分类 Classification based correspondence analysis
Ⅰ(1~4 ,9) 45. 6 100. 8 0. 58 62. 4 28. 8
Ⅱ(5 ,8 ,15) 44. 1 71. 7 0. 58 59. 9 40. 7
Ⅲ(6~7 ,10~14) 39. 0 71. 4 0. 62 73. 5 65. 23 3 3 3
模糊聚类 Fuzzy cluster
Ⅰ(1~5 , 8~9) 44. 7 93. 6 0. 57 59. 7 30. 1
Ⅱ(6~7 ,10~15) 40. 1 70. 5 0. 62 73. 6 64. 03 3 33 为 F 阈值≥应赋临界值时的入选性状. Traits presented in discriminant
function while F1 or F2 ≥Fa ,a :Degree of freedom.3 3 为逐步判别分析中 ,F 检验阈值只允许一个性状入选时所选出的性
状. Only trait permitted to enter into discriminant function by F1 and F2 on
stepwise discriminant analysis.
Ⅰ1 抗旱类型 Drought resistance ecotype , Ⅱ1 中间类型 Middle ecotype ,
Ⅲ1 湿地类型 Wet ecotype.
数据模糊聚类的为 :顶三叶面积 (X19)和 X21 . 详细判别
分析结果将另文报道.
4  讨   论
原始数据的模糊聚类和对应分析法不仅将两种典
型材料基本明晰归类、与专家经验分类较接近 ,而且在
理论上较优异或没有重大缺陷 ,因而认为较理想. 由于
数量性状变异上的连续性及经验分类对综合差异判断
上的模糊性等 ,经验分类中对有些材料、特别是对中间
过渡型材料 (6~10)很难准确界定其归属 ,因此经验与
数学分类结果上有一定差异是可以理解的. 另外 ,本研
究中选用的抗旱和湿地材料在差异上还不十分大. 最
具有典型抗旱特征的材料应该是系统进化而来的草原
生态型 (或常称为地方老品种) , 而我们选用的 5 个抗
旱类型材料均系人工改良品种. 湿地材料中的 7859
(15)实际上也属于中间偏水型. 之所以这样选材 ,一是
为了在差异相对较小的情况下检验数学分类的灵敏
度 ,二是草原生态型目前在生产和亲本选配上已基本
不用. 但即使如此 ,仍可以看出 ,抗旱和湿地材料间的
差异还是很明显的 ,如果采用草原生态型 ,估计检验效
果会更好.
通过比较 ,不难发现以最短距离法的空间链接趋
势最明显 ,这是由该法本身的特点决定的. 该法具有单
调性和很强的空间收缩性 ,致使得样本间链接聚合趋
势明显 (即拒绝分类样本多 ,当然由于差异大 ,自成一
类也是允许的) . 因此 ,该法虽然在数学理论上有不少
优点[15 ,19 ] ,但不适合于一般分类情况 ;最长距离法则
采取与之相反的策略 ,因而具有空间扩张性 ;而类平均
法则是一种单调的、空间守恒的对策 ,相对来说是一种
应用较广泛、聚类效果较好的距离 ,在常见的遗传聚类
分析中大多采用该法 ;模糊聚类中 ,由相似矩阵改造为
模糊等价矩阵、R 自乘思想基于最小距离法原则 ,该法
既考虑了两元素间直接的相似关系 ,也考虑了两元素
通过所有其它元素造成的间接相似关系. 考虑到模糊
聚类依据模糊等价关系进行[13 ] ,在分类上较合理、在
数学上较严格 ,而系统聚类仅着眼于两元素间直接相
似关系进行分类 ,因而认为只是模糊聚类的近似结果.
品种 (系)间数量性状的变异往往是连续的 ,因此模糊
聚类适合于研究生命的软现象.
分类结果还与分类性状的选择有关. 本研究仅挑
选了专家经验分类中所着重的性状 ,主要是便于摸索
方法. 在方法确定后 ,分类性状或指标的选择还可根据
抗旱性的研究进一步补充、调整和完善.
7386 期                柴守玺 :小麦抗旱生态分类中适合性聚类方法的研究          
参考文献
1  Beer SC , Goffreda J ,Phillips TD , et al . 1993. Assessment of genetic
variation in A vena sterilis using morphological traits , isozymes , and
RFL Ps. Crop Sci ,33 (6) :1386~1393
2  Beuningen L T van ,Busch RH. 1997. Genetic diversity among North
American spring wheat cultivars Ⅲ. Cluster analysis based on quanti2
tative morphological traits. Crop Sci ,37 (3) : 981~988
3  Brown J S. 1991. Principal component and cluster analyses of cotton
cultivars variability across the U. S. Cotton Belt . Crop Sci ,31 (4) : 915
~922
4  Fang K2T(方开泰) , Fan S2P (藩思沛) . 1982. Cluster Analysis. Bei2
jing : Geology Press. (in Chinese)
5  Franco J , Crossa J ,Villasenor J et al . 1997. Classifying Mexican maize
accessions using hierarchical and density search methods. Crop Sci ,37
(3) : 972~980
6  Gao Z2R (高之仁) . 1986. Quantitative Genetics. Chengdu : Sichuan
University Press. 236~313 (in Chinese)
7  Goodman M. 1972. Distance analysis in biology. Syst Zool ,21 (2) : 174
~186
8  Guo P2Z(郭平仲) . 1989. Methods of distance analysis and heterosis.
Acta Genet S in (遗传学报) ,16 (2) :97~104 (in Chinese)
9  Hu B2M (胡秉民) , Wang Zh2Q (王兆骞) , Wu J2J (吴建军) . 1992.
Structural index systems of agroecosystem and their quantitative meth2
ods. Chin J A ppl Ecol (应用生态学报) ,3 (2) : 144~148 (in Chinese)
10  Jiang Z2Sh (蒋佐升) . 1988. Comparison analysis of three cluster meth2
ods for crop breeding. J Hunan A gric Colle (湖南农学院学报) , 14
(1) :7~15 (in Chinese)
11 Ke W2S (柯文山) , Zhong Zh2Ch (钟章成) . 1999. Multivariate and
SAD analysis of Gordonia acuminata climatic ecotype. Chin J A ppl
Ecol (应用生态学报) ,10 (5) : 529~533 (in Chinese)
12  Liu C2Y(刘垂王于) . 1991. Multivariate Analysis of Genetics for Quanti2
tative Characters in Crops. Beijing : Agriculture Press. 1~58 , 232~
248 (in Chinese)
13  Long M2Y(龙漫远) . 1986. On the application of fuzzy clustering to
plant breeding. J Sichuan A gric U niv (四川农业大学学报) , 4 (2) :
239~247 (in Chinese)
14  Long M2Y(龙漫远) . 1987. The methods for measuring genetic dis2
tance and the relationship between yield heterosis/ specific combining a2
bility and genetic distance in maize ( Zea mays L . ) . Acta A gro Sin (作
物学报) ,13 (8) :193~199 (in Chinese)
15  Luo J2Y(罗积玉) , Xing Y (邢  瑛) . 1987. Statistic Methods and
Forecast on Economics. Beijing : Qinghua University Press. 156~289
(in Chinese)
16  Men D2S(孟德顺) , Guo M2C(郭满才) . 1996. A note on correspon2
dence analysis method. J Northwest For Colle (西北林学院学报) ,11
(3) :78~81 (in Chinese)
17  Ven WTG van de , Duncan N , Ramsay G et al . 1993. Taxonomic rela2
tionships between V . f aba and its relatives based on nuclear and mito2
chondrial RFL Ps and PCR analysis. Theor A ppl Genet ,86 (1) : 71~
80
18  Wang M (汪  敏) ,Qian J (钱  吉) , Zheng Sh2Zh (郑师章) . 1998.
Isozymes of different geographic populations of Ley m us chinensis .
Chin J A ppl Ecol (应用生态学报) ,9 (3) :269~272 (in Chinese)
19  Wang N2X(王乃信) . 1987. Some problems concerning cluster analy2
sis. J Northwest A gric U niv (西北农业大学学报) ,15 (4) : 55~61
(in Chinese)
20  Williams WT. 1971. Principles of clustering. A nn Rev Ecol Syst ,2 :
303~326
21  Zhou J2Y(周静芋) , Song Sh2D (宋世德) , Yuan Zh2F (袁志发) .
1996. Problems in numerical taxonomy with PCA. J Northwest A gric
U niv (西北农业大学学报) ,24 (5) : 95~98 (in Chinese)
作者简介  柴尔玺 ,男 ,1963 年生 ,博士 ,副教授 ,主要从事小麦
抗旱生态生理方面研究 ,已发表论文 16 篇. E2mail :csxlg @pub2
lic. lz. gs. cn
838 应  用  生  态  学  报                    11 卷