全 文 :西北农业学报 2011 , 20(6):136-140
Acta Agriculturae Boreali-occidentalis S inica
三色堇观赏性状的主成分分析*
杜晓华 ,刘会超 ,姚连芳
(河南科技学院 园林学院 , 河南新乡 453003)
摘 要:以 33 个三色堇品种为试材 , 采用性状相关及主成分分析方法对其 8 个主要观赏性状进行分析 , 同时
对品种的观赏性进行评价。结果表明 , 三色堇的花数与分枝数之间 , 适中株高与冠幅/株高之间呈较高的正相
关性 , 而花径与花数 、分枝数之间呈较高的负相关性。主成分分析可将原 8 个性状综合为 4 个主成分 ,可称为
覆花因子 、株型因子 、花比例因子和花色因子 , 其累计贡献率可达 89.1%。以 4 个主成分的贡献率为权重建
立观赏性评价模型 , 可将 33 个品种分成 4 个等级 , 其中 9、10 、33号品种最优。
关键词:三色堇;观赏性状;主成分分析
中图分类号:S681.9 文献标志码:A 文章编号:1004-1389(2011)06-0136-05
Principal Component Analysis of Ornamental Traits in Pansy
DU Xiaohua , LIU Huichao and YAO Lianf ang
(S chool of H orticulture and Landscape Archi tecture , H enan Inst itute of Science an d Technology , Xinxiang H enan 453003 , China)
Abstract:We investig ated and analyzed eight ornamental characters o f 33 pansy cul tivars by co rrela-
tion and principle component analy sis for comprehensive ornamental evaluation of the cultivars.The
results showed that the high po sitive co rrelations w ere detected be tw een the numbers of flow ers and
branches , medium plant height and crow n/height ratio.The high negative cor relations w ere observed
betw een f low er diameter and numbe r of flow ers , and be tw een f low er diameter and number of bran-
ches.The 89.1% info rmation of 8 ornamental characters can be condensed into four principle compo-
nents including f low er covering factor , plant type facto r , f low er proportion facto rs and f low er color
factor.T he model of o rnamental evaluation w as e stablished by the contribution propor tion of four
principal components as the w eight coeff icient , classifying 33 cultiv ars into four g roups acco rding to
their ornamental evaluation.The cultiv ars w ith the best comprehensive ornaments we re No.9 , No.10
and N o.33.
Key words:Pansy;Ornamental characters;Principal component analy sis(PCA)
三色堇(Viola tricolor L.)花色丰富 ,花期颇
长 ,观赏价值高 ,是世界知名早春花卉 ,近年在国
内应用广泛。对三色堇品种资源的客观评价是其
合理利用的基础[ 1] 。三色堇的观赏性涉及多个指
标(性状),品种的综合评价需要将这些指标信息
加以汇集 ,得到一个综合指标反映其整体情况 。
但由于各指标(性状)重要性的不同 ,需要给它们
赋予不同的权重。主成分分析采用客观赋权法 ,
克服了主观赋权的随意性 ,使权重系数更客观合
理[ 2] 。此外 ,主成分分析在汇集多指标信息的同
时 ,还可有效解决三色堇性状间由于不同程度相
关性[ 3]带来的信息重叠问题 ,使品种评价更加科
学合理 。而目前未见采用主成分分析的方法对三
色堇品种进行评价[ 4-6] 。本试验以 33个三色堇品
种为试材 ,对其 8个观赏性状进行调查和主成分
分析 ,试图对这些品种做出较为客观的评价 ,为三
*收稿日期:2010-10-05 修回日期:2010-11-26
基金项目:河南科技学院博士启动基金(7027)。
第一作者:杜晓华 ,男 ,讲师 ,博士。研究方向为园艺植物遗传育种。 E-m ail:du xiaoh ua0124@sina.com
色堇品种的推广应用及育种利用提供参考 。
1 材料与方法
1.1 材 料
供试材料为 33 个三色堇品种 , 分别引自美
国 、荷兰及中国郑州。材料由河南科技学院园林
植物种质资源与生物技术实验室提供 。
1.2 方 法
2008-10-20播种育苗 , 2009-03-20 定植于河
南科技学院花卉试验基地 ,随机区组设计 ,每小区
20株 ,株行距 0.2 m ×0.5 m ,常规栽培管理。盛
花期 ,每小区选取 5株生长健壮 、具有典型性状的
单株 ,分别调查和统计 6个观赏性状(花色 、花径 、
花数 、株高 、冠幅 、分枝数)。其中花色调查参照美
国泛美种子(Pan American Seed)对三色堇的描
述[ 7] ,并采用专家评分法打分。其他性状的观测
参考王健等[ 3] 的方法进行 。按照郭瑞林[ 8] 的方
法 ,将株高数据按 x j=x/(x+ x-xj )转化为适
中株高 ,其中 x j为适中株高 , xj 为原株高 , x 为株
高平均值。此外 ,计算冠幅/株高 、开花指数 2 个
衍生性状。开花指数[ 9] =花数×(花径/冠幅)2 。
1.3 数据处理
先对原始数据进行无量纲化处理 ,即按照公
式 xi=(xi -x)/si 将原始数据标准化 ,其中 xi为
标准化数据 , x i 为性状原始数据 , si 为标准差 , x
为原始数据平均数 。
对 33 个三色堇品种的 8个观赏性状进行相
关性分析 ,得到各性状间的相关系数及其显著性;
对 33个三色堇品种的 8个观赏性状进行主成分
分析 ,利用雅可比法求出各主成分的特征值 , λ1 ≥
λ2≥…≥λp ≥0 ,再求各相应的特征向量 ej ,可得
到主成分Y j =ei ∑X i ;第 j 个主成分的方差贡献
率为αj =λj/ ∑λj ,当累计方差贡献率 α=∑αj >
85%时 ,取前 m 个主成分Y 1 , Y 2 , …,Y m ,即可认
为这 m个主成分能以较少的指标综合体现原来
p 个评价指标的信息 。用各个主成分的方差贡献
率作为权重 ,线性加权求和得到综合评价函数 Z n
=∑αiY i , Zn 表示第 n 个三色堇品种观赏价值的
综合得分 ,并排列等级 。
主成分分析采用 DPS7.55软件完成。
2 结果与分析
2.1 品种间观赏性状的差异
从表 1可以看出 , 33个品种在不同观赏性状
上存在明显差异 , 其中花数的变异系数最高
(66.1%),其次为开花指数(46.6%)和分枝数
(45.3%);适中株高的变异系数最小(14.0%),但其
最大值为最小值的 2倍 ,反映出实际差异也不小。
表 1 33 个三色堇品种的观赏性状
Table 1 The ornamental characters of 33 pansy cultivars
品种编号
Cu lt ivar code
花径/ cm
Flow er
diam eter
花色(分值)
S core of
f lower color
花数
No.of
f low ers
开花指数
Flowering
index
株高适中性/ cm
Medium of
plant heigh t
冠幅/ cm
Crow n
冠幅/株高
Crow n/
height
分枝数
No.of
branches
1 3.55 1 26.00 1.41 0.82 15.25 1.29 11.00
2 4.65 2 18.00 2.84 0.87 11.70 0.92 6.00
3 4.03 2 33.00 1.76 0.95 17.45 1.23 7.00
4 5.80 3 24.00 1.56 0.64 22.75 0.97 7.00
5 6.00 2 28.00 2.58 0.89 19.75 1.18 7.00
6 4.85 2 19.00 1.15 0.78 19.70 1.02 6.00
7 5.25 4 25.00 2.14 0.79 17.95 0.94 9.00
8 5.20 4 28.70 2.49 0.82 17.65 0.96 9.30
9 2.00 4 135.00 1.41 0.84 19.55 1.10 23.70
10 2.25 2 56.00 1.22 0.85 15.25 1.24 18.30
11 5.75 3 31.00 2.88 0.83 18.85 1.04 10.00
12 4.15 2 19.70 1.78 0.87 13.80 1.08 8.00
13 5.65 2 32.00 4.86 0.94 14.50 1.03 6.00
14 4.95 3 20.00 3.21 0.82 12.35 1.06 6.50
15 5.15 3 36.00 2.76 0.60 18.60 0.74 9.00
16 6.75 3 37.00 5.01 0.89 18.35 1.09 7.00
17 5.10 2 23.30 2.31 0.95 16.20 1.14 9.00
18 4.45 3 35.00 2.29 0.93 17.40 1.07 7.00
19 4.85 2 30.00 1.39 0.60 22.50 0.90 8.00
·137·6 期 杜晓华等:三色堇观赏性状的主成分分析
(续表 1)
品种编号
Cu lt ivar code
花径/ cm
Flow er
diam eter
花色(分值)
S core of
f lower color
花数
No.of
f low ers
开花指数
Flowering
index
株高适中性/ cm
Medium of
plant heigh t
冠幅/ cm
Crow n
冠幅/株高
Crow n/
height
分枝数
No.of
branches
20 3.17 4 34.00 1.59 0.48 14.65 0.47 7.00
21 4.85 2 19.00 1.15 0.78 19.70 1.02 6.00
22 4.85 2 19.00 1.15 0.78 19.70 1.02 6.00
23 4.30 3 32.00 2.81 1.00 14.50 0.97 6.00
24 4.40 1 23.00 2.12 0.83 14.50 0.81 6.50
25 5.95 3 24.00 2.23 0.94 19.50 1.22 7.00
26 4.90 2 29.00 3.55 0.88 14.00 0.82 9.00
27 5.15 3 23.00 2.38 1.00 16.00 1.07 9.00
28 5.40 3 22.00 5.07 0.83 11.25 0.94 6.00
29 5.50 3 25.00 4.15 0.82 13.50 1.14 9.00
30 5.55 3 19.00 1.91 1.00 17.50 1.17 7.00
31 5.20 3 26.00 1.67 0.87 20.50 1.18 8.00
32 5.30 2 25.00 2.43 0.81 17.00 0.92 9.00
33 2.25 4 56.00 1.22 0.85 15.25 1.24 18.30
均值 Mean 4.76 2.64 31.29 2.38 0.83 16.88 1.03 8.75
最大值 Max 6.75 4.00 135.00 5.07 1.00 22.75 1.29 23.70
最小值 Min 2.00 1.00 18.00 1.15 0.48 11.25 0.47 6.00
标准差 Std 1.09 0.82 20.69 1.11 0.12 2.94 0.17 3.96
变异系数 CV 0.229 9 0.311 9 0.661 0 0.466 0 0.139 9 0.174 1 0.162 0 0.453 1
2.2 观赏性状间的相关性
从表 2可知 ,花径(X 1)与花数(X 3)、分枝数
之间的相关性很高 ,相关系数分别为-0.618 7 、
-0.713 ,达极显著水平;花径(X 1)与开花指数
(X 5)呈极显著正相关 ,相关系数为 0.543 3;花数
与分枝数之间呈极显著正相关 , 相关系数为
0.856 4 ,花数与花色分值呈显著正相关 ,相关系
数为0.377 1;开花指数与冠幅呈极显著正相关 ,
相关系数为-0.470 2;适中株高与冠幅/株高呈
极显著正相关 ,相关系数为 0.646 6。
2.3 主成分分析
相关程度较高的观赏性状可能归于同一个主
成分内 ,使指标简化。由表 3可知 ,前 4个主成分
累计贡献率达 89.09%(>85%),所以选前 4 个
主成分就可表示原来 8个性状所包含的绝大部分
信息。Bart lett 球形检验给出的相伴概率为
0.000 1 ,小于显著性水平 0.05 ,因此认为适合因
子分析 。
根据表 3中主成分的特征向量可以构建主成
分与各观赏性状之间的线性关系式:
Y 1 = - 0.495 2X1 + 0.518 3X 2 +
0.209 9X3 + 0.552X 4 - 0.324 3X 5 -
0.072 2X6 -0.104 3X 7+0.126 8X 8
Y 2 = - 0.005 3X1 + 0.057 9X 2 -
0.172 6X3 + 0.135 9X 4 + 0.211 3X 5 +
0.688 7X6 -0.603X7 +0.595 2X8
表 2 观赏性状的相关矩阵
Table 2 Correlation matrix of ornamental traits
性状
C haracter
花径(X 1)
Flower
diameter
花数(X2)
No.of
f lowers
花色(X 3)
Color
of fl ow er
分枝数(X 4)
No.of
branches
开花指数(X 5)
Flow ering
index
株高(X 6)
Plant
heigh t
冠幅(X 7)
Crow n
冠幅/株高(X 8)
C row n/
height
X 2 -0.618 7**
X 3 -0.080 4 0.377 1*
X 4 -0.713** 0.856 4** 0.306 4
X 5 0.543 3** -0.161 7 0.074 -0.307 7
X 6 0.131 1 -0.019 5 -0.146 7 0.002 8 0.251 4
X 7 0.220 5 0.135 6 0.089 0.042 2 -0.470 2** -0.262 9
X 8 -0.050 3 0.126 1 -0.147 6 0.301 6 -0.12 0.646 6** 0.119 1 1.000
注:*0.05显著水平 , **0.01显著水平。
Note:* P<0.05 , **P<0.01.
·138· 西 北 农 业 学 报 20 卷
表 3 主成分分析
Table 3 Analysis of the principle components
主成分 1(Y 1)
Principle componen t 1
主成分 2(Y 2)
Principle component 2
主成分 3(Y 3)
Principle component 3
主成分 4(Y 4)
Principle com ponent 4
特征值 Eigenvalu e 2.817 9 1.775 2 1.418 1.116 2
贡献率/ %Proport ion 35.223 3 22.189 5 17.724 9 13.952 7
累计贡献率/ %Cumulative 35.223 3 57.412 8 75.137 7 89.090 4
花径(X 1)Flower diameter -0.495 2 -0.005 3 -0.101 8 0.476 1
花数(X 2)No.of f low ers 0.518 3 0.057 9 0.188 4 0.191 5
花色(X 3)C olor of f low er 0.209 9 -0.172 6 0.376 8 0.615
分枝数(X 4)No.of b ranches 0.552 0.135 9 0.105 1 0.046 7
开花指数(X 5)Flow ering index -0.324 3 0.211 3 0.548 4 0.259 9
株高(X 6)Plan t height -0.072 2 0.688 7 -0.032 9 0.105
冠幅(X 7)C row n 0.104 3 -0.274 1 -0.603 0.499 1
冠幅/株高(X 8)C rown/ heigh t 0.126 8 0.595 2 -0.368 4 0.169 3
Y 3 = - 0.101 8X 1 + 0.188 4X 2 +
0.376 8X 3 + 0.105 1X 4 + 0.548 4X5 -
0.032 9X 6 +0.561 2X 7-0.368 4X 8
Y 4=0.476 1X 1 +0.191 5X 2 +0.615X 3 +
0.046 7 X4 + 0.259 9X 5 + 0.105X6 +
0.499 1X 7 +0.169 3X 8
从关系表达式可知 ,对第 1主成分影响较大
的是花径(X1)、花数(X 2)和分枝数(X 4),且花数
与分枝数呈较强的正向相关 ,二者又与花径呈显
著负相关。说明分枝数越多 ,花数越多 ,花径相对
越小。该成分与花朵覆盖面积相关 ,因此可称为
覆花因子。对第 2主成分影响较大的性状是适中
株高(X 6)和冠幅/株高(X 8),该主成分与株型相
关 ,可称为株型因子。对第 3主成分影响最大的
是开花指数(X 5)和冠幅(X 7),其中开花指数为
正 ,冠幅为负 。说明随着冠幅的增加 ,开花指数变
小 ,因此 ,为提高三色堇的观花效果 ,应适当控制
冠幅的增加 。该主成分与花朵占整个植株比例有
关 ,可称为花比例因子 。对第 4主成分影响最大
的是花色 ,该主成分值越高 ,反映花色越丰富 ,可
称为花色因子。
2.4 品种评价
以 4个主成分 Y 1 、Y 2 、Y 3 、Y 4 与其方差贡献
率构建出三色堇观赏品质的综合评价模型 Z , Z
是主成分 Y 1 、Y 2 、Y 3 、Y 4 的线性组合 , 即:Z =
0.352 2 Y 1 +0.221 9 Y 2 +0.177 2 Y 3 +
0.139 5Y 4 。利用该数学模型对 33个三色堇品种
的观赏品质进行综合评价 ,结果见表 4。
表 4 33个三色堇品种观赏品质综合评价结果
Table 4 The comprehensive evaluation on ornamental quality of 33 pansy cultivars
排序
Order
品种编号
Code
综合得分
Score
排序
Order
品种编号
Code
综合得分
S core
排序
Order
品种编号
C ode
综合得分
S core
1 9 2.849 12 7 0.033 23 5 -0.308
2 33 1.689 13 1 0.012 24 2 -0.388
3 10 1.224 14 30 -0.006 25 32 -0.393
4 27 0.198 15 17 -0.035 26 15 -0.414
5 23 0.195 16 31 -0.036 27 20 -0.452
6 29 0.186 17 25 -0.043 28 4 -0.694
7 18 0.185 18 14 -0.070 29 6 -0.695
8 8 0.184 19 28 -0.080 30 21 -0.695
9 3 0.099 20 13 -0.095 31 22 -0.695
10 16 0.052 21 12 -0.157 32 24 -0.737
11 11 0.036 22 26 -0.164 33 19 -0.785
·139·6 期 杜晓华等:三色堇观赏性状的主成分分析
表 4为三色堇各品种综合得分 ,依据综合得
分高低可将 33个品种分为 4个类别:第 1类(Z >
1.0)共有 3个品种 ,包括 9 、33 、10号;第 2类(0<
Z<1.0)共 10个品种 ,包括 27 、23 、29 、18 、8 、3 、
16 、11 、7 、1号;第 3类(-0.1
-0.1)有 13个三色堇品种 ,包括 12 、26 、5 、2 、32 、
15 、20 、4 、6 、21 、22 、24 、19号品种。结合外观整体
观赏特征可看出 ,第1组花径虽小(2 cm),但花数
极多(56 ~ 135),花色丰富艳丽 ,冠幅/株高较大
(1.2),整体观赏效果佳;第 2 组花径从较大到最
大(3.5 ~ 6.5 cm),花数较多(25 ~ 37),花色丰富 ,
冠幅/株高 1.0 ,整体观赏效果良;第 3组为大花
径(4.9 ~ 6.0 cm),花数中等(19 ~ 32),花色较丰
富 ,冠幅/株高为 0.9 ~ 1.2 ,整体观赏效果一般;
第 4 组花径较大 ,花数中等或偏少 ,主要为单色
花 ,株高太矮或太高 ,冠幅/株高大多<1.0 ,整体
观赏效果较次 。
3 讨 论
在花卉观赏性的多指标综合评价中 ,由于各
指标在评价中的重要性不等 ,因此 ,必须赋予其不
同的权重[ 9] 。以往采用的百分制方法 、模糊综合
评判法和层次分析法中 [ 10] ,权重的确定依据经
验 ,主观随意性较大;现在采用的 TOPSIS 、灰色
关联度定量方法中 ,权重确定虽较客观 ,却不能解
决多个性状间因基因连锁或一因多效造成的性状
相关 ,使评价信息存在重复的问题[ 2] 。主成分分
析采用降维的方法 ,可将原来具有一定相关性的
众多指标转换成少数新的相互无关的主成分 ,在
信息浓缩的同时 ,避免信息重叠带来虚假性 ,各综
合因子的权重根据其贡献率的大小确定 ,客观合
理[ 2 , 11-13] 。
本研究结果显示 ,三色堇各观赏性状间存在
不同程度的相关性 ,如花数 、花径 、分枝数之间的
相关性均很高 ,达极显著水平。而经主成分分析 ,
前 4个主成分代表原 8 个观赏性状 89.1%的信
息 。综合评价中 ,被赋予最大权重的第 1主成分 ,
包含花数和花径两个指标;权重次之的第 2 主成
分 ,为株型因子。这与三色堇以观花为主 ,同时兼
顾株型的判断标准及品种选育目标相吻合 。从综
合评价的结果来看 ,被归为第 1组的 9 、10 、33号 ,
在田间的整体观赏效果较佳 。其他分组评价情况
也基本与定性评价结果相吻合 ,显示出主成分分
析评价模型在三色堇观赏性上的适用性。
本研究结果还显示 ,三色堇 8个观赏性状的
信息可概括为 4个因子:覆花因子 、株型因子 、花
比例因子和花色因子 。由于这 4个因子互不相
关 ,因此提示在三色堇育种目标的制定中 ,对该
4个因子可组合搭配;或在后代选择中 , 4个因子
并行选择 ,而不必担心相互影响 。本研究对 33个
三色堇品种的评价结果 ,可为其今后的应用及育
种研究提供重要参考。
参考文献:
[ 1] 戴思兰.园林植物育种学[ M] .北京:中国林业出版社 ,
2007:40-41.
[ 2] 虞晓芬 ,傅 玳.多指标综合评价方法综述[ J] .统计与决
策 , 2004 , 11:119-121.
[ 3] 王 健 ,包满珠.三色堇主要观赏数量性状的遗传效应研究
[ J] .园艺学报 , 2007 , 34(2):449-454.
[ 4] 王慧俐.进口与国产三色堇品种适应性的比较[ J] .安徽农
业科学 , 2005 , 33(11):2037-2069.
[ 5] 傅巧娟 ,孙 瑶.三色堇品比试验[ J] .北方园艺 , 2006(5):
130-13.
[ 6] 杜晓华 ,刘会超 ,贾文庆 ,等.三色堇不同品种观赏性状的比
较与评价[ J] .河南农业科学 , 2010(3):71-74.
[ 7] ENDO T.Bioch emical and genetical inves tigat ions of f lower
color in sw iss gian t pan sy , Viola ×Witt rockiana Gams.Ⅲ
[ J] .T he Japanese Journal of Genet ics , 1959 , 34(4):116-
124.
[ 8] 郭瑞林.作物灰色育种学[ M ] .北京:中国农业科技出版
社 , 1995:141.
[ 9] 陈俊愉 ,王四清 ,王香春.花卉育种中的几个关键环节[ J] .
园艺学报 , 1995 , 22(4):372-376.
[ 10] 刘 毅.陕西主要栽培银杏的观赏性状评价研究[ D] .陕西
杨凌:西北农林科技大学 , 2007.
[ 11] 杜晓华 ,李新峥 ,刘海妮 ,等.南瓜前期农艺性状的主成分
分析[ J] .西北农业学报 , 2010 , 19(2):168-171.
[ 12] 孙长法 ,赵 晖 ,陈荣江.棉花新品种产量品质性状的聚类
分析与综合评价[ J] .西北农业学报 , 2010 , 19(4):57-61.
[ 13] 王晓静 ,梁 燕 ,徐加新 ,等.番茄品质性状的多元统计分
析[ J] .西北农业学报 , 2010 , 19(9):103-108.
·140· 西 北 农 业 学 报 20 卷