全 文 : 第 vy卷 第 y期u s s s年 tt 月
林 业 科 学
≥≤∞× ≥∂ ∞ ≥≤ ∞
∂ ²¯1vy o ²1y
²√ qou s s s
主成分分析法在仁用杏品种主要经济
性状选种上的应用研究 3
郭宝林 杨俊霞 李永慈 于树胜
k河北农业大学 保定 sztsssl
摘 要 } 应用主成分分析法 o从样本相关矩阵出发 o对仁用杏 |个品种的主要经济性状k单株产果量 !单果重 !
出肉率 !出核率 !核出仁率 !干核重 !干仁重 !单株产仁量和 ®ª仁需核量l进行分析 o依性状累积方差贡献率达到
{x h以上 o提出了两个反映仁用杏主要经济性状的主成分及其主成分函数式 ∀通过计算各品种的重要主成分
值 o进而选择综合经济性状优良的品种 ∀其结果与品种的实际表型相近似 ∀表明用主成分分析法对仁用杏主
要经济性状综合评选比优良性状打分评优科学 !简便 o为仁用杏优良品种选择提供理论依据 ∀
关键词 } 仁用杏 o主成分分析 o优种选择
收稿日期 }t|||2ts2uz ∀
3 本文经河北农业大学裴保华教授 !吕增仁教授审阅 o特此致谢 ∀
ΤΗΕ ΑΠΠΛΙΧΑΤΙΟΝ ΟΦ ΠΡΙΝΧΙΠΑΛ ΧΟΜΠΟΝΕΝΤ ΑΝΑΛΨΣΙΣ ΟΝ ΜΑΙΝΛΨ
ΕΧΟΝΟΜΙΧ ΧΗΑΡΑΧΤΕΡΣ ΑΝ∆ ΣΥΠΕΡΙΟΡ ς ΑΡΙΕΤΨ ΣΕΛΕΧΤΙΟΝ ΟΦ
ΑΠΡΙΧΟΤ ΦΟΡ ΝΥΧΛΕΟΛΥΣ ΥΣΙΝΓ
∏²
¤²¯¬± ≠¤±ª∏±¬¬¤ ¬≠²±ª¦¬ ≠∏≥«∏¶«¨ ±ª
( Ηεβει Αγριχυλτυραλ Υνιϖερσιτψ Βαοδινγ sztss)
Αβστραχτ :
¤¶¨§²± ¶³¨¦¬° ±¨ ¦²µµ¨ ¤¯·¬²± °¤·µ¬¬o·«¨ °¤¬± ¦¨²±²°¬¦¦«¤µ¤¦·¨µ²©| √¤µ¬¨·¬¨¶²©¤³µ¬¦²·©²µ∏¶¬±ª
±∏¦¯¨ ²¯∏¶º µ¨¨ §¨·¨µ°¬±¨ §¥¼ ³¬±¦¬³¤¯ ¦²°³²±¨ ±·¤±¤¯¼¶¬¶oº«¬¦«¬±¦¯∏§¨§©µ∏¬·¼¬¨ §¯³¨µ·µ¨¨oº ¬¨ª«·³¨µ©µ∏¬·o©¯ ¶¨«
µ¤·¨o¶·²±¨ µ¤·¨o®¨ µ±¨ ¯µ¤·¨o§µ¼ ¶·²±¨ º ¬¨ª«·o§µ¼ ®¨ µ±¨ ¯ º ¬¨ª±·o®¨ µ±¨ ¯ ¼¬¨ §¯³¨µ·µ¨¨o¤±§¤°²∏±·²©¶·²±¨ ·² ³µ²2
§∏¦¨ ²±¨ ®¬¯²ªµ¤° ®¨ µ±¨ ¯q¦¦²µ§¬±ª·² °²µ¨ ·«¤± {x h ²©·«¨ ¦∏°∏¯¤·¬√¨√¤µ¬¤±¦¨ ³µ²³²µ·¬²±o·«¨ µ¨¶∏¯·¶³µ²³²¶¨§
·º²³µ¬±¦¬³¤¯ ¦²°³²±¨ ±·¶¤±§¬·¶©∏±¦·¬²± ¨´ ∏¤·¬²±¶º«¬¦«µ¨©¯ ¦¨·¨§·«¨ °¤¬± ¦¨²±²°¬¦¦«¤µ¤¦·¨µ¶²©¤³µ¬¦²·©²µ∏¶2
¬±ª±∏¦¯¨ ²¯∏¶q׫¨ ®¨ ¼ ³µ¬±¦¬³¤¯ ¦²°³²±¨ ±·√¤¯∏¨¶²©√¤µ¬²∏¶√¤µ¬¨·¬¦¶º µ¨¨ ¦¤¯¦∏¯¤·¨§o¬·º¬¯¯ ¥¨ ¤³³¯¬¨§·²¶¨¯¨ ¦·¬±ª
©¬±¨ √¤µ¬¨·¬¨¶o·«¨ µ¨¶∏¯·¶º µ¨¨ ¶¬°¬¯¤µ·²³µ¤¦·¬¦¤¯ ³«¨ ±²·¼³¨ q׫¨ ° ·¨«²§²©³µ¬±¦¬³¤¯ ¦²°³²±¨ ±·¤±¤¯¼¶¬¶º¤¶°²µ¨
¶¦¬¨±·¬©¬¦¤±§¶¬°³¯¨·«¤±·«¨ ° ·¨«²§²© ¬´√¬±ª¤ °¤µ®²© °¤¬± ¦¨²±²°¬¦¦«¤µ¤¦·¨µ¶º«¬¯¨ √¨¤¯∏¤·¬±ª °¤¬± ¦¨²±²°¬¦
¦«¤µ¤¦·¨µ¶²©¤³µ¬¦²·∏¶¬±ª©²µ±∏¦¯¨ ²¯∏¶¦²³°³µ¨«¨ ±¶¬√¨¯¼ q·º¬¯¯ ³µ²√¬§¨ ¤·«¨ ²µ¨·¬¦¤¯ ¥¤¶¬¶©²µ¶¨¯¨ ¦·¬±ª©¬±¨ √¤µ¬2
·¨¬¨¶²©¤³µ¬¦²·∏¶¬±ª©²µ±∏¦¯¨ ²¯∏¶q
Κεψ ωορδσ: ³µ¬¦²·©²µ±∏¦¯¨ ²¯∏¶∏¶¬±ªo°µ¬±¦¬³¤¯ ¦²°³²±¨ ±·¤±¤¯¼¶¬¶o≥∏³¨µ¬²µ√¤µ¬¨·¼ ¶¨¯¨ ¦·¬²±
主成分分析是从多个存在一定相关关系的变量中选出几个新的综合变量 o而新的综合变量又能反
映原来多个变量所提供的主要信息 o从而简化数据结构 o寻找变量间的线性关系k裴鑫德 ot||tl ∀由于
主成分为综合变量 o且相互独立 o所以用主成分值作为优种选择指标 o可较准确的了解各性状的综合表
现 o在科学研究中具有一定的理论和实际意义 ∀
仁用杏是我国特有的经济林树种k楚燕杰等 ot||wl o以其丰富的营养 !高额的效益和较强的适应性
深受青睐 ∀但目前生产上的仁用杏品种十分混杂 o而依靠传统的打分评价品种的方法 o往往使选优工
作进展缓慢 o且缺乏科学依据 ∀主成分分析用于经济树种选种研究尚未见报道 o本文通过对仁用杏品
种的主要经济性状分析 o探讨主成分分析用于仁用杏优种选择的可行性 o旨在为仁用杏优种选择提供
理论依据 ∀
t 材料与方法
1 q1 供试材料
于 t||z和 t||{年的果实成熟时对河北省涿鹿县 !蔚县栽培的 tu ∗ tx年生 !株行距 w ° ≅ y ° !栽
培条件及管理水平较为一致的仁用杏园中的龙王帽 !一窝蜂 !白玉扁 !北山大扁 !优一 !三杆旗 !红尖嘴 !
二杏扁和干颗 |个品种进行性状调查 ∀每一品种每年随机抽取 x株树调查平均单株产果量 !单株产仁
量 ∀并随机取 ts ∗ tx ®ª果实 o分别调查果实的单果重 !出肉率 !出核率 !核出仁率 !干核重 !干仁重和每
®ª仁需核量 o以两年调查的平均值k表 tl进行分析 ∀
1 q2 统计方法
应用统计软件包 ≥≥程序k裴喜春等 ot||{ ~≤¤µ¼ ot|{xl o从样本相关矩阵出发 o对 |个主要性状指
标进行主成分分析 o根据性状累积方差贡献率达到 {x h以上确定主成分的个数 ∀由各性状相关矩阵的
特征向量 o列出主成分的函数表达式 o最后根据计算的重要主成分值 o对品种进行选择 ∀
u 结果与分析
2 q1 主成分分析
主成分的特征根和贡献率是选择主成分的依据 o将仁用杏 |个原性状指标转化为 |个主成分 ∀由
表 u看出 o第 t个主成分的特征根为 y qs| o方差贡献率为 yz qy h o代表了全部性状信息的 yz qy h o是最
重要的主成分 ~第 u个主成分的特征根为 t qxx o方差贡献率为 tz qu h o代表了全部性状信息的 tz qu h o
是仅次于第 t主成分的重要主成分 ∀其它主成分的贡献率分别为 | qx h ov qu h , , o依次明显减少 ∀
前两个主成分的累积方差贡献率为 {w q{x h o表明前两个主成分已经把仁用杏主要经济性状 {x h的信
息反映出来 o因此可以选取前两个主成分作为仁用杏经济性状选择的综合指标 ∀
表 1 9 个仁用杏品种主要经济性状的调查结果 ≠
Ταβ .1 Ινϖεστιγατιον οφ µαιν εχονοµιχ χηαραχτερσιν 9 ϖαριετιεσ οφ απριχοτ φορ υσινγ νεχλεολυσ
性状
≤«¤µ¤¦·¨µ
统计量
≥·¤·¬¶·¬¦¶
龙王帽
²±ªº¤±ª2
°¤²
一窝蜂
≠¬º²2
©¨ ±ª
白玉扁
¤¬¼∏2
¥¬¤±
北山大扁
¨ ¬¶«¤±2
§¤¥¬¤±
优一
≠²∏¼¬
三杆旗
≥¤±ª¤±2
¬´
红尖嘴
²±ª¬¤±2
½∏¬
二杏扁
∞µ¬¬±ª2
¥¬¤±
干颗
¤±®¨
Ξt单株产果量 mΞ vv q| v| q{ u| qz vs qx v{ qz vy q| vw q{ vu qu vt qy
ƒµ∏¬·¼¬¨ §¯r³¯¤±·k®ªl Σ t qyt t qz| t qx{ u qut t q{u t q|u u qst u qsy u qws
Ξu单果重 mΞ t{ qs tu qt t{ qw ut qu tw qu tu q| tz qy t{ qs ty qx
° µ¨©µ∏¬·º ¬¨ª«·kªl Σ t qz t qs t qu t q{ t qy t q| u qv u qs t qw
Ξv出肉率 mΞ {s qt zy qy zz q{ {u qy z{ qt zx qu z| qx {u qv {t qw
ƒ¯ ¶¨« ³¨µ¦¨±·²©©µ∏¬·k h l Σ u qt v qw v q| u q{ u qw v qv u qy u qw u qv
Ξw出核率 mΞ tz qy us qw tz qv tw qt tz q| ut q{ tz qx tw qv tw qx
≥·²±¨ µ¤·¨ ²©©µ∏¬·k h l Σ s qv s qy t qs s qz s q{ s qy t qw s q| t qs
Ξx核出仁率 mΞ vv qy v| qu vv qw u| qt w{ q{ ws qv vy qv vv qu vv qy
¨µ±¨ ¯µ¤·¨ ²©¶·²±¨ k h l Σ t qu t qs t qt s qv s qx s qy s qw s qz t qs
Ξy干核重 mΞ u qvw t q|{ u qvs u qvx t qzs t qxu t qzy t q{x t qy|
⁄µ¼¬±ª¶·²±¨ ³¨ µ¦¨±·kªl Σ s qu s qtu s qtw s qty s qts s qtt s qt{ s qus s qtz
Ξz干仁重 mΞ s q{w s qy| s qzu s qyy s qzy s qyu s qyx s qyw s qxz
⁄µ¼¬±ª ®¨ µ±¨ ¯ º ¬¨ª«·kªl Σ s qst{ s qstv s qstx s qsty s qstw s qsu s qsty s qsu s qsu
Ξ{单株产仁量 mΞ u qss v qs{ t qy| t quv v qvx v qt| u qus t qxt t qxu
¨µ±¨ ¯ ¼¬¨ §¯r³¯¤±·k®ªl Σ s qsy s qts s qtx s qsy s qs{ s qsw s qtv s qtx s qt{
Ξ|每 ®ª仁需核量 mΞ u qz{ u q{| v qus v qyw u qsx u qw{ u qzx v qst u q|{
≥·²±¨ ¶±¨ §¨¨ §©²µ²±¨ Σ s qsx s qs{ s qs{ s qsz s qsz s qsy s qsx s qsx s qsw
®¬¯²ªµ¤° ®¨ µ±¨ k¯®ªl
≠平均值 mΞ √ µ¨¤ª¨ √¤¯∏¨ q Σ标准差 ≥·¤±§¤µ§ µ¨µ²µq
wx 林 业 科 学 vy卷
表 2 仁用杏前几个主成分的方差
贡献率和累积方差贡献率
Ταβ .2 Απριχοτ φορ υσινγ νυχλεολυσϖαριανχε προπορτιον
ανδ χυµυλατιϖεϖαριανχε προπορτιον οφ τωο πρινχιπαλ χοµ πονεντσ
主成分
°
特征值
∞¬ª¨ ±√¤¯∏¨
贡献率
°µ²³²µ·¬²±
累积贡献率
≤∏°∏¯¤·¬√ k¨ h l
° t y1s{xsz s1yzytt| yz1ytu
° u t1xxtsz s1tzuvwt {w1{wy
° v s1{x{tx s1s|xvxs |w1v{t
° w s1u|s|s s1svuvuu |z1ytv
主成分是原变量的正规化线性组合 o主成分中各性
状载荷值的大小体现了各性状在主成分中的重要程度 ∀
根据各性状相关阵的特征向量k表 vl o可列出前两个主
成分的函数表达式为 }
ψt = s .vzswxx ξt − s .vzyyx| ξu − s .vwts|{ ξv +
s .vwxvzu ξw + s .vyzvuv ξx − s .uxxst ξy + s .sxwtxz ξz +
s .v||zxv ξ{ − s .vxss|| ξ|
ψu = s .sxwtt{ ξt + s .tux{ss ξu − s .tu||{u ξv +
s .tztsvt ξw + s .stu{sz ξx + s .x|wyuv ξy + s .zx{vw| ξz
+ s .sz{||u ξ{ + s .ssxtsw ξ|
表 3 仁用杏主要经济性状相关阵的特征向量 ≠
Ταβ .3 Ειγενϖεχτορσ οφ χορρελατιον µατριξ οφ µαιν εχονοµιχ χηαραχτερσιν απριχοτ φορ νυχλεολυσυσινγ
性状 ≤«¤µ¤¦·¨µ Ξt Ξu Ξv Ξw Ξx Ξy Ξz Ξ{ Ξ|
° t s qvzswxx p s qvzyyx| p s qvwts|{ s qvwxvzu s qvyzvuv p s quxxsts s qsxwtxz s qv||zxv p s qvxss||
° u s qsxwtt{ s qtux{ss p s qtu||{u s qtztsvt s qstu{sz s qx|wyuv s qzx{vw| s qsz{||u s qssxtsw
≠性状同表 t ׫¨ ¦«¤µ¤¦·¨µ¶ ¬¯¶·¨§¤µ¨ ¤¶¬±·¤¥qt q
由表 v看出在第 t主成分中 ,单株产仁量 ξ{ ,单株产果量 ξt ,核出仁率 ξx 和果实出核率 ξw ,w个
性状具有较大的正系数值 , ξu !ξ|和 ξv有较大的负系数值 ,表明第 t主成分主要反映了该品种具有单
株产仁量 !产果量 !核出仁率 !果实出核率均较高的特性 ∀第 t主成分值可视为产仁指标 ∀
第 u主成分中 ,干仁重 ξz和干核重 ξy这两个性状的系数值较大 ,表明第 u主成分主要与干仁重
和干核重有关 ,第 u主成分值较大时 ,核仁重和干核重必较大 ∀第 u主成分可视为仁重指标 ∀
2 q2 优良品种选择
主成分的生物学内涵表明 o上述两个主成分已较好的综合了仁用杏单株产仁量 !产果量 !核出仁
率 !果实出核率 !干仁重和干核重主要经济特性 o其代表性达到 {w q{x h ∀因此 o根据两个主成分值可选
择综合经济性状优良的品种 ∀表 w列出了 |个仁用杏品种重要主成分值 ∀
表 4 9 个仁用杏品种的主成分值
Ταβ .4 Πρινχιπαλ χοµ πονεντ ϖαλυε (ΠΧς )οφ νινεϖαριετιεσ οφ απριχοτ φορ νυχλεολυσ υσινγ
项目
·¨°¶
龙王帽
²±ªº¤±ª2
°¤²
一窝蜂
≠¬º²2
©¨ ±ª
白玉扁
¤¬¼∏2
¥¬¤±
北山大扁
¨ ¬¶«¤±2
§¤¥¬¤±
优一
≠²∏¼¬
三杆旗
≥¤±ª¤±2
¬´
红尖嘴
²±ª¬¤±2
½∏¬
二杏扁
∞µ¬¬±ª2
¥¬¤±
干颗
¤±®¨
第 t主成分值k°≤ ∂ tl p s qztszy u qwz|{s p t qwztu{ p v qzuyzt v quw{yy v qutssx s qtvyss p t qz{|t{ p t qvzyx{
第 u主成分值k°≤ ∂ ul u quvus| s qwvyvz t qsxxyu s quuuss s qwys{{ p s q|s|v{ p s qx||z| p s q|yvss p t q|vxu|
图 t 仁用杏 |个品种两个主成分值散点图
ƒ¬ªqt ≥¦¤··¨µ¨§§²·§¬¤ªµ¤° ²©³µ¬±¦¬³¤¯ ¦²°³¬±¨ ±·¬± ±¬±¨
√¤µ¬¨·¬¨¶²©¤³µ¬¦²·©²µ±∏¦¯ ²¨¯∏¶
¤龙王帽 ²±ªº¤±ª°¤²~¥一窝蜂 ≠¬º²©¨ ±ª~¦白玉扁
¤¬¼∏¥¬¤±~§
北山大扁
¨¬¶«¤±§¤¥¬¤±~¨优一 ≠²∏¼¬~©三杆旗 ≥¤±ª¤±´ ¬~ª红尖
嘴 ²±ª¬¤±½∏¬~«二杏扁 ∞µ¬¬±ª¥¬¤±~¬干颗 ¤±®¨ q
由表 w可见 o在供试的 |个品种中 o产仁指
标k第 t主成分值l较高的品种 o从高向低排序
分别为 }优一kv quxl !三杆旗kv qutl !一窝蜂ku q
w{l o红尖嘴ks qtwl o龙王帽k p s qztl o干颗k p
t qv{l o白玉扁 k p t qwzl o二杏扁k p t qz|l o北
山大扁k p v qzvl ∀
仁重指标k第 u主成分值l较高的品种 o从
高向低的排序分别为龙王帽ku quvl o白玉扁kt q
syl o优一ks qwyl o一窝蜂ks qwwl o北山大扁ks q
uul o红尖嘴k p s qysl o三杆旗k p s q|tl o二杏扁
k p s q|yl o和干颗k p t q|wl ∀
如果将产仁和仁重两个指标同时考虑 o把
第 t主成分值作横坐标 o第 u主成分值为纵坐
标做二维平面图 o根据平面坐标系上的散点图
可知 o优一k l¨ o一窝蜂k¥l o三杆旗k©lv个品种
xx y期 郭宝林等 }主成分分析法在仁用杏品种主要经济性状选种上的应用研究
的产仁指标值较大 o既产仁量较高 o但核仁重指标值中等 ∀这 v个品种为产仁量高 o核仁大小中等或偏
小k三杆旗l的品种 ∀
龙王帽k¤l o白玉扁k¦l两个品种产仁指标值中等或偏低 o但核仁指标值较大 ∀为产仁量中等或偏
小k白玉扁l o核仁较大的品种 ∀
红尖嘴kªl品种产仁指标值和核仁重指标值均中等 o为一般性品种 ∀
二杏扁k«l o干颗k¬l和北山大扁k§lv个品种 o产仁指标值均偏低 o核仁指标也较小 o为产仁量低核
仁较小的品种 ∀
v 讨论
ktl通过主成分分析 o将仁用杏品种的 |个主要经济性状转化为两个主成分 ∀两个主成分提供了
原性状 {x h的信息 o且是综合的 !相互独立的指标 o所以 o将主成分分析用于仁用杏优良品种的选择 o既
能把握品种的综合性状表现 o又能简化选择程序 o较人工打分选优快捷 o且更具有科学性 ∀
kul以 |个仁用杏品种为样本 o确定出仁用杏两个主成分的函数式为 }
ψt = s .vzswxx ξt − s .vzyyx| ξu − s .vwts|{ ξv + s .vwxvzu ξw + s .vyzvuv ξx − s .uxxst ξy +
s .sxwtxz ξz + s .v||zxv ξ{ − s .vxss|| ξ|
ψu = s .sxwtt{ ξt + s .tux{ss ξu − s .tu||{u ξv + s .tztsvt ξw + s .stu{sz ξx + s .x|wyuv ξy +
s1zx{vw| ξz + s .sz{||u ξ{ + s .ssxtsw ξ|
根据主成分函数式 o可计算品种的主成分值 ∀因此 o主成分值可为度量仁用杏品种综合经济性状
指标提供理论依据 ∀
kvl应用主成分分析法 o对 |个仁用杏品种的综合经济性状指标排序 o其结果与品种的实际表型相
近 ∀表明主成分分析在仁用杏优良品种选择及发展杏仁生产上均有较广泛的应用价值 ∀
kwl由于市场因素的可变性 o本文仅从栽培学上确定主要经济性状指标 o而对仁用杏的价格指标未
能考虑 o有待进一步探讨 ∀
参 考 文 献
楚燕杰 o张景宝 q仁用杏丰产栽培 q北京 }中国农业出版社 ot||w ots ∗ ws
裴鑫德 q多元统计分析及其应用 q北京 }北京农业大学出版社 ot||t ot|y ∗ uty
裴喜春 o薛何儒 q≥≥及应用 q北京 }中国农业出版社 ot||{ otx{ ∗ tyv
≤ ≠ q≤ q≥≥ q±¶·¬·∏·¨ ±¦q≥≥ q ¶¨ . ¶∏¬§¨ }≥·¤·¬¶·¬¦¶}≥≥ ±¶·¬·∏·¨ ±¦q ≥ ot|{x
yx 林 业 科 学 vy卷