全 文 :林业科学研究 2015,28(4):464 472
ForestResearch
文章编号:10011498(2015)04046409
药用印楝表型选择的因子分析及综合评价
彭兴民,吴疆罛,王有琼,郑益兴,马李一,张燕平
(中国林业科学研究院资源昆虫研究所,云南 昆明 650224)
收稿日期:20150105
项目基金:国家“十一·五”科技支撑计划项目(2006BAD18B0302);国家“十二·五”科技支撑计划项目(2012BAD21B04)和国家自
然科学基金(31270710)
作者简介:彭兴民(1962—),男,高级工程师主要研究方向:植物引种、种质创新与新品种选育Email:penggong007@21cn.com
摘要:以因子分析和聚类分析作为药用印楝表型选择的分析评价方法,对药用印楝表型选择的分析评价方法进行实
证研究,结果表明:性状间呈显著或极显著相关;特征根>1的4个公因子累计方差贡献率为83.53%,第1、第2、第
3和第4公因子方差贡献率分别为31.33%、22.98%、15.11%和14.10%,种仁质量(0.99511)、种子质量(0.95676)、
种子长(0.78012)、印楝素A+B总含量(0.86667)、印楝素B含量(0.81934)、印楝素 A含量(0.68084)、地径
(0.93904)、株产果实数(0.72282)、印楝素 B与印楝素 A比(-0.83360)是表型选择分析评价中的典型代表变
量;Mantel检测发现,聚类分析能有效的表示33个基因型样株表型性状的相似(异)性(r=0.81,p=1.00);各聚
类群的性状特征概括为:种子印楝素A含量优异类、种子印楝素B含量优异类、种子高印楝素AB含量类、粒大饱满
类、树体大结实多类和无优异特性类;优树的综合评价标准:综合得分≥0.59的为“好”,综合得分为0.59 -0.19
的为“中”,综合得分≤-0.19的为“差”,按此标准,筛选出“好”、“中”、“差”优树各4株、16株、12株。与传统方
法相比,新方法可以更全面、科学、客观、便捷、直观地分析表型选择的综合选择指标,综合评价优树的优劣。
关键词:印楝;表型选择;因子分析;聚类分析;综合评价
中图分类号:S722.5 S759.3 文献标识码:A
FactorAnalysisandComprehensiveAssessmentofPhenotypic
SelectionofOficinalNeemSuperiorTrees
PENGXingmin,WUJiangchong,WANGYouqiong,ZHENGYixing,MALiyi,ZHANGYanping
(ResearchInstituteofResourceInsects,ChineseAcademyofForestry,Kunming 650224,Yunnan,China)
Abstract:Inordertofindanalysisandassessmentmethodsofphenotypicselectionofoficinalneemsuperiortrees,
andtoempiricalyevaluatetheoficinalneemresourcesandtofinalyprovideevidencesandguidanceinoficinal
neembreeding,12characterscorelatedwithqualityandyieldin32primarilyselectedsuperiortreesandcontrol
weretested.Theresultsareasfolows:amongcharacters,atleastonewassignificantlyorextremelysignificantly
corelatedwithanother.Accumulativecontributionrateof4commonfactors(withlatentroot>1)was83.53%,
theircontributionratewas31.33% (thefirstPC,seedshape),22.98% (thesecondPC,azadirachtincontent),
15.11% (thethirdPC,seedyield),14.10% (thefourthPC,ratioofazadirachtiningredient),respectively.And
typicalexampleofvariablesinanalysisandassessmentofphenotypicselectionwere:kernelweight(0.99511),
seedweight(0.95676),seedlength(0.78012),contentofazadirachtinA+B(0.86667),contentofaza
dirachtinB(0.81934),contentofazadirachtinA(0.68084),grounddiameter(0.93904),seedyieldpertree
(0.72282),ratioofazadirachtinBtoA(-0.83360).Manteltestshowedthatclusteranalysiscouldrevealthe
phenotypicdiferencesof33trees(r=0.81,p=1.00).Clustergroupscouldbecategorizedas:typeofhighaza
dirachtincontent,typeoffulsizeofseedsandkernels,typeoflargertreeandhighseedyield,andtypeofnormal.
Criterionofcomprehensiveassessmentofprimarilyselectedsuperiortrees:“Superior”(withscore≥0.59),“Me
第4期 彭兴民等:药用印楝表型选择的因子分析及综合评价
dium”(withscore-0.19 0.59),“Poor”(withscore≤-0.19).Accordingtothiscriterion,primarilyselect
edsuperiortreesweredividedinto4“Superior”,16“Medium”,and12“Poor”trees.Withfactoranalysisand
clusteranalysis,analysisandassessmentofphenotypicselectionofoficinalneemsuperiortreescanbedirectlyand
easilyperformedandjudged,theresultscouldprovideevidencesandguidanceinoficinalneembreeding.
Keywords:neem;oficinalsuperiortrees;phenotypicselection;factoranalysis;comprehensiveassessment
在实现树木良种化的过程中,有2次选择,即从
自然树木到优良类型(表型选择)、再到原种(表型
测定中还有1次再选择),这是从遗传性上解决质的
过程,表型选择的分析及评价是实现树木良种化不
可缺少的重要环节,在树木育种中具有重要的意义。
印楝(AzadirachtaindicaA.Juss.)是5种直接用于加
工农药的植物之一[1],对于全球防治病虫害、保障食
品和环境安全具有重要意义[2]。我国印楝规模化引
种已达十余年,药用印楝遗传改良工作正逐步开
展[3]。研究认为,印楝栽培种群是一个变异的群体,
遗传改良应注重优树变异的选择和利用[4-7]。因
此,研究表型选择的分析评价方法,具有重要的理论
与应用价值。
本课题在对云南12个乡(镇)31个选优样区的
印楝资源进行调查的基础上,以选优林分个体适应
性(病虫害、旱害和冻害)、树体结构(树高、枝下高、
地径和冠幅)、生物产量(单株结实量、种子长、种子
宽、种子粒质量、种仁粒质量和出仁率)和经济产量
(印楝素组分及其含量)等为评价指标,采用传统的
表型选择分析评价方法筛选了一批优树[8];但传统
的表型选择分析评价方法难以完整体现药用印楝表
型选择所包含的属性,需要重新建立一套适合药用
印楝表型选择分析评价的方法。国外,印楝表型性
状在种源、群体水平上的变异已有研究[9-10],但药
用印楝表型选择以及表型选择分析评价方法的建立
等研究均未见报道。因子分析和聚类分析都是多对
象的多元变量分析,目的是进行变量的简化和排序
或分类[11]。在植物领域,因子分析和聚类分析已广
泛应用于植株或品种间数量性状,尤其是品质性状
的分析评价[12-17]。本研究在前期工作的基础上,以
32株药用印楝初选优树及对照的12个品质和产量
相关性状为研究对象,采用因子分析和聚类分析构
建新的药用印楝表型选择分析评价体系,对所建立
的药用印楝表型选择分析评价方法进行实证研究,
旨在重新建立一套适合药用印楝表型选择的分析评
价方法,并在理论和实践上为分析评价药用印楝资
源和指导药用印楝育种提供新的思路和方法。
1 材料与方法
1.1 试验材料
在印楝云南分布区进行药用优树选择,采用对
比木法选出233株药用候选树,其中,印楝素总含量
(azAB)>0.80%的候选树 32株,为初选优树[8]。
选优样区位于23°06′ 25°51′N,101°52′ 03°11′E,
海拔197 1325m,年平均气温218 245℃,年
平均降水量634 8051mm。选优林分造林地均
为宜林荒山,土壤为燥红土,零星种植,株行距4m
×4m,面积一般不少于10hm2,树龄5 7a。初选
优树所在林分的平均木的总体平均值为对照(CK)。
初选优树的名称见表1。
1.2 测定项目与方法
12个品质和产量相关性状是在前文[6]基础上
选取的。用游标卡尺量测地径(Dz)。株产果实数
(Gss)的估测方法:在东、西两面树冠的上、中、下3
个位置各选3个能代表结果状况的样枝,统计果实
数,计算平均每个样枝的果实数,统计植株的结果
枝数。
株产果实数=结果枝数×样枝果实数
果实成熟中期,8:00—12:00在树冠南面的中
部采样,分株采收、存放,约 500粒·株 -1,过熟果
(果皮变黄)不采,只采青色果,采下青色果存放 2
d,拣变黄变软的果实,除去青色、硬果,人工清洗,
自然风干,保存于冰箱冷藏室(4℃左右)待用。采
用GB/T35437—1995的百粒四分法随机抽取30粒
种子,用游标卡尺测量种子长(Sl)、种子宽(Sw),测
量精度0.01cm,计算种子宽长比(Swl);用1/10000
天平称量种子粒质量(St)和种仁粒质量(Kt),称量
精度为0.01g,计算出仁率(KSt)。用宗乾收等[18]
提出的“印楝种仁中印楝素含量的快速液相色谱分
析”法分析种子印楝素 A含量(azA)和印楝素 B含
量(azB),计算印楝素 A+印楝素 B总含量(azAB)
和印楝素B与印楝素 A比(azBA)。性状检测人员
和检测仪器固定。
1.3 数据处理
首先采用MicrosoftOficeExce12003软件对原始
564
林 业 科 学 研 究 第28卷
数据进行描述统计和隶属函数法(公式1)转换[16];转
换后的数据采用SAS9.0systemforwindows(SASIn
stituteInc.,Cary,NC,USA.)软件进行相关分析和
因子分析[19]。因子分析提取公因子的方法为迭代主
因子法,正交方差最大旋转,得到各公因子的特征值、
贡献率Ej、累计贡献率以及因子载荷阵、公因子分值
Fjn;综合评价指标得分Dn的计算以相应公因子的贡
献率Ej为权重,通过对各因子得分值Fjn进行加权得
到(公式2)。
Uin =
Xin-Ximin
Ximax-Ximin
(1)
Dn =∑
m
j=1
Fjn×Ej (2)
式中:Uin指第n个性状第i个指标的原始数据
经转换后的隶属函数值;Xin指第n个性状第i个指
标的原始测定结果;Ximax和Ximin分别指性状组中第i
个指标的最大和最小值;Dn为因子分析法得到的各
性状的综合分值;Fjn为第n个性状第j个特征根 >
1的公因子的分值;m为特征根 >1的公因子的个
数;Ej为第j个公因子的方差贡献率。
以提取公因子值为指标,采用 NTSYSPC2.11e
软件(AppliedBiostatisticsInc.,Setauket,USA)计算
DIST距离系数,并用 UPGMA聚类算法进行系统聚
类[20],最后用 Mantel检测分析33个基因型样株提
取公因子综合得分的空间距离和距离矩阵间的同表
象相关性,以验证聚类是否能有效表示33个基因型
样株表型性状的相似(异)性。
2 结果与分析
2.1 优树表型性状测定与结果分析
32株印楝药用初选优树及对照(CK)表型性状
的测定结果(表1)显示:与对照相比,初选优树在印
表1 初选优树表型性状测定结果
优树
编号 名称
性状
azA/% azB/% azAB/% azBA Sl/cm Sw/cm Swl St/g Kt/g KSt/g Gss/粒 Dz/cm
1 Ww0401 0.78 0.20 0.97 0.25 1.39 0.59 0.43 0.16 0.08 0.4823 2650 11.80
2 Ww0402 0.71 0.20 0.91 0.28 1.15 0.60 0.52 0.13 0.07 0.4909 2760 12.30
3 Ww0410 0.65 0.16 0.82 0.25 1.32 0.61 0.47 0.17 0.08 0.475 3980 15.20
4 Ww0411 0.68 0.17 0.85 0.25 1.29 0.58 0.45 0.14 0.07 0.4579 3690 14.90
5 Ww0418 0.70 0.19 0.89 0.26 1.34 0.63 0.47 0.16 0.07 0.4592 3400 11.60
6 Ww0421 0.64 0.29 0.93 0.46 1.26 0.65 0.52 0.14 0.06 0.4454 2170 11.00
7 Wx0416 0.65 0.19 0.85 0.30 1.60 0.77 0.48 0.25 0.13 0.5081 5500 19.60
8 Wx0423 0.72 0.18 0.90 0.25 1.69 0.66 0.39 0.24 0.12 0.5083 5200 18.30
9 Nms0503 0.63 0.18 0.81 0.29 1.48 0.70 0.47 0.22 0.12 0.5179 2900 13.60
10 Nms0505 0.69 0.17 0.86 0.25 1.31 0.71 0.54 0.19 0.10 0.513 2980 13.70
11 Nms0506 0.69 0.18 0.87 0.26 1.22 0.66 0.54 0.19 0.09 0.492 3280 14.20
12 Nms0509 0.71 0.20 0.90 0.28 1.41 0.64 0.45 0.21 0.11 0.5266 3540 13.80
13 Zz0501 0.65 0.17 0.82 0.26 1.29 0.64 0.50 0.13 0.06 0.4815 8520 18.50
14 Ld0501 0.63 0.21 0.84 0.34 1.18 0.64 0.54 0.13 0.06 0.4463 7520 23.00
15 Ld0502 0.61 0.18 0.79 0.30 1.38 0.71 0.51 0.23 0.12 0.5221 6780 24.00
16 Ld0505 0.85 0.24 1.09 0.28 1.48 0.65 0.44 0.17 0.08 0.4558 6050 20.50
17 Ld0507 0.70 0.15 0.84 0.21 1.24 0.63 0.50 0.14 0.07 0.4601 5100 14.50
18 Ld0509 0.72 0.18 0.90 0.25 1.38 0.71 0.51 0.18 0.08 0.456 4600 16.10
19 Ld0510 0.65 0.20 0.85 0.31 1.66 0.67 0.40 0.29 0.13 0.4542 5020 16.60
20 Ld0511 0.70 0.22 0.92 0.32 1.48 0.68 0.46 0.14 0.07 0.4624 5280 17.80
21 Ld0513 0.69 0.17 0.87 0.25 1.27 0.66 0.52 0.15 0.07 0.4645 5110 18.40
22 At0515 0.68 0.27 0.94 0.39 1.29 0.57 0.45 0.12 0.05 0.4384 4500 17.90
23 At0516 0.73 0.17 0.90 0.23 1.30 0.58 0.45 0.13 0.06 0.4666 4310 14.50
24 At0517 0.68 0.17 0.85 0.25 1.48 0.60 0.41 0.18 0.10 0.5398 3780 14.60
25 At0518 0.64 0.19 0.83 0.30 1.44 0.66 0.46 0.21 0.10 0.4976 3200 16.40
26 Dhg0504 0.66 0.17 0.83 0.26 1.19 0.57 0.48 0.13 0.06 0.4774 6500 16.10
27 Dhg0506 0.67 0.16 0.83 0.24 1.20 0.63 0.61 0.18 0.09 0.4789 7500 17.20
28 Dhg0507 0.73 0.22 0.95 0.30 1.33 0.60 0.46 0.16 0.08 0.4805 6400 16.70
29 Dhg0510 0.70 0.20 0.90 0.29 1.17 0.61 0.53 0.13 0.06 0.4705 8200 24.10
30 Ld0612 0.64 0.17 0.81 0.27 1.14 0.59 0.52 0.09 0.03 0.3471 5850 19.00
31 Ld0642 0.64 0.15 0.79 0.24 1.15 0.65 0.57 0.14 0.08 0.5207 5900 23.00
32 Ww0603 0.63 0.17 0.80 0.26 1.21 0.67 0.56 0.13 0.07 0.4834 2110 13.50
33 CK 0.47 0.14 0.61 0.29 1.39 0.67 0.48 0.22 0.10 0.4545 2335 14.4
注:azA,印楝素A含量(%);azB,印楝素B含量(%);azAB,印楝素A+B总含量(%);azBA,印楝素B比印楝素A;Sl,种子长(cm);
Sw,种子宽(cm);Swl,种子宽长比;St,种子粒质量(g);Kt,种仁粒质量(g);KSt,出仁率(%);Gss,株产果实数(粒);Dz,地径(cm)。
664
第4期 彭兴民等:药用印楝表型选择的因子分析及综合评价
楝素组分含量和树体结实量方面表现较好,而在种
子(仁)形态(大小、质量)方面则表现一般,说明32
株印楝药用初选优树在各项表型指标中表现出不同
程度的优良特性,对上述初选优树进行选优,必须依
据样品在12项表型指标中的综合表现。根据药用
印楝的特性和选优目标,在表型选择时各表型指标
的衡量标准不同:印楝素 A、B含量越高越好,含量
越高,表明品质越好;种子(仁)越大越好、质量越重
越好,种子(仁)大、重,表明种子(仁)粒大饱满,产
量高;树体和地径越大越好,树体和地径大小与产量
呈正相关,树体和地径大表明产量高。另外,不同指
标的计量单位或量纲不同,数据数量级也不一致,不
便于进行数据的分析,因此,在进行数据分析时需对
原始数据进行转化。
2.2 优树性状变异的相关性
经隶属函数法转换的数据进行简单相关性分
析,相关系数矩阵见表2。从表2可以看出:12个性
状都至少与一个其它性状呈显著或极显著相关,其
中,印楝素A和印楝素B与印楝素AB总含量、种子
长和种子宽与种子质量和种仁质量、种子质量与种
仁质量、地径与株产果实数,均达到极显著水平,呈
极显著正相关,结果表明,各表型性状彼此相关,并
不独立,表明印楝药用优树表型是一个复杂的综合
评价指标,有必要对其使用因子分析。
表2 初选优树性状的简单相关系数矩阵
azA azB azAB azBA Sl Sw Swl St Kt KSt Gss Dz
azA 1.00000 NS NS NS NS NS NS NS NS NS NS
azB 0.33829 1.00000 NS NS NS NS NS NS NS NS
azAB 0.92076 0.67444 1.00000 NS NS NS NS NS NS NS NS NS
azBA-0.21452 0.84106 0.17950 1.00000 NS NS NS NS NS NS NS NS
Sl 0.11164 0.11658 0.14305 0.06621 1.00000 NS NS NS
Sw -0.24737-0.09076-0.21213 0.07918 0.46296 1.00000 NS NS NS NS
Swl-0.27682-0.21413-0.29897-0.05044-0.74728 0.17003 1.00000 NS NS NS NS
St -0.18144-0.12299-0.18549-0.00762 0.79155 0.62989-0.37080 1.00000 NS NS
Kt -0.14706-0.18658-0.18615-0.09084 0.74786 0.64508-0.31132 0.96002 1.00000 NS NS
KSt 0.03535-0.21163-0.05905-0.22952 0.31935 0.34035-0.08736 0.48600 0.67377 1.00000 NS NS
Gss 0.10432-0.05388 0.06809-0.08737-0.14752-0.06873 0.20398-0.16053-0.17686-0.13145 1.00000
Dz -0.05572-0.02366-0.04044 0.04089-0.04581 0.16436 0.20011 0.01526-0.01118-0.04479 0.804751.00000
注:r0.05(32)=0.349;r0.01(32)=0.449。、分别表示在5%和1%水平显著性;NS表示差异不显著。
2.3 影响优树间性状差异的因子数及其解释
迭代主因子分析12项指标的前4个公因子(特
征根 >1)、方差贡献率 Ej、累计方差贡献率和因子
载荷矩阵见表3。从表3可以看出:前4个综合指标
或公因子的累计贡献率达83.53%,即这4个公因子
所含信息占总体信息的83.53%,表明前4个综合指
标能代表12个单项指标的绝大部分信息,且具有较
明显的生物学意义,可以分别用这4个公因子对33
样株表型选择指标进行概括分析评价。第1公因子
(PC1)贡献率为31.33%,决定第1公因子大小的主
要是种仁质量(Kt)、种子质量(St)和种子长(Sl),其
特征向量所凝聚的生物学信息主要是种子形态因素
或产量组分;其向量间的关系表明,种子粒大饱满,
产量高。第2公因子(PC2)贡献率为22.98%,决定
第2公因子大小的主要是印楝素总含量(azAB)、印
楝素B含量(azB)和印楝素A含量(azA),其特征向
量所揭示的生物学信息主要是印楝素组分及其含量
构成因子;其向量间关系表明,种子印楝素 A含量
(azA)、印楝素 B含量(azB)和印楝素 A+印楝素 B
总含量(azAB)高,种子品质好。第3公因子(PC3)
贡献率 15.11%,决定第 3公因子大小的是地径
(Dz)和株产果实数(Gss),其特征向量所凝聚的生
物学信息主要是树体结实量因子;其向量间关系表
明,株产果越多,产量越高,而地径(Dz)大小与产量
高低正相关,地径(Dz)越大,产量越高。第4公因
子贡献率14.10%,决定第4公因子(PC4)大小的主
要是印楝素B含量与印楝素A含量比(azBA),其特
征向量所凝聚的生物学信息主要是印楝素B含量与
印楝素A含量比率关系,其大小反映印楝素组分的
变化,为印楝素组分比因子。第1和第3公因子都
与产量相关,可以大致概括为产量因子;第2、第4公
因子都与品质相关,可以大致概括为种子品质性状
因子。
从以上结果可以看出:因子分析可获得33样株
764
林 业 科 学 研 究 第28卷
的相关矩阵的特征值、贡献率 Ej、累计贡献率、因子
载荷阵,能探求并解释影响药用印楝表型选择分析
评价的关键因子,验证表明,因子分析用于药用印楝
表型选择分析可行。因此,药用印楝表型选择适合
使用因子分析进行分析。
表3 影响初选优树间性状差异的因子数及其解释
性状和指标
因子
第1公因子 第2公因子 第3公因子 第4公因子
变量共同度
azA -0.23289 0.68084 -0.04432 0.64617 0.91430943
azB -0.25582 0.81934 0.21497 -0.43519 0.96569675
azAB -0.28028 0.86667 0.06740 0.33317 0.92204236
azBA -0.11837 0.45862 0.29341 -0.83360 0.96761807
Sl 0.78012 0.44650 0.08242 0.06597 0.86663265
Sw 0.59979 -0.08907 0.24524 -0.13770 0.64578285
Swl -0.33247 -0.50065 0.13835 -0.11224 0.60087289
St 0.95676 0.10126 0.11986 -0.03392 0.91570656
Kt 0.99511 0.05770 0.09689 0.05257 0.95332130
KSt 0.53978 -0.01387 -0.02581 0.18711 0.48923572
Gss -0.25070 -0.15713 0.72282 0.30801 0.88352309
Dz -0.08845 -0.20141 0.93904 0.18034 0.89865302
特征值 3.75941799 2.75803724 1.81346141 1.69247812
贡献率/% 31.33 22.98 15.11 14.10
累计贡献率/% 31.33 54.31 69.42 83.53
注:性状同表1。
2.4 各优树的因子得分及排名
因子分析还能获得各公因子分值 Fjn。根据各
公因子分值Fjn可对33样株在每个公因子上进行排
序。33样株在每个公因子上的得分和排序情况(表
4)表明:33样株在 4个公因子上的得分和排序不
一致。
以上结果显示:因子分析可对33样株在每个公
因子上进行排序。因此,表型选择适合使用因子分
析进行评价;但各优树在4个公因子上的得分和排
序不一致,表明用单个公因子评价药用印楝优树会
得出不同甚至相反的结论。因此,必须进行综合
评价。
2.5 各优树的分布
为探明各优树在4个公因子中的分布则需作聚
类分析。以33样株的4个公因子值为指标,进行系
统聚类分析,聚类结果见图1。图1反映了优树间的
相似性关系,欧式平均距离为2.224 0176。按欧
式平均距离1.712的阈值把33个基因型聚为4类:
即由Ww0421、Ld0505和 CK3株自成体系的个类
(Ⅰ类、Ⅱ类和Ⅳ类)和由其余30株优树聚成的Ⅲ
类。按欧式平均距离1.200的阈值把Ⅲ类分为4个
亚类:Wx0416、Wx0423、Ld0502、Ld0510组成Ⅲ1亚
类,Ld0511、At0515、Dhg0507组 成 Ⅲ2亚 类,
Zz0501、Dhg0506、Ld0642、Ld0501、Dhg0510、Ld0612
组成Ⅲ4亚类,其余17株优树组成Ⅲ3亚类。除分
“类”和“亚类”外,还可按欧式平均距离0.688的阈
值把各亚类分为次亚类,从次亚类中找出具有优异
特性的单株。
Mantel检测发现:表象相关系数r=0.81,p=
1.00,表明33样株综合得分的 DIST距离系数的空
间距离和距离矩阵间全相关,聚类分析能有效的表
示33样株表型性状的相似(异)性。各聚类群的性
状特征概括为:Ⅰ类(Ww0421)和Ⅱ类(Ld0505)分
别为种子印楝素B含量、印楝素A含量优异类,Ⅲ1
亚类为粒大饱满类,Ⅲ2亚类为高印楝素总含量
(azAB)类,Ⅲ3亚类为树大结实多类,而Ⅲ4亚类
与Ⅳ类(对照)同类,为无优异特性类(表5)。
聚类分析可以直观地揭示各印楝药用优树间表
型性状差异状况,能更具直观、简便地区分出各优树
自然类型分类的特点;所以,药用印楝表型选择的分
析与评价适合使用聚类分析。
2.6 优树的综合评价
以33样株因子分析相应公因子的贡献率 Ej为
权重,通过对各因子得分值Fjn进行加权得到综合评
价指标得分 Dn(公式2),并按综合得分进行排序
(表4)。根据33样株的分布(图1)及其综合得分
(表4),可计算出各聚类样株的平均综合得分(表
5)。各类群平均综合得分值大小或综合表现排序:
Ⅱ类>Ⅲ1类>Ⅲ2类>Ⅰ类>Ⅲ3类>Ⅲ4类>
864
第4期 彭兴民等:药用印楝表型选择的因子分析及综合评价
表4 各初选优树因子得分及排名
优树
编号 名称
因子
第1公因子
得分 排名
第2公因子
得分 排名
第4公因子
得分 排名
第4公因子
得分 排名
综合评价
得分 排名
1 Ww0401 -0.19856 17 1.74446 2 -0.49340 22 -1.36943 32 0.07103 15
2 Ww0402 -0.96120 30 0.29464 11 -0.14446 16 -1.12176 29 -0.41343 29
3 Ww0410 -0.18411 15 -0.25096 19 -0.72743 28 -0.59828 22 -0.30962 25
4 Ww0411 -0.69442 25 0.27118 12 -0.65073 26 -0.80947 25 -0.36771 27
5 Ww0418 -0.38315 19 0.40823 10 -0.19585 17 -1.12869 30 -0.21497 22
6 Ww0421 -0.75685 26 -0.53519 25 3.59269 1 -1.40004 33 -0.01466 16
7 Wx0416 2.20526 1 -0.45358 24 0.56450 7 0.94979 8 0.80589 3
8 Wx0423 1.85786 3 1.21008 3 -0.47997 21 0.25776 13 0.82396 2
9 Nms0503 1.37588 5 -0.67143 26 0.06407 13 -0.88996 27 0.16097 9
10 Nms0505 0.52856 10 -0.38745 23 -0.63069 25 -0.56178 21 -0.09795 18
11 Nms0506 -0.02621 14 -0.27938 21 -0.42196 20 -0.52979 20 -0.21087 21
12 Nms0509 0.89539 6 0.66391 6 -0.13211 15 -0.74668 24 0.30785 8
13 Zz0501 -0.50775 22 -0.27853 20 -0.51788 24 1.26414 5 -0.12309 19
14 Ld0501 -0.83402 28 -0.82517 29 1.15702 3 1.74035 3 -0.03071 17
15 Ld0502 1.45012 4 -1.09203 31 0.22704 10 1.77526 2 0.48799 5
16 Ld0505 0.27729 11 2.73818 1 0.61652 6 1.15493 6 0.97211 1
17 Ld0507 -0.68760 24 0.06619 16 -1.36072 33 -0.20811 18 -0.43516 30
18 Ld0509 0.21976 12 0.21800 14 -0.23089 18 0.19033 14 0.11090 12
19 Ld0510 1.99616 2 0.13456 15 0.84578 5 -0.07451 16 0.77361 4
20 Ld0511 0.12575 13 0.54602 9 1.06173 4 0.39603 12 0.38114 6
21 Ld0513 -0.39223 21 -0.08704 18 -0.49446 23 0.49949 9 -0.14717 20
22 At0515 -1.05235 32 0.61514 8 2.36664 2 -0.11936 17 0.15243 11
23 At0516 -0.83324 27 0.97502 5 -1.00860 31 -0.61775 23 -0.27650 24
24 At0517 0.72470 8 0.64016 7 -0.94370 29 -0.85654 26 0.11079 13
25 At0518 0.84412 7 -0.38198 22 0.33321 9 -0.52078 19 0.15360 10
26 Dhg0504 -1.00410 31 -0.02375 17 -0.70325 27 0.15271 15 -0.40477 28
27 Dhg0506 -0.39012 20 -0.69089 27 -0.96557 30 1.11390 7 -0.26983 23
28 Dhg0507 -0.19310 16 1.13475 4 0.41378 8 0.41174 11 0.32084 7
29 Dhg0510 -0.86684 29 0.25846 13 0.15486 12 2.09777 1 0.10700 14
30 Ld0612 -2.18407 33 -0.76809 28 0.16117 11 0.47686 10 -0.76919 33
31 Ld0642 -0.34383 18 -1.01828 30 -1.11506 32 1.38549 4 -0.31485 26
32 Ww0603 -0.64613 23 -1.19154 32 -0.38388 19 -1.01081 28 -0.67678 31
33 CK 0.63902 9 -2.98371 33 0.04158 14 -1.30282 31 -0.66287 32
CK类。由各类群样株综合得分的变幅看出:类群间
样株并没有完全按综合得分大小分布,表明各类群
的平均综合得分并不能作为优树实际表现的分类标
准,若按优树的实际表现进行分类,还需进行再
选择。
表5 各聚类群性状的平均值及综合得分
性状 Ⅰ Ⅱ
Ⅲ
Ⅲ1 Ⅲ2 Ⅲ3 Ⅲ4
Ⅳ(CK)
azA/% 0.64 0.85 0.66 0.70 0.66 0.69 0.47
azB/% 0.29 0.24 0.19 0.24 0.18 0.18 0.14
azAB/% 0.93 1.09 0.85 0.94 0.83 0.86 0.61
Sl/cm 1.26 1.48 1.58 1.37 1.19 1.32 1.39
Sw/cm 0.65 0.65 0.70 0.62 0.63 0.64 0.67
St/g 0.14 0.17 0.25 0.14 0.13 0.17 0.22
Kt/g 0.06 0.08 0.13 0.07 0.06 0.08 0.10
Gss/粒 2170.00 6050.00 5625.00 5393.00 7248.00 3758.24 2335.00
Dz/cm 11.00 20.50 19.63 17.47 20.80 14.42 14.40
综合得分 -0.01 0.97 0.82 0.49 0.38 0.15 0.31 -0.68 0.11 -0.77 -0.66
平均综合得分 -0.01 0.97 0.72 0.28 -0.16 -0.23 -0.66
注:性状同表1。
964
林 业 科 学 研 究 第28卷
图1 32株药用印楝初选优树及对照的UPGMA聚类图(Mantel检测,r=0.81,p=1.00)
Ⅱ类群(Ld0505)、Ⅲ1类群(Wx0416、Wx0423、
Ld0502、Ld0510)和 Ⅲ2类群 (Ld0511、At0515、
Dhg0507)8株综合排名均名列前茅,性状表现好,其
余25株综合排名居后,性状表现较差。分别计算性
状表现好的8株和性状表现较差的25株的平均综
合得分,以此制定32株优树表型选择的综合评价标
准:综合得分≥0.59的为“好”,综合得分为0.59
-0.19的为“中”,综合得分≤ -0.19的为“差”。
按此标准,可筛选出表型选择“好”、“中”、“差”的各
类优树(表 6)。由各类群的综合得分变幅可以看
出:类群间优树综合得分按大小分布,表明按此标准
进行分类能完全反映各优树的实际表现。
综合评价结果表明:因子分析结合聚类分析可
计算出各聚类群优树的平均综合得分,以此制定药
用印楝表型选择的综合评价标准,对优树作出综合
评价。因此,表型选择适合使用因子分析和聚类分
析进行综合评价。
表6 32株印楝药用初选优树综合评价
综合评价 综合得分 平均综合得分 样本量 样本分布情况
好 ≥0.59
0.60
0.97 0.77
4 Ld0505、Wx0416、Wx0423、Ld0510
中 0.59 -0.19
0.12
0.49 -0.15
16
Ld0502、Ld0511、At0515、Dhg0507、Ww0421、Ww0401、Nms0503、Nms0505、
Nms0509、Ld0509、At0517、At0518、Ld0501、Dhg0510、Ld0513、Zz0501
差 ≤-0.19
-0.41
-0.211 -0.77
13
Ww0402、Ww0410、Ww0411、Ww0418、Nms0506、Ld0507、At0516、Dhg0504、
Ww0603、Dhg0506、Ld0642、Ld0612、CK
注:平均综合得分值列各行下排为综合得分值。
3 小结与讨论
3.1 表型选择分析评价方法的构建
印楝株产果实数、地径、树高、印楝素 A、B总含
量、印楝素A含量及印楝素 B含量等6个表型性状
是造成表型差异的主要表型性状[6];因此,本研究主
要从种子品质与产量的角度对表型选择进行分析评
价。本研究12个性状都至少与一个其它性状呈显
著或极显著相关,表明药用印楝优树表型是一个复
杂的综合评价指标,表型选择分析评价实质上是一
个多目标的多元统计分析问题。定性描述、描述统
计、单变量分析和专家打分等是过去表型选择分析
074
第4期 彭兴民等:药用印楝表型选择的因子分析及综合评价
评价普遍采用的方法。彼此相关的指标采用上述传
统分析评价方法进行分析评价,会导致各单项指标
提供的信息发生重叠,不易得出简明的规律,不仅增
加了分析问题的难度,而且会歪曲研究对象间的真
实差异[15,20]。前期研究[8]也表明,采用 t检验方法
进行表型选择的分析评价,只能对优树与对比木间
差异进行比较,获得比对比木优良的单株,但入选单
株(或优树)间的差异不能深入探究,难以完整体现
药用印楝表型选择所包含的属性。综上,传统分析
评价方法的视角单一,技术手段的科学性、客观性受
到质疑,也较繁琐,所获结果是初步的,且不够直观。
因此,上述传统分析评价方法不适于做表型选择的
深入分析及评价。
多目标的多元统计分析进行变量的简化和排序
或分类,基本方法有二,方法之一是推导变量的线性
组合以概括原始数据集中的差异(R方式分析法),
也就是基于从变量或对象间相关矩阵中抽取的特征
向量和特征值进行变量的简化和排序;另一种方法
是根据对象间不相似测度的方法(Q方式分析法),
也就是基于对象间相似性或不相似性直接对对象进
行简化和分类。基于从变量或对象间相关矩阵中抽
取的特征向量和特征值的方法很多,目前主要采用
主成分分析(PCA)。主成分分析采用的分析方法相
对来说比较简单和粗糙,而因子分析采用的分析方
法更加精细和深入[21]。因子分析是基于从变量或
对象间相关矩阵中抽取的特征向量和特征值进行变
量的简化和排序,目的或结果是排序;聚类分析是根
据对象间不相似测度进行变量的简化和分类,目的
或结果是分类。结果展示上,因子分析有“序”无
“类”,而聚类分析则是有“类”无“序”,两种分析结
合能进行变量的简化和排序或分类。基于上述认
识,本研究采用因子分析和聚类分析构建新的药用
印楝表型选择分析评价体系。
3.2 新建表型选择分析评价方法的实证研究
原始数据直接用于分析或不同转换方法对分析
结果有较大影响[14,16]。本研究不同指标的计量单
位(量纲)不同,数据数量级也不一致。因此,在使
用因子分析进行分析评价时必须对原始数据作规范
化处理,即区分评价指标的类型和评价指标的无量
纲化处理。评价指标包括4种基本类型,不同指标
类型数据有各自的转换公式[22]。本研究指标类型
为正相关型指标,故采用正相关型指标转换公式(隶
属函数法)进行转换。
考察原始变量之间的相关性是因子分析的首要
步骤,如果各变量之间是独立的,那么可能不适合使
用因子分析[19]。为此,对经隶属函数法转化的数据
进行相关分析就成为因子分析的首要步骤。本研究
的各表型性状彼此相关,故适合使用因子分析。如
何构造因子变量和对因子变量进行命名解释,是因
子分析的两个核心问题[19]。提取特征根>1的公因
子,获得相关矩阵的累计贡献率、因子载荷阵等值。
根据累积方差贡献率阈值确认提取公因子的数目,
即累积方差贡献率85%阈值来决定,方差贡献率越
大,因子分析越有意义;因子载荷是第i个变量与第j
个因子之间的相关系数,反映了第i个变量在第j个
因子上的重要性,根据因子载荷大小确认因子的典
型代表变量,因子的典型代表变量突出,即每个原始
变量仅在一个公因子上有较大的载荷,而在其余的
公因子上的载荷比较小。本研究提取到种子形态、
印楝素组分及其含量、印楝素组分比和树体结实量
4个公因子,所含信息占总体信息的83.53%,表明
前4个综合指标能代表12个单项指标的绝大部分
信息,可以分别用这4个公因子对33样株表型选择
进行概括分析评价。
本研究表明,因子分析还能获得33样株各公因
子分值Fjn和公因子的贡献率Ej,根据各公因子分值
Fjn可对33样株在每个公因子上进行排序;以相应
公因子的贡献率Ej为权重,通过对各因子得分值Fjn
进行加权得到综合评价指标得分Dn(公式2),并按
综合得分进行排序;以4个公因子值为指标,进行
UPGMA系统聚类分析,获聚类图,可探明各样株在
4个公因子中的分布。由各类群样株综合得分,分
别计算性状表现好的8株和性状表现较差的25株
的平均综合得分,以此制定32株优树表型选择的综
合评价标准。按此标准,可筛选出表型选择“好”、
“中”、“差”的各类优树。
聚类中引入公因子的目的是用尽可能少的公因
子说明生物学的大部分信息,减少统计的复杂
性[23]。聚类分析能直观地揭示研究对象在各公因
子中的分布情况,但由于各公因子在因子分析时的
方差贡献率不同,所以在实际应用时,还要结合因子
贡献率,协调好各公因子之间的侧重关系。以往研
究,无聚类矩阵间的相关性检验;但按聚类分析程序
要求,尚需再作Mantel检测,以验证聚类的代表性;
所以,无Mantel检测的聚类分析是不全面或不彻底
的。本研究为验证聚类的代表性,进行了 Mantel检
174
林 业 科 学 研 究 第28卷
测,发现33样株综合得分的 DIST距离系数的空间
距离和距离矩阵间全相关(r=0.81,p=100),表
明聚类分析能有效的表示33样株表型性状的相似
(异)性。
因子分析使各样株有“序”或被“定量”,聚类分
析使各样株有“类”或被“定性”。由“定量”到“定
性”、再到“定量”,“定量”与“定性”结合,互为补
充,保证了分析与综合评价的科学、客观、全面。与
传统的表型选择分析评价方法相比,新的表型选择
分析评价方法视角更全面,技术手段更科学、客观、
便捷,结果更直观。
参考文献:
[1]TomilinCD.ThePesticideManual.12nded.[M].UK:Surey,
BritishCropProtectionCouncil,2000.
[2]NationalRC.NeemATreeforSolvingGlobalProblems[M].
WashingtonDC:NationalAcademyPress,1992.
[3]彭兴民,吴疆罛,郑益兴,等.印楝属(AzadirachtaA.Juss.)植物
分类及分布的研究现状[J].植物遗传资源学报,2012,13(4):
583-588.
[4]KaushikN,SinghBG,TomarUK,etal.Regionalandhabitatvar
iabilityinazadirachtincontentofIndianneem(Azadirachtaindica
A.Jusieu)[J].CurentScience,2007,92(10):1400-1406.
[5]吴疆罛.印楝繁育系统的研究[D].北京:中国林业科学研究
院,2007.
[6]彭兴民,吴疆罛,郑益兴,等.云南引种印楝实生种群的表型变
异[J].植物生态学报,2012,36(6):560-571.
[7]彭兴民,吴疆罛,郑益兴,等.云南引种印楝实生栽培种群表型
的地理变异[J].林业科学研究,2013,26(4):399-405.
[8]彭兴民,吴疆罛,程金焕,等.印楝农药原料林优树选择方法与
标准[J].福建林学院学报,2010,30(3):265-269.
[9]SidhuOP,KumarV,BehlHM.VariabilityinNeem(Azadirchta
indica)withrespecttoazadirchtincontent[J].JAgriFoodChem,
2003,51(4):910-915.
[10]TomarUK,SinghG,KaushikN.ScreeningAzadirachtaindica
treeforenhancingazadirachtinandoilcontentsindryareasofGu
jarat[J].JournalofForestryResearch,2011,22(2):217-224.
[11]QuinnGP,KeoughMJ.生物实验设计与数据分析[M].蒋志
刚,李春旺,曾 岩,译.北京:高等教育出版社,2003.
[12]TanYF,CorkeH.Factoranalysisofphysicochemicalpropertiesof
63ricevarieties[J].JournaloftheScienceofFoodandAgricul
ture,2002,82(7):745-752.
[13]TokerC,CagirganMI.Theuseofphenotypiccorelationsandfac
toranalysisindeterminingcharactersforgrainyieldselectionin
chickpea(CicerarietinumL.)[J].Hereditas,2004,140(3):226
-228.
[14]KurtanjekZ,HorvatD,MagdicD,etal.Factoranalysisandmod
elingforrapidqualityassessmentofcroatianwheatcultivarswith
diferentglutencharacteristics[J].FoodTechnologyandBiotech
nology,2008,46(3):270-277.
[15]敖 妍.因子分析法在文冠果优良单株选择中的应用[J].华
南农业大学学报,2009,30(4):70-73.
[16]马庆华,李永红,梁丽松,等.冬枣优良单株果实品质的因子分
析与综合评价[J].中国农业科学,2010,43(12):2491-2499.
[17]康立宁,田志刚,刘香英,等.大豆组织蛋白产品品质的因子分
析和综合评价研究[J].吉林农业科学,2012,37(2):45-48.
[18]宗乾收,林 军,武永昆,等.印楝种仁中印楝素含量的快速
液相色谱分析[J].农药,2003,42(4):23-24.
[19]阮 敬.SAS统计分析从入门到精通[M].北京:人民邮电出
版社出版,2009.
[20]汤飞宇,程 锦,黄文新,等.高品质陆地棉数量性状的因子分
析及品种聚类分析[J].江西农业大学学报,2008,30(6):1014
-1018.
[21]柳伟伟,胡良平.主成分分析与探索性因子分析的SAS软件实
现[J].中西医结合学报,2010,8(6):589-593.
[22]胡建军.烟叶质量评价方法优选与实证研究[D].长沙:湖南
农业大学.2009.
[23]徐克学.生物数学[M].北京:科学出版社,1999.
274