免费文献传递   相关文献

基于主成分和聚类分析的荷花品种生物学性状的比较研究



全 文 :中国园林
摘 要:应用DPS统计软件,对89个花莲品种的26个生物学性状进行了主成分分析和聚类分析,按照方差累计贡献率70%提取
了6个主成分,通过计算各品种的主成分得分和综合得分值,分析出植株大小、花径、花型、花色等影响荷花品种分类的几个主要指标。
根据聚类分析结果,将89个供试品种从株型和花型的差异聚为4大类。
关 键 词:园林植物;荷花品种;主成分分析;聚类分析;生物学性状
文章编号:1000-6664(2008)08-0086-04
中图分类号:S688 文献标志码:A
收稿日期:2008-02-28;修回日期:2008-06-20
基金项目:河南省杰出青年基金(编号412001900)和河南省高校创新人才培养工程项目共同资助
Abstract:Principalcomponentanalysisandclusteranalysiswereconductedon26biologicalcharactersindexesof89lotus
cultivarsbyusingthestatisticalsoftwareDPS.Accordingtotheaccumulatedcontributionratiotothevarianceover70%from the
totalinformationreflectedbyoriginal26indexes,6principalcomponentswereextracted,andbasedonthescoresofthe
principalcomponentsandthegeneralscore,themajorindexesofthesizeofplant,thediameterofflower,thetypeofflower
andthecolourofflowerthatcaninfluencetheclassificationoflotuscultivarswereanalyzed.Thediferencesbetweenthetype
ofplantandthetypeofflowerweredividedinto4groupsfrom 89cultivars.
Keywords:landscapeplants;Nelumbonuciferacultivars;componentanalysis;clusteranalysis;biologicalcharacter
基于主成分和聚类分析的荷花品种生物学性状的比较研究
AComparativeStudyonBiologicalCharactersofNelumbonuciferaCultivars
UsingPrincipalComponentAnalysisandClusterAnalysis
孔德政 管志涛
KONGDe-zheng,GUANZhi-tao
花卉的观赏性主要由花径、花色、花香、花数、花态
等构成,同时又与株高、叶大小、繁密程度等相关联。这
些性状以及由这些性状衍生出来的其他性状如花型、花
量等都是数量性状。目前关于农艺形状的描述,多见于
农作物[1-2]和果[3]蔬[4]植物。在观赏植物上,对数量性状的研
究并不多见。本文对荷花(Nelumbonucifera)的主要观赏
性状做了系统的调查和研究,运用主成分分析和聚类分
析的方法对 89个荷花品种进行分析,为荷花的育种、分
类以及亲缘关系的研究提供数量遗传依据。
1 材料与方法
1.1材料
供试荷花品种有‘娃娃莲’‘淡霞’‘娇容三变’等 89
个品种(品种名见图 1)。
1.2方法与数据收集
2007年 5—10月进行 26个生物学性状的测量与统
计。其中数值性状有:花径、花瓣数、雄蕊数、最大立叶宽、
长、最大叶柄高(从泥土—叶蒂高度)、莲蓬直径、莲蓬高、
心皮数、叶径(长×宽)、叶脉数、瓣径(长×宽);质量性状
有:叶面、瓣型、瓣脉是否明显、花瓣硬度、花型、花色、叶
柄倒刺颜色、叶柄箍颜色、花蕾形、莲蓬形、心皮、莲瓣形
状、花态、花蕾色。
其中,(1)花径:选择品种中盛开的大、中、小型各 3~5
朵,分别用游标卡尺或直尺测量其直径,记录其均值。(2)
花瓣[5]:瓣型均取外瓣最大瓣,瓣径取最大瓣长、宽,求平
均值,花瓣数各取不同区域、盆、缸 3朵观测。小于 20瓣
的为少瓣型,21~50瓣的为半重瓣型,大于 51瓣的为重
瓣型,心皮绝大部分瓣化的为重台型。(3)立叶高和花柄
高:选同出于一节上的成年花、叶为测定对象。均从泥土
量到叶柄顶端和花蒂处。(4)雄蕊:记录雄蕊数目、瓣化、泡
状现象及附属物大小、颜色等。(5)雌蕊:记录心皮数目、泡
状、瓣化现象。(6)花色:按Wanschers花色谱,以盛开第
一天早晨10点的花色为标准。(7)叶径:以随花而出的伴
生立叶为测试对象,直径除取最大、最小值外,还求出各
叶的平均值,每次测定至少 3片叶。
本研究采用等级数量编码方法进行性状编码[6],二元
86
中国园林
性状以“0”“1”表示,有序多态性状以“1”“2”“3”⋯⋯表示,数值性状取平均值
直接转入下一步数学运算。
1.3统计方法
试验数据采用 DPS软件进行统计分析。其中聚类分析采用分辨力较好的
卡法距离,聚类方法采用最适合莲属资源分类的最长距离法[7-8]。聚类计算方法
如下:
标准化变换:
Yij=(Yij-Yj)/Sj,其中,Yj=!Yij/m,
样本 i与 j之间的平均欧氏距离:
样本 i与 j之间的卡方距离:
Dij=!{(Yik-eijk)2/eijk+(Yjk-ejik)2/ejik}
式中 eijk=(Yik-Yjk)Ti/Tij,Ti=!Yik,Tij=Ti+Tj
其中m为样本个数;n为性状个数;Yij为第 i个品种的第 j个性状的原始数
据;Yij为 Yij经过变换后的数据;Yj为第 j个性状数据的平均值;Sj为第 i个品种
的第j个性状的标准差;Dij为第i个分类单位与第j个分类单位的距离系数。
2 结果与分析
2.1主要生物学性状的主成分分析
主成分分析是把多个指标化为少数几个综合指标的一种统计分析方法[9]。
本研究把各性状数量化,进行主成分分析,以确定荷花品种分类的主要指标,使
分类更加客观。本研究对代表大部分原始性状信息的6个主成分进行分析。各
主成分的规格化特征向量、特征值、贡献率、累计贡献率见(表1)。
由(表 1)可知,前 6个主成分的累计贡献率已达 70%以上,代表了原始性
状的大部分信息。用前 6个主成分各性状的特征向量值分析各主成分及其携
带的信息,得出以下结果:
第一主成分:最大立叶宽、最大立叶长、最大叶柄高、花径;
第二主成分:花瓣数、花型、心皮特征、花蕾型;
第三主成分:花色、花蕾色;
第四主成分:花瓣硬度、叶柄箍颜色、花态;
第五主成分:莲瓣形状;
第六主成分:叶柄倒刺颜色。
可以看出影响荷花品种分类的指标,第一主成分中最大立叶长、宽、最大叶
柄高均为植株形状,因此可以认为此 3项是植株大小的综合指标,说明荷花花
径和植株大小这 2个性状对荷花品种分类影响较大。王其超、张行言[5]根据荷
花花瓣数的多少和心皮瓣化程度,将花型分为少瓣、半重瓣、重瓣、重台、千瓣
m
i=1
Sj= !(Yij-Yj)
1
m
m
i=1
Dij=!(Yik-Yjk)2
m
k=1
m
i=1
n
k=1
表1 主成分的累计贡献率表
主成分6
1.12682
4.33394
70.30427
主成分5
1.19904
4.61170
65.97033
主成分4
1.60655
6.17904
61.35862
主成分3
1.87909
7.22728
55.17959
主成分2
3.16629
12.17804
47.95230
主成分1
9.30131
35.77427
35.77427
特征值
贡献率/%
累计贡献率/%
图1 89份荷花品种聚类分析
‘娃娃莲’
‘春水绿波’
‘粉碗莲’
‘绛碗’
‘恋夏’
‘粉喜’
‘风采’
‘迎宾芙蓉’
‘冰心玉洁’
‘厦门碗莲’
‘黄舞妃’
‘白碗莲’
‘金珠落玉盘’
‘小佛手’
‘独立’
‘洛神’
‘案头红’
‘红领巾’
‘青莲姑娘’
‘娇容三变’
‘夕阳落花巷’
‘小碧莲’
‘丽雅’
‘寿星桃’
‘春意含芳’
‘扬州碗莲’
‘落霞映雪’
‘桃红宿雨’
‘别样红’
‘桌上莲’
‘重瓣八一莲’
‘牡丹仙子’
‘钗头凤’
‘天娇’
‘友谊红 2号’
‘醉东风’
‘玉碗’
‘霜洁’
‘粉西施’
‘白芍药莲’
‘秋水长天’
‘锦旗’
‘丹焰托珠’
‘翠微夕照’
‘晓霞’
‘彩云’
‘山茶红’
‘红碗莲’
‘羊城碗莲’
‘沂蒙春色’
‘淡霞’
‘心花怒放’
‘繁星’
‘绯桃’
‘红宝石’
‘寿星莲’
‘秋月’
‘小曲’
‘红云’
‘粉珠’
‘虞姬衫’
‘人面桃花’
‘锦边碗莲’
‘东湖夕照’
‘小台红’
‘菊红’
‘佳蕾’
‘云蕾’
‘瑞玉点翠’
‘落霞’
‘明月秋菊’
‘眼儿媚’
‘一丈青’
‘曙光’
‘青菱红莲’
‘明星’
‘太空莲’
‘玉蝶’
‘艳阳天’
‘大红袍’
‘镶玉’
‘大洒锦’
‘友谊牡丹莲’
‘白君子莲’
‘丹凤朝阳’
‘建德红莲’
‘武义红莲’
‘墨荷’
‘中日友谊莲’
0.00 0.87 1.74 2.62 3.49 4.36


C
L2=2.5501

L5
B
L4
L0=3.71370


L3
A
L1=2.98651













87
中国园林
图2 26个形态性状R聚类分析结果
花径
最大立叶长
最大立叶宽
最大叶柄高
立叶高
花柄高
花瓣长
花瓣宽
雄蕊数
心皮数
莲蓬直径
叶脉数
花瓣数
花型
心皮
花蕾型
莲蓬型
叶面是否光滑
花瓣硬度
叶柄箍颜色
花态
内瓣脉是否明显
莲瓣形状
花色
花蕾色
叶柄倒刺颜色
1.00 0.80 0.60 0.40 0.20 0.00
L=0.72287
型。在调查时发现,通常少瓣型、千瓣型和部分半重瓣型
品种的花蕾呈长桃型,部分半重瓣型、重瓣型和重台型品
种呈桃型或圆桃型。因此在第二主成分中,几个性状指标
集体反映荷花花型在分类中的影响,显然花型对荷花品
种类型的确定具有重要意义。在第三主成分中,花色与花
蕾色有密切关系,通常白花、黄花品种花蕾呈绿色,红花
品种花蕾呈暗紫色,粉色花品种呈暗紫色或玫红色,白色
和复色花品种花蕾呈尖红苞绿。所以应认为第三主成分
是反映花色的综合指标。综合第四和第五2个主成分,可
以认为这 2个主成分全面地反映了花瓣的特征。第六主
成分和(表 1)中未提及的主成分,都为荷花植株的附属因
子,因此可以认为这些成分所代表的主要性状为前 5个
主成分的补充。
经过以上分析,影响荷花品种分类的几个主要指标
分别为:植株大小、花径、花型、花色和花瓣的特征。
2.2R型聚类结果与分析
反映荷花特点的变量有很多,我们根据分类的需要,
对荷花的形态性状进行的分析,称作变量聚类。分析结果
见(图 2),为便于分析,依据聚合水平数值,计算出跳变
值,在(图2)中作结合线 L=0.72287。从(图 2)中可看出大
多数性状间都彼此独立,说明这些性状间的变异和演进
是互不干扰的。但部分性状间仍存在一定的联系,最大立
叶长和最大立叶宽、花瓣长和花瓣宽存在的联系比较容
易理解;花型是由花瓣数的多少来决定;最大叶柄高、立
叶高、花柄高均表示同一植株大小的性状,在以后的调查
中,可取其一项作为形态指标,进入 Q型分析时,可淘汰
立叶高和花柄高。
2.3Q型聚类结果与分析
由主成分分析和 R型聚类结果,筛选出 24个生物学
性状,对 89个花莲品种采用卡方距离最长距离法进行系
统聚类分析,所得结果如(图 1)所示。
由(图 1)可以看出,利用品种聚类可以直观地反映荷
花品种的具体分类方式。结合线L0首先将这些荷花品种
分为 2大类,即中小株型群(Ⅰ类)和大株型群(Ⅱ类);L1又
将中小株型群分为 3大类,即少瓣和半重瓣类(A组)、重
瓣类(B组)、重台类(C组)。L2将大株型群分为 3类。这些
大类下面又可分为若干小类。
A组:所包含的品种为单瓣或半重瓣,因为半重瓣是
单瓣类型的初级进化形式,故归为一类。在 A组中,结合
线 L3将其分为 2类:①组和②组。①组大部分品种为白
莲型和粉白莲型,但还出现了红莲品种‘恋夏’,这可能是
亲本的亲缘关系较近而聚类在一起。而复色品种‘风采’
和黄色系‘黄舞妃’则是白色系的转变形式。②组大部分
品种为粉红莲型和红莲型,白色系品种‘白碗莲’和‘金珠
落玉盘’因其为少瓣类,而和其他少瓣类聚类在一起。
B组:所包含的品种类型为重瓣类。半重瓣类品种
‘友谊红 2号’有向重瓣类进化的趋势而和重瓣类聚类在
一起,重台类品种‘玉碗’因少数心皮还能结实,是重瓣向
重台过度的雏形,因而将其归为重瓣类一组。在 B组中,
结合线 L4将其分为③组和④组。③组大部分品种为白莲
型和粉白莲型。红莲型品种‘桃红宿雨’‘别样红’和‘桌上
莲’,因亲本亲缘关系和其他性状的影响,而将其与③组
归为一类。④组品种均为红莲型品种。
C组:所包含品种的花型大部分为重台类,少数为重
瓣类。C组中重瓣类品种的心皮大部分瓣化或泡状,很少
结实,有向重台类进化的趋势,故其与重台类聚类在一
起。结合线L5将 C组分为 3类:⑤、⑥和⑦组。⑤组大部
分为粉色系,复色系品种‘虞姬衫’‘人面桃花’和‘锦边碗
莲’的花色均是由粉色进化而来。⑥组品种为红莲型。因
复色品种‘佳蕾’由红莲进化而成故其与红莲聚类在一
起,又因花色与红莲不同而与其他 3个品种遗传距离较
远。⑦组品种为白色系。复色品种‘落霞’因其遗传性状与
其他品种相近而聚在一起。
大株型群(Ⅱ类):结合线 L2将其分为 3类:⑧、⑨和
⑩组。⑨组品种的瓣型均为重瓣类。⑧和⑩组的品种瓣型
均为少瓣类。
由以上分析可以看出,花莲品种的分类中,株型大小、
88
中国园林
汶川大地震给中国带来深重灾难,如何重
建家园,恢复生产和生活是当前各方关注的焦
点问题,为了以实际行动向这片承受了巨大伤
痛的土地,向逝去的生命和坚强的生者表示崇
高的敬意,由《风景园林》杂志社主办、深圳市
北林苑景观及建筑规划设计院资助的“中国
五·一二地震纪念景观概念设计国际竞赛”于
2008年 5月 26日启动并在 8月 4日揭晓最
终结果。
作为震后风景园林行业内首次地震纪念
类国际设计竞赛,竞赛通告在《风景园林》杂志
官方网站及业内各大网站发出后,业界纷纷响
应。《风景园林》杂志社共收到海内外报名表
267份,有效方案120个,最终遴选出一等奖 1
名、二等奖2名、三等奖 5名和佳作奖7名。本
次竞赛评审委员分别为:王小璘(中国台湾)、
王绍增、王向荣、朱育帆、陈弘志(中国香港)、
何昉、邱建、俞孔坚、侯梁、黄居正、尼尔·科克
伍德(美)、安迪·曹(美),评审委员会主席由孟
兆祯院士担任。
来自美国的参赛选手方菀莉(Wan-Li
Fang)、吕欣侃(Hsin-KanLu)共同创作的 051
号作品《抚平创伤》(HealingtheWounds)荣
获一等奖。二等奖2名:由 001号作品《万世轮
回》(EON)和 050号作品《生命线》(LifeLines)
获得,分别由来自美国的阿卜·阿杜拉(Abul
Abdulah)、桑迪潘·阿迪亚(Sandipan Aditya)、
恩兰·侯赛因(EmranHossain)以及来自加拿
大的叶韵诗(VanThiDiep)、肖智(ZhiXiao)创
作。三等奖 5名,由英国段非、万欣宇创作的
084号作品《镜震》(MirorMatrix),荷兰马汀·
柯努伊特(MartinKnuijt)创作的 030作品《记
忆的身躯》(MemorysBody),中国李其郅的
269号作品《对·话》(HearttoHeart),陈舒捷
的 070号作品 《关于愈合的设计》(Onthe
DesignofHealing)和李倞的 128号作品《痕·
记忆》(TheCrackTheMemory)获得。
(李翠筠 文 桦)
作者简介:
孔德政/1965年生/男/江苏南京人/博士/河
南农业大学园林系副教授/研究方向为花卉遗传
育种(郑州 450002)
管志涛 /1981年生 /男 /河南濮阳人 /河南农
业大学园林系在读硕士研究生/研究方向为花卉
遗传育种(郑州 450002)
花型、花色、亲缘关系和遗传性状在荷花分类中占有一定
优势,但与众多学者[10]关于花径、花型、花色 3项基本特征
的先后排列顺序相比,笔者仅和王其超观点一致。至于哪
项为前提标准?众说纷纭,各抒己见。王其超等认为,在以
后的荷花品种研究中,中外荷花工作者应通过探讨、沟
通,求同存异,逐步增进共识,最后达成统一。
另外,从‘黄舞妃’和‘友谊牡丹莲’2个黄色品种与其
他中国莲的遗传距离并不远来看,这说明中国莲系和美
洲黄莲系仅存在地理隔离,不存在生殖隔离。将美洲黄莲
作为中国莲的亚种处理较为合理[11]。
3 结 论
(1)通过主成分分析,将荷花品种主要生物学性状指
标转化为较少的几个主成分。其中前 6个主成分值的贡
献率达到 70%以上,其所表达的综合信息可以用来表达
全部性状的信息。荷花的生物学性状较多,且相互间存在
错综复杂的关系,致使它们提供的信息出现重叠,不易得
出简明的规律。采用主成分分析和 R型聚类简化了评价
指标,抓住了主要矛盾,从而能够比较容易和清晰地解释
其间的相关关系。
(2)通过对 89个花莲品种进行聚类分析,将其划分为
4大类,又依据各品种的相似性状,细分为 10小类。在荷
花育种和生产需求中,根据各类的特点可以对品种进行
相关选择,以减少育种和生产的盲目性和工作量。聚类结
果再次有力地证明了将美洲黄莲作为中国莲的亚种处理
比较合理。
参考文献:
[1]肖炳光,张燕春.烤烟品种主成分分析和聚类分析[J].种子,
2000(2):27-29.
[2]陈四龙,李玉荣,程增书,等.花生品种(系)生物学形状的主成
分分析和聚类分析[J].花生学报,2007,36(2):28-34.
[3]单成刚,王志芬,苏学合,等.桔梗种质资源农艺性状的主成分
及聚类分析[J].现代中药研究与实践,2008,20(1):25-28.
[4]刘永莉,刘翘,孙冲霞.大白菜主要数量性状主成分分析和聚
类分析[J].吉林蔬菜,2007(3):73-75.
[5]王其超,张行言.中国荷花品种图志[M].北京:中国林业出版
社,2005.
[6]徐克学.数量分类学[M].北京:科学出版社,1994.
[7]余家林.农业多元试验统计[M].北京:北京农业大学出版社,1993.
[8]刘艺平,李艳妮,孔德政.荷花盆景制作与品种选择的研究[J].
安徽农业科学,2007,35(18):5426-5427.
[9]唐启义.DPS数据处理系统[M].北京:科学出版社,2007.
[10]王其超,张行言,胡春根.荷花品种分类新系统[J].武汉植物
学研究,1997,15(1):19-26.
[11]王其超,张行言.二元分类法在荷花品种分类中的应用[J].北
京林业大学学报,1998,20(2):33-37.
中国五·一二地震纪念景观概念设计国际竞赛揭晓
信 息
89