全 文 :Vol. 30 , No. 7
pp. 675 - 679 July , 2004
作 物 学 报
ACTA AGRONOMICA SINICA
第 30 卷 第 7 期
2004 年 7 月 675~679 页
玉米种质保持中的适宜样本容量
罗铮锋 盖钧镒 3 章元明 Ξ
(南京农业大学大豆研究所/ 国家大豆改良中心/ 作物遗传与种质创新国家重点实验室 ,江苏南京 210095)
摘 要 用两个胚乳色基因型纯合的玉米品种不同比率的混合来模仿具有不同标记基因频率的玉米群体 ,通过田间试
验、统计抽样以及 Monte Carlo 模拟研究玉米种质在繁殖前后标记基因频率的变化。两年田间试验和 Monte Carlo 模拟试
验得到一致结论 ;在玉米群体田间植株中随机抽取 8 株上的全部种子或 10 株上每株 25 粒种子作样本可使群体中频率大
于 0. 05 基因的丢失频率非常小 ,样本群体的基因频率相对稳定且基因频率的 95 %置信下限大于 0 ,达到保持较低频率基
因的基本目的。在种质库中 ,一般可保存 3 000~5 000 粒种子。为避免繁殖次数而增加的遗传漂变和漂移 ,要尽量减少
繁殖次数。本研究结果可推广到其他异花授粉作物。
关键词 玉米 ;种质 ;适宜样本容量 ;Monte Carlo 模拟
中图分类号 :Q348
A Suitable Sample Size in the Conservation of Corn Germplasm
LUO Zheng2Feng ,GAI Jun2Yi 3 ,ZHANG Yuan2Ming
( Soybean Research Institute of Nanjing Agricultural University/ National Center for Soybean Improvement/ National key Laboratory for Crop Genetics and Germplasm
Enhancement , Nanjing 210095 , Jiangsu , China)
Abstract The corn populations prepared through mixing two maize cultivars , homozygous in endosperm color , Suyu 9
(yellow , YY) and Suyunuo 1 (white , yy) to form various marker ( Y) frequencies , i . e. 0. 01 , 0. 05 , 0. 10 and 0. 30 ,
were used to study suitable sample size in the conservation of corn germplasm. The changes of marker gene frequency after
propagation were studied through field experiment combined with statistical sampling , as well as Monte Carlo simulation.
The results from both field experiment and Monte Carlo simulation were basically the same and showed that a random sample
of eight plants with all seeds or 10 plants with 25 seeds per plant could conserve the rare gene with 95 % confidence. It was
suggested that for germplasm storage , a sample with 3 000 - 5 000 seeds should be conserved. The variation of gene fre2
quency after several times of reproduction was increased obviously and so was for the probability of losing a rare gene. The
above conclusion might be applied to other cross2pollinated crops because the results from Monte Carlo simulation were
under a general situation and were basically similar to those from the field experiments.
Key words Corn ; Germplasm;Suitable sample size ;Monte Carlo simulation
种质资源的保持日益受到重视。然而 ,种子库
中的种质资源每隔一定时间不可避免地需要扩繁。
在种质扩繁时 ,必然遇到样本容量问题 ,过大浪费人
物力 ,过小造成遗传漂变 (genetic drift) 。以往关于样
本大小的讨论基本上是理论推导或经验性结
果[1~7 ] 。章元明等 (1995)从田间试验和计算机模拟
两方面研究了自花授粉作物种质保持的最小适宜样
本容量[8 ] 。然而 ,异花授粉作物与自花授粉作物不
同 ,基因型频率与基因频率不一致 ,代代互交 ,保持
了基因频率便保持了全部基因型及其频率 ,因而只
需研究其基因频率的保持。本文通过花粉直感现象
观察基因频率 ,并从田间试验和 Monte Carlo 模拟两
方面研究玉米种质繁殖过程中稀少基因频率的抽样
变异 ,进而研究其最小适宜样本容量。
1 材料与方法
1. 1 供试材料与田间试验
用胚乳色基因型纯合的 2 个玉米品种不同比例
混合来模仿具有不同标记基因频率的异花授粉群Ξ基金项目 :国家“九五”攻关项目 (962014202201204) 。
作者简介 :罗铮锋 (1975 - ) ,男 ,江西南昌人 ,南京农业大学作物遗传育种硕士 ,现任铁岭先锋种子研究有限公司研究助理。3通讯作者 (Author for correspondence) :盖钧镒。E2mail : sri @njau. edu. cn
Received (收稿日期) :2003203227 ,Accepted (接受日期) :2003206228.
体。黄胚乳品种为苏玉 9 号 ,白胚乳品种为苏玉糯
1 号 ,黄色对白色直感。这两个材料虽均为杂交种 ,
但胚乳基因型均纯合。播前按苏玉 9 号 (黄籽粒为
标记基因型)占总播种种子的比例 0. 01、0. 05、0110
和 0. 30 构成播种群体 ,分别于 1997 年和 1998 年进
行田间试验 ,1997 年的 4 群体依次记为 A1、B1、C1
和 D1 ,1998 年的 4 群体依次记为 A2、B2、C2 和 D2 ,
群体间远距隔离种植 ,自由授粉。每群体 55 行 ,行
距 66 cm ,株距 20 cm ,并编出每株的行号与列号 ,以
定位观察并绘制标记基因分布图。各群体观察
1 000株左右 ,群体间因出苗情况而有一定波动。
1. 2 试验数据的记录与统计分析方法
对两年 8 个群体 ,记录每株的基因型 ,并数出每
株玉米的总籽粒数和黄色籽粒数 (标记基因型) ,以
得到种植一代后种质群体的遗传结构。由于花粉直
感效应 ,可用繁殖后苏玉糯 1 号植株上黄色籽粒的
频率代表群体中雄配子的频率 ,从而以雄配子频率
的波动代表标记基因的波动 ,因此在以后的分析中
用对花粉的抽样代表对基因的抽样。
采用两种抽样策略 :第一种策略是不控制植株
繁殖力的变异 ,在群体中以连续两株苏玉糯 1 号玉
米株 (非标记基因型植株)上的全部种子合并构成抽
样的样本单位 ,即第 1、2 株 ,第 3、4 株 ⋯⋯依次各构
成一个样本单位 , 每群体约有 500 个样本单位 , 再
随机抽取一定数目的样本单位 (2 ,4 ,6 ,8 ⋯⋯,16 个
等 8 种) 构成抽样单位 , 每种抽样单位均随机抽取
1 000个构成样本。第 2 种策略是控制繁殖力变异 ,
在不同标记基因频率群体中以连续两株苏玉糯 1 号
玉米株上的相同数目种子合并构成样本单位 ,再随
机抽取一定数目的样本单位 (2 ,4 ,6 ,8 ⋯⋯,16 个等
8 种) 构成抽样单位 , 每种抽样单位也随机抽取
1 000个构成样本。两种抽样策略下的分析方法相
同。对各类样本分别统计出每抽样单位中黄色籽粒
(标记基因)所占的百分率 ,并得出样本标记基因的
频率分布。用该分布的平均数、标准差和标记基因
丢失频率作为统计指标。统计指标的计算参见文献
[8 ,10 ]。
平均数 p = ∑pi/ n
标准差 s = ∑( pi - p) 2/ ( n - 1)
pi 为一定抽样单位的标记基因频率 , n 为重复
抽样次数 (此处为 1 000) 。
丢失频率是 1 000 次随机抽样中没有抽到标记
基因籽粒的频率。
1. 3 Monte Carlo 模拟
为验证田间试验结果 ,进行了 Monte Carlo 模
拟[11 ,12 ]。第 1 种抽样策略中包括基因频率、每株籽
粒数 (繁殖力) 和株数 (样本容量) 等试验因素 ,第 2
种抽样策略中包括基因频率、每株抽取籽粒数和株
数 (样本容量) 等试验因素。群体稀少基因频率为
0. 01、0. 05 和 0. 10 ,分别用 A、B 和 C表示。
2 结果与分析
2. 1 第 1 种抽样策略
在抽取植株上全部种子的情况下 ,从样本标记
基因频率标准差变化观察判定的转折点探讨适宜样
本容量 (表 1) 。在各群体中 ,标记基因频率标准差
由迅速下降到缓慢降低的转折点因频率不同而异。
如在群体 D1 中 ,8 株样本容量是标准差由迅速减小
到缓慢降低的转折点。在群体 A2 中 6 株样本是标
准差变化的转折点。在模拟分析结果中 ,其综合分
界线为 8 株样本。综合两方面结果 ,抽取 8 株上的所
有种子的样本容量为种质保持的最小适宜样本容量。
表 1 不同群体不同样本容量下标记基因频率标准差
Table 1 Standard deviation of marker gene frequency for various populations under various sample sizes ( no. of plants)
群体 Population 样本容量 Sample size
Y Code 2 4 6 8 10 12 14 16
1998 0. 01 A2 0. 034 0. 020 0. 015 0. 014 0. 011 0. 011 0. 010 0. 009
0. 05 B2 0. 070 0. 050 0. 039 0. 036 0. 032 0. 030 0. 026 0. 024
0. 10 C2 0. 094 0. 070 0. 058 0. 049 0. 043 0. 040 0. 037 0. 036
0. 30 D2 0. 192 0. 138 0. 107 0. 098 0. 083 0. 080 0. 073 0. 070
1997 0. 01 A1 0. 041 0. 027 0. 021 0. 020 0. 017 0. 016 0. 015 0. 014
0. 05 B1 0. 080 0. 055 0. 047 0. 041 0. 038 0. 035 0. 031 0. 028
0. 10 C1 0. 098 0. 063 0. 057 0. 046 0. 043 0. 039 0. 036 0. 034
0. 30 D1 0. 184 0. 138 0. 108 0. 098 0. 087 0. 077 0. 073 0. 066
MC 0. 01 A 0. 018 0. 141 0. 011 0. 010 0. 009 0. 008 0. 007 0. 007
0. 05 B 0. 054 0. 043 0. 036 0. 028 0. 027 0. 025 0. 023 0. 022
0. 10 C 0. 118 0. 078 0. 069 0. 062 0. 052 0. 047 0. 045 0. 042
注 : Y 表示标记基因 (黄粒)在群体中所占比例。
Note : MC = Monte Carlo simulation ; Y = Ratio of marker gene (yellow grain) in a population.
676 作 物 学 报 30 卷
从标记基因丢失频率探讨适宜样本容量 (表
2) ,当标记基因频率大于 0. 10 ,样本容量为 2 株时丢
失频率均小于 0. 05 ;当样本容量增大到 6 株时 ,可使
群体中频率大于 0. 01 的基因丢失频率小于 5 %。因
此 ,标记基因频率不小于 0. 01 ,样本容量为 6 株时 ,
稀少基因的丢失属小概率事件。
表 2 不同群体中各样本容量下标记基因丢失频率
Table 2 Extinction frequency of marker gene in various populations
under various sample sizes
群 体
Population
样本容量 Sample size
2 4 6 8
A2 0. 184 0. 034 0. 005 0. 000
B2 0. 020 0. 000 0. 000 0. 000
C2 0. 006 0. 000 0. 000 0. 000
A1 0. 161 0. 033 0. 010 0. 000
B1 0. 023 0. 001 0. 000 0. 000
C1 0. 006 0. 000 0. 000 0. 000
A 0. 241 0. 046 0. 015 0. 000
B 0. 089 0. 007 0. 002 0. 000
C 0. 004 0. 000 0. 000 0. 000
2. 2 第二种抽样策略
若每株抽取相同数目的种子 ,则首先要确定每
株抽取的种子粒数。Monte Carlo 模拟表明 (表 3) ,每
株抽取粒数较少时增加每株抽取粒数可以显著减小
抽样变异 ,当达到一定值后再增大每株抽取粒数的
效果不显著。当群体植株标记基因频率较低时 ,其
配子频率相对集中在较低的区域 ,变异较小 ;当每株
抽取粒数为 15~20 时 ,标记基因配子频率标准差与
再增大每株抽取粒数下的标记基因配子频率标准差
差异不显著。在标记基因频率较大的群体中 ,当每
株抽取 20~25 粒时 ,标记基因配子频率标准差与再
增大每株抽取粒数时的标记基因配子频率标准差差
异不显著。因而 ,每株抽取 25 粒是一个适宜的每株
抽样量。由于每株抽取不同的粒数时的规律相似 ,
下文仅报道每株抽取 25 粒的结果。
表 3 不同每株粒数下样本基因频率标准差的多重比较
Table 3 Multiple comparisons of standard deviation of marker gene frequency for sampling various seed number per plant
每株粒数
Seed no.
per plant
群 体 Population
A1 B1 C1 D1 A2 B2 C2 D2 A B C
5 A A A A A A A A A A A
10 B B B B B B B B B B B
15 CB C C C C C B C C C C
20 CD C D D DC DC C DC D D C
25 D D D ED DE DE DC DE ED D
30 D D ED ED DE DE DC E ED D D
35 D D E ED DE DE DE E E D D
40 D D E E E E E E E D D
Note : Significant at 0. 05 level between the seed number with different letters in a same column.
表 4 在不同群体中抽取不同样本容量的标记基因频率的标准差
Table 4 Standard deviation of marker gene frequency under various sample sizes
群 体
Population
样 本 容 量 Sample size
2 4 6 8 10 12 14 16
A2 0. 030 0. 022 0. 018 0. 016 0. 014 0. 014 0. 013 0. 011
B2 0. 066 0. 048 0. 039 0. 036 0. 032 0. 027 0. 026 0. 025
C2 0. 100 0. 070 0. 058 0. 050 0. 043 0. 040 0. 037 0. 035
D2 0. 184 0. 127 0. 105 0. 090 0 080 0. 071 0. 066 0. 063
A1 0. 039 0. 027 0. 021 0. 020 0. 017 0. 015 0. 015 0. 013
B1 0. 080 0. 056 0. 045 0. 039 0. 036 0. 031 0. 030 0. 028
C1 0. 094 0. 069 0. 061 0. 050 0. 044 0. 042 0. 038 0. 035
D1 0. 186 0. 134 0. 108 0. 097 0. 084 0. 076 0. 070 0. 065
A 0. 023 0. 016 0. 014 0. 012 0. 011 0. 010 0. 009 0. 008
B 0. 058 0. 044 0. 035 0. 035 0. 027 0. 028 0. 025 0. 022
C 0. 122 0. 084 0. 069 0. 060 0. 054 0. 049 0. 044 0. 043
776 7 期 罗铮锋等 :玉米种质保持中的适宜样本容量
从表 4 可知 ,当标记基因频率为 0. 10 时 ,样本
容量分别为 2、4 和 6 的标记基因频率标准差分别为
0. 122、0. 084 和 0. 069 ,随样本容量增加 ,其标准差下
降幅度增大 ,若再增加时 ,下降幅度减小 ,以后则基
本稳定。在这种标记基因频率群体中样本容量为
10 就可以保持这种基因频率相对稳定。当群体基
因频率为 0. 05 时 ,样本容量从 2 开始 ,以后每次增
加 2 ,其标准差依次为 0. 058、0. 044、0. 035 和 0. 035 ,
标准差由迅速减少到缓慢降低 ,到 8 株后变化较小 ,
说明要保持群体中这种频率的基因在抽样中基本稳
定 ,样本容量至少应为 8 株。同样地对于其他频率
的基因 ,其标准差随着样本容量的增大由迅速减少
到缓慢降低 ,其粗略分界线为 8~10 株样本 ,要保持
这些群体的遗传结构 ,所需的样本大小是不同的 ,一
般采用 10 株较适宜 ,既能保持样本中较低基因频率
在抽样中的相对稳定 ,又不至于增加太大的工作量。
由基因的丢失频率 (表 5) 可知 ,当群体基因频
率为 0. 10 左右 ,样本容量为 4 时 ,基因的丢失频率
小于 5 % ,保持这类基因只需要较小的样本 ,保存较
为容易。群体基因频率为 0. 05 左右 ,样本容量为 4
时 ,基因的丢失频率较大 ,但是当样本容量增大到 6
时 ,其丢失频率小于 5 % ;当样本容量为 8 ,则未发生
标记基因的丢失。因此 ,对于这种频率基因 ,样本容
量为 8 时 ,发生该基因丢失的概率是很小的。群体
中频率更小的基因 (0. 01 左右) ,其丢失频率很大 ,
保持这种频率的基因需要较大的样本。
表 5 在不同群体中抽取不同容量的样本时标记基因的丢失频率
Table 5 Extinction frequency of marker gene in germplasm population with various sample sizes
群 体
Population
样本容量 Sample size
2 4 6 8 10 12 14 16
A1 0. 628 0. 437 0. 228 0. 163 0. 084 0. 055 0. 032 0. 019
A2 0. 647 0. 430 0. 274 0. 179 0. 127 0. 076 0. 061 0. 030
B1 0. 274 0. 067 0. 019 0. 005 0. 003 0. 000 0. 000 0. 000
B2 0. 201 0. 043 0. 005 0. 003 0. 000 0. 000 0. 000 0. 000
C2 0. 091 0. 014 0. 000 0. 000 0. 000 0. 000 0. 000 0. 000
C1 0. 072 0. 008 0. 000 0. 000 0. 000 0. 000 0. 000 0. 000
D1 0. 012 0. 000 0. 000 0. 000 0. 000 0. 000 0. 000 0. 000
D2 0. 006 0. 000 0. 000 0. 000 0. 000 0. 000 0. 000 0. 000
A 0. 724 0. 493 0. 357 0. 257 0. 194 0. 141 0. 105 0. 084
B 0. 252 0. 100 0. 020 0. 000 0. 000 0. 000 0. 000 0. 000
C 0. 100 0. 010 0. 000 0. 000 0. 000 0. 000 0. 000 0. 000
2. 3 繁殖世代对群体结构的影响
由表 6 可知 :随着繁殖世代的增加 ,抽样群体基
因频率标准差不断增加 ,其变异度不断增大。例如 ,
基因频率为 0. 01 时 ,繁殖 20 代时的标准差是繁殖
一代时标准差的 4 倍多 ,基因频率为 0. 05 时 ,繁殖
表 6 不同基因频率群体经不同繁殖代数后标记基因频率的标准差
Table 6 Standard deviation of marker gene frequency after
reproduction of certain generations
世代
Generation
标记基因频率 MGF
0. 01 0. 05 0. 1
1 0. 010 0. 029 0. 057
5 0. 022 0. 065 0. 127
10 0. 031 0. 094 0. 175
15 0. 038 0. 111 0. 206
20 0. 044 0. 137 0. 239
10 代时的标准差是繁殖一代时标准差的近 3 倍 ,增
加繁殖次数可以极大地增加抽样变异度。因此 ,要
保持抽样的相对稳定 ,减少繁殖次数是相当必要的。
3 讨论
3. 1 本研究找到的最小适宜样本容量为在田间玉
米群体中随机抽取 8 株上的全部种子或者抽取 10
株上每株 25 粒的种子作样本 ,它可使群体中频率大
于 0. 05 基因的丢失频率非常小 ,达到保持较低频率
基因的基本目的。在实际工作中 ,可首先取种子样
本约 250 粒 ,于田间繁殖一代 ,从中随机抽取 8 株上
的种子作样本 ,室内保存 4~6 个样本 ;或者从 10 株
上每株抽取 25 粒种子作样本 ,同时保存 10~20 个
样本 ;一般宜取 3 000~5 000 粒种子保存在种质
876 作 物 学 报 30 卷
库中。
3. 2 种质群体繁育过程中不同生育阶段会受到不
同因素的影响 ,父母本贡献的变异都影响适宜样本
容量。控制父本贡献波动的方法是尽量随机交配 ,
增大有效群体 ;控制母本贡献波动的方法是从每一
个基因型收获和保存同样数量的种子。
3. 3 田间和计算机模拟试验中 ,只考虑了一对等位
基因的保存。在种质群体中还会出现复等位基因情
况 ,可把较大频率基因合为一项与最小频率基因相
对 ,当作一对基因看待 ,这样就可和本研究讨论的情
形一样。对于两对或更多对基因的保持着重看具最
小频率的那对基因 ,仍可参考本研究结果。
3. 4 本研究结果虽是从玉米获得的 ,但它以群体遗
传结构为出发点 ,并有模拟多种条件的 Monte Carlo
研究与田间试验研究相互印证 ,因此可推广到其他
异花授粉作物。
References
[1 ] Gao K(高楷) , Ma G2R(马港日) , Liu A2Q(刘爱群) . Study on po2
pulation size of hand2pollinated plants in seed renewal of maize cultivars.
Acta Agronomica Sinica (作物学报) , 1991 , 17 (4) :314 - 320
[2 ] Crossa J . Methodologies for estimating the sample size required for gene2
tic conservation of outbreeding crops. Theor Appl Genet ,1989 , 77 :153 - 161
[ 3 ] Crossa J . Statistical genetic consideration for maintaining germplasm col2
lections. Theor Appl Genet , 1993 , 86 :673 - 678
[4 ] Frankel O H. Plant genetic resources today : a critical appraisal . In :
Holden J H W (ed. ) Crop Genetic Resources : Conservation and Evalua2
tion. Rome : IBPGR George Allen and Unwin Ltd. , 1984
[5 ] Lawrence M J , Marshall D F , Davies P. Genetics of genetic conserva2
tion. Ⅱ. Sample size when collecting seed of cross2pollinating species
and the information that can be obtained from the evaluation of material
held in gene banks. Euphytica , 1995 , 84 :101 - 107
[6 ] Lawrence M J , Marshall D F , Davis P. Genetics of genetic conserva2
tion . Ⅰ. Sample size when collecting germplasm. Euphytica , 1995 ,
84 :89 - 99
[7 ] Yonezawa K, Ichihashi H. Sample size for collecting germplasms from
natural plant populations in view of the genotype multiplicity of seed em2
bryos borne on a single plant . Euphytica , 1989 , 41 :91 - 97
[8 ] Zhang Y2M(章元明) , Gai J2Y(盖钧镒) . A study on suitable sample
size in the conservation of germplasm in soybean. Scientia Agricultura
Sinica (中国农业科学) , 1995 , 28 (suppl) :70 - 75
[9 ] Breese E L. Regeneration and multiplication of germplasm resources in
seed GenBank : the scientific background. IBPGR , Rome , 1992
[10 ] Gai J2Y(盖钧镒) . Methods of Experimental Statistics. Beijing :China
Agriculture Press , 2000
[ 11 ] Xiao Y2R(肖云茹) . Numeration Methods of the Probability and Statis2
tics. Tianjin :Nankai University Press , 1994. 130 - 172
[12 ] Xu Z2J (徐中济) . Monte Carlo Method. Shanghai :Shanghai Scientific
and Technological Press , 1985
976 7 期 罗铮锋等 :玉米种质保持中的适宜样本容量