全 文 :核 农 学 报 , 一
滩口扭 通刃 扭 从 £
植物数量性状诱发突变的数学模型
吴为人
福建农学院农学系 福州
本文提 出 了一种植物数量性状诱变的数学模型 —混合分布模型
。 该模型将诱
变后 代群体分解成正常与突变两个子群体 , 总群体中性状的分布 由两个子群体的分
布混合 而 成 。 利 用信息条件最小 “ 估计方法 , 可 以 估计 出总群体及两个子群体的均
值和方差 , 以 及突变子群体 占总群体的比例 , 即突 变率 , 并由此确定分布的形式 。
从两个子群休的方差还可 估算 出突匆性状的广 义遗传 力 。 另外
, 该模型能 够推广到
多元情形 , 并举 出 了一个实例 。
关健词 植物 诱变 数童性状 混合分布模型
一 、 健绪、 了 口
‘﹂份电几
植物诱变育种的主要目的在于改 良作物的农艺和经济性状 , 以培育出符合生产需要的优
良品种 。 由于这些性状大多是数量性状 , 因此在诱变育种中 , 研究数量性状的突变 问题就显
得十分重要 。 然而 , 迄今我们对植物数量性状突变的规律了解还不多 , 主要原因之一是 尚无
有效的数学方法来克服其变异连续性所造成的困难 。 目前常用临界值法 ‘ 来估计数量 性 状
的突变率 , 这种估值往往是偏低的 。 因为数量性状的遗传基础主要是微效多基 因系统 , 所 以
微突变体大部分将落在临界值范围内而被判为正常个体 。 从临界值法也无法了解突变性状的
分布情况 , 所能获得的信息非常有限 。 总的看来 , 发展一种研究植物数量性状诱变规律的有
效数学方法是十分必要的 。
在微生物诱变育种中 , 刘垂开 “ 」曾提出一种两个正态分布的混合分布模型 , 并利 用 生
物信息反馈的原理 , 发展了一种称为信息条件最小 估计的数学方法来估计突变率 及突 变
性状分布参数 。 实践证明 , 该模型和方法在微生物诱变研究中是可行的 。 笔者考虑到生物规律
的普遍性和特殊性 , 适当修改了刘的模型 , 以适用于植物诱变的研究 。 同时 , 考虑到数量性
状间相关的影响 , 又将模型推广到多元情形 , 以期获得更丰富 、 更准确的信息 。
二 、 混合分布模型
一 就单个数量性状 以下 皆简称性状 而言 , 植物诱变后代 指 , 及以后各 世 代
是一个混合群体 记为 , 它包含两个子群体 , 一个是 由表现正常的个体组成的正常子群
此文于 年 月 日收到
核 农 学 报 一
, 一 ’
卷
体 记为 ,
结构可表示为
另一个是 由突变体组成的突变子群体 记为
。 因此 , 植物诱变后代群 体
二
被考察的性状显然是
别写成
个随机变量 关记为 它在 、 和 中的概率分布 函 数 可 分
二
丁几‘
‘ ’‘
丁飞· ‘ ’“
,
丁飞 ‘ ’‘
若 在 中所 占比例 即突变率 为 , 则 由式 一 可得
一
一丁飞“ 一 , ·‘· , ·
·
或者 一
因此 , 在 中服从混合概率分布
。
二 在正态分布中 , 变量的数学期望和方差就是分布参数 , 在其它分布中 , 分布参数
也可表示为数学期望和方差的函数 。 因此 , 只要估得各群体中的数学期望和方差 及 参 数 , 就
能确定所有分布形式 。 现将
、 和 中 的 数 学 期 望 和 方 差 分 别 记 为 件和 护
、 协 和
时 及 件 和 盖
。 可以证明 「“ ’, 这些参数间存在关系
。 弓一 一 、 ,
, 一 登 令‘ 。
“ 一 , , 气升 协一 协 ,
三 以上讨论适用于任何分布形式 , 下面讨论的参数估计方法也是如此 。 为了估计参
数 , 事先必须对 和 的形式进行假设 。 假设正确与否最后可以验证 。
现采用信息条件最小 估计法来估算参数 在式 和 中 , 协和 护可 以从 的
样本直接估得
。 按照生物信息反馈原理 , 以原品种为对照 , 可用对照提供的信息来 估 得 协
和 荃。 剩下的问题就是 估 算 林 、 圣和 了 。根据信息条件最小 “ 估计原理 , 在样本矩 林
、
。 、 林 和 分别等于对应的总体矩 卜 、 护
、 林 和 时 的条件下 , 信息条件卡方函数应
取决于如何使
名
一
‘、夕尸舀‘百二︵
“洲、、 沪产、如
“ “ , , 卜 , ,
, 一 ,
通
为最小 。 其中。 , 是 的样本中第 组个体数观察值 , , 是在上述四个样本矩分别等于对 应 的
总体矩的条件下第 组个体数的期望值 。
具体算法 选择一个 值连同已知的 林
、
护
、 卜 和 时一起代 入 式 和
求出 卜 和 孟 然后将 林
,
圣
、 林 , 全和 代入式 的 具 体 形 式 中 ,
一
求 出 ,
植物数量性状诱发突变的数学模型
, , 二 , 再将 , 和 。 代入式 求出 值 反复迭代 , 即可得到 为最小时
的 林 、 麦和 。 再求出 的上概率 , 可判断对 和 的形式的假设是否合适
若不合适 , 可假设其它分布形式 , 重复上述过程 理论上是能够找到合适的分布的 。
四 为求 上概率 , 应知道其自由度 。 对 和 均为正态分布的情形 , 由
式 知 , 每组期望 频率 , , ⋯ , 依赖于参 数 林
、
釜、 卜 、 盆和
但 由式 和 知 , 卜 和 吐 均是 卜 、 时 和 的函数 , 因此 ,实际只依赖于 三 个
参数 据皮尔逊定理 , 要自由度应为
一 一
,
五 由于对照为基因型纯一的品种 , 因此其方差可作为环境方差的估值 。 在满足线性
可加模型及基因型与环境无互作条件下 , 可求出突变性状的广义遗传力
尝一 。老
盖 ,
一受由此可以预期对突变性状的选择效果 。
三 、 模型的多元推广
一 同时考虑 个性状 , 仍然可将植物诱变后代群体分解为两个子群体 , 因此式
仍然成立 。 个性状构成了一个 维随机列向量 , , ⋯ , , 撇号 示 转 置
只需将式 一 中的变量 和 改成向量 和 , 一重积分号改成 重积分号 , 即可 作
为多元情形的表达式 。
二 在 、 和 中的数学期望和方差矩阵 简称方差 可分别 记 为 和 、
及 和 。 容易证明 , 这些参数 间具有与一元情形完全相似的关系式
止匕 一
和
二 高匕 ‘ 一 , 令‘ 一 , ‘ 一
息
实际上 , 若令 二 , 式 和 就变成式 和
证明 以
、 和 分别表示在 、 和 中求数学期望 , 由式 应有
一 一
, 二 一 , ,
, 〔 一 〕 〔 一 厂 ‘〕
一 , 犷 ‘一 一 厂一 劣
一 ‘
二 一 ‘ 一 一 一
一 产
尹一耳 产
核 农 学 报
’
卷
一 , 一 , , 一 ‘
一 一 一 产
二 一 、 一 、二 、一 ,
联立式 和 即可得式 和
。
三 多元情形参数估计也可用信息条件最小 “估计法 , 算法跟一元情形相似 , 这里 不
再赘述 。 但 由于牵涉到多重积分 , 实践上比较麻烦 。 对于 多元正态联合分布的积分 , 可采用
数论方法求得 〔毛 。
宁
四 多元情形下 自由度求法与一元情形相似 , 但应 考 虑 到 实际包含 个参数 ,
包含于 个参数 两对称元素只算一个参数 , 因此参数总 数 含
二 含 , 从而有
一 告 一
若令 , 上式即是式
。
五 多元方法估得的参数包含了性状间相互影响的信息 , 因此更为丰富和准确 。 突变
率 不再针对某个性状 , 而是多个性状的综合表现 。 方差阵 既给出了各性状的突变方差 ,
又给出了性状突变的相关关系 , 因此意义十分重大
。
从方差阵 和 出发 , 不仅可 以 计
算出各个性状的遗传力 , 而且能够计算两性状间的相关遗传力 〔“ 及所有性 状 的 多 元 遗 传
力 〔。 等 , 这对理论上植物数量性状诱变规律及其遗传学的研究 , 以及实践上突变性状 的 综
合选择 , 无疑是很有意义的 。
四 、 应用实例
这是一个一元情形的实例 。 供试材料为长果种黄麻品种翠绿
。
年在福建省农科院钻
室辐照处理干种子 , 当年种植 丫 , 代并收获种子 。 年种植略 低 于 半 致 死 剂 量 的 处 理
的 代 , 以原品种作对照
。 月 日播种 , 相邻排列 。 试验 田前作为水稻 , 土壤肥
力均匀 。 开花期间定株观察 , 记载每株第一朵花开放 日期
。 对照共 观 察 株 , 丫 代 观 察
株 。
假设 和 皆是正态分布 , 用信息条件最小 估计法估算 参数 表 。 计
算知 ’上概率大于 表 , 表明假设是合适的
从表 可 以看出 突变子群休平均值小于正常子群休 , 但方差却大得多 , 说明突变
范围是较宽的 , 且主要是朝早熟方向突变 突变率较高 , 说明诱变效果较好 广
义遗传力亦较高 , 说明在丫 代选择生育期突变体是有效的 从图 可以清楚地看出
、
和 三者间的关系
。
利用临界值法对试验结果也进行了分析 。 计算表明 , 取显著水准 比较适合 。 这
时临界下限 了 天 , 上限 天 , 对照个体全落入临界 范 围 内 。 丫 代早
熟突变率为 , 迟熟突变率为 , 总突变率 图 阴影部分 。 可 见 , 临 界
值法估得的突变率是偏低的 , 它实际上只估算了表现极端类型的突变休 , 严格地说 , 临界值
公式只能用于正态总体的样本 。 由于植物诱变后代群体实际上是个混合分布总体 , 故其样本
用临界值公式只能是近似的 , 判别结果是有偏差的 , 特别是 当突变率较高时偏差更大 。 本例
期 植物数且性状诱发突变的数学模型 弓
表 攀姆几代始花期有关今橄的估位
戈 多
菇心 , 人
︿
·、
、月协
⋯参 数 节 落 节 。爹 节 飞 氢
估 值
了礼住 。 。 切
注 矶和决涵对照估得 卜一 屯老访 拓尽 比
粗 取绿 代始花期现案组救与理论级救
‘
一 “ , 。 叹瓦而、 夕,
嘴 双
组 限 观 察 值 期 望 值
一
一
名
一
一
一 ,
。
。
。
。
。
。
弓曰口
,上‘
。
说明了这一点 , 因为 , 从图 可见 , 临界下 限实际上至少可增大到 天 不过 , 由于临 界 值
法简单易行 , 在近似应用 中仍不失其价值 。
总的来看 , 混合分布模型用于植物诱变育种研究是一种有益的偿试 , 它不仅有助于对植
物数量性状诱变规律的深入了解 , 而且对育种实践也有指导意义 。
参 考 文 献
〔 〕周松茂 诱变育种中突变频率的计算 , 《 原子能农业应用 》 , , 曰一
〔 刘垂环 生物数盆性状的一个模型及其应用 , 《 安徽农学院学报 》 , , 一
〔 〕周概容 《 概率论与数理统计 》 , 高等教育出版社 , 坤 韶一 反
〔 〕张尧庭
、 方开泰 《 多元统计分析引论 》 , 科学出版社 , 一 。
〔 〕戴君惕等 相关遗传力及其在育种上的应用 , 《 遗传学报 》 , 。 , 了 一
〕盖钧谧 应用于遗传研究的多元变异指数 , 《 南京农学院学报 》 , , 时 一 ”
已、州
诩
肠
。
刁帅
朋
扭 通如介毗扭翔 那眯加加 名认泛汾
,
一 已
,《留,
》
《
吞一,‘七
越祖
吞咨荟在趁﹄肠件
一
招 丽一丽 有专宁
,
。。厂
岌久旅 勿 , 》
图 , 和 的曲线图
,
龟
亡 夕 优 夕 , 夕 夕 ,
, 一 一
一一一
, ,
’ ,
, 一一 一
一
’
一 一
, ,
五
, 诊
一 ,
毛
‘