免费文献传递   相关文献

THE CALIBRATION SAMPLE SELECTION AND MODEL OPTIMIZATION IN RICE QUALITY ANALYSIS BY NEAR INFRARED SPECTROSCOPY

稻米品质近红外光谱法分析中定标样品选择与模型优化



全 文 :文章编号 :100028551 (2008) 062823206
稻米品质近红外光谱法分析中定标样品选择与模型优化
陆艳婷 张小明 叶胜海 祁永斌 金庆生
(浙江省农业科学院作物与核技术利用研究所 ,杭州 浙江 310021)
摘  要 :通过对粳型水稻精米粉的直链淀粉含量和氨基酸含量近红外光谱检测模型的定标样品数量和优
化的分析 ,用新复极差检验对不同样品组的粳稻精米粉直链淀粉含量和谷氨酸、亮氨酸含量的近红外建
模效果校正决定系数 ( R2 )和交叉检验均方误差 (RMSECV) 进行了评价 ,发现样品数为 216 份、114 份、81
份的直链淀粉含量样品组间无显著差异 ,200 份、132 份、91 份谷氨酸和 200 份、113 份和 70 份亮氨酸含
量的样品组间无显著差异。结果表明 ,优选合适的样品及数量 ,并对模型进行优化 ,不仅可保持定标方
程的精度 ,也可节约成本、减少工时。在本试验中 ,直链淀粉、谷氨酸和亮氨酸含量分别选择 81、91、70
份分布均匀的样品 ,可满足各自的建模要求。
关键词 :近红外光谱法 ;水稻 ;样品数量 ;模型优化
THE CALIBRATION SAMPLE SELECTION AND MODEL OPTIMIZATION IN RICE
QUALITY ANALYSIS BY NEAR INFRARED SPECTROSCOPY
LU Yan2ting  ZHANG Xiao2ming  YE Sheng2hai  QI Yong2bin  J IN Qing2sheng
( Institute of Crop and Nuclear Technology Utilization , Zhejiang Academy of Agricultural Sciences , Hangzhou , Zhejiang  310021)
Abstract :The number of calibration sample and model optimization of using near2infrared spectroscopy for the measurement of
amylose content and amino acid contents of milled japonica rice powder were studied. The Duncan’s multiple ranger test was
done for different number sample set of rice amylose , glutamic acid and leucine contents determination through near2infrared
model predication analysis , which was appreciated by the optimal calibration determination coefficient ( R2 ) and cross2
examination mean square errors (RMSECV) . The test results showed that there were no significant difference of the amylose ,
glutamic acid and leucine contents when the amylase content sample set was 216 , 114 and 81 ; and glutamic acid sample set
was 200 , 132 and 91 ; leucine content sample set was 200 , 113 and 70 , respectively. The results indicated that the suitable
sample , the numbers of sample and the optimized model must be selected , which would not only maintain the calibration
equation precision , but also save the cost and reduce the manpower. It will keep the demand of modeling to choose 81 ,91 and
70 samples well distrbuted for amylose content , glutamic acid content and leucine content respectively in this study.
Key words :near infrared spectroscopy ;rice ;sample quantity ;model optimization
收稿日期 :2008204205  接受日期 :2008206205
基金项目 :农业部科技项目 (nyhyzx0720012006 , 200803034) ,浙江省科技攻关项目 (2004C12020 , 2008C22068)
作者简介 :陆艳婷 (19692) ,女 ,浙江台州人 ,硕士 ,助理研究员 ,从事水稻育种研究。E2mail :lytcc2003 @hotmail . com
通讯作者 :金庆生 (19552) ,男 ,浙江杭州人 ,研究员 ,从事水稻育种研究。Tel :0571286404200 ; E2mail :jinqs @mail . hz. zj . cn  传统的稻米品质测定分析方法因操作繁琐、费工费时 ,且大多数情况下需要对种子进行碾磨成粉样后检测 ,故不利于水稻早代育种材料的选择和突变材料的筛选。因而近年不少学者将近红外光谱 (NIRS)技术 应用于稻米品质分析 ,该方法具有快速、高效、低成本、无污染等优点[1~8 ] 。但近红外分析首先需建立近红外分析定标模型(定标方程) ,为最大限度地涵盖待测未知样品成分的
328 核 农 学 报 2008 ,22 (6) :823~828Journal of Nuclear Agricultural Sciences
1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
范围 ,需要尽可能多地收集样品[3 ] ,样品数往往数百
份 ,甚至上千份 ,导致实验分析工作量较大 ,因此很有
必要对现有的方法进行优化。作者在应用近红外光谱
分析粳型水稻米质时发现 ,优选合适的样品及数量 ,剔
除异常值 (化学法测定值不精确和异常光谱) ,不仅可
保持定标方程有可靠的精度 ,还可节约成本、减少工
时。本文结合粳稻直链淀粉含量和谷氨酸 (非必需氨
基酸) 、亮氨酸 (必需氨基酸) 含量的建模 ,探讨定标样
品选择和模型优化的方法。
1  材料与方法
111  材料和仪器
供试材料为浙江省近年育成的粳稻品种 (系) 226
份 ,其中粳糯稻 35 份 ,均为具有代表性的常用种质资
源 ,统一种植于浙江省农业科学院试验田 ,按当地水稻
栽培习惯进行常规管理 ,2004 年秋季收获。种子经脱
糙碾精后用国产 SDM2A 型旋风磨粉机碾磨 ,过 100 目
筛 ,分别装于小塑料袋中存放在干燥器中待用。样品
的含水量 ≤1210 %。
仪器为具有积分球、PbS 检测器、旋转样品池等装
置的德国Bruker FT2NIR 近红外光谱仪 (Vector 22ΠN2I) ,
由 OPUSΠIR 扫描程序控制。光谱扫描前 ,光谱仪室的
温度调节至 25 ℃,将样品置于光谱仪室平衡一昼夜 ,
确保样品环境条件与近红外仪一致 ,以减少试验的误
差。
112  方法
11211  直链淀粉含量和氨基酸含量的化学测定 用
于直链淀粉含量测试的供试材料 226 份 (216 份用于定
标 ,10 份用于检验) ,用于亮氨酸和谷氨酸含量测定的
材料均为 210 份 (200 份用于定标 ,10 份用于检验) ,测
定方法同文献[7 ,8 ]。
11212  样品组的建立  定标样品根据化学测定值大
小确定样品的近似性 ,通过删除不同程度的近似样品
获得不同的样品组 ,用于作为建模的定标集样品组。
11213  样品近红外光谱的获取  工作谱区选用
349814~1000116cm- 1 ,分辨率为 8cm - 1 ,重复扫描 64
次 ,取平均值。每个样品重复装样 2 次 ,扫描后利用
OPUS软件计算平均光谱 ,以减少装样造成的误差。光
谱获取的方法同文献[7 ]。
11214  定标方程的建立和优化  所有样品的近红外
光谱采集后 ,用 Bruker 公司的 OPUS 定量分析软件包
Quant2 分析。对一定数量的定标样品采用偏最小二乘
法 (Partial Least Squares , PLS)建立定标回归方程 ,用内
部交叉验证法检验方程 ,通过比较利用近红外光谱模
型分析得到的预测值和化学测定值的符合程度 ,计算
交叉检验均方误差 (RMSECV) 和决定系数 ( R2 ) ,以评
价模型的预测效果 ,用已知真值 (化学法测定值) 的 10
个样品作为检验集对定标模型进行验证。
本研究设置最大主成分数目为 10 ,即在小于 10 的
条件下确立最佳主成分数 ,PLS 利用交叉验证法来选
择主成分数 ,用阶数 (Rank)来表示 ,主成分数太少会出
现欠拟合 ,导致光谱中一些有用的信息没有被包含在
模型中 ,校正的结果和预测的结果较差 ;所用的主成分
数太多 ,校正集的校正结果虽然较好 ,但预测结果会很
差 ;本研究所得结果均以 Quant2 分析软件通过交叉验
证法来确立最佳主成分数。
2  结果与分析
211  直链淀粉含量和氨基酸含量各样品组的建立与
分布
本试验在不改变样品组的相关成分含量总体分布
的基础上 ,对 216 份直链淀粉样品组中含量相同的样
品进行删除 ,得到 114 份样品组 ;对 114 份样品组中含
量相差 011 %的样品进行删除 ,得到 81 份样品组 ;依次
加大含量相差值 ,从而得到 57 份、38 份、25 份样品。
亮氨酸和谷氨酸含量也运用此方法得到各样品组 (详
见表 1) 。由表 1 可见 ,用于本试验建模的供试样品组
之间的直链淀粉含量、亮氨酸含量、谷氨酸含量变幅一
致 ,平均值略有差异。标准差随样品组中样品数的减
少而变大 ,反映出样品组内变量分散程度变大 ,这说明
试验采用的样品中有相当一部分是分布在一个比较密
集的区域 ,且在平均数附近。
212  粳稻直链淀粉含量和氨基酸含量的近红外模型
优化与预测效果
PLS分析方法提供了丰富的统计指标来评价校正
模型的质量。在模型进行校正前运用各种数学手段对
光谱进行数据处理 ,以消除基线漂移和其他光谱变异
的来源 ,从而减少光谱变异对校正模型的影响 ; 用
RMSECV(交叉检验均方误差)和 R2 (校正决定系数) 的
值来评价模型的优劣 ,对于一个可靠的模型而言 ,应具
有较高的决定系数和较低的均方误差。
本试验对不同数量样品组的直链淀粉含量和两种
氨基酸含量的近红外光谱选择适当的谱区[7 , 8 ] (直链
淀粉含量的谱区范围为 6102~424617cm- 1 ,谷氨酸含
量的谱区范围为 6102~459717cm- 1 ,亮氨酸含量的谱
区范围为 712013~609812 和 545012~424617cm- 1 ) ,进
428 核 农 学 报 22 卷
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
表 1  供试定标样品的直链淀粉含量和氨基酸含量的分布
Table 1  The content of amylose and amino acids of the calibration samples and their distribution
直链淀粉含量 amylose content 亮氨酸含量 leucine content 谷氨酸含量 glutamic acid content
样品数
number of
sample
变幅
range ( %)
平均值
mean
( %)
标准差
SD
样品数
number of
sample
变幅
range ( %)
平均值
mean
( %)
标准差
SD
样品数
number of
sample
变幅
range ( %)
平均值
mean
( %)
标准差
SD
216 0~3116 17110 8109 200 1113~2159 1183 0126 200 0152~1106 0183 0111
114 0~3116 17158 8167 132 1113~2159 1183 0128 113 0152~1106 0182 0112
81 0~3116 17170 9113 91 1113~2159 1181 0133 70 0152~1106 0182 0113
57 0~3116 18101 9133 54 1113~2159 1182 0136 40 0152~1106 0181 0113
38 0~3116 18154 9145 32 1113~2159 1182 0139 24 0152~1106 0180 0114
25 0~3116 16183 9183 18 1113~2159 1181 0143 15 0152~1106 0178 0116
注 :SD :standard deviation
表 2  不同样品组的不同光谱数据预处理对粳稻直链淀粉含量近红外建模效果的影响
Table 2  The effect of the different sample sets using different spectrum data pre2treatments on
near2infrared modeling of amylose content in Japonica rice
光谱预处理方法
pre2treatments 定标样品份数 number of sample set25 38 57 81 114 216
R2
RMS2
ECV rank R
2 RMS2
ECV rank R
2 RMS2
ECV rank R
2 RMS2
ECV rank R
2 RMS2
ECV rank R
2 RMS2
ECV rank
FD + SLS 93118 2157 9 91126 2179 9 94107 2127 9 95137 1192 10 95101 1194 10 94193 1189 10
FD 93166 2148 9 90116 2196 9 93164 2135 9 9513 1198 10 94173 1199 10 94179 1192 10
FD + VN 92132 2172 9 9115 2176 9 94191 2111 9 95114 2101 9 94163 2101 9 94176 1192 9
FD + MSC 92118 2175 9 91117 2181 9 94183 2112 9 95119 2100 9 94161 2101 9 94171 1193 9
mean 92184 2163 9 91102 2183 9 94136 2121 9 95125 1198 915 94175 1199 915 9418 1192 915
1 % B C A A A A
SSR 检验 5 % c d b a ab ab
SSR test 1 % B A C D D D
5 % b a c d d d
注 : FD :一阶导数 ;SLS:直线扣除 ;VN :矢量归一化 ;MSC:多元散射校正 ; R2 :校正决定系数 ;RMSECV :交叉检验均方误差 ;Rank :最佳主成分数 ;5 % :显
著差异 ;1 % :极显著差异。下表同。
Note :FD :first derivative ; SLS: straight line subtraction ; VN : vector normalization ; MSC: multiplicative scatter correction ; R2 : calibration determination coefficient ;
RMSECV :cross2examination mean square errors ; rank : optimal principal components number ; 5 % :5 % significant difference ; 1 %∶1 % significant difference.
行多种光谱数据预处理 ,得到 R2 和 RMSECV 值 ,并进
行比较分析 ,结果见表 2 和表 3。
213  不同样品组所建模型的预测值与化学值比较分

利用各样品组所建的近红外直链淀粉含量模型 ,
对 10 份检验集样品的预测值与化学值进行比较分析 ,
显示 216 份、113 份、81 份、57 份、38 份和 25 份样品组
所建的近红外光谱模型的预测值绝对平均误差和误差
极值分别为 1124、1126、1128、1132、1156、0193 和 214、
217、219、315、311、413 (表 4) ,216 份、113 份和 81 份样
品组所建的模型预测值间无显著性差异。25 份样品
组所建模型的预测值平均误差只有 0193 ,但其误差极
值在各样品组中最大 ,说明 25 份样品组因样品数太少
影响了模型精度 ,而 216 份与 81 份之间没有显著差
异 ,进一步说明了建模样本群体只要成分含量分布合
理 ,最大限度地涵盖待测样品的成分范围 ,样本数达一
定量后 ,所建模型可以用作预测分析。
利用 PLS 分析方法对不同样品组的粳稻直链淀粉
含量和谷氨酸、亮氨酸含量的近红外建模效果进行评
价 ,用新复极差法 (SSR 检验 ,又称 Duncan 法) 进行差
异性检验 (表 2 和表 3) 。结果表明直链淀粉含量建模
的样品组在 57 份、81 份、114 份、216 份的之间 R2 值无
极显著差异 ,25 份、38 份与其他样品组存在显著和极
显著差异 ;交叉检验显示 81 份、114 份、216 份的样品
组无显著差异。
由表 3 可见 ,谷氨酸含量的近红外建模样品组在
200 份、132 份与 91 份、54 份、32 份间 R2 值无极显著
差异 ,但 18 份样品组极显著优于 132 份和 200 份样品
528 6 期 稻米品质近红外光谱法分析中定标样品选择与模型优化
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
组 ,而其预测效果显示 18 份样品组显著差于其他样品
组 ,导致这一现象的原因可能在于 18 份样品组样品份
数少 ,导致模型过拟合 ,从而使得校正结果很好而预测
结果很差。交叉检验显示样品数为 200 份、132 份、91
份间无显著和极显著差异。
亮氨酸含量的近红外定标模型效果显示 ,样品数
为 200 份、113 份、70 份、40 份间的 R2 值没有显著和极
显著差异 ,其预测结果也显示类似结果。交叉检验显
示样品数为 200 份、113 份、70 份样品组的亮氨酸含量
差异不显著。
表 3  不同样品组的不同光谱数据预处理对粳稻氨基酸含量近红外光谱模型校正和预测效果的影响
Table 3  The near2infrared modeling effect of amino acid content of japonica rice of the different sample
group’s using different spectrum data pre2treatments
项目
item
R2 RMSECV rank
181 32 54 91 132 200 18 32 54 91 132 200 18 32 54 91 132 200



GUL
定标集
calibration
set
SSR 检验
SSR test
检验集
validation
set
SSR 检验
SSR test
MSC 92128 87166 89154 89103 87175 87109 011210 011370 011160 011090 010979 010938 3 3 3 4 4 5
VN 92129 87165 89154 89103 87174 87109 011210 011370 011160 011050 010979 010938 3 3 3 4 4 5
FD + SLS 92102 90103 90182 89110 86162 87114 011230 011230 011060 011080 011040 010936 3 4 4 4 4 5
COE 85165 86161 88147 87126 86104 86179 011650 011430 011220 011070 011040 010949 3 4 4 5 5 6
平均值 mean 90156 87199 89159 88161 87104 87103 011325 011350 011150 011073 011010 010940 310 315 315 413 413 513
1 % A AB AB AB B B A A AB BC BC C C BC BC B B A
5 % a bc ab abc c c a a b bc Bc c c c c b b a
MSC 72141 83103 83165 85102 88188 87162 011930 011510 011480 011420 011220 011290 2 2 2 2 4 4
VN 72140 83103 83165 85102 88195 87162 011930 011510 011480 011420 011220 011290 2 2 2 2 4 4
FD + SLS 68170 84155 87119 87121 86126 85147 012050 011440 011310 011310 011360 011400 4 4 4 4 4 4
COE 70158 82156 86133 86100 85197 85170 011990 011530 011360 011370 011380 011390 5 5 5 5 5 5
平均值 mean 71102 83129 85121 85181 87152 86160 011975 0114975 0114075 01138 011295 011343 313 313 313 313 413 413
1 % C B AB AB A A A B BC BC C C A A A A A A
5 % d c bc ab a ab a b bc cd D cd a a a a a a
项目
item
R2 RMSECV rank
151 24 40 70 113 200 15 24 40 70 113 200 15 24 40 70 113 200



LEU
定标集
calibration
set
SSR 检验
SSR test
检验集
validation
set
SSR 检验
SSR test
SLS 75106 82191 89126 89167 88124 90123 010809 010586 010430 010414 010409 010351 3 4 5 5 5 6
FD + SLS 80143 85113 87168 89161 88165 89163 010716 010546 010461 010416 010396 010362 2 3 3 3 3 4
MSC 68172 79123 85 ,43 88104 89149 89122 010906 010646 010501 010417 010386 010369 2 3 4 4 5 5
MMN 74100 78183 88115 89151 88156 89160 010826 010652 010452 010418 010404 010362 2 3 4 5 5 5
平均值 mean 74155 81153 87163 89121 88174 89167 010814 010608 010461 010416 010399 010361 213 313 4 413 415 5
1 % C B A A A A A B C CD CD D C BC AB AB AB A
5 % c b a a a a a b c cd D d c bc ab ab a a
SLS 90144 92105 93102 92188 90143 90108 010447 010408 010382 010386 010447 010456 6 5 5 6 5 5
FD + SLS 89148 90141 92173 92154 91167 90167 010469 010448 010390 010395 010418 010437 2 3 3 3 3 3
MSC 84187 91100 92153 91120 90123 91197 010563 010434 010395 010429 010452 010410 1 4 5 4 4 5
MMN 90108 92164 93162 91192 91197 91123 010456 010392 010365 010411 010410 010428 3 4 2 3 3 3
平均值 mean 88172 91153 92198 92114 91108 90199 010484 010421 010383 010405 010432 010433 3 4 318 4 318 4
1 % B A A A AB AB A B B B AB AB A A A A A A
5 % c ab a ab ab b a bc c bc B b a a a a a a
注 : MMN :最小最大归一化。1 所在行的数字表示样品份数 ,下表同。
Note : MMN :Min2Max normalization. The data in this line of 1 mean the amount of sample. The same as following table
628 核 农 学 报 22 卷
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
  综上所述 ,在样品数较多的前 3 组 ,彼此间近红外
定标模型校正效果 R2 和 RMSECV 值显示无显著差
异 ,各自的预测效果也显示了类似的结果。在本试验
条件下 ,直链淀粉含量选择 81 份、谷氨酸含量选择 91
份、亮氨酸含量选择 70 份的样品组所建模型仍具有较
高的精度。
表 4  各样品组所建模型的直链淀粉含量预测结果
Table 4  The near2infrared modeling effect
of amylose content of the different sample sets
样品
sample
预测值
modeling data
化学值
chemical
data
216 113 81 57 38 25
矮粳 23 Aijing 23 2618 2516 2610 2615 2415 2612 2617
城特 232 Chengte 232 2819 2814 2913 2914 3215 3 3016 2914
越光 Koshihikari 1815 3 1812 3 1811 3 1714 3 1815 1616 3 2019
越南 190 号 Echinan 190 816 917 913 912 913 819 710
浙粳 66 Zhejing 66 2813 2714 2814 2714 2614 2711 2712
浙粳 27 Zhejing 27 2316 2216 2312 2310 2313 2119 2118
嘉湖 5 号 Jiahu 5 2110 2016 2017 2017 2412 2310 2313
秀水 63 Xiushui 63 1818 1919 2010 1914 2111 2019 2013
浙大 332 Zheda 332 1916 1910 1913 1914 1914 2010 1917
太湖糯 Taihunuo - 019 - 013 019 - 211 112 012 010
平均误差 mean error 1124 1126 1128 1132 1156 0193
误差极值 extra2error 214 217 219 315 311 413
注 : 3 为该组中预测值与化学值之差最大的样品.
Note: 3 The data with 3 are the biggest value between the modeling and
chemical analysis data in that the same column.
3  讨论
311  近红外光谱分析是一种快速、高效的稻米品质分
析方法 ,建模过程中选择适当的定标样品数量十分重
要 ,数量过多 ,虽然可以获得准确的预测模型 ,但前期
工作量大 ,数量过少则建模时往往主成分数偏少 ,易出
现过拟合现象 ,预测效果差。根据美国实验材料协会
对 NIRS 分析中校正集样品数目的要求 ,样品需大于
6 (k + 1) ,k 为 PLS 模型中所用的主成分数 ,通常需要
最小数目的样品数为 24。本研究中样品数较多的 3
组样品组获得的模型 ,校正与预测效果均较好 ,且无显
著差异。说明应用近红外光谱法分析直链淀粉、谷氨
酸和亮氨酸含量等稻米品质时均有一个最小样品数 ,
但 81 份、91 份、70 份是否为上述成分的最优样品数还
有待进一步研究。王之安认为建立较窄范围模型需要
50~100 个定标样品 ,对于较宽范围或开放样品群则
需要至少 150 个以上的定标样品[9 ] ;舒庆尧等对稻米
直链淀粉含量近红外校正样品数量的试验得出 896 个
样本与 277 份样本建立的回归方程效果相似[10 ] ;而李
宁等以 39 个不同品种的完整籽粒黄豆样品建立蛋白
质和脂肪含量近红外定量分析模型 ,所获得模型也具
有良好的实用性 ,对 264 个不同品种的黄豆样品进行
预测 ,其蛋白质和脂肪模型预测的最小相对误差分别
为 0104 %和 2146 % ,最大相对误差分别为 2145 %和
4125 %[11 ] ;芦永军等从 178 份玉米粉样品中剔除相似
样品 (成分含量相近的样品)优选得到 94 份样品 ,其蛋
白质和脂肪的近红外模型定标精度与 178 份样品集相
近[12 ] 。说明定标样品群理论上必定存在一定区间的
最小值 ,在这个区间既可以获得较好的模型 ,又可以减
少工作量。
312  近红外光谱分析技术是以样品组分的化学测定
值作为标准且用于定标的 ,要求定标用的样品组分含
量范围尽可能覆盖将来需测定样品可能出现的含量范
围[10 ,13~15 ] ,且含量分布合理 ,而现有的样品中往往是
田间种植品种的样品占绝大多数 ,这些样品组分的化
学测定值比较相近 ,它们的光谱也较相似 ,本研究在建
模的过程中通过减少这些样品数量 ,保留含量具代表
性的样品 ,取得了较好的结果。
313  慎重删除异常样品是校正模型建立和优化的重
要环节。校正集和检验集中异常值的出现与化学测试
准确度和模型的准确度有关 ,但如果出现在相关模型
的两个极端 (最大或最小含量值) ,可能是特殊样品 ,应
慎重处理。本试验中定标集与检验集的样品中存在极
个别的浓度和光谱超常样品 ,考虑到选择样品的随机
性 ,建模与预测时均未作删除 ,这可能会影响建模的质
量和预测的效果。在实际使用中 ,对此类样品应考虑
删除以优化定标模型和提高预测精度[10 ,15~17 ] ,但过多
删除超常样品会降低模型的适用性 ,删除样品不应超
过总样品数的 10 %[6 ] ,删除时应慎重。
314  测试样品的均匀度是影响建模质量的关键因素
之一。严衍禄等[18 ]在用近红外光谱分析谷物时 ,将谷
物的颗粒度从通过 40 目筛改为 60 目筛 ,样品分析测
定的标准偏差降低约 15 % ,王文真[19 ] 、刘建学[20 ] 、李勇
等[5 ]在分析影响近红外光谱结果中也表明了同样的观
点。在本试验中所有样品均过 100 目筛 ,以最大限度
地保持样品处理的一致性 ,减少因此带来的化学测试
和光谱扫描误差 ,确保所建模型具有实用价值。
4  小结
本研究对稻米品质近红外光谱分析建模遇到的定
标样品数量问题进行了系统分析 ,获得的结果表明在
728 6 期 稻米品质近红外光谱法分析中定标样品选择与模型优化
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
建模中选择适当数量且具有代表性的样品 ,可以实现
预测效果与工时成本的最佳组合 ,既省工省时 ,又确保
预测效果 ,有利于提高稻米品质分析的近红外建模效
率。
参考文献 :
[ 1 ]  Wesley I J , Larroque O , Osborne B G, Azudin N , Allen H , Skerritt J
H. Measurement of gliadin and glutenin content of flour by NIR
spectroscopy. Journal of Cereal Science , 2001 , 34 (2) :125~133
[ 2 ]  Brian G, Osborne , Thomas Fearn , Andrew R Miller , Stuart Douglas.
Application of near infrared reflectance spectroscopy to the compositional
analysis of biscuits and biscuit doughs. Journal of the Science of Food
and Agriculture , 35 (1) :99~105
[ 3 ]  Wehling R L , Jackson D S , Hamaker B R. Prediction of corn dry2
milling quality by near2infrared spectroscopy. Cereal Chemistry , 1996 ,
73 (5) :543~546
[ 4 ]  邵咏妮 ,曹 芳 ,何 勇. 基于独立组分分析和BP 神经网络的可
见Π近红外光谱稻谷年份的鉴别. 红外与毫米波学报 ,2007 ,26
(6) :433~436
[ 5 ]  李 勇 ,魏益民 ,王 锋. 影响近红外光谱分析结果准确性的因
素. 核农学报 , 2005 ,19 (3) :236~240
[ 6 ]  陈 锋 ,Nagamine T ,张  艳 ,何中虎 ,王德森 ,Hisashi Yoshida. 中
国冬播小麦面粉颗粒度分布及近红外透射光谱测试技术研究.
作物学报 ,2005 ,31 (3) :302~307
[ 7 ]  陆艳婷 ,金庆生 ,叶胜海 ,张尧锋 ,祁永斌 ,王林友 ,张小明. 应用
近红外光谱技术快速测定粳稻品种的直链淀粉含量. 中国粮油
学报 ,2007 ,22 (3) :149~153
[ 8 ]  陆艳婷 ,张小明 ,叶胜海 ,祁永斌 ,严文潮 ,王建清 ,金庆生. 粳稻
七种必需氨基酸含量近红外漫反射光谱分析技术研究. 核农学
报 ,2007 ,21 (5) :478~482
[ 9 ]  王之安. AOAC公定分析方法. 北京 :中国科学技术出版社 ,1991
[10 ]  舒庆尧 ,吴殿星 ,夏英武 ,高明尉 ,Anna McClung. 稻米表观直链淀
粉含量近红外测定校正群体的界定与样品选择. 浙江农业学报 ,
1999 ,11 (3) :123~126
[11 ]  李 宁 ,闵顺耕 ,覃方丽 ,张明祥 ,叶升锋. 近红外光谱法非破坏
性测定黄豆籽粒中蛋白质、脂肪含量. 光谱学与光谱分析 ,2004 ,
24 (1) :45~49
[12 ]  芦永军 ,曲艳玲 ,朴仁官 ,张 军. 近红外光谱分析技术定标和预
测中的相似样品剔除算法. 光谱学与光谱分析 ,2004 ,24 (2) :158
~161
[13 ]  朱苏文 ,何 瑰 ,李 展. 玉米籽粒直链淀粉含量的近红外透射
光谱无损检测. 中国粮油学报 ,2007 ,22 (3) :144~148
[14 ]  孙成效 ,段彬伍 ,谢黎虹 ,陈 能. 利用近红外透射光谱技术同步
测定糙米的多项品质指标初报. 中国水稻科学 ,2006 ,20 (4) :451
~454
[15 ]  李君霞 ,张洪亮 ,严衍禄 ,闵顺耕 ,李自超. 水稻蛋白质近红外定
量模型的创建及在育种中的应用. 中国农业科学 ,2006 ,39 (4) :
836~841
[16 ]  闵顺耕 ,李 宁 ,张明祥. 近红外光谱分析中异常值的判别与定
量模型优化. 光谱学与光谱分析 ,2004 ,24 (10) :1205~1209
[17 ]  徐广通 ,袁洪福 ,陆婉珍. 近红外光谱定量校正模型适用性研究.
光谱学与光谱分析 ,2001 ,21 (4) :459~463
[18 ]  严衍禄 ,景 茂 ,张录达 ,王万军. 傅立叶变换近红外漫反射光谱
分析测量误差的研究. 北京农业大学学报 ,1990 ,增刊 (16) :37~
48
[19 ]  王文真. 在近红外光谱定量分析中应注意的几个问题. 现代科
学仪器 ,1996 , (1) :24~25
[20 ]  刘建学 ,吴守一 ,方如明. 近红外光谱法快速检测大米蛋白质含
量. 农业机械学报 ,2001 ,32 (3) :68~70
(上接第 891 页)
[ 7 ]  Du Z , Hempken R , Jackson J , Trammell D. Utilization of copper in
copper proteinate , copper lysine and cupric sulfate using the rat as an
experimental model . Journal of Animal Science , 1996 , 74 : 1657~1663
[ 8 ]  刘 强 , 黄应祥 , 王 聪 , 董宽虎 , 裴 华. 赖氨酸铜对西门塔
尔牛瘤胃发酵及尿嘌呤衍生物的影响. 中国畜牧杂志 , 2006 , 42
(23) : 33~35
[ 9 ]  刘 强 , 黄应祥 , 王  聪 , 董宽虎 , 裴  华 , 刘  曦. 蛋氨酸铜
对西门塔尔牛瘤胃发酵及尿嘌呤衍生物的影响. 黑龙江畜牧兽
医 , 2007 , 49 (6) : 29~30
[10 ]  王 聪 , 黄应祥 , 董宽虎 , 刘 强 , 霍文婕. 硫酸铜对西门塔尔
牛发情周期生殖激素分泌的影响. 核农学报 , 2008 , 22 (2) : 228
~232
[11 ]  杨 胜. 饲料分析及饲料质量检测技术. 北京 : 北京农业大学出
版社 ,1996 : 171~172
[12 ]  Van Soest P J , Robertson J B , Lewis B A. Methods for dietary fiber ,
neutral detergent fiber and non2starch polysaccharides in relation to
animal nutrition. Journal of Dairy Science , 1991 , 74 (6) : 3583~3597
[13 ]  刘 强 , 黄应祥 , 王 聪 , 周 怿 , 王  浩. 蛋氨酸硒对牛营养
物质代谢和生化指标的影响. 核农学报 , 2008 , 22 (2) : 233~237
[14 ]  Radecki . Effect of dietary copper on intestinal mucous enzyme activity ,
morphology and turnover rates in waling pigs. Journal of Animal Science ,
1992 , 70 :1424~1434
[15 ]  Engle T E , Spears J W , Armstrong T A , Wright C L , Odle J . Effects of
dietary copper source and concentration on carcass characteristics and
lipid and cholesterol metabolism in growing and finishing steers. Journal
of Animal Science , 2000 , 78 : 1053~1059
[16 ]  Tetlow L C , Woolley D E. Histamine stimulates the proliferation of
human articular chondrocytes in vitro and is expressed by chondrocytes in
osteoarthritic cartilage. Annals of the Rheumatic Diseases , 2003 , 62
(10) : 991~994
[17 ]  Blakley B. Immnotoxicity of pesticides : a review. Toxicol and Health ,
1999 , 15 : 119~132
[18 ]  Lauridsen C , Hojsgaard S , Sorensen M T. Effects of diretary rapeseed
oil , vitamin E , and copper on the perforance and antioxidative and
oxidative status of pigs. Journal of Animal Science , 1999 , 77 :906~916
[19 ]  冯 杰 , 刘 欣 , 吴新民 , 许梓荣. 酪蛋白铜对仔猪生长及血清
铜蓝蛋白和 SOD 活性的影响. 中国畜牧杂志 , 2005 , 41 (3) : 14~
17
[20 ]  Paynter D I. The role of dietary coper , manganese , selenium and vitamin
E in lipid peroxidationin tissues oh the rat . Biological Trace Element
Research , 1980 , 2 :121~135
[21 ]  Elvehjem C A , Hart E B. The necessity of copper as a supplement to
iron for hemoglobin formation in the pig. Journal of Biological Chemistry ,
1932 , 95 :363~370
828 Journal of Nuclear Agricultural Sciences
2008 ,22 (6) :823~828
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net