全 文 :第 11 卷第 6 期
2013 年 11 月
生 物 加 工 过 程
Chinese Journal of Bioprocess Engineering
Vol. 11 No. 6
Nov. 2013
doi:10. 3969 / j. issn. 1672 - 3678. 2013. 06. 015
收稿日期:2013 - 01 - 15
基金项目:国家自然科学基金(31101348);上海市教委科研创新项目(10YZ113)
作者简介:古方青(1988—),女,安徽无为人,硕士研究生,研究方向:食品安全监控技术;管 骁(联系人),副教授,E⁃mail:gnxo@ 163. com
近红外光谱技术快速检测原料乳中掺杂物
古方青1,管 骁1,刘 静2,杨永健3,张仲源1
(1.上海理工大学 医疗器械与食品学院,上海 200093; 2.上海海事大学 信息工程学院,上海 200135;
3.上海市食品药品检验所,上海 201203)
摘 要:采用近红外光谱技术结合化学计量学方法,对原料乳中常见的 2 种掺杂物———大豆分离蛋白与植脂末进
行定量分析研究。 先通过不同光谱预处理方法结合偏最小二乘法(PLS)建模评价不同预处理方法的效果,结果表
明通过平滑处理结合多元散射校正(MSC)进行光谱预处理效果最佳,大豆分离蛋白 PLS定量模型相关系数(R2)与
交叉验证均方差(RMSECV)分别为 0 980 9、0 127 5,植脂末 PLS模型分别为 0 972 2、0 130 8。 随后比较了不同建
模方法的效果,结果发现:采用径向基神经网络(RBF)对大豆分离蛋白的建模效果最佳,R2为 0 999 4,测试集均方
根误差为 0 003 1;采用广义回归神经网络(GRNN)方法对植脂末建模效果最佳,R2为 0 998 9,测试集均方根误差
为 0 004 5。 因此,合理结合近红外光谱技术与化学计量学方法可快速、准确检测原料乳中大豆分离蛋白和植脂末
这 2 种掺杂物含量。
关键词:化学计量学;植脂末;近红外光谱;原料乳;大豆分离蛋白
中图分类号:TS252. 7;O657. 33 文献标志码:A 文章编号:1672 - 3678(2013)06 - 0073 - 05
Rapid determination of adulteration in raw milk by
near⁃infrared spectroscopy analysis
GU Fangqing1,GUAN Xiao1,LIU Jing2,YANG Yongjian3,ZHANG Zhongyuan1
(1. School of Medical Instruments and Food Engineering,University of Shanghai for Science and Technology,Shanghai 200093,China;
2. College of Information Engineering,Shanghai Maritime University,Shanghai 200135,China;
3. Shanghai Institute for Food and Drug Control,Shanghai 201203,China )
Abstract:Quantitative determination of two kinds of common adulterants in raw milk,namely soy protein
isolates and creamer,was performed by combining near⁃infrared spectroscopy with chemometrics analysis.
Firstly,the effects of different spectrum pretreatment methods were evaluated by combining different
spectrum pretreatment methods with partial least squares model. The results showed that smoothing
algorithm combined with multiple scattering corrections had best performance. R2 and RMSECV of PLS
model for soy protein isolates were 0 980 9 and 0 127 5,and that of creamer were 0 972 2 and 0 130 8,
respectively. Then, the performances of different modeling methods were compared. The results
demonstrated that the best modeling methods for soy protein isolates and creamer were RBF and GRNN
methods. R2 and RMSE test of the RBF model for soy protein isolates were 0 999 4 and 0 003 1,and that
of the GRNN model for creamer were 0 998 9 and 0 004 5, respectively. Therefore,NIRS combined
reasonably with chemometric methods could be used to determine the contents of soy protein isolates and
creamer in raw milk with high speed and accuracy.
Key words:chemometrics;creamer;near⁃infrared spectroscopy;raw milk;soy protein isolates
近年来,不断出现的原料乳质量问题日益引起人
们对乳制品质量安全的重视。 目前,原料乳出现的主
要质量问题为掺杂使假,掺杂物主要包括水、蛋白粉、
植脂末等[1 - 2]。 传统的原料乳质量分析方法通常需
要利用不同手段对乳中不同组分分别进行测定,例如
用凯氏定氮法测定蛋白质含量,用盖勃法或罗兹法等
方法测定脂肪含量等,这些方法耗时费力,不利于原
料乳品质的在线监控。 因此,如何快速有效检测出原
料乳中蛋白、植脂末这两类掺杂物是乳品企业及相关
质检单位亟待解决的问题[1,3]。
随着光学仪器设计、制造水平的提高、计算机技
术的发展和化学计量学方法研究的深入,近红外光谱
分析技术在过程分析和工业控制领域应用越来越广,
它具备无损、高效、快速、成本低、绿色环保和易于实
现自动化等优点[4],特别是试样一般无需化学前处
理,更加便于实现在线分析,同时依靠化学计量学方
法,可实现物质的定性与定量研究[5 - 6]。
笔者通过分析掺入大豆分离蛋白以及植脂末
的原料乳的近红外漫反射光谱,结合多种光谱预处
理以及建模方法,建立定量模型,以期为快速检测
原料乳中的蛋白或脂肪掺假物含量提供新的思路。
1 材料与方法
1. 1 仪器设备
MPA 型傅里叶变换近红外光谱仪 (德国
Bruker),谱区范围 4 000 ~ 12 501 cm - 1,扫描次数为
64 次,分辨率为 8 cm - 1。
1. 2 试样准备
新鲜正常原料乳,取自上海金山奶牛场,用蒸
馏水稀释至蛋白质质量分数为 1 5%作为基底乳备
用。 在基底乳中分别掺入不等量的大豆分离蛋白
或植脂末模拟掺假试样,大豆分离蛋白掺入量控制
在 0 1% ~5 0% (质量分数),植脂末掺入量控制在
0 1% ~3 0% (质量分数),浓度梯度均匀分布,共
制备 61 组样本。 建模过程中在 61 组样本中随机选
取 45 组作为训练集,剩余 16 组为测试集。
1. 3 光谱采集与数据处理
在环境温度 25 ℃、相对湿度 45%条件下,近红
外光谱仪开机预热 10 min。 采集光谱前,将试样均
质 60 s。 利用光纤探头采集试样漫反射近红外光
谱,每个试样采集光谱 10 次。 将 61 × 10 组光谱数
据图导入 OPUS 6 5 软件进行处理,即对每一个试
样的 10 组图谱取平均值作为该样本的代表性光谱,
共获得 61 组光谱图,并将光谱图以.CSV 格式进行
保存以备后续数据分析。
1. 4 数据分析
数据处理分析在 Math works公司提供的 Matlab
2009b环境下进行。
2 结果与讨论
2. 1 光谱预处理及特征信息提取
图 1 显示了正常原料乳、基底乳、61 组掺入不
同浓度大豆分离蛋白或植脂末的掺伪乳漫反射图
谱。 由图 1 可知:稀释处理的基底乳图谱与原料乳
未见明显差异,均在波数 5 106 和 6 800 cm - 1附近
有较强特征吸收。 但掺入大豆分离蛋白或植脂末
后,光谱在部分波数处出现较大幅度扰动,如植脂
末组在 4 200 ~ 5 200 cm - 1与6 700 ~ 6 900 cm - 1区
间内随着植脂末掺入量的提高光谱吸收增强。 由
于大豆分离蛋白与植脂末本身在近红外区间各处
均有吸收,故选取全谱建立模型。 光谱信号中除包
括试样成分信息外,还包含高频噪声、基线漂移和
试样背景等,因此建模前需对光谱进行预处理以过
滤干扰信号,提高模型准确度。 常用的光谱预处理
方法包括平滑处理、多元散射校正、小波变换、一阶
导数、二阶导数等[7]。 同时,对光谱进行主成分分
析可以避免建模中的信息冗余,在分析中起到简化
数据的目的。 本实验中笔者首先采取了平滑处理、
多元散射校正以及小波变换等不同组合对光谱进
行预处理,并通过主成分分析提取出特征变量,进
一步通过偏最小二乘法建立定量模型,根据模型的
相关系数 R2、交叉验证均方差 RMSECV和相对误差
Σσ评价模型效果[8](表 1)。。
表 1 为大豆分离蛋白试样组 5 种不同的光谱预
处理方法效果。 由表 1 可知:通过光谱平滑处理结
合多元散射校正预处理后,应用主成分分析,前 4 个
主成分累积可解释原光谱信息的 90 1% ,PLS 模型
相关系数 R2可达 0 980 9,RMSECV 为 0 127 5,建
模效果最好;相反,尽管通过平滑处理结合小波变
换预处理后,提取前 3 个主成分可解释原光谱
47 生 物 加 工 过 程 第 11 卷
99 8%的信息,但最终建模效果不理想 ( R2 为
0 926 8,RMSECV为 0 232 6),可能的原因是建模
效果并非完全取决于预处理方法的有用信息提取
量,也与冗余信息剔除效果有关,同时全波段光谱
与特征光谱段的选择也会影响建模效果。 因此,平
滑处理结合多元散射校正光谱预处理方法在综合
平衡以上两方面关系的效果最佳。 同样,通过对植
脂末试样组光谱预处理效果比较可知,采用平滑处
理结合多元散射校正预处理后,提取前 4 个主成分
可解释原始光谱的 88 8% 信息, PLS 模型 R2为
0 972 2,RMSECV为 0 130 8,建模效果最好。 由此
可见,对本实验中的掺伪乳试样而言,平滑处理结
合多元散射校正光谱预处理方法最能有效降低原
始光谱的噪音,对提高建模性能有较大的帮助。
图 1 不同试样的近红外光谱
Fig. 1 Near infrared spectram of samples
表 1 不同光谱预处理方法对 PLS建模效果的影响
Table 1 Effects of different spectrum pretreatments on performances of PLS models
组别 预处理方法 主成分数 主成分累积比例 / % R
2 RMSECV ∑σ
大豆分
离蛋白
平滑处理 4 94 3 0 972 9 0 149 0 2 967 5
多元散射校正 3 95 1 0 954 5 0 190 7 3 545 4
平滑处理 +多元散射校正 4 90 1 0 980 9 0 127 5 2 783 5
平滑处理 +小波变换 3 99 8 0 926 8 0 232 6 3 985 5
多元散射校正 +小波变换 6 82 1 0 763 3 0 326 0 5 755 2
植脂末
平滑处理 4 95 2 0 965 4 0 152 3 3 106 4
多元散射校正 3 95 0 0 963 2 0 158 7 3 157 3
平滑处理 +多元散射校正 4 88 8 0 972 2 0 130 8 2 887 6
平滑处理 +小波变换 3 98 9 0 910 9 0 257 7 4 454 2
多元散射校正 +小波变换 6 71 3 0 804 3 0 299 8 5 042 3
57 第 6 期 古方青等:近红外光谱技术快速检测原料乳中掺杂物
2. 2 建模方法的比较
建模方法的选择同样对最终模型效果有重要
影响。 除偏最小二乘建模方法外,其他常用建模
方法还包括多元线性回归、人工神经网络等。 近
年来,人工神经网络方法得到了飞速发展[9 - 10] 。
神经网络是一种新的智能学习方法,它通过模拟
动物神经网络行为特征,进行分布式并行信息处
理得到数学模型。 该网络还可根据系统的复杂程
度,通过自行调整内部大量节点之间相互连接的
关系,进而达到高效处理信息的目的[11] 。 本文将
原始光谱通过平滑处理结合多元散射校正预处理
后,对主成分系数拟通过分别采用线性神经网络
( linear neural network,LNN)、反向传播神经网络
(Back propagation neural network,BP)、径向基函数
神经网络(RBF)和广义回归神经网络(GRNN)建
立模型。
由于不同神经网络方法模型系数各有不同,例
如 BP网络中节点层数、节点个数以及训练函数不
同,对模型建立效果影响很大[12]。 因此笔者比较了
不同神经网络中不同系数设置对模型性能的影响,
评价指标通过模型 R2、训练集均方根误差 σ1以及测
试集均方根误差 σ2来衡量。 表 2 为不同的神经网
络建模方法对大豆分离蛋白及植脂末含量预测能
力的比较结果。
表 2 不同建模方法的效果比较
Table 2 Comparison of performancse of different modeling methods
组别 建模方法 模型参数变量 模型参数变量值 R
2 σ1 σ2
大豆
分离
蛋白
LNN N / A N / A 0 957 7 0 093 6 1 139 4
BP 节点层数固定为 1
节点个数 10,传递函数 trainrp 0 983 5 0 057 5 0 400 0
节点个数 15,传递函数 trainrp 0 987 7 0 043 7 0 517 8
节点个数 10,传递函数 trainscg 0 972 1 0 057 9 0 467 2
节点个数 15,传递函数 trainscg 0 970 9 0 075 6 0 533 3
节点个数 10,传递函数 traingd 0 978 9 0 042 6 0 396 7
节点个数 15,传递函数 traingd 0 980 7 0 069 8 0 467 2
RBF 散布常数(SPREAD)
Spread = 0 1 0 997 8 0 002 1 0 003 1
Spread = 0 5 0 983 0 0 062 8 0 083 3
Spread = 1 0 0 978 9 0 097 3 0 103 3
GRNN 散布常数(SPREAD)
Spread = 0 1 0 999 4 0 002 0 0 003 1
Spread = 0 5 0 990 2 0 057 8 0 078 3
Spread = 1 0 0 982 5 0 067 3 0 083 4
植脂
末
LNN N / A N / A 0 950 5 0 094 1 1 139 4
BP 节点层数固定为 1
节点个数 10,传递函数 trainrp 0 979 6 0 056 9 0 399 2
节点个数 15,传递函数 trainrp 0 985 3 0 045 4 0 515 3
节点个数 10,传递函数 trainscg 0 977 4 0 058 2 0 466 8
节点个数 15,传递函数 trainscg 0 975 8 0 076 7 0 532 9
节点个数 10,传递函数 traingd 0 980 5 0 043 3 0 396 6
节点个数 15,传递函数 traingd 0 981 1 0 071 2 0 467 4
RBF 散布常数(SPREAD)
Spread = 0 1 0 998 9 0 003 7 0 004 5
Spread = 0 5 0 986 0 0 064 0 0 084 1
Spread = 1 0 0 979 8 0 096 2 0 102 7
GRNN 散布常数(SPREAD)
Spread = 0 1 0 995 5 0 002 5 0 003 4
Spread = 0 5 0 991 3 0 058 8 0 077 9
Spread = 1 0 0 986 6 0 060 5 0 082 8
由表 2 可知:LNN 建模效果较差,这是由于该 建模方法只能较好表征线性关系的输入与输出,而
67 生 物 加 工 过 程 第 11 卷
在本实验中由于建模输入的自变量较多,与输出结
果线性关系不明显,由此导致模型预测能力不佳;
BP神经网络建模相关系数较高,2 种掺杂物的定量
预测模型 R2均大于 0 97,但预测效果不理想,测试
集均方根误差 σ2较大,这是由于 BP 神经网络构建
中间层节点数量较多,模型样本数量偏少,建模随
机性大而不具代表性所导致;而 RBF和 GRNN模型
拟合度以及预测准确程度均较高,其中对大豆分离
蛋白含量的预测,通过 GRNN网络建模,SPREAD为
0 1 时,R2为 0 999 4,测试集均方根误差 σ2仅为
0 003 1,而对植脂末建模效果分析中,RBF 建立模
型可以取得最佳效果,模型 R2为0 998 9,测试集均
方根误差 σ2为 0 004 5。
总体看来,通过神经网络方法建立模型,对大
豆分离蛋白以及植脂末含量的预测均能达到很好
的效果,具有应用价值,但由于各种神经网络中参
数变量复杂,且有不同组合,而不同取值均能对模
型预测能力产生不同影响,因此在实际应用中需不
断探讨参数变量以及最优组合的选择。 本文中笔
者仅讨论了部分通用参数设置条件下建立模型的
结果,而对模型的全面优化仍有待进一步研究。
3 结 论
通过实验研究表明:利用近红外光谱分析可以快
速检测原料乳中常见掺杂物———大豆分离蛋白和植
脂末的含量。 通过选择平滑处理结合多元散射校正
光谱预处理方法结合 GRNN建模方法,大豆分离蛋白
组模型 R2可达到 0 999 4,测试集均方根误差为
0 003 1;通过平滑处理结合多元散射校正预处理结
合 RBF建模,植脂末组模型 R2达 0 998 9,测试集均
方根误差为 0 004 5,说明建立的模型稳定性很高,且
预测能力较强,可为研究原料乳中其他掺杂物的近红
外定量分析提供参考。 此外,进一步优化近红外光谱
的建模参数设置,将有利于推广近红外光谱分析技术
在原料乳质量监控实际工作中的应用。
参考文献:
[ 1 ] 郭朔.近红外光谱分析技术快速检测液态乳制品品质的研究
[D].长春:吉林大学,2008.
[ 2 ] 王多加,周向阳,金同铭,等. 近红外光谱检测技术在农业和
食品分析上的应用[ J] . 光谱学与光谱分析,2004,24 (4):
447⁃450.
[ 3 ] 王田子,邓丽敏,田立军,等. 近红外在乳及乳制品质量检测
中的研究进展 [ J] . 光谱学与光谱分析, 2010, 30 ( 12 ):
3208⁃3212.
[ 4 ] Balabin R M,Smirnov S V. Melamine detection by mid,and near⁃
infrared (MIR / NIR) spectroscopy:a quick and sensitive method
for dairy products analysis including liquid milk,infant formula,
and milk powder[J] . Talanta,2011,85(1):562⁃568.
[ 5 ] 徐广通,袁洪福,陆婉珍. 现代近红外光谱技术及应用进展
[J] .光谱学与光谱分析,2000,20(2):134⁃142.
[ 6 ] 张晓慧,刘建学.近红外光谱技术在牛奶及其制品质量检测
中的应用[J] .红外,2007,28(6):38⁃41.
[ 7 ] 褚小立,袁洪福,陆婉珍.近红外分析中光谱预处理及波长选
择方法进展与应用[J] .化学进展,2004,16(4):528⁃542.
[ 8 ] 何勇,李晓丽,邵咏妮.基于主成分分析和神经网络的近红外
光谱苹果品种鉴别方法研究[ J] . 光谱学与光谱分析,2006,
26(5):850⁃853.
[ 9 ] Dowman R,Ben⁃Avraham D. An artifical neural network model of
orienting attention towards threatening somatosensory stimuli[J] .
Psychophysiology,2007,44(2):229⁃239.
[10] Robinson C J, Johnson D O, Almeida J S. Second trimester
prediction of preeclampsia using an artifical neural network[J] . J
Soc Gynecol Invest,2006,13(2):126A.
[11] Liu X Z,Kang S Z,Li F S. Simulation of artificial neural network
model for trunk sap flow of Pyrus pyrifolia and its comparison with
multiple⁃linear regression [ J] . Agric Water Manage,2009,96:
939⁃945
[12] 齐俊. BP神经网络在牛乳检测中的应用[D].哈尔滨:哈尔滨
理工大学,2009.
77 第 6 期 古方青等:近红外光谱技术快速检测原料乳中掺杂物