免费文献传递   相关文献

Back propagation neural network and genetic algorithm for multi objective
optimization of extraction technology of Cortex Fraxini.

BP神经网络结合遗传算法多目标优化秦皮提取工艺的研究



全 文 :[参考文献]
[1] 杨 华,易 红.我国微乳技术在药学领域中的研究进展[J].
中国新药杂志,2006,15(10):764.
[2] 查建蓬,张嫡群,王云志.微乳色谱的研究及其在药物分析中
的应用[J].中国药学杂志,2006,41(2):90.
[3] 闻璃毓,康 纯.微乳TLC同时分离鉴定2种成药的多种成分
[J].中成药,2001,23(2):94.
[4] 中国药典.一部[S].2005:527.
[5] 邓 茂,杨 健,易 红,等.丹参微乳液中丹参酮ⅡA的
HPLC测定方法的建立[J].中国实验方剂学杂志,2008,14
(3):1.
ExperimentofextractingSalviaeMiltiorrhizaeonusingO/W Microemulsion
YANGHua,DENGMao,YIHong
(InstituteofChineseMateriaMedica,ChinaAcademyofTraditionalMedicalSciences,Beijing100700,China)
[Abstract] Objective:ToinvestigatethefeasibilityofextractingthefatsolubleandthewatersolubilitysubstancesfromSalviae
MiltiorhizaewithO/WMicroemulsion.Method:WiththeyieldofTanshinoneⅡAandSalvianolicacidBasindex,comperewitheficien
cyofextractingSalviaeMiltiorhizaebysuingthediferentmedia(water,alcoholandmicroemulsion),usingdiferentextractionmethods
(heat,microwave,ultrasonic),usingdiferentformulationsofO/Wmicroemulsion.Result:TheextractingyieldofTanshinoneⅡAand
SalvianolicacidBaremorethan70% byusingmicroemulsionatmeantime.Itisgoodoftheabilitiesofextractionofliposolubilitycom
poundssuchastheTanshinoneⅡAbythemicroemulsion.TheformulationsofmicroemulsionhaveremarkableefectforextractingSalviae
Miltiorhizae.Conclution:ItisfeasibialethatextractedSalviaeMiltiorhizaebyusingO/Wmicroemulsionasasolvents.
[Keywords] Salviaemiltiorhizae;microemulsion;extract;tanshinoneⅡA;salvianolicacidB
[责任编辑 鲍 雷]
[收稿日期] 20080506
[通讯作者] 杨铭,Tel:(021)643857007308,Email:yangpluszhu@sina.com
[作者简介] 杨铭,硕士,药师,主要从事中西药物制剂工艺及质量控制研究
BP神经网络结合遗传算法多目标优化秦皮
提取工艺的研究
杨 铭,余敏英,史秀峰,滕艳萍
(上海中医药大学 附属龙华医院 药剂科,上海 200032)
[摘要] 目的:使用BP神经网络结合遗传算法用于秦皮提取工艺的多目标优化。方法:以秦皮甲素和秦皮乙
素为指标,采用均匀设计法优化BP神经网络模型参数,并建立网络模型,再利用遗传算法对网络进行多目标寻优,
获得秦皮的最佳提取工艺。结果:得到的最优工艺条件为提取温度99℃、乙醇体积分数50%、液固比7、提取时间
94min,网络在此条件下的预测值为秦皮甲素提取量为9617mg·g-1,秦皮乙素提取量为2195mg·g-1,和实际
测量值的相对误差仅为-116%和-514%,具有较好的网络预测性。结论:BP神经网络结合遗传算法可用于秦
皮提取工艺的多目标优化。
[关键词] 秦皮;提取工艺;均匀设计;BP神经网络;遗传算法;多目标优化
[中图分类号]R284.1 [文献标识码]A [文章编号]10015302(2008)22262205
·2262·
第33卷第22期
2008年11月
         
    中 国 中 药 杂 志
ChinaJournalofChineseMateriaMedica
       
Vol.33,Issue 22
 November,2008
  目前,中药提取工艺较常用的实验设计有因子
设计、响应曲面设计(中心复合设计[1]、球面对称设
计[2]等)、正交设计[35]、均匀设计、中心旋转回归[6]
等,然后再用多元回归来拟合这些实验所得的数据
(连续型数据),在优化过程中通常采用的是线性或
非线性规划,但是中药的成分比较复杂,需要考察的
指标有很多,在多目标优化方法中目前较常用的是
将各个目标加权,从而将多目标问题转换为单目标,
再采用比较成熟的单目标优化算法求解,如综合评
分法。但它们有明显的缺点,如转换成单目标优化
后每次计算只能产生一个解,而权重系数往往也无
法确定。
人工神经网络(ANN)系统从20世纪40年代
末诞生至今仅短短半个多世纪,但由于它具有信息
的分布存储、并行处理以及自学习能力等优点,已经
在信息处理、模式识别、智能控制及系统建模等领域
得到越来越广泛的应用。尤其是基于误差反向传播
算法的多层前馈网络(简称 BP网络),可以以任意
精度逼近任意的连续函数,所以广泛应用于非线性
建模[7]。由于神经网络模型是通过神经元间的连
接权值与阈值来实现的,在解决最优化问题时,根本
无法用传统的优化方法来实现。遗传算法(GA)[8]
是一种基于自然选择和基因遗传学原理的优化搜索
方法。它将“优胜劣汰,适者生存”的生物进化原理
引入待优化参数形成的编码串群体中,按照一定的
适配值函数及一系列遗传操作对各个个体进行筛
选,从而使适配值高的个体被保留下来,组成新的群
体,新群体中各个体适应度不断提高,直到满足一定
的极限条件。此时,群体中适配值最高的个体即为
待优化参数的最优解。
秦皮具有清热解毒、清肝明目的功效,用于热
痢、泄泻、赤白带下、目赤肿痛、目生翁膜等症。秦皮
甲素和秦皮乙素是其主要的活性成分,本研究就利
用神经网络建模并结合遗传算法多目标优化秦皮的
提取工艺。
1 材料
日本岛津LC-10Avp高效液相色谱仪,SPD-
10Avp紫外检测器,CTO-10Avp柱温箱,Class-vp
色谱工作站,KromasilLAAI-KR006C18色谱柱
(46mm×250mm,5μm),SBXZ-1A恒温水浴锅
(上海申玻仪器公司),SartoriusBS110S精密电子天
平。
秦皮甲素(批号 110740200104)与秦皮乙素
(批号110741200506)对照品见自中国药品生物制
品检定所,秦皮药材购自上海德华国药制品有限公
司,产地陕西,批号2007102502。甲醇为色谱纯,其
他试剂均为分析纯。
使用的软件为MATLAB的神经网络工具箱、英
国谢菲尔德(Shefield)大学开发的基于MATLAB的
遗传算法工具箱。
2 方法与结果
2.1 试验设计
采用均匀设计对乙醇回流提取的主要影响因
素:提取温度、乙醇浓度、液固比、提取时间进行考
察,因素水平见表1。
表1 均匀试验因素水平
水平 提取温度/℃ 乙醇体积分数/% 液固比 提取时间/min
1 75 50 6 45
2 80 60 7 60
3 85 70 8 75
4 90 80 9 90
5 95 90 10 105
6 100 100 11 120
2.2 提取液的制备
称取秦皮样品共12份,各800g,按照均匀试
验设计条件进行处理,回流提取后放冷,过滤,滤液
置于100mL量瓶中,用相应浓度乙醇定容至刻度,
摇匀,微孔滤膜(045μm)滤过,取续滤液,密封备
用,得12个供试品溶液。
2.3 秦皮甲素和乙素的HPLC测定
2.3.1 色谱条件 色谱柱为 KromasilC18色谱柱
(46mm×250mm,5μm);流动相甲醇01%磷酸
水(15∶85);柱温30℃;流速12mL·min-1;进样
量2μL;检测波长340nm。色谱图见图1,秦皮对
照品及样品中秦皮甲素及秦皮乙素在此色谱条件下
分离良好,分离度>15,理论塔板数以秦皮甲素峰、
秦皮乙素峰计算均不低于2000,空白乙醇在此处无
干扰。
A.空白;B.对照品;C.样品;1.秦皮甲素;2.秦皮乙素
图1 秦皮样品HPLC图
2.3.2 对照品溶液制备 精密称取对照秦皮甲素
·3262·
第33卷第22期
2008年11月
         
    中 国 中 药 杂 志
ChinaJournalofChineseMateriaMedica
       
Vol.33,Issue 22
 November,2008
对照品29mg和秦皮乙素对照品20mg,分别置于
10mL量瓶中,加甲醇定容至刻度线。再精密吸取
上述秦皮甲素和秦皮乙素母液各5mL和3mL,共
同置于10mL量瓶中,加甲醇定容至刻度线。得到
每毫升分别含秦皮甲素0145mg和秦皮乙素006
mg的混合对照品溶液。
2.3.3 标准曲线绘制 将混合对照品液分别进样
2,6,8,10,20μL,注入高效液相色谱仪,按上述色谱
条件测定,以进样量 X为横坐标,峰面积 Y为纵坐
标绘制标准曲线,并进行线性回归,得到如下线性回
归方程,秦皮甲素:Y=1434997X+409297,r=
09997;秦皮乙素:Y=2571591X+292597,r=
09997。结果表明秦皮甲素和秦皮乙素进样量分
别在029~290μg和012~120μg与峰面积的
线性关系良好。
2.3.4 样品均匀实验结果 取12个供试品溶液,
按照上述色谱条件测定,通过峰面积计算含量,得出
各供试品溶液中秦皮甲素、秦皮乙素含量。样品的
测定结果见表2。
表2 U12(64)均匀设计实验方案及结果


温度
/℃
乙醇体
积分数
/%
液固比
提取
时间
/min
提取率/mg·g-1
秦皮甲素 秦皮乙素
N1 90 60 8 45 6366 1529
N2 100 80 10 105 7879 1797
N3 80 100 11 90 6286 1982
N4 95 70 11 60 8616 2094
N5 85 90 9 45 7260 1966
N6 90 90 8 120 7755 2390
N7 95 50 6 90 9360 2125
N8 100 100 7 75 3052 1081
N9 75 50 10 75 8128 1744
N10 75 70 7 105 6825 1497
N11 80 80 6 60 5887 1310
N12 85 60 9 120 6611 1717
2.4 神经网络建模
2.4.1 BP神经网络参数优化 理论上已证明具有
3层结构(只有1个隐层)的BP神经网络能够逼近任
何有理函数,而隐层的神经元数目和不同的神经网络
训练算法及目标收敛精度将直接影响神经网络的性
能[9]。因此,本试验用3层结构的BP神经网络来建
模,用均匀设计U10(53)来优选隐层的神经元数目、
网络训练和目标收敛精度,以10折交叉验证后的平
均残方差来评价神经网络的性能。4个输入节点分
别对应提取温度、乙醇浓度、固液比、提取时间4个考
察因素,输出层2个输出节点对应要考察的指标是秦
皮甲素和秦皮乙素的提取含量。隐层为双曲正切传
递函数(tansig),输出层为线性传递函数(purelin),设
定最大学习步长为2000次,其他参数为默认值。隐
层神经元数目、网络训练算法和目标收敛精度见均匀
设计表3各水平,在训练前分别对各数据进行标准化
处理[(X-珋x)/S],然后对其进行预测拟合。
10折交叉验证后的结果见表3,可见不同的隐
层神经元数目、网络训练算法和目标收敛精度对网
络的性能均有影响,从直观上看,隐层神经元16个、
目标精度0034、一步正切BP算法(trainoss)具有较
小的平均残方差。因此,针对本实验,采用隐层神经
元数目为16个,BP神经网络训练算法为一步正切
BP算法,目标收敛精度为0034较优。
表3 U10(53)均匀设计表
因子
隐层
神经元
训练函数
目标
精度
平均残方差
/%
N1 10 LevenbergMarquardt算法 0036 575156
N2 16 一步正切BP算法 0034 334891
N3 14 LevenbergMarquardt算法 0028 840096
N4 12 自适应学习率动量法 0032 574888
N5 16 弹性反向传播算法 0030 338279
N6 8 弹性反向传播算法 0034 644770
N7 14 Bayes规范化BP算法 0036 605065
N8 10 Bayes规范化BP算法 0028 376096
N9 12 自适应学习率动量法 0032 574888
N10 8 一步正切BP算法 0030 669176
2.4.2 用优化的神经网络模型进行预测拟合 根
据以上结论,采用 MATLAB编程,隐层神经元数目
为16个,BP神经网络训练算法为一步正切 BP算
法,中间层传递函数为双曲正切转换函数和线性传
递函数,设定最大学习步长为2000次,目标收敛精
度为0034,其他参数为默认值。在训练前分别对
各数据进行标准化处理后,对实验数据进行预测拟
合。结果:BP神经网络的训练均方误差曲线于174
步收敛,实际收敛精度为00339882,秦皮甲素和
秦皮乙素的拟合相关系数可达09999和09994。
2.5 用遗传算法进行多目标优化
2.5.1 遗传算法进行多目标优化的基本思想[8] 
本研究采用并列选择法在已建立的神经网络模型上
进行多目标优化求解,其基本思想是先将初始群体
中的全部个体按子目标函数的数目均等地划分为一
些子群体,对每个子群体分配1个子目标函数,各子
目标函数在相应的子群体中独立地进行选择运算,
·4262·
第33卷第22期
2008年11月
         
    中 国 中 药 杂 志
ChinaJournalofChineseMateriaMedica
       
Vol.33,Issue 22
 November,2008
各自选择出一些适应度高的个体组成1个新的子群
体,然后再将所有新生的子群体合并成1个完整的
群体,在这个群体中进行交叉、变异运算,从而生成
下一代的完整群体,如此不断地进行“分割并列选
择合并”操作,最终可求得多目标优化的 Parerto最
优解,程序编译示意如图2。
图2 并列选择遗传算法示意图
2.5.2 用遗传算法对已建立的网络模型进行多目
标寻优 数据进行标准化处理[(X珔X)/S]后将 BP
神经网络模型的实际仿真结果的相反数作为适应度
函数,由于输出为二维,在将相应的维数作为相应的
子目标函数,采用二进制编码方式,初始种群大小为
200,即每个子种群大小为100,选择随机遍历抽样
(sus),单点交叉(xovsp)概率为07,变异(mut)概
率为0004,遗传代数为50代,变量搜索范围为实
验结果中各参数数据经标准化后的范围。用 MAT
LAB进行编程,运行结果见各子种群均值变化迭代
图,如图3,4,可见当迭代到50代时,各子目标已趋
向恒定,搜索结果如下:秦皮甲素的最大提取量为
96173mg·g-1,秦皮乙素的最大提取量为21954
mg·g-1,各相应参数经反标准化为提取温度 99
℃、50%乙醇、液固比7、提取时间94min。
2.6 工艺验证
选用上述优化条件,称取800g药材,共3份。
以提取温度99℃、乙醇体积分数50%、液固比7、提
取时间94min,进行乙醇回流提取实验,测定秦皮甲
素和秦皮乙素的提取率。其平均提取率分别为
9730mg·g-1生药和2314mg·g-1生药,网络预
测值和实际测量值的相对误差仅为 -116%和
-514%。
3 讨论
3.1 数据的预处理
在提取工艺中,由于各个参数指标互不相同,因
此原始样本数据中各变量的数量级可能差别很大,
  
图3 子目标1(秦皮甲素)种群均值变化
图4 子目标2(秦皮乙素)种群均值变化
为了方便及防止神经网络中的部分神经元达到过饱
和状态,在研究中对样本的输入进行必要的标准化
处理。标准化处理的方法很多,本研究采用的是
(X珔X)/S,即数据与均数之差再除以标准差。
3.2 10折交叉验证
交叉验证被认为是评估机器学习模型的有效方
法,所谓10折交叉验证,是指给定1个数据样本,数
据被随机分割成10个部分,每个部分依次轮流被旁
置,其余9/10的数据则参与某1个学习方案的训练,
而旁置的数据集则用于计算误差率;这样,学习过程
共进行10次,每次使用不同的训练集。最后,将10
个误差率估计值平均得到1个综合误差估计。大量
试验证明10折正是获得最好的误差估计的恰当选
择[10]。作者以10折交叉验证的结果优选的网络模
型能够对于提取工艺的各参数提供准确的预报性。
3.3 遗传算法工具箱的使用
作者采用了并列选择遗传算法进行多目标优
化,使用的是设菲尔德(Shefield)遗传算法工具箱
中的基于排序的适应度分配函数,因此目标值较低
的就有较高的适应度,所以在求解极大值时,需进行
相反数变换,本研究要优选的2个指标均为极大,因
此都以网络模型的实际仿真结果的相反数作为适应
度函数。另外,由于遗传算法的初始种群具有随机
性,因此每次运算搜索到的结果都有细小的差别,但
·5262·
第33卷第22期
2008年11月
         
    中 国 中 药 杂 志
ChinaJournalofChineseMateriaMedica
       
Vol.33,Issue 22
 November,2008
是这并不会影响搜索到全局的较优解。
3.4 与多元回归的结果比较
将秦皮甲素 Y甲素和秦皮乙素 Y乙素的提取率分
别与提取温度 X1、乙醇体积分数 X2、液固比 X3、提
取时间X4进行二次多项式回归处理,得秦皮甲素和
秦皮乙素的回归方程分别为 Y甲素 =198893-
02767X4-00029X1X1-133536X2X2+00978X3
X3+00061X1X4+15033X2X3+00325X2X4-
00319X3X4(r=09995);Y乙素 =-200364+
01367X1+251669X2+18713X3-00455X4-
02402X1X2-00074X1X3+00013X1X4-06376
X2X3+00153X2X4-00085X3X4(r=09947)。
将多元回归的拟合与 BP神经网络的预测拟合
结果作比较,从拟合结果可看出,BP神经网络的相
关系数明显高于多元回归。在得出最佳工艺后,经
过验证实验得到的数据是秦皮甲素提取率是9730
mg·g-1,秦皮乙素的提取率是2314mg·g-1,多
元回归在此条件下的预测值分别为 8949和
2676,预测误差分别达到了 -803%和 1566%,
通过神经网络的预测值分别为9617和2195,预
测误差分别为 -116%和 -514%。由此可见,合
适的神经网络模型不但在拟合效果上优于多元回
归,对于提取工艺的各参数显示出了更准确的预报
性,可以在提取工艺中用于建立多指标与多参数之
  
间的关系模型,由于遗传算法独具的工作原理,使它
能够在复杂空间进行全局优化搜索,特别适合在复
杂的神经网络模型的基础上进行寻优,这种神经网
络结合遗传算法的方法是解决中药提取工艺中多指
标多参数优化的有效途径。
[参考文献]
[1]  郝秀华,程 刚,王 琳,等.中心复合设计优化5氟尿啥陡
肝动脉栓塞微球的制备工艺[J].中国药学杂志,2004,39
(7):525.
[2]  宋学伟,潘 兰,韩泳平,等.球面对称设计优化荨麻多糖的
提取工艺[J].中草药,2006,37(9):1344.
[3]  魏 敏,江雪华.正交设计法优选黄芪提取工艺研究[J].基
层中药杂志,2000,14(6):23.
[4]  王玉华,赵国丁,荀雅书,等.四物汤中多糖提取工艺筛选
[J].中成药,2003,25(5):351.
[5]  周素娟.正交设计研究补肾通痹颗粒提取工艺[J].中华中医
药学刊,2007,25(3):606.
[6]  吴亚琼,张建新.旋转回归设计优化超声波橘皮总黄酮提取
工艺[J].食品研究与开发,2008,29(3):13.
[7]  高 隽.人工神经网络原理及仿真实例[M].北京:机械工业
出版社,2005:16.
[8]  雷英杰,张善文,李续武,等.MATLAB遗传算法工具箱及应
用[M].西安:西安电子科技大学出版社,2005:45.
[9]  飞思科技产品研发中心.神经网络理论与 MATLAB7实现
[M].北京:电子工业出版社,2005:99.
[10] IanHWiten,EibeFrank.数据挖掘实用机器学习技术[M].
董 琳,邱 泉,于晓峰,等译.北京:机械工业出版社,2006:
286.
Backpropagationneuralnetworkandgeneticalgorithmformultiobjective
optimizationofextractiontechnologyofCortexFraxini.
YANGMing,YUMinying,SHIXiufeng,TENGYanping
(MedicamentDepartmentOfLonghuaHospitalAfiliatedtoShanghaiunivesityofTraditionalChineseMedicine,Shanghai200032,China)
[Abstract] Objective:TointroduceBackpropagation(BP)neuralnetworkandgeneticalgorithmformultiobjectiveoptimiza
tionofextractiontechnologyofCortexFraxini.Method:BPneuralnetworkwasestablishedandoptimizedwithuniformdesign.Genet
icalgotithmwasusedformultiobjectiveoptimizationofextractiontechnologyofcortexfraxini.Result:theoptimizationofextraction
wasasfolows:extractiontemperaturewas99℃,concentrationofEtOHwas50%,liquidsolidratiowas7,extractiontimewas94
min.Theproportionalerorbetweenpredictivevalueandpracticalmeasuredvaluewasjust-116% and-514%.Conclusion:
Backpropagationneuralnetworkandgeneticalgorithmformultiobjectiveoptimizationofextractiontechnologyofcortexfraxiniisadvis
able.
[Keywords] CortexFraxini;extractiontechnology;uniformdesignmethod;backpropagation(BP)neuralnetwork;genetic
algorithm;multiobjectiveoptimization
[责任编辑 鲍 雷]
·6262·
第33卷第22期
2008年11月
         
    中 国 中 药 杂 志
ChinaJournalofChineseMateriaMedica
       
Vol.33,Issue 22
 November,2008