免费文献传递   相关文献

人工神经网络建模结合遗传算法优化岗松油环糊精包合物制备工艺参数



全 文 :学 报
Journal of China Pharmaceutical University 2011,42(4) :324 - 328
人工神经网络建模结合遗传算法优化岗松油
环糊精包合物制备工艺参数
张纪兴,陈燕忠*
( 广东药学院,广州510062)
摘 要 采用均匀设计法制定岗松油 β-环糊精包合物制备的实验方案,应用人工神经网络对影响包合物制备的因素
与考察指标之间的关系进行模型拟合,并结合遗传算法优化包合物的制备工艺参数。优化结果为:环糊精与岗松油的用量
配比 7. 1、包合温度 46. 6 ℃、时间 149. 9 min、搅拌速度 417. 8 r /min。参照优化后的工艺条件所制备的包合物,含油率和包
合率分别为 11. 89%和 89. 55%。结果可见,人工神经网络建模与遗传算法寻优相结合,为药物制剂工艺的多维非线性系统
的优化提供了有效途径。
关键词 岗松油;β-环糊精包合物;人工神经网络;遗传算法;工艺参数;优化
中图分类号 R944 文献标识码 A 文章编号 1000 - 5048(2011)04 - 0324 - 05
Optimization of the process parameters of Baeckeae oil-β-cyclodextrin inclu-
sion complex by artificial neural network and genetic algorithm
ZHANG Ji-xing,CHEN Yan-zhong*
Guangdong Pharmaceutical University,Guangzhou 510062,China
Abstract The preparation process was optimized by U11(11
10)uniform design,and a mathematical model of
relationship between the independent and dependent variables was established by using back-propagation(BP)
artificial neural networks(ANN) ,the process parameters were optimized with genetic algorithm(GA). The opti-
mum process was established as follows:7. 1 as the ratio of β-cyclodextrin to Baeckeae oil,46. 6 °C as tempera-
ture for inclusion,149. 9 min as duration of stirring and 417. 8 r /min as stirring rate. The average drug-loading
rate 11. 89% and inclusion yield 89. 55%(n = 3)were the results of the verification test of the inclusion complex
according to the optimized process parameters,and they were better than any orther results among the uniform
design. Combining BP ANN modeling with GA provided an effective way to solve the multi-dimensional optimiza-
tion problem of nonlinear systems in pharmaceutical technology.
Key words Baeckeae oil;β-cyclodextrin inclusion complex;artificial neural networks;genetic algorithm;process
parameters;optimization
岗松油为桃金娘科植物岗松 Baeckea frutescens
L. 带有花果的枝叶经水蒸汽蒸馏得到的挥发油,
具有清热利湿、杀虫止痒的功效,常用于治疗湿疹、
疥疮等症。其主要由单萜及含氧单萜、倍半萜及含
氧倍半萜和少量醇、酚等化合物组成,难溶于水、易
挥发、逸散[1]。若将其制备成环糊精包合物,可以
增加其水溶性,防止挥发,并使液体粉末化,能够更
好地利用于工业生产和临床应用。
本研究采用均匀设计制定实验方案获取原始
数据,采用人工神经网络建模和遗传算法结合,进
行岗松油环糊精包合物的制备工艺参数优化研究。
1 仪器与试药
JA203N电子天平( 上海精密科学仪器有限公
司) ;HH-4 数显恒温水浴锅( 常州澳华仪器有限公
司) ;RW20 电动搅拌器( 德国IKA公司)。
423
* 收稿日期 2011-03-02 * 通讯作者 Tel:020 - 39354072 E-mail:jxzh1998282@ 163. com
第 4 期 张纪兴等:人工神经网络建模结合遗传算法优化岗松油环糊精包合物制备工艺参数
岗松挥发油( 广州固志医药有限有限公司提
供) ;β-环糊精(β-CD,天津博迪化工有限公司,批
号 20080111) ;其余试剂均为市售分析纯。
2 方 法
2. 1 包合物的制备
准确称取处方量的 β-CD,加适量蒸馏水制成
饱和溶液,加热至一定温度,然后缓缓加入一定量
岗松挥发油( 岗松挥发油用等量乙醇稀释) ,按照
规定速度恒温搅拌至规定时间,置 4 ℃冰箱内冷藏
24 h,过滤,40 ℃以下干燥,即得。
2. 2 包合物产率、含油量的测定计算
取制得的包合物适量,置 500 mL圆底烧瓶中,
加入 10 倍量蒸馏水,按 2010 年版《中华人民共和
国药典》( 一部,附录ⅩD) 方法测定包合物中的实
际含油量,并计算包合物产率和含油率[2]。包合
物产率(Y)=包合物质量 /(β-CD 质量 +加入挥发
油质量)× 100%,包合物含油率(DL)=包合物含
油量(mL)/包合物质量(g)× 100%。
2. 3 实验设计
预实验表明,影响岗松油 β-CD 包合物产率以
及含油率的主要因素为:β-CD 与挥发油的比例
(X1,g:mL)、包合温度(X2,℃)、包合时间(X3,
min) 和搅拌速度(X4,r /min)。因此,本研究采用
U11(11
10) 均匀设计实验表安排4 因素 5 水平的实
验,见表 1。
Table 1 Factors and levels of the uniform design
Level
Factor
X1 X2 X3 X4
1 20∶ 4. 0 35 30 100
2 20∶ 3. 5 40 60 300
3 20∶ 3. 0 45 90 500
4 20∶ 2. 5 50 120 700
5 20∶ 2. 0 55 150 900
X1:Ratio of β-cyclodextrin and Baeckeae oil;X2:Temperature for inclu-
sion;X3:Duration of stirring;X4:Stirring rate
包合物产率、含油量是衡量包合效果的关键指
标,包合物含油量越高,包合效果越好,包合物产率
在大生产中也有重要意义,因此选用二者进行综合
考察,采用 Hassan 法,对其进行综合评分,得总评
“归一值”(overall desirability,OD)[3]。对于越大
越好的效应:dmax =(yi - ymin)/(ymax - ymin) ,其中,
dmax表示越大越好的效应指标的归一值,yi 表示某
指标实验结果中的数值( 本实验中,i = 1,2,…,
10) ,ymin表示某指标实验结果中的最小值,ymax表示
某指标实验结果中的最大值。包合物含油量和产
率两指标权重系数分别取 0. 7 和 0. 3,对其进行综
合评分,OD = 0. 7dmax,oil percentage + 0. 3dmax,yield,其中,
dmax,oil percentage表示包合物含油率(DL) 指标的归一
值,dmax,yield表示包合物产率(Y) 指标的归一值,实
验结果见表 2。
Table 2 Uniform design and results of Baeckeae oil-β-cyclodextion in-
clusion complex
No. X1 X2 X3 X4 DL /% Y /% OD
1 5. 00 35 90 700 9. 77 70. 99 0. 543 5
2 5. 00 40 150 300 9. 94 77. 14 0. 688 3
3 5. 71 45 60 900 10. 97 80. 22 0. 900 1
4 5. 71 50 150 500 10. 30 85. 34 0. 901 8
5 6. 67 55 60 100 6. 30 69. 96 0. 012 2
6 6. 67 35 120 900 9. 81 78. 16 0. 689 9
7 8. 00 40 30 500 8. 18 74. 68 0. 380 9
8 8. 00 45 120 100 9. 31 82. 26 0. 696 5
9 10. 0 50 30 700 8. 44 77. 14 0. 468 0
10 10. 0 55 90 300 6. 21 75. 09 0. 099 9
DL:Drug-loading rate;Y:Inclusion yield;OD:Overall desirability
2. 4 人工神经网络建模
2. 4. 1 人工神经网络的选择 人工神经网络(ar-
tificial neural networks,ANN) 是以实验数据为基
础,经过有限次迭代计算而获得的一个反映实验数
据内在规律的数学模型,它特别适合于研究复杂非
线性系统的特性。反向传播(back-propagation,
BP) 人工神经网络是最具代表性的误差反向传播
的多层前馈式网络,网络输入、输出节点外,有一层
或多层隐层节点,同层节点间没有任何耦合[4]。
已经证明具有 3 层结构( 只有1 个隐含层) 的BP
网络能够逼近任何有理函数,并且单隐层 BP 网络
的非线性映射能力较强[5],因此,本试验采用 3 层
BP人工神经网络建模以逼近存在于实验数据间的
函数关系( 图1)。
Figure 1 Delineation of structure of a back-propagation (BP)artifi-
cial neural network model with one hidden layer
523
学 报 Journal of China Pharmaceutical University 第 42 卷
本实验研究以影响岗松油 β-CD 包合物质量
的主要因素为人工神经网络的网络输入,衡量包合
效果的评价指标为人工神经网络的网络输出,建立
影响岗松油 β-CD 包合物质量的主要因素与评价
指标实验数据间的关系模型。
2. 4. 2 网络训练、检验样本的采集和选择 本研
究采用均匀设计安排实验,得到了 10 个基本实验
样本数据。但是为了获得可信的神经网络,需要大
量样本数据进行训练,为此引入了虚拟样本[6],即
在实际的生产实验过程中,由于原料、操作条件、测
量仪器本身等的限制,各输入变量的值和实际值必
然会有微小的误差,这种误差是正常的,不可避免
的,那么在此误差范围内的输入值应该对应相同的
输出值。这样,对网络的输入分别按 ± Δi = 0. 2%,
i = 1,2,3,4 波动进行搭配,每个实际输入样本就
可以产生 24 个虚拟样本,10 个基本实验样本数据
可以产生 10 × 24 个虚拟样本。但是,10 × 24 个虚
拟样本没有必要全部参与训练,可以根据 L8(2
7)
正交设计实验表,只需对每一个实际样本产生 8 个
虚拟样本就可以代表全部 24 个虚拟样本。如表 3
为第 1 个实际样本产生的 8 个虚拟样本。
Table 3 Virtual samples from the first sample
No. X1 X2 X3 X4
1 4. 99 34. 93 89. 82 698. 60
2 4. 99 34. 93 90. 18 701. 40
3 4. 99 35. 07 89. 82 701. 40
4 4. 99 35. 07 90. 18 698. 60
5 5. 01 34. 93 89. 82 701. 40
6 5. 01 34. 93 90. 18 698. 60
7 5. 01 35. 07 89. 82 698. 60
8 5. 01 35. 07 90. 18 701. 40
这样,本研究的 10 个实际实验样本加上各自
的虚拟样本,使参加神经网络训练和检验的样本达
到 90 个,加大了训练样本空间的样本密度,强化了
训练过程中的记忆效果,致使在实际样本的附近区
域不会产生大的波动。
2. 5 人工神经网络模型结合遗传算法优化工艺
参数
由于人工神经网络建立的是黑箱模型,网络模
型表达并非传统的数学表达形式,而遗传算法寻优
无需目标函数具备明确的数学表达式,所以可以用
来进行网络模型的优化计算,其思路如下:①在一
定的编码方案下,随机产生 1 个初始种群;②用相
应的解码方法,将编码后的个体转换成问题空间的
决策变量,并求得个体的适应值;③按照个体适应
值的大小,从种群中选出适应值较大的一些个体构
成交配池;④由交叉和变异这 2 个遗传算子对交配
池中的个体进行操作,并形成新一代的种群;⑤反
复执行上述第② ~ ④步骤,直至满足收敛判据
为止[7- 8]。
2. 6 回归分析法优化均匀实验数据
实验主要影响因素与评价指标之间的关系从
严格意义上讲是呈现非线性的,可以用二次多项式
来拟合,本实验采用均匀设计法产生了 10 组数据,
因此,只能选择含有小于 10 个未知系数的二次回
归设计,多项式的选择就得忽略各影响因素之间的
交互作用,因此,可选择采用的回归方程为:
OD = a0 + a1X1 + a2X2 + a3X3 + a4X4 + a5X
2
1 +
a6X
2
2 + a7X
2
3 + a8X
2
4 (1)
通过多元逐步回归法拟合获得优化的数学模
型方程,再结合函数方程的优化求解确定优化工
艺,最后进行实验验证比较。
3 结 果
3. 1 BP人工神经网络训练和预测
根据上述人工神经网络训练、检验样本的采集
和选择方法,在采集的样本中,避开综合评分最高
和最低的第 4、第 5 组实验样本和虚拟样本,在其
余 8 组中任选各组的 2 个样本,共计 16 个样本作
为人工神经网络的检验样本,其余则作为人工神经
网络的训练样本,运用 MATLAB 软件,进行人工神
经网络的训练和预测。设定 BP 人工神经网络训
练循环次数参数为 100,训练误差目标参数为
0. 000 000 1,学习率参数为 0. 1,训练过程和结果
见图 2。
Figure 2 Training process for BP artificial neural networks
623
第 4 期 张纪兴等:人工神经网络建模结合遗传算法优化岗松油环糊精包合物制备工艺参数
网络训练结果显示,经过 9 次训练后,网络误
差平方和均值为 5. 639 8 × 10 -8,达到了设定的最
小训练目标值。网络训练完毕后,利用 MATLAB
仿真函数 sim输出网络预测,用检验样本来检验网
络训练效果( 图3)。从图 3 可以看出,BP 人工神
经网络的预测输出与检验样本测试值非常接近。
—○—Predicted;— ×—Experimental
Figure 3 Test output of BP artificial neural networks
图 4 为 BP 人工神经网络的预测输出与检验
样本测试值的误差输出图,从中可以看出,网络的
预测输出与检验样本测试值的误差均小于
0. 015%,表明本研究用 BP 人工神经网络建立了
准确的描述岗松油环糊精包合物制备工艺参数与
其评价指标之间关系的模型。
Figure 4 Error of BP artificial neural networks
3. 2 人工神经网络结合遗传算法优化工艺参数及
验证
应用 MATLAB 软件,设定遗传算法最大进化
代数为 500,种群大小为 5,交叉概率为 0. 4,变异
概率 0. 2,在这些参数下运行得到每代种群最优适
应度和平均适应度及其变化,结果输出见图 5。
Figure 5 Optimized fitness curve of genetic algorithm
从图 5 看出,随着进化代数增大,种群的平均
适应度和最优适应度均呈现曲折上升的趋势。最
后,平均适应度向最优适应度方向靠拢,种群平均
适应度趋于平稳状态。表明此时群体中对应于最
大适应度的个体已经达到该优化算法的最优解,优
化结果是:OD 为 0. 953 0,X1、X2、X3、X4 分别为:
7. 1、46. 6、149. 9、417. 8。按此结果选择优化工艺
参数(β-CD与挥发油的比例为 20 ∶ 3. 0、包合操作
温度为 45 ℃、包合时间为 150 min、搅拌速度为
400 r /min) ,制备3 批岗松油环糊精包合物,实验
测得其平均包合物产率和含油量分别为 89. 55%
和 11. 89%(n = 3) ,均大于此前任一组实验样本
值,证明了采用 BP人工神经网络建模结合遗传算
法优化工艺参数的可行性。
3. 3 均匀实验设计数据回归分析法优选结果及
验证
本研究将均匀实验设计获得的数据,采用传统
的回归分析,即运用多项式方程,通过多元逐步回
归,所得的数学模型方程为:
OD = - 8. 115 5 - 2. 258 5 × 10 -2 X1 + 0. 375 5
X2 + 3. 512 1 × 10
-3 X3 + 5. 624 4 × 10
-4 X4 -
4. 184 7 × 10 -3X22,R
2 = 0. 970 2,F = 0. 003 8。再通
过规划求解,可获得最优化方法的解:X1 = 5,X2 =
44. 87,X3 = 150,X4 = 900,OD =1. 230 0 ± 0. 0787。
按此结果选择优化工艺参数(β-CD 与挥发油
的比例为 20 ∶ 4. 0、包合操作温度为 45 ℃、包合时
间为 150 min、搅拌速度为 900 r /min) 制备3 批环
糊精包合物,测得其平均包合物含油率和包合率分
别为 11. 02%和 86. 34%(n = 3)。从实验结果验证
均优于均匀设计实验中任一组数据来看,说明达到
723
学 报 Journal of China Pharmaceutical University 第 42 卷
了回归分析优选的目的。
4 讨 论
从优化数据和验证结果来看,人工神经网络结
合遗传算法与回归分析方法相比,数据优化的趋势
是一致的,验证结果也都达到了一定的优化目的,
即在本实验研究中,前者的应用并没有充分体现其
优势。这可能是因为本研究仅为四因素多水平的
实验,二者的差距要在更多因素及水平的复杂非线
性实验模型关系中才能体现出来。
但是,本实验研究中,利用 BP 人工神经网络
建立的模型,其精度达到 5. 639 8 × 10 -8,且 BP 人
工神经网络训练后网络预测值与实验值相对误差
很小(< 0. 015%) ,模型非常准确,这是传统的数
学优化方法难以达到的。
另外,尽管均匀实验设计结合多项式等非线性
回归分析,可以揭示多因素多水平之间的规律,但
其依赖于具体的非线性方程的选择和解析,没有一
个是完全能排除其他选择的最佳方法,且在模型拟
合不甚理想时就难以优化出较为准确的点及区域。
人工神经网络建模结合遗传算法寻优,无需目
标函数具备明确的数学表达式,并且模型的建立与
寻优的过程都可以利用数据可视化技术以直观的
图形展现出来,模型的建立与优化过程一目了然,
为解决多维非线性系统的优化问题提供了一个全
新而有效的途径。
本实验研究表明,采用人工神经网络建模结合
遗传算法寻优,进行制剂工艺参数的优化是可行
的。为解决制剂生产实践过程中存在的多维非线
性系统模型的建立及其模型参数优化,本法有独特
优势,值得进一步深入研究。
参 考 文 献
[1] 刘布鸣(Liu BM) ,梁凯妮(Liang KN) ,林 霄(Lin X).壮药
岗松油的研究概况[J]. 广西科学院学报(Acad J Guangxi
Med Coll) ,2010,26(3) :374 - 376.
[2] 董方言(Dong FY). 现代实用中药新剂型新技术[M].北京:
人民卫生出版社,2001:596.
[3] 吴 伟(Wu W) ,崔光华(Cui GH) ,陆 彬(Lu B).实验设计
中多指标的优化:星点设计和总评“归一值”的应用[J]. 中
国药学杂志(Chin Pharm J) ,2000,35(8) :530 - 533.
[4] 徐 东(Xu D) ,吴 铮(Wu Z).基于 MATLAB 6. X 的系统
分析与设计———神经网络[M]. 西安: 西安电子科技大学出
版社,2002:4 - 24.
[5] 闵惜琳(Min XL) ,刘国华(Liu GH).人工神经网络结合遗传
算法在建模和优化中的应用[J].计算机应用研究(Appl Res
Comput) ,2002,19(1) :79 - 80.
[6] 王卫东(Wang WD) ,郑宇杰(Zheng YJ) ,杨静宇(Yang JY).
采用虚拟训练样本优化正则化判别分析[J]. 计算机辅助设
计与图形学学报(J Comput-aided Des Comput Graphics) ,2006,
18(9) :1 327 - 1 331.
[7] 梁 科(Liang K) ,夏定纯(Xia DC). Matlab环境下的遗传算
法程序设计及优化问题求解[J]. 电脑知识与技术(Comput
Knowl Technol) ,2007,3(4) :1 049 - 1 051.
[8] Singh V,Khan M,Khan S. Optimization of actinomycin V produc-
tion by Streptomyces triostinicus using artificial neural network and
genetic algorithm[J]. Appl Microbiol Biotechnol,2009,82(2) :
379 - 385.
823