免费文献传递   相关文献

用人工神经网络结合粒子群优化算法筛选地锦草槲皮素醇提工艺参数



全 文 :中国医药工业杂志 Chinese Journal of Pharmaceuticals 2012, 43(1) · ·21
用人工神经网络结合粒子群优化算法筛选地锦草槲皮素
醇提工艺参数
张纪兴 1,吴智南 2,陈小坚 2*,何 雯 3
(1. 广东药学院,广东广州 510006 ;2. 广州固志医药科技有限公司,广东广州 510370 ;3. 中国医药工业研究总院
上海医药工业研究院,上海 200040)
摘要:应用反向传播人工神经网络建立地锦草中槲皮素醇提工艺的影响因素与评价指标总评归一值之间的关系模型,并
结合粒子群算法优化醇提工艺参数。所得优化条件为:采用 75%乙醇提取 75 min,75%乙醇与地锦草的用量比为 8 ∶ 1。
按此优化方案进行验证试验,计算得平均槲皮素提取率和干浸膏得率为 0.11%和 9.30% (n=3),其总评归一值优于正交
试验中任一组的归一值。
关键词: 人工神经网络;粒子群优化算法;槲皮素;提取
中图分类号:TP183 文献标志码:A 文章编号:1001-8255(2012)01-0021-04
Screening of the Process Parameters of Ethanol Extraction of Quercetin from
Euphorbia humifusa Willd. by the Combination of Artifi cial Neural Networks &
Particle Swarm Optimization Algorithm
ZHANG Jixing1, WU Zhinan2, CHEN Xiaojian2*, HE Wen3
(1. Guangdong Pharmaceutical University, Guangzhou 510006; 2. Guangzhou Guzhi Pharmaceuticals Technology Co., Ltd., Guangzhou
510370; 3. Shanghai Institute of Pharmaceutical Industry, China State Institute of Pharmaceutical Industry, Shanghai 200040)
ABSTRACT: A mathematical model of relationship between the influence factors and overall desirability of
evaluation indexes in the ethanol extraction of quercetin from Euphorbia humifusa Willd. was established by back-
propagation (BP) artificial neural networks(ANN) . The process parameters were optimized with particle swarm
optimization (PSO) algorithm. The optimal process was as follows: the quercetin was extracted with 75% ethanol for
75 min and the ratio of ethanol to Euphorbia humifusa Willd. was 8 ∶ 1. According to the optimal process, the verifi cation test
was carried out. The results showed that the average extraction rate of quercetin was 0.11% and the yield of dry extraction was
9.30% (n=3). The overall desirability of evaluation indexes was better than any other results among the orthogonal design.
Key Words: artifi cial neural networks; particle swarm optimization algorithm; quercetin; extraction
地锦草 (Euphorbia humifusa Willd.) 为大戟科
双子叶一年生草本植物,具有凉血止血、清热止痢
等功效,用于治疗痢疾、肠炎、便血等症 [1]。地
锦草主要含槲皮素 (quercetin,1)、山柰素等黄酮
类化合物 [2],药理研究证实这类黄酮化合物是地锦
草抗菌、止血、抗氧化的主要有效成分。地锦草煎
剂、醇提取液等均有抗菌止血等作用 [3]。本研究采
用 L9(34) 正交设计表安排地锦草的醇提工艺试验,
尝试应用反向传播人工神经网络 (back-propagation
artificial neural networks,BP-ANN) 映射地锦草醇
提工艺因素与评价指标之间的关系,并结合粒子群
收稿日期:2011-10-08
基金项目:科技部科技型中小企业技术创新基金(09C26214412134)
作者简介:张纪兴(1966-),男,副教授,从事中药新剂型与新技
术及缓控释制剂的研究。
Tel:020-39352117
E-mail:jxzh1998282@163.com
通信联系人:陈小坚(1965-),女,高级工程师,从事中药新制剂
与新技术研究。
Tel:020-81683201
中药与天然药物
· · 中国医药工业杂志 Chinese Journal of Pharmaceuticals 2012, 43(1)22
优化 (particle swarm optimization,PSO) 算法筛选
工艺参数。
1 仪器与试药
1100 型高效液相色谱仪 (美国 Agilent 公司 )。
1 对照品(中国食品药品检定研究院,批号 10081-9905);
地锦草( 购自广州清平药材批发市场,经本院生药学教研室
刘基柱副教授鉴定为大戟科植物 Euphorbia humifusa Willd.
的干燥全草 );甲醇为色谱纯,水为重蒸水,其他试剂均为
分析纯。
2 方法与结果
2.1 地锦草的提取工艺
取地锦草药材,粉碎,过 10 目筛,每份 10 g,
按表 1 中的试验安排定量加入一定浓度的乙醇,按
规定的提取次数和时间,加热回流提取,合并提取
液,回收乙醇,水浴浓缩成稠膏后,60 ℃干燥至恒
重,即得。
2.2 1 含量的测定方法
2.2.1 色谱条件 
色谱柱 Kromasil C18 柱(4.6 mm ×250 mm,5 µm);
流动相 甲醇 -0.4%磷酸(40∶60);流速 1.0 ml/min;
柱温 40 ℃;检测波长 360 nm ;进样量 5 µl。
2.2.2 溶液的配制
对照品溶液:精密称取 1 对照品 10 mg,置 25 ml
量瓶中,加甲醇溶解并定容,摇匀,制成浓度为
0.4 mg/ml 的对照品溶液。
供试品溶液:精密称取地锦草提取物 0.1 g,置
具塞锥形瓶中,精密加入甲醇 50 ml,密塞,精密称定,
超声处理 (250 W,40 kHz)30 min,放冷,再精密
称定,用甲醇补足减失的重量,摇匀,用 0.45 µm
微孔滤膜滤过,取续滤液即得。
2.2.3 线性范围
分别精密吸取对照品溶液 0.5、1、2、4、6、8
和 10 µl,进样测定。以对照品的进样量 q(g) 为横
坐标,峰面积 A 为纵坐标,进行线性回归,得 1 的
回归方程为:A= 4.116×106q-81.01,r=0.999 9。表
明 1 在 0.2 ~ 4 µg 范围内线性关系良好。
2.2.4 样品含量测定
分别精密吸取对照品溶液和供试品溶液各 5 µl,
按上述标色谱条件测定,记录色谱图,按峰面积值
用外标法计算含量,即得。典型色谱图见图 1。
mAU 50
25
0
0.0 5.0 10.0 15.0
t/min
1
A mAU 50
25
0
0.0 5.0 10.0 15.0
t/min
1
B
A :对照品溶液,B :供试品溶液
1-1
图 1 典型色谱图
2.3 试验设计
根据 1 的理化性质 [ 4],经预试验选择地锦草
醇提工艺中的乙醇浓度 (X1,% )、每次提取时间
(X2,min)、乙醇与药材的用量比 (X3,ml ∶ g) 以
及提取次数(X4)为考察因素,每个因素设3水平(见
表 1)。采用 L9(34) 正交设计表安排试验。
本试验将 1 提取率 (Y1,% )和干浸膏得率 (Y2,
% ) 作为提取工艺评价指标,采用二者的总评“归
一值 ”(OD) [5] 评估提取工艺,计算方法如下:
1 提取率 = 干浸膏中 1 的量 / 地锦草取样量 ×100%
干浸膏得率 = 干浸膏量 / 地锦草取样量 ×100%
dmax=(Yi-Ymin)/(Ymax-Ymin)
dmin=(Ymax-Yi)/(Ymax-Ymin)
OD=ω1×dmax +ω2×dmin
其中,dmax 表示越大越好的效应指标 (Y1) 的归
一值,dmin 表示越小越好的效应指标 (Y2) 的归一值,
Y i 表示某指标试验结果,Ymin、Ymax 分别表示某指
标试验结果中的最小值和最大值。ω1、ω2 为 Y1、Y2
的权重系数,各取 0.5。
表1 正交试验设计和结果


因素(Xi) 评价指标(Yi)
OD
X1/% X2/min
X3/
ml∶g X4 Y1/% Y2/%
1 60 60 6 1 0.013 8.502 0.500
2 60 90 8 2 0.061 10.829 0.506
3 60 120 10 3 0.072 12.811 0.335
4 75 60 8 3 0.100 10.441 0.773
5 75 90 10 1 0.069 9.781 0.672
6 75 120 6 2 0.084 10.561 0.665
7 90 60 10 2 0.070 10.137 0.640
8 90 90 6 3 0.100 10.768 0.737
9 90 120 8 1 0.070 9.922 0.664
中国医药工业杂志 Chinese Journal of Pharmaceuticals 2012, 43(1) · ·23
2.4 人工神经网络 (ANN) 建模
2.4.1 ANN 的选择
ANN 是以实验数据为基础,经有限次迭代计算
而获得的一个反映实验数据内在规律的数学模型,
尤适于研究复杂的非线性系统的特性。已证明具有三
层结构(只有 1 个隐含层)的 BP-ANN 能逼近任何有
理函数,且单隐层 BP 网络的非线性映射能力较强 [6]。
因此,本试验采用三层 BP-ANN 建模以逼近存在于
实验数据间的函数关系。
本试验中以变量 X i 作为 ANN 的输入,因变量
OD 为输出,建立 ANN 数学模型。
2.4.2 网络训练及检验样本的采集和选择
采用正交设计得到了 9 个实验样本数据。但为
了获得可信的 ANN 模型,需要大量样本进行训练,
为此引入了虚拟样本 [7,8]。即对于 Xi 设置 ±∆i=0.1%
的变化。这样,每个实际样本就能对应产生 24 个虚
拟样本,但根据正交设计表,只需对每一个实际样
本产生 8 个虚拟样本就可以代表全部 24 个虚拟样
本。如表 2 为第 1 个实际样本产生的 8 个虚拟样本。
表 2 第 1 个实验样本产生的虚拟样本
编号 X1 X2 X3 X4
1 59.94 59.94 5.99 1.00
2 59.94 59.94 6.01 1.00
3 59.94 60.06 5.99 1.00
4 59.94 60.06 6.01 1.00
5 60.06 59.94 5.99 1.00
6 60.06 59.94 6.01 1.00
7 60.06 60.06 5.99 1.00
8 60.06 60.06 6.01 1.00
这样,试验所得的 9 个实际样本加上各自的虚
拟样本,使参加神经网络训练和检验的样本总计达
到 81 个,加大了训练样本空间的样本密度,强化
了训练过程中的记忆效果,致使在实际样本的附近
区域不会产生大的波动。
2.5 粒子群优化 (PSO) 算法筛选提取工艺参数
PSO 算法 [9] 源于鸟群飞行觅食行为的研究。
PSO 算法中,每个优化问题的解都被看作是搜索空间
中的一只鸟,称之为“粒子”,所有的粒子都有一个
由被优化的函数决定的适应值,每个粒子还有一个位
置和速度函数,决定它们飞行方向和距离,粒子群追
随每次迭代中的最优粒子在解的空间中进行搜索。
PSO 算法首先初始化一群随机粒子 (随机解 ),
然后通过迭代寻找最优解。在每次迭代过程中,粒
子都通过跟踪两个“极值”来更新自己。一个是粒
子本身所找到的最优解,这个解称为个体极值,另
一个极值是整个种群找到的最优解,即全局极值。
在找到这两个最优值后,粒子根据 vid( t+1)[ vid( t+1)=
ω×vid( t)+c1×r1×[pbest( t)-xid( t)]+c2×r2×[gbest( t)-
xid(t)]] 和 xid(t+1)[xid(t+1)=xid(t)+vid(t+1)] 来更新自己的
速度和位置,直至找到满意解或达到最大迭代次
数停止。式中,vid( t) 和 xid( t) 是当前粒子的速度和
位置,i、d 分别为粒子个数和粒子维度,ω 是惯
性权重,r1、r2 是介于 (0,1) 之间的随机常数,c1、
c2 是加速常数。
本试验利用 ANN 的网络输出 OD i 值作为 PSO
的适应度函数。适应值优化的具体步骤如下:
(1) 训练建立样本数据 Xim 与 OD i 内在规律的
ANN 数学模型;
(2) 初始化惯性权重、加速常数等参数;
(3) 在可行区域内把 4 个输入 Xim 随机映射为
一群粒子,初始化粒子的位置和速度;
(4) 判断目标函数值是否得到最优解或达到预
定迭代次数;
(5) 如得到最优解或达到预定迭代次数,则将
全局最优粒子映射为最佳条件,并以此为优化结果,
得到最佳工艺条件;否则按粒子群计算模型进行粒
子速度和位置的更新,并生成新一代种群,返回步
骤 (3)。
2.6 试验结果
2.6.1 BP-ANN 的训练和预测
样本采集中,避开综合评分最低和最高的第 3、
第 4 组实际样本及其虚拟样本,在其余 7 组中每组
任选的 2 个样本,共计 14 个样本作为 BP-ANN 的
检验样本,其余则作为训练样本。运行 Matlab 软
件进行训练。设定 BP-ANN 训练循环次数参数为
100,训练误差目标参数为 1×10-6,学习率参数为 0.1,
训练过程和结果见图 2。
网络训练结果显示,经 9 次循环训练后,网络
误差平方和均值 (MSE) 为 5.832 7×10-7,达到了设
· · 中国医药工业杂志 Chinese Journal of Pharmaceuticals 2012, 43(1)24
定的目标值。网络训练完毕后,利用 Matlab 仿真
函数输出网络预测,用检验样本来检验网络训练效
果 (图 3)。从图 3 可见,BP-ANN 的预测输出与检
验样本非常接近。
图 2 BP-ANN 训练过程
图 3 BP-ANN 测试输出
图 4 为 BP-ANN 的预测输出与检验样本的误差
输出。可见,网络的预测输出与检验样本测试值的
误差在 ±3.5×10-5 间。表明本试验利用 BP-ANN 映
射出了准确地描述地锦草中 1 醇提工艺参数与其评
价指标的关系。
2 4 6 8 10 12 14
-4×10-5
-3×10-5
-2×10-5
-1×10-5
0
1×10-5
2×10-5


样本数
图 4 BP-ANN 的误差
2.6.2 PSO 算法筛选工艺参数及验证
设定惯性权重为 0.75,加速常数为 1.496,种
群规模 20,最大迭代次数 200,粒子飞行最大速度
为 1,粒子飞行边界限制在试验因素的水平范围内。
运行 Matlab 软件,结果输出见图 5 和表 3。
0 50 100 150 200
0.790
0.795
0.800
0.805
0.810
0.815
0.820
0.825
0.830
进化代数



图 5 粒子群优化适应度收敛过程曲线
表 3 PSO 算法结果
编号 迭代次数 适应度 X1/% X2/min X3/ml∶g X4
1 5 0.817 71.768 71.879 8.115 2.671
2 10 0.817 75.986 71.994 8.160 2.697
3 20 0.824 74.491 72.377 8.193 2.753
4 50 0.829 73.115 73.179 7.875 2.901
5 80 0.830 73.868 74.173 7.863 2.945
6 130 0.830 74.035 74.475 7.849 2.951
7 180 0.830 74.280 74.836 7.857 2.968
8 200 0.830 74.280 74.836 7.857 2.968
由图 5 和表 3 可见,粒子群优化迭代初期 10
代以内,能很快找到较优解,即其解群在优化初
期随进化代数表现出较强的随机性,容易找到较
优解。迭代 10 ~ 80 次,粒子逐渐向更优的解逼近。
在迭代 80 次以后,通过每代所有解的“信息”共享、
整合,优化解群逐渐趋向稳定,最后达到了群体
最优。
根据 PSO 算法优化得到的结果为:X1、X2、
X3、X4 分别为 74.280%、74.836 min、7.857 ml/g、
2.968。按实际情况稍作调整,即选择每次用地锦草
重量 8 倍的 75%乙醇作为溶剂提取 75 min,共提取
3 次为最佳方案。
按此优化方案,取粉碎并过 10 目筛的地锦草
药材 10 g,共 3 份,制备 3 批地锦草醇提物。计算
得平均 1 提取率和干浸膏得率分别为 (0.11±0.02)%
和 (9.30±0.16)%,其评价指标总评归一值为 0.908,
优于此前任一组实际样本,证明采用 BP-ANN 建模
结合 PSO 算法筛选提取工艺参数是可行的。
(下转第 72 页 )
· · 中国医药工业杂志 Chinese Journal of Pharmaceuticals 2012, 43(1)72
[25] O'mara E, Kasserra C, Huddlestone JR, et al. Effect of vicri-
viroc on the QT/corrected QT interval and central nervous
system in healthy subjects [J]. Antimicrob Agents Chemo-
ther, 2010, 54(6): 2448-2454.
[26] Xue CB, Chen L, Cao G, et al. Discovery of INCB9471, a
potent, selective, and orally bioavailable CCR5 antagonist
with potent anti-HIV-1 activity [J]. ACS Med Chem Lett,
2010, 1(9): 483-487.
[27] Shin N, Solomon K, Zhou N, et al. Identifi cation and cha-
racterization of INCB9471, an allosteric noncompetitive
small-molecule antagonist of C-C chemokine receptor 5 with
potent inhibitory activity against monocyte migration and
HIV-1 infection [J]. J Pharmacol Exp Ther, 2011, 338(1):
228-239.
[28] Maeda K, Nakata H, Koh Y, et al. Spirodiketopiperazine-
based CCR5 inhibitor which preserves CC-chemokine/CCR5
interactions and exerts potent activity against R5 human
immunodeficiency virus type 1 in vitro [J]. J Virol, 2004,
78(16): 8654-8662.
[29] Nishizawa R, Nishiyama T, Hisaichi K, et al. Discovery of
4-[4-({(3R)-1-butyl-3-[(R)-cyclohexyl(hydroxy)methyl]-
2,5-dioxo-1,4,9-triazaspiro[5.5]undec-9-yl}methyl)phenoxy]
benzoic acid hydrochloride: a highly potent orally available
CCR5 selective antagonist [J]. Bioorg Med Chem, 2011,
19(13): 4028-4042.
[30] Nichols WG, Steel HM, Bonny T, et al. Hepatotoxicity ob-
served in clinical trials of aplaviroc (GW873140) [J]. Anti-
microb Agents Chemother, 2008, 52(3): 858-865.
[31] Lemoine RC, Petersen AC, Setti L, et al. Evaluation of se-
condary amide replacements in a series of CCR5 antagonists
as a means to increase intrinsic membrane permeability. Part
1: Optimization of gem-disubstituted azacycles [J]. Bioorg
Med Chem Lett, 2010, 20(2): 704-708.
[32] Rotstein DM, Melville CR, Padilla F, et al. Novel hexa-
hydropyrrolo[3,4-c]pyrrole CCR5 antagonists [J]. Bioorg
Med Chem Lett, 2010, 20(10): 3116-3119.
[33] Ma D, Yu S, Li B, et al. Synthesis and biological evaluation
of 1,3,3,4-tetrasubstituted pyrrolidine CCR5 receptor anta-
gonists. Discovery of a potent and orally bioavailable anti-
HIV agent [J]. Chem Med Chem, 2007, 2(2): 187-193.
( 上接第 24 页 )
3 讨论
本研究利用 BP-ANN 建立的模型精度达 5.832 7×
10-7,且 BP-ANN 训练后网络预测值与检验样本相
对误差小于 3.5×10-5,模型准确。此外,BP-ANN
建模结合 PSO 算法寻优,无需目标函数具备明确的
数学表达式,且模型的映射建立与寻优迭代的过程
都可利用数据可视化技术以直观的图形、图表输出
呈现出来,无疑为解决多维非线性系统的优化问题
提供了另一个全新有效的途径。BP-ANN 建模结合
PSO 算法具有深刻的智能背景,适合科学研究和工
程设计数据的筛选优化,在药物制剂处方及制备工
艺的优化过程中,值得进一步研究和探讨应用。
参考文献:
[1] 李荣芷 , 何云庆 , 刘 虎 , 等 . 地锦草化学成分的研究 ——
Ⅰ . 三种黄酮甙的分离及其甙元的鉴定 [J]. 北京医学院学
报 , 1983, 15(S1): 72-74.
[2] 王慕邹 . 常用中草药高效液相色谱分析 [M]. 北京 : 科学出
版社 , 1999: 245.
[3] 邢俊波 , 水彩虹 , 刘 云 , 高效液相色谱法测定地锦草中
槲皮素的含量 [J]. 中国中药杂志 , 2002, 27(10): 758-760.
[4] 黄泰康 . 常用中药成分与药理手册 [M]. 北京 : 中国医药科
技出版社 , 1994: 803-805.
[5] 吴 伟 , 崔光华 , 陆 彬 . 实验设计中多指标的优化 : 星点
设计和总评“归一值”的应用 [ J] . 中国药学杂志 , 2000,
35(8): 530-533.
[6] 闵惜琳 , 刘国华 . 人工神经网络结合遗传算法在建模和优
化中的应用 [J]. 计算机应用研究 , 2002, 19(1): 79-80.
[7] 王卫东 , 郑宇杰 , 杨静宇 . 采用虚拟训练样本优化正则化判
别分析 [J]. 计算机辅助设计与图形学学报 , 2006, 18(9):
1327-1331.
[8] 张纪兴,陈燕忠 . 人工神经网络建模结合遗传算法优化岗
松油环糊精包合物制备工艺参数 [J] . 中国药科大学学报 ,
2011, 42(4): 324-328.
[9] 倪立斌 , 刘继常 , 伍耀庭 , 等 . 基于神经网络和粒子群
算法的激光熔覆工艺优化 [ J] . 中国激光 , 2011, 38(2) :
0203003-1-0203003-6.
IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII