全 文 :基于遗传算法和 BP网络的清开灵注射液增溶
工艺优化研究
刘瑞新1,2,刘南岑3,史新元1,乔延江1
(1.北京中医药大学 中药学院,北京 100102;
2.河南中医学院 第一附属医院 药学部,河南 郑州 450000;
3.首都医科大学 中医药学院,北京 100069)
[摘要] 目的:优化清开灵注射液的增溶工艺。方法:以清开灵注射液八混液中间体中胆酸的溶解度为指标,通过均匀
设计,结合基于遗传算法的BP神经网络(GABPNN)建模,对工艺参数进行优化。结果:增溶剂种类和八混液 pH影响较大,
而增溶剂浓度影响较弱;增溶剂宜选择聚氧乙烯脱水山梨醇单油酸酯(Tween80),八混液pH一定范围内宜选择较大者,增溶
剂浓度虽和溶解度正相关,但因其影响甚弱,故过高的浓度意义不大。结论:均匀设计结合 GABPNN建模的方法,适合于中
药注射液的增溶工艺的优化,具有一定的实际应用价值。
[关键词] BP神经网络;遗传算法;均匀设计;增溶;清开灵注射液;聚氧乙烯脱水山梨醇单油酸酯
[收稿日期] 20090414
[基金项目] 国家中医药管理局中医药行业科研专项(200708006)
[通信作者] 乔延江,Tel:(010)84738620,Email:yjqiao@263.net
[作者简介] 刘瑞新,主管药师,中药学在读博士。Tel:13520728351,
(010)84738622,Email:liuruixin7@yahoo.com.cn
清开灵注射液由古方安宫牛黄丸衍生而来,由
胆酸、猪去氧胆酸、栀子等8味药材或提取物组成,
功能清热解毒、化痰通络、醒神开窍,用于热病、神
昏、中风偏瘫等,是临床常用制剂,疗效显著。其中
的黄芩苷、胆酸、猪去氧胆酸均以较大量的单体形式
加入,且均为弱酸性难溶性成分。如胆酸为游离的
胆汁酸类成分,在水中溶解度很小(20℃时为
0028%[1])。因此,采取有效的增溶措施对于提高
其安全性和稳定性至关重要。
BP神经网络(backpropagationneuralnetwork,
BPNN)具有优良的非线性映射能力[2],在生物药剂
学、处方优化等方面有较多应用[3],但其算法易陷
入局部极值点。遗传算法(geneticalgorithm,GA)是
模拟生物在自然环境中的遗传和进化过程而形成的
一种自适应全局优化概率搜索算法[4],可克服
BPNN算法的不足。GA和 BPNN的结合(GA
BPNN)一般有多种方式[56],其中应用较多的是利
用GA优化BP网络的初始权值和偏置。
均匀设计(uniformdesign,UD)属于数论方法中
的“QuasiMonteCarlo”方法,各试验点“均匀分散”,
具有更好的代表性,大大减少了试验次数,但其不具
备“整齐可比”性,无法直接进行方差分析,故借助
准确、适宜的数学方法建模和优化尤为重要。常用
的有逐步多元回归建模(SMR)[7]、神经网络建
模[8]、B样条函数建模[8]等。GABPNN建模具有较
高的精度和较好的稳健性。本实验试以胆酸的溶解
度为指标,采用 UD结合 GABPNN建模,优选清开
灵注射液增溶工艺。
1 材料
Agilent1100高效液相色谱仪:四元泵,在线脱
气机,自动进样器,柱温箱,DAD检测器,HPCORE
ChemStation数据处理工作站。SartoriusBP211D电
子天平。上海雷磁PHS3C精密 pH计。荣华 SHA
CA水浴恒温振荡器。
胆酸标准品(中国药品生物制品检定所,批号
100078200414)。胆酸原料(福建仙游生化有限公
司,批号 08040947,经测定纯度以胆酸标准品计
977%)。清开灵注射液中间体由北京中医药大学药
厂提供。聚氧乙烯脱水山梨醇单油酸酯(Tween80,
江苏晨牌药业,批号080225)、泊洛沙姆188(P188,
上海协泰)、聚乙二醇400(PEG400,北京会友,批号
20080423)。甲醇为色谱纯。
MATLAB软件工具(MathworkInc.)。遗传算法
GAOT工具箱(北卡罗莱纳州立大学提供网络共享,
22
第34卷第19期
2009年10月
Vol.34,Issue 19
October,2009
htp://www.ise.ncsu.edu/mirage/GAToolBox/gaot/)。
2 方法与结果
2.1 均匀设计方案
拟考察清开灵注射液八混液中间体的 pH(A)、
增溶剂用量(B)以及增溶剂种类(C)诸因素对胆酸
在其中的表观溶解度(Y)的影响。各因素的水平范
围:A因素选择该制剂质量标准要求范围(pH68~
75)适当扩大;B因素为其常用量范围适当扩大;C
因素选择了3种毒性较小的非离子型表面活性剂:
C1为Tween80,C2为P188,C3为PEG400。
根据有关均匀设计表的选择原则[7],拟选用 U
12(12
10)均匀设计表,并按该表所对应的使用表分
别安排各因素及水平。其中 C为定性因素,且水平
不足12,按拟水平的方法进行变换后安排[7,9]。此
外,为便于建模,须将定性变量 C转化为2个哑变
量[10]Z1,Z2。转化后C1,C2,C3分别对应(Z1,Z2)的
取值为(1,0)、(0,1)、(0,0)。见表1。
表1 均匀设计表和试验
No.
A B①
/g·mL-1
C
Z1 Z2
Y②
/g·L-1
1 650 150% 0 0 43282
2 665 300% 0 1 49222
3 680 125% 1 0 61369
4 695 275% 1 0 68863
5 710 100% 0 0 59270
6 725 250% 0 1 66173
7 740 075% 0 1 67135
8 755 225% 1 0 85055
9 770 050% 0 0 70628
10 785 200% 0 0 72742
11 800 025% 0 1 80183
12 815 175% 1 0 99354
注:①.B因素有效数字:黏稠液体不易精确称取,且A因素有效
数字较少,故少保留一位;②.Y的有效数字:有大量数据运算,多保
留一位安全数。
2.2 溶解度测定方法与结果
取50mL离心管,加入按各试验号相应质量体
积百分比折算量的增溶剂,加热至80℃[11],再加入
调节至规定pH的八混液10mL,(25±05)℃恒温
水浴振荡2h使分散,加入过量胆酸,继续恒温水浴
振荡24h,1000r·min-1离心10min,取上清液以
045μm微孔滤膜过滤,取续滤液5mL,加水稀释
至10mL。按《中国药典》2005年版一部清开灵注
射液项下胆酸测定方法测定。胆酸标准品浓度
1029mg·mL-1。经进一步验证,方法可靠。结果
见表1。
2.3 GABPNN模型的建立及优化
2.3.1 模型的算法流程 本文利用GA优化BP神
经网络的初始权重和偏置。主要算法步骤为:①在
初始化模型的基础上,将由 BP网络的所有连接权
值和偏置编码后组成 GA的染色体,再通过 GA对
其进行优化,并将优化后的染色体解码后赋给网络;
②BP网络在上述网络权重和偏置的基础上,通过
BP训练函数的局部优化进一步寻优。其算法的流
程见图1。图中虚线方框示步骤①。
图1 GABPNN算法流程图
2.3.2 模型的初始化及参数选择 BP网络以 A,
B,Z1,Z2作为输入向量,以 Y作为输出向量。将所
有向量归一化至[-1,1]范围内以消除量纲影响。
经过预试验、内验证,初步选择网络为3层结构,1
个隐含层;隐含层结点数取3;传递函数分别为 tan
sig和 purline;训练函数 traingd。学习速率005,目
标误差10-4,最大训练周期30000。
GA采用实数编码的方式,将 BP网络的各连接
权值等 19个参量定向排列后组成 GA的染色体。
种群规模50,遗传代数500。适应度函数定义为拟
合残差平方和的倒数。该残差为归一化后的原输出
向量和未反归一化的预测输出向量之差。采用基于
正态几何分布的排序选择法,选择函数的参数 q取
008,该参数决定概率选择表的分布情况[12]。采用
算术交叉,每一代进化进行交叉操作的频次为2,即
进行交叉操作的个体占群体(50)的比例最大为
4%。采用非均匀变异,形状参数 b取3。每一代进
化中变异操作的频次为4次,进行变异操作的每个
个体的变异概率为0053。
2.3.3 模型的训练与建立 GA部分经过500代进
化,未达GA目标精度10-3,将此时的最优个体赋给
32
第34卷第19期
2009年10月
Vol.34,Issue 19
October,2009
BP网络。图2所示为进化过程中群体的最大适应
度和平均适应度的变化。再经过 BP进一步优化,
达到目标精度10-4,如图3所示。
图2 GA的适应度变化曲线
图3 GA优化后的BP训练曲线
2.3.4 模型的优化与评估 采用Jacknifing[13]交叉
验证方法,以交互验证平均绝对百分比误差
(MAPECV)为指标进行评价:
MAPECV=1n
n
i=1
|Yi-Y
∧
i|
|Yi|
其中 n为总观测数;Yi为第 i个观测对应的 Y
值;Y
∧
i为用除去第i个观测后用剩余的n1个观测所
建模型对 Yi的预测值。此外,因初始权值的随机
性,计算了6组交叉验证,求得其均值为187%。
对最终模型进行残差分析(小样本条件下使用
t分布的双侧临界值[14]),样本资料符合模型条件。
2.4 工艺参数优化和实验验证
通过编程使最优模型在当前因素及其水平范围
内模拟全面实验,并据此对工艺参数进行优化。
图4,5分别是全面试验中总离均差平方和、总
方差的分布情况,结果表明:增溶剂种类和八混液
pH影响较大,而增溶剂浓度影响较弱。图6所示为
Y受A,B,C3类因素综合影响的示意图,结果表明:
Tween80的增溶效果明显优于其余2种增溶剂;随
着pH的升高,胆酸溶解度明显增加。图7是将使
用每种增溶剂时的指标成分的均值进行最大值归一
化得到的百分数,结果表明:Tween80分别优于
PEG400和P188196%和128%。图8所示为模
拟300%的 Tween80增溶条件下胆酸的溶解度随
八混液 pH变化的杆形图。图 9所示为模拟 pH
815时不同浓度的 Tween80引起的胆酸溶解度变
化的杆形图。
经过上述分析可知:使用八混液 pH815,
30%的Tween80为最优工艺条件。对该工艺分别
进行实验验证和模型预测,二者结果分别为
10074,10154g·L-1,预测相对误差079%。
图4 总离均差平方和分布
图5 总方差分布
图6 Y受A,B,C影响示意
图7 3种增溶剂对比
42
第34卷第19期
2009年10月
Vol.34,Issue 19
October,2009
图8 Y受A的影响(Tween80,30%)
图9 Y受B的影响(Tween80,pH815)
3 讨论
本文结果显示,溶液的 pH在一定范围内与指
标成分的溶解度呈良好的正相关,但注射剂 pH一
般要求在4~9,过高可引起局部组织的刺激或坏
死[11]。增溶剂浓度虽然和指标正相关,但相对于溶
液pH的影响而言,其影响甚弱,故过高的浓度意义
不大,且可能引起毒性。按优化工艺进行制备的成
品,其安全性、稳定性等暂未考察,有待进一步研究。
胆酸在八混液中的溶解度远高于在水中的溶解
度,其原因可能是游离的胆酸转化为盐而使表观溶
解度升高。
此外需要说明的是,实验中八混液的 pH是加
入过量增溶质之前通过加入少量适宜浓度的 NaOH
溶液进行调节的,而在加入过量增溶质之后,其 pH
将有一定程度的降低。
本文采用了 GA和 BPNN结合的方法建模,即
首先利用GA的全局寻优能力优化 BPNN的初始权
重等参数,再对优化后的参数利用 BPNN的训练函
数进一步精细化寻优,发挥二者各自的优势。关于
GA和 BPNN结合的建模方法,也有文献[13]仅仅通
过GA优化网络权重和偏置,再使用 BPNN的结构
直接确定最终模型,而未用 BP网络的训练函数进
行进一步精细寻优。也有文献[15]利用 GA对已经
建好的BPNN进行目标值的寻优,与本文方法存在
本质不同。
遗传算法步骤采用了实数编码,它具有较多优
点,如改善遗传算法的计算复杂性,提高运算效率;
便于遗传算法和其他经典优化方法的混合使用
等[4]。
本文建模方法所建立的模型,对训练集样本拟
合优度高(R2 =09996),高于常规的 SMR和
BPNN;内部验证的平均 MAPECV较低,且远低于
BPNN,SMR,建模方法可靠;验证实验和模型预测结
果相对误差较小,模型具有良好的预测能力。
总之,本文采用均匀设计结合 GABPNN建模
的方法,适合于中药注射液的增溶工艺的优化,具有
一定的实际应用价值。
[参考文献]
[1] 肖崇厚.中药化学[M].上海:上海科学技术出版社,1997:
512.
[2] HonikK.Approximationcapabilitiesofmultilayerfeedforward
networks[J].NeuralNetworks,1991,6(8):1069.
[3] Kozot,Junichit,Mikitof.Formulaoptimizationbasedonartificial
neuralnetworksintransdermaldrugdelivery[J].JControled
Release,1999,62(1/2):161.
[4] 周明,孙树栋.遗传算法原理及应用[M].北京:国防工业出
版社,2000:4,38.
[5] 李建珍.基于遗传算法的人工神经网络学习算法[J].西北师
范大学学报:自然科学版,2002,38(2):33.
[6] 杨洪明,白培林.基于遗传算法的人工神经网络负荷预报模
型[J].湖南电力,2000,20(1):6.
[7] 曾昭钧.均匀设计及其应用[M].北京:中国医药科技出版
社,2005.
[8] 方开泰,马长兴.正交与均匀试验设计[M].北京:科学出版
社,2001:120.
[9] 方开泰.均匀设计与均匀设计表[M].北京:科学出版社,
1994.
[10] 孙振球.医学统计学[M].北京:人民卫生出版社,2005:327.
[11] 赵新先.中药注射剂学[M].广州:广东科技出版社,2000:130.
[12] CRHouck,JAJoines,MGKay.Ageneticalgorithmforfunc
tionoptimization:aMatlabimplementation[R].NCSUIETR
9509,NorthCarolinaStateUniversity,Raleigh,NC,1995.
[13] 许禄,邵学广.化学计量学方法[M].北京:科学出版社,
2004.
[14] 隗斌贤,袁晋华,崔鸣文,等.统计分析概论[M].西安:陕西
科学技术出版社,1992:445.
[15] 杨铭,余敏英,史秀峰,等.BP神经网络结合遗传算法多目标
优化秦皮提取工艺的研究[J].中国中药杂志,2008,33(22):
2622.
52
第34卷第19期
2009年10月
Vol.34,Issue 19
October,2009
OptimizationofsolubilizingprocessofQingkailinginjectionbasedon
GABPNNmodeling
LIURuixin1,2,LIUNancen3,SHIXinyuan1,QIAOYanjiang1
(1.SchoolofChinesePharmacy,BeijingUniversityofChineseMedicine,Beijing100102,China;
2.Dept.ofPharmacy,TheFirstAfiliatedHospitalofHenanColegeofTraditionalChineseMedicine,Zhengzhou450000,China;
3.SchoolofTraditionalChineseMedicine,CapitalMedicalUniversity,Beijing100069,China)
[Abstract] Objective:TooptimizesolubilizingprocessofQingkailinginjection.Method:Uniformdesignexperimentalmeth
odandGABPNNmodelingmethodwereappliedtooptimizethetechnicalparameters,andthesolubilityofcholicacidinintermediate
wastakenasoptimizingindex.Result:ThetypeofsolubilizerandpHofintermediatehavegreaterimpactontheindexthantheconce
trationfosolubilizer;TheoptimumsolubilizerisTween80;InacertainrangehigherpHisoptimum;itisnotnecessarytousehigh
concentrationsolubilizeralthoughthereispositivecorelationbetweentheindexandtheconcentrationofsolubilizer.Conclusion:Uni
formdesigncombinedwithGABPNNmodelingmethodissuitableforoptimizationofsolubilizingprocessofChinesemateriamedicain
jection,whichhascertainpracticalapplicationvalue.
[Keywords] BPneuralnetwork;geneticalgorithm;uniformdesign;solubilizing;Qingkailinginjection;Tween80
[责任编辑 周 驰]
62
第34卷第19期
2009年10月
Vol.34,Issue 19
October,2009