免费文献传递   相关文献

A method for predicting activity of traditional Chinese medi cine based on quantitative composition-activity relationship of neural network model

一类基于组效关系神经网络模型的中药药效预测方法



全 文 :一类基于组效关系神经网络模型的中药
药效预测方法
赵筱萍t ou o范骁辉t o余 杰t o程翼宇t 3
kt1 浙江大学 中药科学与工程学系 o浙江 杭州 vtssuz ~
u1 浙江医学高等专科学校 o浙江 杭州 vtssxvl
≈摘要  目的 }研究与药效相关的中药质量分析方法 ∀方法 }分别选取非线性函数逼近能力较强的 …°神经网
络和径向基函数神经网络 o并与偏最小二乘法相结合 o建立中药组效关系模型 o进而用组效关系模型计算预测药
效 o据此评价中药质量 ∀结果与结论 }将其应用于川芎质量评价 o无论在训练误差 !预测误差以及相关系数等方面 o
均明显优于 °≤• 和 °≥• 方法 o具有较理想的训练及预测精度和可信度 o能够较准确地反映川芎各化学组分与药效
检测指标间复杂的非线性映射关系 o可发展成为能反映药效的中药质量评价方法 ∀
≈关键词  中药组效关系 ~中药质量评价 ~神经网络 ~偏最小二乘法
≈中图分类号  • u2sv ≈文献标识码  „ ≈文章编号  tsst2xvsukusswltt2ts{u2sw
≈收稿日期  ussw2sy2sv
≈基金项目  国家自然科学基金重大研究计划重点项目
k|sus|ssxl ~国家重点基础研究发展规划项目kŠt|||sxwwsxl
≈通讯作者  3 程翼宇 oר¯ }ksxztl{z|xttv{ o∞2°¤¬¯}¦«¨ ±ª¼¼ ƒ
½­∏1 §¨∏1¦±
建立科学规范的中药质量评价方法是中药现代
化研究领域的重大前沿课题 ∀由于中药的疗效取决
于其内在的物质基础 o故以现代仪器分析为核心的
质量检测技术已成为中药质量评价的主流方法≈t  ∀
但是 o这类质量分析技术并不直接反映药效 o往往难
以准确地评价中药质量 ∀这就需要建立中药化学组
成与其药效间关系模型 o并据组效关系≈u 模型 o通过
测定中药化学组分含量较准确地推算出药效优劣 o
从而科学准确地分析与评价中药质量 ∀因此 o研究
中药组效关系建模方法具有十分重要的学术意义和
应用价值 ∀
许多中药的化学组成极其复杂 o各组分间会存
在相互作用 o导致其药效往往是各成分的加和 !协同
和互补作用的结果≈v  o因而采用经典的多元线性回
归等多元统计建模方法无法正确反映这类中药组效
间复杂的非线性关系 o以致难以准确地预测中药药
效 ∀神经网络具有很强的非线性逼近能力和自学习
功能 o从理论上讲 o它可以精确逼近任意复杂的非线
性函数 o因此适合于中药组效关系建模 ∀本研究选
用基于反向传播算法的多层前馈网络k¥¤¦® ³µ²³¤ª¤2
·¬²± ±¨·º²µ®o …°‘l和径向基函数网络kµ¤§¬¤¯ ¥¤¶¬¶
©∏±¦·¬²± ±¨ ·º²µ®o• …ƒ‘l分别建立中药川芎组效关系
的非线性模型 o并与主成分回归k³µ¬±¦¬³¤¯ ¦²°³²±¨ ±·
µ¨ªµ¨¶¶¬²±o°≤• l和偏最小二乘回归k³¤µ·¬¤¯ ¯¨ ¤¶·¶´∏¤µ¨
µ¨ªµ¨¶¶¬²±o°≥• l等经典多元统计建模方法进行比
较 ∀研究结果表明 o基于神经网络的非线性模型无
论在训练精度 !预测精度和相关性系数等指标上面
都明显优于线性模型 o能较好地模拟药材的多组分
与药效活性间的定量关系 o在中药组效关系建模方
面 o具有良好的应用前景 ∀
1 中药组效关系建模原理
111 化学组分空间降维
由于从实验中测得的川芎化学组分较多 o数据
空间维数过高 o若直接作为神经元网络的输入变量 o
必然会造成网络拓扑结构过于庞大复杂 o而训练样
本量又十分有限 o故会大大增加函数逼近的困难 o严
重影响训练及预测精度 ∀为此 o本研究采用偏最小
二乘k³¤µ·¬¤¯ ¯¨ ¤¶·¶´∏¤µ¨¶o°≥l法≈w 提取若干个 °≥
成分实现数据空间降维 o以减少网络的输入变量数 o
简化网络结构 ∀与由主成分分析法≈x 提取得到的主
成分相比 o°≥成分既包含了自变量数据较多的方
差 o又与因变量数据有较大的相关性 o对两者间相互
关系具有更强的解释性 o有利于提高后续神经网络
训练及预测精度 ∀
#u{st#
第 u|卷第 tt期
ussw年 tt月
中 国 中 药 杂 志
Χηινα ϑουρναλ οφ Χηινεσε Ματερια Μεδιχα
∂²¯1u| oŒ¶¶∏¨ tt
‘²√¨ °¥¨µoussw
112 神经网络模型
11211 …°‘神经网络 本研究采用 v 层结构的
…°‘o各层神经元传递函数均取为对数型 ¶¬ª°²¬§函
数≈y  ∀…°‘的权值和阈值向量通过反向传播k…°l
学习算法进行训练≈z  ∀由于标准的 …°学习算法是
一种基于梯度下降的静态寻优算法 o训练过程易发
生振荡且收敛速度慢 o故本研究采用 ¨√¨ ±¥¨µª2¤µ2
∏´¤µ§·优化算法≈{  o以缩短学习时间和提高网络训
练速度 ∀
11212 • …ƒ‘神经网络 • …ƒ‘拓扑结构与 …°‘类
似 o一般也是 v层结构 ∀其中间层神经元传递函数
是径向基函数 o这里采用高斯型径向基函数≈y  o尺度
因子取为 t ~而输出层神经元传递函数取为线性函
数 ∀ • …ƒ‘的训练一般采用最小二乘法或递推型最
小二乘法≈|  ∀
2 研究实例
211 药材样品
本研究共选取来自不同产地 !等级及采摘年份
的 vv个川芎样品作为实验样本 o用于组效关系建模
研究 ∀
212 样本数据集
对各川芎样品 o通过高效液相色谱分析测得 vx
种组分 o组成化学组分数据集 ~并选用血小板聚集 !
动脉收缩 !耳灌流量 !血栓形成和心肌损伤等 x个药
效检测指标 o通过动物实验获取药效检测数据集 ∀
限于篇幅 o整个数据集不予列出 ∀
213 建模算法步骤
川芎组效关系神经网络模型分以下几步来建模 ∀
21311 数据预处理 先对化学组分数据进行降维 o
采用 °≥法提取前 ν 个 °≥成分构建新的数据空
间 o并将原始数据投影到该低维子空间 ∀本研究提
取了前 x个 °≥成分 ∀
21312 神经元网络的构建 分别采用 v层结构的
…°‘和 • …ƒ‘模型 o输入层的 x个端口分别对应于 x
个 °≥成分数据 o输出端则为所选取的某个药效检
测指标值 ∀其中 o…°‘取为kx ow otl结构 o各层传递
函数均取为对数型 ¶¬ª°²¬§函数 o权值向量和阈值向
量的初值取≈ p t ot 间均匀分布的随机数 ~而 • …ƒ‘
的隐层采用高斯型径向基函数 o输出层采用线性函
数 ∀
21313 神经网络训练 为保证模型的可信度 o先采
用/留一法0 对 vv个样本进行交叉验证 o即从 vv个
样本中每次不重复地选择一个作为预测样本 o而其
余 vu个作为训练样本输入网络进行训练 ~然后采用
随机检验 o即任意抽取 x个样本作为预测集 o而其余
u{个样本组成训练集 ∀为了保证较高的预测精度 o
避免/过拟合0现象 o以预测集来监控训练次数 o当平
均预测误差明显增大时即停止训练 ∀
3 结果与讨论
311 交叉验证的结果与分析
首先采用交叉验证依次选取每个样本作为预测
样本 o分别用 …°‘和 • …ƒ‘进行训练 o并与经典的
°≤• 和 °≥• 方法进行对比 ∀以血小板聚集率为
例 o各组效关系模型的计算结果对比如表 t所示 ∀
从表 t可见 o采用 °≤• 或 °≥• 法所建的川芎
组效关系模型 o效果较差 o无论是训练集的平均误差
还是预测集的平均误差都很高 o说明简单的线性化
数学模型难以精确描述中药多组分与药效间的高度
非线性关系 ~而采用神经元网络所建的组效关系模
型 o训练误差和预报误差均有较大程度的改善 o表明
所采用的两种神经元网络模型均可较精确地逼近多
组分与药效间非线性函数关系 ∀经过对计算结果的
相关性分析发现 o采用 …°‘和 • …ƒ‘的相关系数分
别达到 s1|yv和 s1|zy o说明模型具有很高的可信度
和预测精度 ∀而与 …°‘相比较而言 o• …ƒ‘具有更
快的网络训练速度 o同时在训练集平均误差上要明
显优于前者 o这主要是 …° 网络得到的是局部最优
解 o而 • …ƒ‘则能得到全局最优解 ~同时 o• …ƒ‘在对
未知样本的预报能力方面也略优于 …°‘∀对其他 w
个药效检测指标 o在交叉验证时 o本研究方法同样取
得了较理想的训练和预测效果 ∀
312 随机检验的结果与分析
在对样本集进行交叉验证的基础上 o又对 u种
神经元网络模型进行 v次随机分组检验 o每次任意
选取 u{个样本作为训练集 ~而其余 y个样本构成预
测集 o以上 v次随机检验的结果如表 u所示 ∀
从对样本集随机检测的结果可见 o在训练误差
上 o• …ƒ‘明显优于 …°‘~而在预测误差上 o• …ƒ‘也
优于 …°‘∀总体说来 ou种神经网络模型在川芎组
效关系建模方面都取得了较好的结果 o具有很高的
训练和预测精度以及可信度 o从而可根据未知样本
的成分分析数据来定量预测药材的各药效值 ∀相比
较而言 o• …ƒ‘模型的性能更为理想 ∀
4 结论
#v{st#
第 u|卷第 tt期
ussw年 tt月
中 国 中 药 杂 志
Χηινα ϑουρναλ οφ Χηινεσε Ματερια Μεδιχα
∂²¯1u| oŒ¶¶∏¨ tt
‘²√¨ °¥¨µoussw
川芎组效关系建模研究实例表明 o基于 …°‘和
• …ƒ‘的中药组效关系神经元模型明显优于经典的
多元统计模型 o具有较高的训练和预测精度 ∀其中 o
基于 • …ƒ‘的组效关系模型更为理想 o能较准确地
反映药材化学组分与药效间的非线性函数关系 ∀因
此 o通过建立组效关系模型 o能够根据中药成分分析
数据对其药效值进行较准确地预测 o从而可用于评
价中药质量 o并推广应用于中药新药的优化设计 ∀
表 t 各模型交叉验证的结果 h
分组
序号
…°‘
平均训练误差 平均预报误差
• …ƒ‘
平均训练误差 平均预报误差
°≤•
平均训练误差 平均预报误差
°≥•
平均训练误差 平均预报误差
t t1xt v1zw s1ty v1{| {1{| tv1yz y1tz |1xv
u t1{| u1vy s1tu w1uw z1yu tw1sx x1{u tu1w{
v u1tx v1|v s1uz w1yv |1x{ tu1w{ z1|t tv1s|
w t1{s u1z| t1sy x1z{ {1uy tt1x| y1x{ {1wu
x v1ww x1st t1tv v1zv y1x| tv1zw z1vz ts1ut
y t1wv t1zy s1zv v1|{ z1sx ts1tz x1uy |1sz
z t1|x w1tz t1uu x1{u {1ut tu1xy x1{t tt1vy
{ t1vw u1yu s1|{ w1tz z1|| tv1zw y1uu ts1sz
| u1vt x1sx s1|s v1{v y1u{ |1{v w1u| tu1xz
ts t1uy u1zv t1uw y1su |1ty tx1ww y1t{ ts1zy
tt u1t{ w1wt s1zv w1v{ |1{z tw1v{ z1tt |1vw
tu t1{v v1xu s1xw u1tt z1yu tt1x| w1u| {1ty
tv t1{| t1zs t1yx x1uv {1{v tv1sy y1tz ts1uy
tw u1tu v1vv s1{{ v1wu |1yu tu1xv z1xw |1vy
tx t1us u1|t t1tz u1|y z1yw tt1tz x1x{ tu1t|
ty t1w| u1{x t1su v1sz y1tu |1{| w1uv ts1yz
tz t1vv x1xs u1tt w1tv z1zv tz1w{ y1sv tw1uy
t{ u1tz v1|w s1y| u1su y1{w tt1su w1w| |1{x
t| t1zt v1wy s1zx t1{x z1z| tt1vx x1st {1{z
us t1sz v1tv s1wz t1|w z1w{ tw1x| y1uz tu1vu
ut t1wu w1zv s1xx t1tz y1v{ ts1|z x1vy tt1ws
uu t1u{ w1{t t1uy w1tw x1uu |1st v1u{ {1|z
uv t1{u u1|t t1{v v1y{ y1zx tw1u{ z1{w tv1xy
uw t1sx t1|s s1yu u1uz x1v| |1sz x1xx y1|{
ux t1yw w1vx s1xt t1|v {1yv tu1|w z1su ts1{v
uy t1tv v1{s u1sv w1vx z1x| ts1s| y1ww |1xz
uz t1w| w1tt t1vx v1s| x1wu z1|y x1x| {1wu
u{ t1u{ w1sy t1st v1uz {1uz tu1su z1sv tt1wz
u| t1|y v1{| s1zu u1sw z1zv tw1xu y1x{ tu1ty
vs t1ux u1v| s1{y v1wz x1v{ |1|x v1zw {1u{
vt t1ws u1{x t1xw w1s| z1ut tt1sw y1wt {1|x
vu t1xu u1{{ t1tu u1vz y1x| tu1wv x1uy ts1wz
vv t1ww v1{| s1|y u1yu {1tw tv1zu y1s| |1zu
均值 t1zw v1xu s1|{ v1xs z1xt tu1t| x1{| ts1wt
表 u u种神经元网络模型的随机检验结果 h
序号 …°‘平均训练误差 平均预测误差 ρ
• …ƒ‘
平均训练误差 平均预测误差 ρ
t v1z{ x1yz s1|vz u1tw x1xt s1|ww
u w1uu x1{v s1|tv u1|x x1tz s1|u|
v v1x| x1sv s1|s{ t1|z w1|w s1|ty
≈参考文献 
≈t  陈闽军 o瞿海斌 o程翼宇 1 一类用化学指纹特征鉴别中药材真
伪的方法 1 高等学校化学学报 oussv ouwktul }ut{t1
≈u  赵明洁 o程翼宇 o陈慰浙 1 天然植物复杂化学模式特征的分步
提取法 1化学学报 ousst ox|kyl }{wu1
≈v  张礼和 1我对中药复方有效成分研究的一些看法 1 化学进展 o
t||| ottkul }t{y1
≈w  Š¨ ¤¯§¬° o Ž²º¤¯¶®¬… • 1 °¤µ·¬¤¯ ¯¨ ¤¶·2¶´∏¤µ¨¶µ¨ªµ¨¶¶¬²±}¤·∏·²µ¬2
¤¯1 Αναλψσισ Χηιµιχα Αχτα ot|{y otx{ }t1
≈x  方开泰 1 实用多元统计分析 1 上海 }华东师范大学出版社 o
#w{st#
第 u|卷第 tt期
ussw年 tt月
中 国 中 药 杂 志
Χηινα ϑουρναλ οφ Χηινεσε Ματερια Μεδιχα
∂²¯1u| oŒ¶¶∏¨ tt
‘²√¨ °¥¨µoussw
t|{|1u|t1
≈y  胡上序 o程翼宇 1 人工神经元计算导论 1 北京 }科学出版社 o
t||w1
≈z  • ∏°¨ «¯¤µ·⁄ ∞o ‹¬±·²± Š ∞o • ¬¯¯¬¤°¶ • 1 ¨¤µ±¬±ªµ¨³µ¨¶¨±·¤·¬²±
¥¼ ¥¤¦®2³µ²³¤ª¤·¬±ª µ¨µ²µ1 Νατυρε ot|{y ow }xvv1
≈{  汪树玉 o杨德铨 o刘国华 o等 1 优化原理 !方法与工程应用 1 杭
州 }浙江大学出版社 ot||t1tt{1
≈|  ≥¦«º ±¨®¨µƒ o Ž¨¶·¯¨µ‹ „ o°¯ ¤° Š1 ׫µ¨¨¯¨ ¤µ±¬±ª³«¤¶¨¶©²µµ¤§¬¤¯2
¥¤¶¬¶2©∏±¦·¬²± ±¨ ·º²µ®¶1 Νευτραλ Νετωορκσousst otwkwl }wv|1
Α µετηοδ φορ πρεδιχτινγ αχτιϖιτψ οφ τραδιτιοναλ Χηινεσε µεδιχινε βασεδ ον
θυαντιτατιϖε χοµ ποσιτιον2αχτιϖιτψ ρελατιονσηιπ οφ νευραλ νετωορκ µ οδελ
‹„’ ÷¬¤²2³¬±ªtou oƒ„‘÷¬¤²2«∏¬t o ≠˜ ¬¨t o≤‹∞‘Š ≠¬2¼∏t 3
(t1 ∆επαρτµεντ οφ Χηινεσε Μεδιχινε Σχιενχε ανδ Ενγινεερινγ , Ζηεϕιανγ Υνιϖερσιτψ, Ηανγζηου vtssuz , Χηινα ;
u1 Ζηεϕιανγ Μεδιχαλ Χολλεγε , Ηανγζηου vtssxv , Χηινα)
[ Αβστραχτ] Οβϕεχτιϖε : ײ¶·∏§¼ ¤ ° ·¨«²§©²µ √¨¤¯∏¤·¬±ª·«¨ ∏´¤¯¬·¼ ²©·µ¤§¬·¬²±¤¯ ≤«¬±¨ ¶¨ ° §¨¬¦¬±¨ k×≤ l ¤¦¦²µ§¬±ª¤¶·«¨¬µ¤¦·¬√¬·¼1
Μετηοδ : ≤²°¥¬±¨ §º¬·«³¤µ·¬¤¯ ¯¨ ¤¶·¶´∏¤µ¨¶k°≥l o…° ¤±§• …ƒ ±¨ ∏µ¤¯ ±¨ ·º²µ®¶º µ¨¨ ¶¨¯¨ ¦·¨§·² ¶¨·¤¥¯¬¶«·«¨ °²§¨¯²© ∏´¤±·¬·¤·¬√¨¦²°³²2
¶¬·¬²±2¤¦·¬√¬·¼ µ¨ ¤¯·¬²±¶«¬³k±≤„• l §∏¨ ·²·«¨¬µ¶·µ²±ª¤³³µ²¬¬°¤·¬²± ¦¤³¤¥¬¯¬·¬¨¶©²µ±²±¯¬±¨ ¤µ©∏±¦·¬²± µ¨¶³¨¦·¬√¨¯¼1 ׫¨ ¤¦·¬√¬·¼ ²© ×≤  º¤¶
³µ¨§¬¦·¨§º¬·«·«¨ ±≤„• °²§¨¯o¤±§·«¨ ∏´¤¯¬·¼ ²©×≤  º¤¶ √¨¤¯∏¤·¨§¤¦¦²µ§¬±ª·²·«¨ ³µ¨§¬¦·¨§¤¦·¬√¬·¼1 Ρεσυλτ & Χονχλυσιον : ׫¨ ³µ²2
³²¶¨§ ° ·¨«²§º¤¶¤³³¯¬¨§·² √¨¤¯∏¤·¨·«¨ ∏´¤¯¬·¼ ²© ≤«∏¤±¬¬²±ª1 ׫¨ µ¨¶∏¯·¶¬±§¬¦¤·¨§·«¤·o¬±·«¨ ¬±§¨ ¬¨ ¶¬±¦¯∏§¬±ª·µ¤¬±¬±ª µ¨µ²µo³µ¨§¬¦·¬²±
µ¨µ²µ¤±§¦²µµ¨ ¤¯·¬²± ¦²¨©©¬¦¬¨±·o·«¨ ¶¨·¤¥¯¬¶«¨ § °²§¨¯¬¶¥¨·¨µ·«¤±·«¨ °²§¨¯ ¶¨·¤¥¯¬¶«¨ §¥¼ ³µ¬±¦¬³¤¯ ¦²°³²±¨ ±·µ¨ªµ¨¶¶¬²± ²µ°≥ µ¨ªµ¨¶2
¶¬²±1 ׫¨ ±¨ º °²§¨¯¦¤±¤¦¦∏µ¤·¨¯¼ µ¨³µ¨¶¨±··«¨ ¦²°³¯¬¦¤·¨§±²±¯¬±¨ ¤µµ¨ ¤¯·¬²±¶«¬³¥¨·º¨¨ ±·«¨ ¦²°³²±¨ ±·¶¤±§·«¨ ¥¬²¤¦·¬√¬·¼ ²©≤«∏¤±¬¬²±ª1
≤²±¶¨ ∏´¨ ±·¯¼ o·«¬¶° ·¨«²§«¤¶³²·¨±·¬¤¯ ·² √¨¤¯∏¤·¨·«¨ ∏´¤¯¬·¼ ²©×≤  ¤¦¦²µ§¬±ª·²¥¬²¤¦·¬√¬·¼1
[ Κεψ ωορδσ] ∏´¤±·¬·¤·¬√¨¦²°³²¶¬·¬²±2¤¦·¬√¬·¼ µ¨ ¤¯·¬²±¶«¬³~ ∏´¤¯¬·¼ √¨¤¯∏¤·¬²± ²©·µ¤§¬·¬²±¤¯ ≤«¬±¨ ¶¨ ° §¨¬¦¬±¨ ~±¨ ∏·µ¤¯ ±¨ ·º²µ®~³¤µ·¬¤¯
¯¨ ¤¶·¶´∏¤µ¨¶
≈责任编辑 古云侠 
≈收稿日期  ussv2sw2ts
≈基金项目  吉林省科委新药基金项目kussssvu|l
≈通讯作者  3睢大员 oר¯ }kswvtlxyt|yys o∞2°¤¬¯}§¤¼∏¤±¶∏¬ƒ tyv1¦²°
人参 • ¥组皂苷对高脂血症大鼠血脂代谢的
影响及其抗氧化作用
张馨木 o曲绍春 o睢大员 3 o于晓风 o吕忠智
k吉林大学 药学院 药理教研室 o吉林 长春 tvssutl
≈摘要  目的 }观察人参 • ¥组皂苷kŠ2• ¥l对实验性高脂血症大鼠血清总胆固醇 !脂蛋白2胆固醇代谢的影响
及其抗氧化作用 ∀方法 }Š2• ¥按 xs otss ouss °ª#®ªp t给大鼠连续灌胃 tu §o测血清总胆固醇 !脂蛋白2胆固醇及过氧
化脂质k°’l含量 o血浆前列环素k°ŠŒul和血栓烷 „uk×÷„ul水平 o血清和肝脏超氧化物歧化酶k≥’⁄l活性及全血黏
度 o并观察肝脏脂肪沉积情况 ∀结果 }Š2• ¥tss ouss °ª#®ªp t能明显降低甘油三脂k׊l o总胆固醇k×≤l o低密度脂蛋
白胆固醇k⁄2¦l o×÷„u o°’含量及全血黏度 o并能明显提高实验性高脂血症大鼠高密度脂蛋白胆固醇k‹⁄2¦l o
#x{st#
第 u|卷第 tt期
ussw年 tt月
中 国 中 药 杂 志
Χηινα ϑουρναλ οφ Χηινεσε Ματερια Μεδιχα
∂²¯1u| oŒ¶¶∏¨ tt
‘²√¨ °¥¨µoussw