全 文 :#网络资源#
±·¨µ±¨ ·上的小分子化合物公共数源的利用
郑 颖 3 o邓 勇
k中国科学院 成都文献情报中心 o四川 成都 ytsswtl
≈收稿日期 ussx2s|2sx
≈通讯作者 3 郑颖 oר¯ }ksu{l{xuvxszx o∞2°¤¬¯}½«¨ ±ª¼ ¦¯¤¶q
¤¦q¦±
随着计算机网络技术的发展和普及 o±·¨µ±¨·
已经成为了当今世界资源最为丰富的信息库和文
献资料库 o是科研人员获取科研信息最方便 !最快
速的渠道 ∀作者对新近出现在网络上的几个优秀
的小分子化合物公共数据库资源进行了介绍 o以
期能使更多的中药和生物药研究开发人员认识 !
利用它们 o并得到研发新药的灵感和研发过程中
所需的资料 ∀
1 °∏¥≤«¨ °2有机小分子化合物公共数据库≈t
°∏¥≤«¨ °的 为 }«·³}rr³∏¥¦«¨ ° q±¦¥¬q±¯ ° q
±¬«qª²√r
美国 / 分子文库计划0 k׫¨ ²¯ ¦¨∏¯¤µ¬¥µ¤µ¬¨¶
±¬·¬¤·¬√¨ ol是在基因时代促进科学发展的一个大
胆计划 o它将为研究探索提供新的路径 o从而加速科
学研究以及将其成果转化为公共卫生服务的进程 ∀
这一计划是美国国立卫生研究院kl医学研究指
南的一个主体部分 o旨在促进公共部门对小分子数
据库的使用 o开发小分子技术 o以便更为深入和广泛
地理解与健康和疾病相关的基因 !细胞及有机体的
功能 ∀公共化合物数据库k°∏¥≤«¨ °l是 的重要
组成部分 o°∏¥≤«¨ °是一个免费网站 o于 ussw年秋
季启动 ∀
到目前为止 o°∏¥≤«¨ °拥有 yx万个化合物的结
构和生物学阵列等信息 o并与 免费的公共生物
医学文献数据库k°∏¥ §¨l连接 ∀ °∏¥≤«¨ °的发展目
标是涵盖 的数据 o筛选几千种分子的生物活
性 ∀ 希望基础科学的研究人员能够使用这一数
据库来鉴别他们所使用的化合物 o以探索基因和细
胞的工作机制 ∀°∏¥≤«¨ °是一个加速美国多数卫生
问题新治疗方法发展的重要新工具 ∀它向生物医学
研究者们提供范围广泛的化学物质的生物活性信
息 ∀
°∏¥≤«¨ °在生物技术信息国家中心 k¤·¬²±¤¯
≤ ±¨·¨µ²©
¬²·¨¦«±²¯²ª¼ ±©²µ°¤·¬²±o≤
l的 ∞±·µ¨½信
息检索系统中有 v个链接的数据库 ∀这些数据库子
集链接是 }物质数据库k°∏¥≤«¨ ° ¶∏¥¶·¤±¦¨l o化合物
数据库k°∏¥≤«¨ ° ¦²°³²∏±§l和生物检测数据库k°∏¥2
≤«¨ °
¬²¤¶¶¤¼l ∀ °∏¥≤«¨ °也提供快速化学结构相
似性搜索工具2结构检索k≥·µ∏¦·∏µ¨ ≥¨ ¤µ¦«l ∀
物质数据库的内容包括了化学结构 !异名 !登记
号 !描述 !相关 !与 °∏¥ §¨的交叉数据链接 !蛋
白质三维结构和生物筛选结果等 ∀其为寄存化学物
质记录k§¨³²¶¬·¨§¦«¨ °¬¦¤¯ ¶∏¥¶·¤±¦¨ µ¨¦²µ§¶l的检索途
径 o提供与生物学性质和信息寄存者网址的链接 ∀
物质数据库现有记录已经超过 {x万条记录 ∀
化合物数据库收载了 yx万个化合物的独特结
构 ∀该数据库和物质数据库的检索方法相同 o都可
用名称 !异名 !关键词以及化学性质k包括分子质量 !
氢键供氢体数等l多种检索途径查询化合物 o并提供
与每个化合物的生物学性质信息的链接 ∀
生物检测数据库 }用从生物检测描述中得来的
术语来检索生物检测记录 o例如 / ¦¤±¦¨µ¦¨¯¯ ¬¯±¨ 0 ∀
它提供与活性化合物和生物检测结果的链接 ∀
结构检索 }用化学结构作为查询式来搜索 °∏¥2
≤«¨ °的化合物数据 ∀可按 ≥∞≥ o©¬¯¨ ¶或其
他格式来绘制和说明化合物的结构 ∀
数据库提供从 °∏¥≤«¨ °的化学结构记录到其他
∞±·µ¨½数据的链接 ∀这包括了到 °∏¥ §¨k美国国家
医学图书馆服务l的科学文献和 ≤
的蛋白质三
维结构资源的链接 ~到 °∏¥≤«¨ °生物检测数据库的
链接可显示生物筛选的结果 ~到信息寄存者网址的
链接可为查询者提供进一步的相关信息 ∀也可用
°∏¥≤«¨ °的 ƒ×°站点来下载数据 ∀
数据库的检索界面如下所示 ∀
#ssvt#
第 vt卷第 tx期
ussy年 {月
中 国 中 药 杂 志
Χηινα ϑουρναλ οφ Χηινεσε Ματερια Μεδιχα
∂²¯1vt o¶¶∏¨ tx
∏ª∏¶·oussy
可在左侧下菜单中选择检索数据库子集 o在右
侧框中输入检索词 ∀例如 o选择物质数据库子集 o输
入茴香醚的化学名 °¨ ·«²¬¼¥¨ ±½¨ ±¨ o或其 °≤ 名
¤±¬¶²¯¨o都可搜索得到该化合物的名称 !分子质量 !
分子式 !结构式以及其他相关数据库的链接等 ∀
最近 o°∏¥≤«¨ °数据库又引入了发现伙伴国际
公司k⁄¬¶¦²√¨ µ¼ °¤µ·±¨ µ¶±·¨µ±¤·¬²±¤¯ o±¦1l提供的 tss
万个小分子化合物的数据k⁄°≥ l o生物分子相互
作用数据网k
¬°²¯ ¦¨∏¯¤µ¬±·¨µ¤¦·¬²± ±¨·º²µ® §¤·¤¥¤¶¨ o
⁄l !分布式结构检索毒性公共数据网k⁄¬¶·µ¬¥∏·¨§
≥·µ∏¦·∏µ¨2≥¨ ¤µ¦«¤¥¯¨ ײ¬¬¦¬·¼ °∏¥¯¬¦ ⁄¤·¤¥¤¶¨ ¨·º²µ®o
⁄≥≥ײ¬l及天然化学生物学杂志k¤·∏µ¨ ≤«¨ °¬¦¤¯
¬2
²¯²ª¼l的生物学数据 ∀这使得该数据库进一步壮大 o
数据更为丰富 ∀
2 ≤«¨ °
¤±®2小分子生物活性数据库≈u
≤«¨ °
¤±®的 为 }«·³}rr¦«¨ °¥¤±®q¥µ²¤§q
«¤µ√¤µ§q¨§∏r
≤«¨ °
¤±®是一个可免费收集小分子相关数据和
研究它们生物性质 o特别是它们生物作用的数据库 ∀
建设该数据库的目的是为了给想查找用于扰动生物学
系统的小分子的生物学家们和正在设计新化合物库的
化学家们 o以及生物信息分析家们提供信息 ∀这个数
据库的建设仍处于初期阶段 ∀该数据库由美国国立癌
症研究所的化学遗传学 ≤«¨ °
¤±®计划支持 o由哈佛大
学医学院化学和细胞生物学研究所的信息小组研制开
发 o它也是主要研究所生物化学计划k
µ²¤§±¶·¬·∏·¨
≤«¨ °¬¦¤¯
¬²¯²ª¼ °µ²ªµ¤°o
≤
l的重要组成部分 o内容包
括了合成化学 !分析化学 !化学工程 !高通量筛选 !高通
量数据分析的多个方面∀该数据库的建立是化学 !生
物学 !医学 !计算机 !化学工程学 !药理学等多学科领域
的专家与学者们相互合作的成果 ∀
该数据库号称将收录所有化学结构和生物活性
数据 ∀现已收录了 tts多万个化合物的结构信息 o
其中包括 tx万个药品商业数据和超过 zs万条其他
药物样化合物 ∀该数据库有 w个检索入口 ∀
211 小分子生物活性资料库 y vss多个已知生物
活性化合物的化学结构和生物学活性数据 ∀它是
≤«¨ °
¤±®结构数据库中的化合物的子集 ∀可通过
结构及活性 !下层结构和相似结构 v个途径进行检
索 o还可通过分类来限制缩小查询的范围 ∀
212 生物检测数据 包含可用于收集 !分析和下载
的来自于高通量化学筛选的公开检测数据 ∀可通过
化合物名称及筛选测定方法两条途径进行查询检
索 ∀其检索界面如下所示 ∀
#tsvt#
第 vt卷第 tx期
ussy年 {月
中 国 中 药 杂 志
Χηινα ϑουρναλ οφ Χηινεσε Ματερια Μεδιχα
∂²¯1vt o¶¶∏¨ tx
∏ª∏¶·oussy
可以就化合物的筛选者 !实验室及研究机构名
来检索 o也可一次性显示所有的筛选数据供查询 ∀
213 数据下载 收集了许多可下载的化合物结构
214 资源 这一检索入口提供了相关的小分子 !化
学信息学和高通量筛选的外部资源的链接 o这些资
源分为高通量筛选资源和多样性导向的有机合成资
源 !计算机分析资源 !小分子数据库资源等 w个大
类 ∀
≤«¨ °
¤±®库现仍在建设中 o它正在快速地追加
数据资料 o而且还在不断开发新的工具以便于使用
者检索查询 ∀
3 ≥× ≤«¨ °¬¶·µ¼ • ¥¨
²²®2美国国家标准与技术局
化学数据库≈v
≥× ≤«¨ °¬¶·µ¼ • ¥¨
²²®的 为 }«·³}rrº¨ ¥2
¥²²®q±¬¶·qª²√r¦«¨ °¬¶·µ¼r
≥×k׫¨ ¤·¬²±¤¯ ±¶·¬·∏·¨ ²©≥·¤±§¤µ§¶¤±§× ¦¨«2
±²¯²ª¼l≤«¨ °¬¶·µ¼ º ¥¨
²²®¶即美国国家标准与技术
局化学数据库 o是提供各种化合物化学和物理性质
的免费查询数据库 ∀该网站提供由美国国家标准和
技术研究所k≥×l编辑的热化学 !热物理学 !离子能
量学数据 ∀
≥×化学数据库提供直接查找化学种类的检
索方式 o也可由基于相关资料的非直接查找方式检
索 ∀该网站提供了相当多检索途径 o用户可以十分
方便地查找需要的资料 ∀用户可运用普通检索项下
输入公式 !名称 !≤≥登记号 !反应 !作者 !结构等方
式进行检索 o也可根据被检索对象的物理性质检索 o
即其离子能量性质 !振动和电子能 !分子质量 !酸度
等各种性质来进行查找 ∀≥×提供的所有资料都会
标明化合物的名称 !分子质量 !≤≥登记号 !结构图 !
该化合物的异名别称 o与其他相关资料的链接 o以及
单位之间的转换 ∀除此之外 o该数据库提供的数据
还包括 }气相热化学数据 !凝聚相热化学数据 !相转
化数据 !反应热化学数据 !气相离子能量数据 !气相
红外谱数据 !质谱数据 !可见紫外谱数据 !振动电子
谱数据 !二原子分子常数 !亨利定律数据 !气相色谱
保留值数据 !流体系统的热物理性质等 o在页面末尾
还会列明这些数据相关的参考资料来源 o可供查询
人进一步查找相关的研究信息 ∀库中的数据多以表
格的形式呈现 ∀数据库还为查询人提供了到 ≥×
的其他数据库的链接 }如到物理学图书馆网站的微
波谱数据库的链接 !物理学网站的电子撞击电离截
面库的链接 !≥ ⁄网站的计算机化学比较和基准数
据库的链接 !动力学网站的气相动力学数据库的链
接等 ∀
≥× ≤«¨ °¬¶·µ¼ • ¥¨
²²®按 ≤≥ 登记号检索非
常便捷 o其检索界面如下所示 ∀
4 ° ∞ ×2天然产物数据库≈w ox
° ∞ × 的 为 }± ∞∏µ²³¨ }«·³}rr
¶·±¨ ¤¶¼q©¬½2®¤µ¯¶µ∏«¨ q§¨
± ¤³¤±}«·³}rr¶·±¨ ¤¶¼2¤³¤±q¦¤¶q²µª
± ²µ·« °¨ µ¬¦¤ ¤±§ ¨¯¶¨º«¨µ¨ }«·³}rr¶·±¨ ¤¶¼q
¦¤¶q²µª
¤·∏µ¤¯ °µ²§∏¦·¶¯ µ¨·k° ∞ × o天然产物数
据库l由芝加哥伊利诺大学药学院的药学合作研究
计划k≤²¯ ¤¯¥²µ¤·¬√¨ ¶¨¨¤µ¦«¬± ·«¨ °«¤µ°¤¦¨∏·¬¦¤¯ ≥¦¬2
±¨¦¨¶l开发 o它是属于 ≥×网上科学技术信息服务
系统中的一部分 ∀它是世界最大的植物 !微生物和
#usvt#
第 vt卷第 tx期
ussy年 {月
中 国 中 药 杂 志
Χηινα ϑουρναλ οφ Χηινεσε Ματερια Μεδιχα
∂²¯1vt o¶¶∏¨ tx
∏ª∏¶·oussy
动物k主要是海洋动物l提取物的民族医学 !传统应
用 !化学和药理学文献关系数据库 ∀另外 o
° ∞ ×还存有相当多的来自于天然资源的已
知结构次生代谢产物的化学和药理学k包括人类研
究l数据 ∀
° ∞ ×现在拥有来源于从 tyxs年到现在
的超过 tx万篇科学研究论文的精华信息 ∀其中大
约 {s h的信息是从 t|zx年到现在的文献的系统调
查得到的 ∀余下的记录是从上溯至 tyxs年的回顾
索引中挑选出来的 ∀这些文章共涉及 tx1t万个纯
化学物种 ox1u万个植物物种 !海洋物种 !微生物物
种和动物物种 o和 txs万条将上述的文献与生物活
性联系起来的记录 ∀
° ∞ ×数据库以每月大约 yss篇文章的
速率增长 o这些文章从收载天然产物文献的超过
zss种的各类杂志中得到 ∀其资料的检索比摘要服
务k¤¥¶·µ¤¦·¬±ª¶¨µ√¬¦¨¶l或引用列表k¦¬·¤·¬²± ¬¯¶·¬±ª¶l更
加复杂精密 ∀可获取的数据包括 }植物物种 !海洋物
种 !动物物种或微生物物种的所有民族医药 !药理学
和植物化学 v个部分的标准描述信息 ∀该数据库是
为药物发现和开发过程特别设计的 ∀ ° ∞ ×
搜索得到的数据能够通过按有机体具有的特别生物
#vsvt#
第 vt卷第 tx期
ussy年 {月
中 国 中 药 杂 志
Χηινα ϑουρναλ οφ Χηινεσε Ματερια Μεδιχα
∂²¯1vt o¶¶∏¨ tx
∏ª∏¶·oussy
活性的可能性排序 o达到增强查询者在这一领域的
研究能力的目的 o帮助查询人优选出研究对象和目
标 ∀
° ∞ × 有欧洲 k¬± ∞∏µ²³¨ l !日本 k¬±
¤³¤±l !北美及其他地方k¬± ²µ·« °¨ µ¬¦¤ ¤±§ ¨¯¶¨2
º«¨µ¨lv个网站入口 o分别提供英语 !日语 !德语 !法
语和西班牙语的多种查询介面 ∀其资料来源包括了
文摘 !书籍 !政府报告 !期刊 !时事通讯和专利等几大
类 ∀其检索和收录方式与 ≥×的著名数据库化学
文摘 k ≤l相似 ∀ ° ∞ × 通过在线帮助 !
≥×∏¬§¨ 及 ≤≥的分类号 v种方式辅助检索 ∀与
≤相同 o其所执行的也是付费服务 ∀
除 ° ∞ × 数据库外 o≥×还拥有 °
k°«¤µ°¤³µ²¨¦·¶o药品项目l数据库 o它包含了从 t|{s
年以来世界主要市场销售药品的药物行销 ! i⁄和
注册信息 ∀主要涉及新化合物药品 o但也有生物技
术药品和新的配方 ∀那些已经被废止和没有继续开
发的药品也被收录在数据库中 ∀ ° ∞ × 库和
° 库的查询结果相结合就可以得到可供药物研
究和开发人员参考的具有生物活性化合物或药品的
较全面的信息 ∀
以上的几个数据库系统为生物医药学研究者们
提供了大量详实的数据和便利的检索途径 ∀总体来
说 o这几个数据库的内容难免有相互重复之处 o但都
各有特色 o其资料描述侧重点各不相同 ∀ °∏¥≤«¨ °
侧重于化合物结构和化学性质方面 o而 ≤«¨ °
¤±®则
是化合物生物活性的大集合 o≥× ≤«¨ °¬¶·µ¼ • ¥¨2
²²®则更重视化合物的物理性质描述 o° ∞ ×
和 ° 内容较为全面 o提供的付费服务也是更加
周到和专业的 ∀ °∏¥≤«¨ ° o≤«¨ °
¤±®和 ≥× ≤«¨ °2
¬¶·µ¼ • ¥¨
²²®都是免费资源 o而且正在以极快的速
度更新扩充中 o可以满足生物医药研究开发者们及
时得到最新信息的要求 ∀但 °∏¥≤«¨ °的免费服务方
式还是引起了世界最大的收费化合物数据库美国化
学文摘服务k≤≥l的所有者 ≤≥k美国化学学会l的
不满 o他们声称 °∏¥≤«¨ °已经超越了一个化学调查
数据库的界线 o认为该数据库实际上是 ≤≥的一个
小型版本 o要求美国政府加以关闭 ∀但不论 °∏¥2
≤«¨ °这一类的免费数据库怎样发展 o可以相信网络
今后还会提供更多更好的数据库资源 ∀
除了这些数据库之外 o研究人员所熟悉的 ≤ o
≤«¨ ° ∂¬¯¯¤ª¨ !
¨ ¬¯¶·¨¬±r≤µ²¶¶©¬µ¨ 和 ≤«¨ °¬¶·µ¼ ≥¨ µ√¨ µ等
都是很好的专业化合物数据库 ∀另外 o一些期刊 !文
献搜索引擎 !专利局等也提供其自身收集得到的化
合物数据资源 ∀因特网上还有大量各种不同主题的
数据库系统 o如危险化学药品数据库 k ¤½¤µ§²∏¶
≤«¨ °¬¦¤¯ ⁄¤·¤¥¤¶¨l !物理化学手稿数据库k≤«¨ °¬¦¤¯
°«¼¶¬¦¶°µ¨³µ¬±·⁄¤·¤¥¤¶¨l !核酸数据库k∏¦¯ ¬¨¦¦¬§
⁄¤·¤¥¤¶¨l !有机化学文献数据库k≤«¨ °®¨·⁄¤·¤¥¤¶¨l !
化学新闻与情报 k ≤«¨ °¬¦¤¯ ¨º¶ i ±·¨¯ ¬¯ª¨ ±¦¨
k≤l !化学设备k≤«¨ °¬¦¤¯ ∞´ ∏¬³°¨ ±·l !欧洲光谱学
k≥³¨¦·µ²¶¦²³¼ ∞∏µ²³¨ l等 o可为研究者们提供不同研
究方向的信息 ∀这些主题数据库除了可以通过在公
共搜索引擎上用主题词查询外 o还可通过各类专业
信息门户网站进入 ∀
±·¨±¨ ·网是一个迅速发展 !庞大的信息资源宝
库≈y ∀为了全人类的健康和社会的进步 o希望科研
工作者们能更好地利用这些网上数据库资源 ∀
≈参考文献
≈t °∏¥≤«¨ °主页 1«·³}rr³∏¥¦«¨ °1±¦¥¬1±¯ °1±¬«1ª²√r1
≈u • ¥¨¥²²®主页 1«·³}rrº ¥¨¥²²®1±¬¶·1ª²√r¦«¨ °¬¶·µ¼r1
≈v ≤«¨ °
¤±®主页 1«·³}rr¦«¨ °¥¤±®1¥µ²¤§1«¤µ√¤µ§1 §¨∏r1
≈w ≥ר¤¶¼公司主页 1«·³}rr¶·±¨ ¤¶¼1¦¤¶1²µªr1
≈x ¤°∞ × 介绍 q«·³}rrººº q¦¤¶q²µªr∞r⁄
≥≥r±¤³µ¤¯ µ¨·¶¶q
«·°¯ 1
≈y 徐 伟 o沙 玫 o余宇燕 o等 1±·¨µ±¨ ·网上中药信息资源的利
用 q中国中药杂志 oussu ouzkvl }uv{1
≈责任编辑 李 禾
本刊投稿须知
本刊目前一律不收网上投稿 o请作者务必以邮寄方式投稿 ∀
来稿应为打印稿 o一式两份 ~投稿时不必附软盘 ~实验性文章应附单位介绍信 ∀
投稿同时请从邮局汇寄处理费kxs元r篇l o切勿在稿件中夹带现金 ~汇款时请注明文章第一作者姓名及稿件题目 ∀本刊
将于收到稿件后的 t个月之内给予回执及发票 ∀
#wsvt#
第 vt卷第 tx期
ussy年 {月
中 国 中 药 杂 志
Χηινα ϑουρναλ οφ Χηινεσε Ματερια Μεδιχα
∂²¯1vt o¶¶∏¨ tx
∏ª∏¶·oussy