An introduction to the immunoinformatics methods for conformational B-cell epitope prediction and its web-based resources-文献传递-植物通论文库

摘要：抗原表位预测是免疫信息学研究的重要方向之一，可以给实验提供重要的线索。B细胞表位或抗原决定簇是抗原中可被B细胞受体或抗体特异性识别并结合的部位。实际上，近90%的B细胞表位是构象性的。即使抗原蛋白质三级结构已知，B细胞表位预测仍然是一大挑战。该文结合实例阐述当今主要的构象性B细胞表位预测方法和算法：机器学习预测、非机器学习的计算预测、基于噬菌体展示数据的识别方法，以及一些也可用于构象性B细胞表位预测的通用蛋白质-蛋白质界面预测方法；介绍最新相关预测软件和Web服务资源，说明未来的研究趋势。
关键词：抗原；抗体；表位；预测；构象性

Abstract:Accurate prediction of epitopes is an important goal of immunoinformatics， which can give important clues to experiments. B-cell epitopes or antigenic determinant is a part of an antigen recognized by either a particular antibody molecule or a particular B-cell receptor of the immune system. Up to 90% of B-cell epitopes are conformational in nature. Even when the tertiary structure of the antigen is available， the accurate prediction of B-cell epitopes remains challenging. First， this review illustrated current prediction methods and algorithms for the conformational B-cell epitopes by describing some examples， including machine-learning approaches，computational prediction methods independent of machine-learning approach， Phage-displayed data based approaches， along with some universal recognizing approaches of protein-protein interface prediction. Next， it presented the latest software packages and web services available online that relate to conformational B-cell epitope prediction， and projected future developments.
Key words: antigen; antibody; epitope; prediction; conformational

全文：生命科学
Chinese Bulletin of Life Sciences
第22卷第9期
2010年9月
Vol. 22, No. 9
Sep., 2010
文章编号：1004-0374(2010)09-0946-06
收稿日期：2010-03-09；修回日期：2010-05-10
通讯作者：E-mail：fang9352@sina.com
构象性B 细胞表位预测的免疫信息学方法及其网络资源
欧阳玉梅
(伊犁师范学院文理系计算机教研室，奎屯 833200)
摘　要：抗原表位预测是免疫信息学研究的重要方向之一，可以给实验提供重要的线索。B 细胞表位
或抗原决定簇是抗原中可被 B 细胞受体或抗体特异性识别并结合的部位。实际上，近 90% 的 B 细胞表
位是构象性的。即使抗原蛋白质三级结构已知，B 细胞表位预测仍然是一大挑战。该文结合实例阐述
当今主要的构象性 B 细胞表位预测方法和算法：机器学习预测、非机器学习的计算预测、基于噬菌体
展示数据的识别方法，以及一些也可用于构象性 B 细胞表位预测的通用蛋白质 - 蛋白质界面预测方法；
介绍最新相关预测软件和 W e b 服务资源，说明未来的研究趋势。
关键词：抗原；抗体；表位；预测；构象性
中图分类号: R392.12; R392-3 文献标识码：A
An introduction to the immunoinformatics methods for conformational B-cell
epitope prediction and its web-based resources
OUYANG Yu-mei
(Department of Liberal Arts & Science, Yili Normal University, Kuitun 833200, China)
Abstract: Accurate prediction of epitopes is an important goal of immunoinformatics, which can give important
clues to experiments. B-cell epitopes or antigenic determinant is a part of an antigen recognized by either a
particular antibody molecule or a particular B-cell receptor of the immune system. Up to 90% of B-cell epitopes
are conformational in nature. Even when the tertiary structure of the antigen is available, the accurate prediction
of B-cell epitopes remains challenging. First, this review illustrated current prediction methods and algorithms
for the conformational B-cell epitopes by describing some examples, including machine-learning approaches,
computational prediction methods independent of machine-learning approach, Phage-displayed data based
approaches, along with some universal recognizing approaches of protein-protein interface prediction. Next, it
presented the latest software packages and web services available online that relate to conformational B-cell
epitope prediction, and projected future developments.
Key words: antigen; antibody; epitope; prediction; conformational
B 细胞表位或抗原决定簇是抗原中可被B 细胞
受体或抗体特异性识别并结合的部位。许多免疫检
测和免疫治疗学应用是基于抗体识别表位的能力。
表位上特定残基及其位置的确定是这些应用的关键
起始步骤。确定 B 细胞表位的实验方法费时费力，
而且并不是总能成功。因此，免疫信息学的重要目
标之一就是利用计算方法预测B 细胞表位。这个问
题的解决，即使是近似解决都将有助于设计实验和
提高研究效率。
B细胞表位可以分为两类：线性(连续)表位和
构象性(不连续)表位。前者是肽链上一段连续的氨
基酸残基序列；后者是一级结构上不完全连续但在
折叠的蛋白质三维结构表面上密切接近的一些氨基
947第9期欧阳玉梅：构象性B 细胞表位预测的免疫信息学方法及其网络资源
酸残基。Greenbaum 等[1]研究表明，在B 细胞表位
中只有很少一部分是线性的，而近 90 % 是构象性
的。线性表位预测可以直接用于疫苗设计和免疫诊
断。构象性表位预测的目标则是设计能够模拟表位
结构和免疫原性的分子，这种分子在抗体产生的过
程中可以替代抗原(作为预防或治疗的疫苗)，或在
医学诊断或实验研究的抗体检测过程中替代抗原。
线性B细胞表位预测已经历了20多年的发展，主要
是使用依赖于序列的方法来构建免疫原性肽段集，
目前已有了多种工具，但预测精度仍有很大的提高
空间；而构象性B 细胞表位在没有蛋白质三维结构
知识的情况下，仅从功能分析很难预测和识别。事
实上，抗原和抗体相互作用是通过空间结构互补性
而非共价结合形成，两者距离越小相互作用力(静
电作用、氢键、疏水基和范德华力)越大，而且结
合时可能互相形变。因此，即使抗原蛋白质的三级
结构已知，表位预测仍然是一大挑战。鉴于过去已
知晶体结构的抗原-抗体复合体数量较少、抗原-抗
体结合机理研究不够清楚以及预测算法设计难度大
等原因，这项研究一直以来进展十分缓慢。最近几
年，随着免疫信息学时代的来临[2]和生物学技术的
发展，大量原始数据的积累为计算预测及预测系统
性能评价提供了基本的素材[3]。考虑抗原蛋白的三
维结构等信息，采用计算预测或计算预测和生物实
验数据结合的免疫信息学方法进行构象性表位分析
和定位已成为目前研究的热点，并呈现出了快速发
展的趋势[4]。
1　免疫信息学预测方法
人们通过观察发现一些蛋白质的氨基酸序列或
结构特征与抗原表位有关。在线性表位预测中，通
常从抗原蛋白质的氨基酸一级结构出发，综合抗原
蛋白质的理化性质、结构特点、统计显著性度量等
指标进行表位预测。目前已发展出氨基酸倾向性标
度(propensity scale)方法、机器学习方法等[5]。氨
基酸倾向性标度方法中具有较好预测效果的有：亲
水性方案、溶剂表面可及性方案、抗原性方案、可
塑性方案、二级结构预测方案和电荷分布方案等。
其基本思想是首先给每一个氨基酸残基赋予一个分
值，然后按一定窗口宽度(通常为7～13个残基)对
序列曲线进行光滑，如果某个曲线峰值所在片段的
平均指标超过某个指定阈值(通常为整个抗原序列的
均值)，则该片段很可能是 B 细胞表位。这些方案
预测准确度一般低于60%。机器学习方法中的人工
神经网络、隐马尔可夫模型、支持向量机、基于
距离度量的K近邻、决策树、贝叶斯分类器等已被
应用于预测线性 B 细胞表位。
刚刚兴起的构象性表位预测通常涉及表面残基
定义、表位残基定义、基准数据集构建、算法设
计与性能评价。目前有机器学习预测、非机器学习
的计算预测、基于噬菌体展示实验数据的识别方
法，以及一些最近发展起来的通用蛋白质- 蛋白质
界面(也称结合位点或接触面)预测方法。它们多数
是基于结构的，有的联合了序列数据，有的结合了
噬菌体展示数据；一些方法使用了训练集(已验证
了的表位数据集)，而有些方法则没有使用。这些
方法一般需要输入抗原的三维结构，对于那些未知
三维结构的抗原可以采用计算机预测技术得到。输
出主要是被预测为表位的各残基及其位置、表位的
残基数目。不同方法的输出形式不尽相同，有的反
映抗原蛋白质表面残基成为蛋白质表位的概率得
分；有的则预测由表面残基组成的表面块(surface
patch)是否为表位，即每个残基是否是表位表面块
的一部分；有的兼有输出前两者的功能；有的还
提供了 3D 结构的可视化图形，实现了表位作图。
而设计出的软件工具，多数既能够预测线性表位也
能够预测构象性表位。
1.1　机器学习预测方法
机器学习方法的主要思想是将预测问题转化为
分类问题。主要有两种学习方式：无监督学习和有
监督学习。无监督学习，如聚类，是数据挖掘的
一种基本手段，其目的是提取数据中隐含的类结
构。由于类不是预先定义的，需根据实际数据的数
学特征按照数据之间的相似性来定义。有监督学习
则使用已知数据源训练分类器区别正、负样本，再
用构造好的分类器对待识别的样本进行分类决策。
已有多种有监督学习用于预测线性B细胞表位，而
把它们用于预测构象性B细胞表位是最近才刚刚出
现的。建立这样的预测系统通常包括基本步骤：
(1)数据集的构建；(2)表位特征提取；(3)分类器的
设计与性能评价。下面介绍的方法前两个采用的是
无监督学习(聚类)，第三个采用的是有监督学习。
CEP 是一个利用抗原蛋白质的三维结构预测构
象性表位和线性表位的在线服务系统[6]。该方案没
有使用训练集。首先，系统为输入的抗原结构中的
每一个氨基酸残基计算相对可及表面积(残基在单体
948 生命科学第22卷
中的可及表面积与其总的可及表面积的比值); 确认
抗原表面结构上具有高溶剂可及性的肽段。然后，
按它们之间的空间距离低于一个指定阈值进行聚
类，形成各个块(patch)区域。最后，输出这些块
区域作为候选表位。该系统使用蛋白质数据库
(protein data bank，PDB)中63个抗原/抗体复合物
组成的数据集进行测试。使用接受者操作特性曲线
(ROC)下的面积(area under the ROC curve，AROC)
度量系统性能，算法的 AROC 评分达到0.750。该
系统是第一个以抗原蛋白质的三级结构PDB文件作
为输入，以构象性表位预测为主要目的的网上免费
服务软件，具有开创性的意义，与其后出现的同类
软件相比略显不足的是特征选择太少。
ElliPro是一个基于结构的蛋白质表位预测和可
视化的在线服务工具[7]。如果抗原蛋白质的三维结
构已知，则可输入其在 PDB 数据库中的 ID 或提交
一个具有PDB 格式的自己的PDB 文件。如果其结构
未知，则要求输入其序列，系统将在 PDB 数据库
中使用BLAST 工具搜索这个蛋白质或它的同源物；
如果没有发现匹配的目标，则用 MODE LL ER 程序
预测蛋白质的 3D 结构，然后用 MODELLER 建立的
模板作为一个输入。对于输入的蛋白质结构，系统
实现了三个算法来完成表位预测任务：(1)把蛋白质
的形状近似为一个椭球；(2)计算球面残基的突出索
引(protrusion index，PI); (3)基于它们的PI值聚类
近邻残基。在Ponomarenko等于2007年发布的基准
数据集上系统的AROC评分达到0.732。系统还利用
开源分子可视化工具Jmol实现了3D表位图的输出。
改进该系统的进一步研究也是应考虑更多的特征。
Rubinstein等[8]于2009年首次将朴素贝叶斯分类
器用于构象性B 细胞表位预测。这项研究潜在的假
设是，抗原表面的表位部分和非表位部分可以依据
它们的理化和几何结构特征加以区分。为识别基于
这些大量特征的免疫原区，系统训练了两个朴素贝
叶斯分类器：一个是基于结构的，一个是基于序列
的。对于基于结构的分类器，系统构建了一个表位
已可靠确定的抗原基准数据集，它们来自已知晶体
结构的抗原-抗体复合体集。首先，为已验证的表
位集提取它们的理化和几何结构特征，用这些表位
特征集训练分类器。然后，对于一个待求表位的蛋
白质抗原，输入其表面的三维结构；把该表面按典
型表位尺寸划分成一些搭接的表面块，计算每个表
面块的理化和几何结构特征。最后，使用已训练好
的分类器，基于与先前已知表位的相似性为每个表
面块计算反映其潜在免疫原性的概率得分，再把该
得分赋给表面块的中心残基，作为推断它是否为表
位的依据。在这项设计中，系统利用各种软件工具
提取了28 个几何特征、16 个氨基酸倾向性标度特
征。其中几何特征包括每个氨基酸在表面块与其余
表面中的出现率之比、二级结构元件(α螺旋、β转
角和环)在表面块与其余表面中的出现率之比、在
探针半径为1.4Å情况下表面块到溶剂的平均相对可
及性、在探针半径为9Å 情况下表面块接近抗体互
补决定区(complementarity-determining region, CDR)
的平均可及性等。为了优化性能，系统还对这些特
征进行了筛选。采用交叉验证中的留一验证法，系
统的AROC评分从特征筛选前的0.703达到了筛选后
的0.914。
机器学习方法能够揭示数据集中的复杂非线性
关系，适合数据量大、含有噪声并且缺乏统一理论
的领域。该方法通常联合多个特征(有时还有实验
数据)进行预测，以克服基于较少特征的一些方法
的预测识别率不高的缺陷。系统性能的进一步提高
依赖于基准数据集的不断增长和更具价值特征的发
现。
1.2　非机器学习的计算预测方法
非机器学习的计算预测方法，主要指的是使用
蛋白质抗原结构的几何特征或使用几何特征与理化
特征的联合，通过计算直接实现预测(不使用机器学
习)。这类方法直观明确，不存在机器学习方法中
的所谓“黑箱操作”质疑，受到一些研究人员的
信赖。
DiscoTope是一个基于序列-结构混合方法的构
象性B 细胞表位预测在线服务系统[9]。它是一个基
于训练集且利用了更多表位特征的方案，所用特征
涉及氨基酸倾向性、残基溶剂可及性、空间分布和
分子相互作用接触。当抗原氨基酸残基具有与抗体
原子距离在4Å 之内的原子时，则被定义为表位残
基。训练样本集(DiscoTope数据集)来源于对76个
抗原/抗体复合物的X射线晶体衍射分析得到的非连
续性表位。基于该表位数据集，系统计算出了参与
抗原相互作用的每一个氨基酸残基的统计特征——
对数让步比矩阵(log-odds ratios matrix); 计算出了表
面氨基酸定位和结构突出部分的联合度量(一种溶剂
表面可及性度量)——残基接触数目。残基接触数
目是指距该残基Cα原子10Å之内的抗原中的Cα原子
949第9期欧阳玉梅：构象性B 细胞表位预测的免疫信息学方法及其网络资源
的数目。系统使用了该矩阵和联合度量的得分来预
测构象性表位残基的定位。与单独的基于Parker的
亲水性参数的线性表位预测方法和基于抗原三维结
构推断出的溶剂表面可及性预测方法相比均显示出
其优越性。算法的 AROC 评分达到 0.711。
PEPITO 是一个联合氨基酸倾向性得分和多个
距离上的半球暴露值的构象性表位预测系统[10]。其
中，氨基酸倾向性标度采用Andersen等[9]的描述；
半球暴露值与接触数目的相关性采用了Hamelryck的
描述。系统为目标蛋白质肽链中的每一个残基r计
算出一个表位得分E(r)。E(r)越大，表明残基r越
可能是一个表位残基。E(r)值计算方法：首先，对
于每一个k(k=8，10，…，16Å)，分别计算出下
列三项：残基r 的k 范围内的所有残基的倾向性标
度得分(滑动窗口宽度为9个残基)求和、残基r的k
范围内上半球中的 C α 原子的数目(上半球暴露值，
反映其侧链是指向蛋白质表面还是中心)、残基r的
k 值范围内下半球中的 Cα 原子的数目(下半球暴露
值) 。然后，对这三项进行线性叠加。最后，对
所有k值求得的三项线性叠加再求和，即得E(r)值。
PEPITO 在 DiscoTope 数据集上 AROC 评分达到
0.754。另外，在更新的 Epitome 数据集上检验
PEPITO与 DiscoTope，AROC 评分分别达到了0.683
和 0.660。
1.3　基于噬菌体展示数据的识别方法
噬菌体展示技术(phage display technology)经过
多年的发展和完善，已能够为表位研究提供一个操
作简便、高通量、低成本和可调控的实用性平台。
因为用单克隆抗体从噬菌体肽库中竞争免疫筛选得
到的线性肽序列即模拟肽(mimotope)，在一定条件
下可以引发识别原始抗原的抗体反应，所以这样得
到的模拟肽集，特别是通过比对模拟肽集得到的模
体(motif)集含有一定的表位信息；但是噬菌体形态
发生过程中伴随着氨基酸序列的偏向性，而且筛选
得到的模拟肽在蛋白质抗原上通常不是以线性序列
形式存在的[5]。因此，确定这些肽段模拟的抗原区
域还需要特殊的工具。一般地，这种基于模拟肽分
析的计算方法可采用下列步骤[11]: (1)描述抗原的表面
残基；(2)在抗原三维结构分子表面搜索与模拟肽或
模体最佳匹配的氨基酸序列；(3)基于聚类算法和可
视化技术输出候选表位。因为在代表抗原暴露残基
的表面图上求解所有给定长度的简单路径(即一个由
相邻残基构成的序列)是NP-hard问题，所以精确求
解时面临过高的时间复杂度。为了克服传统方法的
局限，已提出多种启发式算法。
EMT是利用表位模体(epitopic motif)数据库预测
蛋白表位的工具[12]。通过比对从噬菌体肽库中竞争
免疫筛选捕捉到的模拟肽，收集氨基酸表位模体，
构建表位模体表。对于抗原中的氨基酸残基，结合
对其上是否存在这些表位模体的考察和相对表面可
及性的评价，对其抗原性进行预测。
EPIMAP方法是由Mumey等[13]于 2003年和2006
年提出的。在这个方法中，从噬菌体肽库中筛选得
到的每个模拟肽都通过动态规划算法与其父抗原进
行比对。抗原蛋白质每一个残基的比对频率结果图
揭示出与三维空间中自然折叠接近的片段。
MEPS 是一个基于肽段有效模拟的蛋白质构象
性表位识别的在线服务系统[1 4 ]，其具体步骤为：
(1)产生肽表面体。对于给定的一个目标蛋白质的结
构，首先，选择溶剂暴露氨基酸。可设最小溶剂
可及表面的阈值为 4 0 Å2。其次，计算每对暴露氨
基酸的Cβ(对于甘氨酸是Cα)间的距离并存入一个矩
阵。最后，用该矩阵作图：每一个节点代表一个
表面氨基酸；当两节点的距离低于一个最大阈值d
时，它们之间则存在一条边。用图表示邻接表的集
合。(2)为一个目标蛋白质或蛋白质集找到所有的潜
在表位。把肽表面体图处理为能够提取模拟给定蛋
白质表面的所有的可能的肽序列(序列最大长度为
L)。对于每一个邻接表，迭代搜索 5.5Å 距离内的
近邻，直到用户选择的L值。肽序列被交互地检查
并存入一个FASTA 格式的文件中，以便能够直接用
于肽表面体的BLAST 或 FASTA 相似性搜索。(3)搜
索构象性表位。当用户向系统输入一个蛋白质结
构、模拟表位的肽序列和一个最小错配氨基酸数目
后，如果它的确存在，通过搜索将得到相应表位的
定位。也可以搜索固定大小肽序列，得到相应的表
位定位。系统还利用Rasmol可视化工具实现了可视
化表位图的输出。
Pep-3D-Search是基于模拟肽分析的B细胞构象
性表位预测工具[11]。其算法流程如下。首先，输
入一个抗原的三维结构和一个模拟肽集(或一个模
体) ，识别抗原的表面残基并创建一个表面残基
图。其次，对于输入为模拟表位集的情况，通过
使用蚁群优化(ant colony optimization，ACO)算法在
抗原表面图上搜索各模拟肽；计算每一个匹配的路
径的 P 值；从匹配的路径集中选择结果路径；为
结果路径创建一个权重图。最后，使用深度优先
(depth-first search，DFS)算法聚类结果路径得到候
950 生命科学第22卷
选表位。而对于输入为模体的情况，通过使用ACO
算法在抗原表面图上定位模体，得到高分的那些路
径被直接输出为候选表位。
把噬菌体展示技术构建的随机肽库和计算机建
模结合起来进行构象性表位预测，有较坚实的实验
基础，预测更可靠，受到了研究者的广泛青睐。这
些方法的主要局限在于只能预测出确定的单克隆抗
体的亲和表位，算法没有考虑抗原-抗体结合的构
象契合关系和分子相互作用机制，不能进行更广泛
的表位预测[5]。
1.4　一些通用蛋白质-蛋白质界面预测方法
蛋白质-蛋白质界面预测是指对参与蛋白质相
互作用的特定残基及其位置的预测。它们依赖于在
蛋白质复合物界面中发现的残基所具有的特性。近
年来，PDB 经历了快速发展。为了最大化利用存储
在PDB中的高解析度的蛋白质和蛋白质复合物的三
维结构数据，已开发出众多蛋白质-蛋白质界面数
据库。而其中的数据使得比较蛋白质表面的界面和
非界面成为可能。在界面残基特征分析中发现序列
保守性、20 种氨基酸的比例、二级结构、溶剂可
及性、侧链构象熵等是比较突出的特征。但这些涉
及典型蛋白质结构的特征属性对于伴随复合物形成
的局部构象改变不是特别敏感。应该注意，随着抗
体的成熟，一个蛋白质抗原表面的许多部分可以成
为与抗体结合的表位。因此，早期的仅依赖于这些
普通特征的界面预测系统并不能很好地预测蛋白质
抗原表位。
然而，最近出现的一些通用蛋白质-蛋白质界
面预测方法如蛋白质- 蛋白质对接方法、用各种原
理和不同数据集训练的基于结构的方法和把残基序
列保守性映射到表面的方法等却取得了较好地预测
效果。其中，蛋白质- 蛋白质对接是指由诸蛋白质
单体结构配位构成复合体结构的过程，分为刚性对
接和柔性对接两大类。在这个过程中，不论是局部
的还是大规模的构象改变都是极其复杂的。潜在姿
势的巨大搜索空间和排列对接姿势的困难是两个主
要问题。例如，ClusPro(DOT程序)[15,16]在线服务实
现了基于快速傅立叶变换相关方法的刚体蛋白质-蛋
白质对接，PatchDock[17]在线服务实现了基于局部
形状特征匹配的刚体蛋白质- 蛋白质对接。
2　预测软件和Web 服务资源
最新预测软件和 Web 服务资源见表 1。
3　结语
抗原表位预测是免疫信息学研究的重要方向之
一，可以给实验提供重要的线索。构象性B 细胞表
位预测具有广阔的应用前景，但同时也是一个难度
很大的课题。首先，应尽可能多地收集抗原表位数
据，并按标准格式存放在数据库中；其次，开发
用于表位预测的新方法、新软件，为临床和基础生
物医学研究人员提供服务。最近，出现了各种构象
性B细胞表位预测软件工具和相关Internet资源。由
于它们选择的数据集和提取的特征不同和采用的策
略差异较大，呈现出了各自的优势与局限，但总体
上预测的准确性都还不够高。这些系统性能的进一
步提高依赖于基准数据集的增长、更具价值特征的
发现、计算策略的改进以及各种方法间的联合，对
这些方法进行评估与比较亦有助于其发展[1]。采用
生物实验和计算机预测相结合的方法，把分子相互
作用理论、抗原-抗体的构象契合关系以及抗原-抗
体结合机制融合到预测系统中来，提高预测的准确
性和预测方法的普遍性是未来研究的方向[5]。
[参　考　文　献]
[1] Greenbaum JA, Andersen PH, Blythe M, et al. Toward a
consensus on datasets and evaluation metrics for developing
B-cell epitope prediction tools. J Mol Recognit, 2007, 20:
75-82
[2] Korber B, LaBute M, Yusim K. Immunoinformatics comes
of age. PLoS Comput Biol, 2006, 2(6): 484-92
[3] Ponomarenko JV, Bourne PE. Antibody-protein interactions:
benchmark datasets and prediction tools evaluation. BMC
Struct Biol, 2007, 7: 64-82
[4] Yang X, Yu X. An introduction to epitope prediction meth-
ods and software. Rev Med Virol, 2009, 19: 77-96
[5] 黄艳新. 抗原表位预测的免疫信息学方法研究进展. 中
国免疫学杂志, 2008, 24(9): 857-61
[6] Kulkarni-Kale U, Bhosle S, Kolaskar AS. CEP: a conforma-
tional epitope prediction server. Nucleic Acids Res, 2005, 33:
W168-71
[7] Ponomarenko J, Bui H, Li W, et al. ElliPro: a new structure-
based tool for the prediction of antibody epitopes. BMC
Bioinformatics, 2008, 9: 514-21
[8] Rubinstein ND, Mayrose I, Pupko T. A machine-learning
approach for predicting B-cell epitopes. Mol Immunol, 2009,
46: 840-7
[9] Andersen PH, Nielsen M, Lund O. Prediction of residues in
discontinuous B-cell epitopes using protein 3D structures.
Protein Sci, 2006, 15: 2558-67
[10] Sweredoski MJ, Baldi P. PEPITO: improved discontinuous
B-cell epitope prediction using multiple distance thresholds
and half sphere exposure. Bioinformatics, 2008, 4(12): 1459-
60
951第9期欧阳玉梅：构象性B 细胞表位预测的免疫信息学方法及其网络资源
[11] Huang YX, Bao YL, Guo SY, et al. Pep-3D-Search: a method
for B-cell epitope prediction based on mimotope analysis.
BMC Bioinformatics, 2008, 9: 538-54
[12] Batori V, Friis EP, Nielsen H, et al. An in silico method using
an epitope motif database for predicting the location of an-
tigenic determinants on proteins in a structural context. J
Mol Recognit, 2006, 9: 21-9
[13] Mumey BM, Bailey BW, Kirkpatrick B, et al. A new method
for mapping discontinuous antibody epitopes to reveal struc-
tural features of proteins. J Comput Biol, 2003, 10: 555-67
[14] Castrignanò T, De Meo PD, Carrabino D, et al. The MEPS
server for identifying protein conformational epitopes. BMC
Bioinformatics, 2007, 8(Suppl 1): S6
[15] Mandell JG, Roberts VA, Pique ME, et al. Protein docking
using continuum electrostatics and geometric fit. Protein Eng,
2001, 14(2): 105-13
[16] Comeau SR, Gatchell DW, Vajda S, et al. ClusPro: an
automated and discrimination method for the prediction of
protein complexes. Bioinformatics, 2004, 20(1): 45-50
[17] Schneidman-Duhovny D, Inbar Y, Polak V, et al. Taking
geometry to its edge: fast unbound rigid (and hingebent)
docking. Proteins, 2003, 52(1):107-12
[18] Mayrose I, Shlomi T, Rubinstein ND, et al. Epitope mapping
using combinatorial phage-display libraries : a graph-based
algorithm. Nucleic Acids Res, 2007, 35(1): 69-78
[19] Zhang Q, Wang P, Kim Y, et al. Immune epitope database
analysis resource (IEDB-AR). Nucleic Acids Res, 2008, 36:
W513-8
[20] Bradford JR, Westhead DR. Improved prediction of protein-
protein binding sites using a support vector machines
approach. Bioinformatics, 2005, 21: 1487-94
[21] Kufareva I, Budagyan L, Raush E, et al. PIER: protein
interface recognition for structural proteomics. Proteins,
2007, 67(2): 400-17
[22] Neuvirth H, Raz R, Schreiber G. ProMate: a structure based
prediction program to identify the location of protein-pro-
tein binding sites. J Mol Biol, 2004, 338(1): 181-99
[23] Landau M, Mayrose I, Rosenberg Y, et al. ConSurf 2005: the
projection of evolutionary conservation scores of residues on
protein structures. Nucleic Acids Res, 2005, 33: W299-302
表1 构象性B细胞表位预测软件和Web服务资源
名称(年份) 描述网址
CEP(2005)[6] 基于残基溶剂可及性和空间分布的构象性表位预测工具 http://bioinfo.ernet.in/cep.htm
ElliPro(2008)[7] 基于几何特性的蛋白质表位预测和可视化工具 http://tools.immuneepitope.org/tools/
　ElliPro
EpitopePrediction (2009)[8] 基于机器学习(朴素贝叶斯分类器)的B-cell表位预测 http://www.tau.ac.il/~talp/Epitope
　Prediction
DiscoTope(2006)[9] 基于氨基酸统计、残基溶剂可及性和空间分布的构象性 http://www.cbs.dtu.dk/services/Disco
　表位预测　Tope
PEPITO(2008)[10] 联合氨基酸倾向性标度和多个距离上的半球暴露值的 http://pepito.proteomics.ics.uci.edu/
　构象性表位预测
EMT(2006)[11] 基于噬菌体展示数据的连续/非连续表位预测工具 elro@novozymes.com
EPIMAP(2006)[12] 基于噬菌体展示数据的非连续表位识别工具 mumey@cs.montana.edu
MEPS(2007)[13] 基于肽段有效模拟的蛋白质构象性表位识别的 http://www.caspur.it/meps
　在线服务系统
Pep-3D-Search (2008)[14] 基于模拟肽分析的B 细胞构象性表位预测系统 http://kyc.nenu.edu.cn/Pep3DSearch
PepSurf(2007)[18] 一个基于图的使用组合噬菌体展示肽库的表位作图算法 http://pepitope.tau.ac.il/sources.
html
IEDB-AR(2008)[19] 免疫抗原表位数据库分析资源 http://tools.immuneepitope.org
　(含7个B细胞表位预测工具)
ClusPro(DOT)(2004)[16] 基于快速傅立叶变换相关方法的刚体蛋白质- 蛋白质对接 http://structure.bu.edu
PatchDock(2003)[17] 基于局部形状特征匹配的刚体蛋白质- 蛋白质对接 http://bioinfo3d.cs.tau.ac.il/sources.
html
PPI-PRED(2005)[20] 基于有效结构和序列界面特性的蛋白质- 蛋白质结合 http://bioinformatics.leeds.ac.uk/ppi-
　界面预测　pred
PIER(2007)[21] 基于蛋白质表面(原子团水平)局部统计特性的蛋白质 http://abagyan.ucsd.edu/PIER/
　结合界面预测
ProMate(2004)[22] 基于有效结构和序列界面特性的蛋白质- 蛋白质 http://biointo.weizmann.ac.il/
　结合界面预测　promate/
ConSurf(2005)[23] 映射系统发生信息到已知三维结构的蛋白质表面的 http://consurf.tau.ac.il
　界面预测

An introduction to the immunoinformatics methods for conformational B-cell epitope prediction and its web-based resources

构象性B细胞表位预测的免疫信息学方法及其网络资源

相关文献