蛋白质-蛋白质结合热点是界面中对结合自由能有着显著贡献的一小簇残基。捕捉和揭示这类热点残基可以加深对蛋白质间相互作用机制的理解,为蛋白质工程和药物设计提供指导。但实验技术费时费力且代价昂贵。计算工具可用于辅助和补充实验上的尝试。该文较详细、系统地介绍了蛋白质界面热点的特性、计算预测的策略与技术,并应用实例进一步说明这些方法学的特征;还介绍了界面热点的数据库和一些主要的在线预测工具,旨在为设计、挑选和应用这类工具解决特定问题的研究人员提供指南。
关键词:蛋白质-蛋白质相互作用;蛋白质界面;热点预测;数据库;服务器
全 文 :第24卷 第1期
2012年1月
生命科学
Chinese Bulletin of Life Sciences
Vol. 24, No. 1
Jan., 2012
文章编号:1004-0374(2012)01-0106-06
蛋白质-蛋白质界面热点残基预测及其在线工具
欧阳玉梅1,方若森2*
(1 伊犁师范学院文理系计算机教研室,奎屯 833200;2 伊犁师范学院教务处,奎屯 833200)
摘 要:蛋白质 -蛋白质结合热点是界面中对结合自由能有着显著贡献的一小簇残基。捕捉和揭示这类热
点残基可以加深对蛋白质间相互作用机制的理解,为蛋白质工程和药物设计提供指导。但实验技术费时费
力且代价昂贵。计算工具可用于辅助和补充实验上的尝试。该文较详细、系统地介绍了蛋白质界面热点的
特性、计算预测的策略与技术,并应用实例进一步说明这些方法学的特征;还介绍了界面热点的数据库和
一些主要的在线预测工具,旨在为设计、挑选和应用这类工具解决特定问题的研究人员提供指南。
关键词:蛋白质 -蛋白质相互作用;蛋白质界面;热点预测;数据库;服务器
中图分类号:TP39;Q78;Q51 文献标志码:A
Predictions of hot spot residues in protein-protein interfaces
and its web-based tools
OU-YANG Yu-Mei1, FANG Ruo-Sen2*
(1 Department of Liberal Arts & Science, Yili Normal University, Kuitun 833200, China; 2 Academic Administration,Yili
Normal University, Kuitun 833200, China)
Abstract: A protein binding hot spot is a cluster of residues in the interface that are energetically important for the
binding of the protein with its interaction partner. The catch and identification of hot spots in protein interfaces can
deepen our understanding of protein-protein interaction, and give useful information to protein engineering and drug
design. However, experimental techniques are lengthy, labor intensive and costly. Computational tools can be used
to assist and complement experimental efforts. By the numbers, this review summarizes the characteristics of hot
spots in protein interfaces, computational prediction strategy and technique, and explains the methodology features
by applications example ulteriorly. At one time, it also introduces the databases of hot spots in protein interfaces and
some primary web-based prediction tools to provide guidance for the researchers who need to design, select and
apply these tools to solve relative problems.
Key words: protein-protein interactions; protein interfaces; hot spot prediction; databases; web servers
收稿日期:2011-07-13; 修回日期:2011-08-11
基金项目:伊犁师范学院教改项目(JG2011057)
*通信作者:E-mail: fang9352@sina.com
蛋白质 -蛋白质相互作用在生命过程中扮演着
极为重要的角色。Thorn 和 Bogan[1]实验发现,蛋
白质相互作用主要依赖于界面上的少数几个关键残
基——“热点”(hot spots)。热点对蛋白质间的结合
自由能 (∆G)有着显著的贡献,而且如果对其进行
丙胺酸突变会中止相互作用。显然,捕捉和揭示这
类热点残基对深入了解蛋白质间相互作用的机制具
有重要的生物学意义。由于探测热点的实验技术费
时费力且不能大规模应用,时至今日,人们也只在
少量的蛋白质界面上做了详尽的实验分析。这导致
热点残基的实验数据仍然十分稀少。随着全基因组
测序和蛋白质结构解析时代的来临,出现了快速且
自动地确定热点残基的计算预测方法。最近,在该
领域专家和计算机技术专家的共同努力下,已有了
几个热点残基数据库和众多在线预测工具,可以用
欧阳玉梅,等:蛋白质-蛋白质界面热点残基预测及其在线工具第1期 107
来帮助和指导实验上的尝试。
1 蛋白质界面及其特性
1.1 相互作用界面
蛋白质 -蛋白质界面 (也称结合位点或接触面 )
是两个蛋白质链发生相互作用、形成接触的区域。
蛋白质分子间的相互作用依赖于表面互补性 [2],尽
管这种互补表面有些是预先存在的,有些是相互作
用发生时才形成的。表面互补性包括空间结构互补
性和理化性质互补性。前者是指形状匹配;后者是
指将复合物聚集在一起的弱键:氢键供体对受体、
非极性基团对其他非极性基团、正电荷对负电荷。
两种互补性也是相互依存的:由于 ∆G是累计的,
如果有大量的弱相互作用,紧密结合就是可能的;
如果接触的表面紧密契合的话,弱相互作用的数目
和强度就可以达到最大化。相互作用蛋白质对的稳
定性和特异性主要涉及氢键、静电相互作用、范德
华力、盐桥、疏水效应的存在。分子柔性和环境条
件进一步支配了物理结合。结合与折叠具有相似的
过程已是被广泛接受的概念,与此相一致,高度组
装的折叠与高度组装的结合位点间的结构比较说明
界面区域通常与球蛋白的核相似。蛋白质 -蛋白质
结合是各种热力学相互作用的结果,可以在热力学
框架下计算 ∆G[3]。
1.2 界面中的热点
蛋白质界面中的残基对能量的贡献不是均匀
分布的。目前,一种强有力的实验鉴定 [1]蛋白质
界面上的关键相互作用的方法是丙氨酸扫描突变
(alanine scanning mutagenesis)。它将蛋白质界面残
基系统性地用丙氨酸替换,然后测量在替换前后,
也就是野生型和突变型的蛋白质复合物之间的结合
自由能的变化,即 ∆∆G = ∆GMUT-∆GW(其中 ∆GMUT
与 ∆GW分别是突变型和野生型复合物的结合自由
能 )。利用这种方法,人们发现蛋白质相互作用主
要依赖于界面上的少数几个关键残基——“热点”。
热点通常被定义为丙氨酸突变后 ∆∆G大于等于 2
kcal/mol 的那些界面残基。它们在蛋白质界面的中
心部位紧密地聚集在一起 (多数被深度包埋 ),对
于保持蛋白质复合物的稳定性至关重要。
自 1998年至今,人们通过对实验收集的热点数
据 [1,4]的各种研究,逐渐发现了热点的一些特性 [5-6]。
(1)进化保守性。蛋白质界面比蛋白质的其余表面
有较高的残基进化保守性,且界面中的热点比界面
中的其他部分的保守性更高。这当然是在漫长的分
子进化过程中自然选择的压力造成的。(2)溶剂可
及性。结合位点通常有比平均量高很多的暴露的疏
水性表面积,因而界面残基比非界面的表面残基具
有较高的溶剂可及表面积 (solvent accessible surface
area,SASA) (即溶剂可及性 ),且界面中的热点比
界面中的其他部分的溶剂可及性更高。当然,热点
残基由于在复合物界面形成后被深度包埋,其
SASA比单体时将有较大的减少。(3)“O”环理论。
热点残基是由那些在能量上不重要的残基环绕包围
着的。这些不太重要的残基形成了一个所谓的“O”
型环,使大量的水分子和热点残基不能发生相互作
用。(4)“热区”理论。界面结构由一些相对独立的
相互作用模块 (被称为“热区”)组成;在这些热
区中,热点被紧密包裹着。(5)形状相关性。即空
间结构互补性或形状匹配。显然,相互给合的蛋白
质分子越大,其界面也越大。蛋白质表面大分子的
结合位点可以是凹的、凸的和平的。当然,最常观
察到的是突出的环和大的孔穴,因为这些地方提供
了特定的形状互补。小配体的结合位点常常是狭缝、
口袋和孔穴,而界面中的热点具有更好的形状相关
性。(6)残基倾向性。在热点残基中,由于大小和
构象的原因,酪氨酸、色氨酸和精氨酸含量很高;
而亮氨酸、丝氨酸、苏氨酸和缬氨酸出现得很少,
即界面中的热点残基和非热点残基在氨基酸组成上
差别非常明显。(7)残基成对偏好性 [7]。在相互作
用中起支配地位的残基对倾向于相同残基接触 (特
别是疏水残基,如酪氨酸 )、脂肪族残基接触 (多
数是疏水的 )、芳香族残基接触 (如酪氨酸、色氨酸、
苯丙氨酸 )以及芳香族残基与精氨酸 /脂肪族残基
接触。(8)理化相互作用的空间结构保守性 [8]。通
过考虑界面两侧的针对相互作用对的多重结构比
对,识别出了一些空间结构保守的理化相互作用。
2 热点残基预测策略与技术
2.1 分类与特点
蛋白质界面热点的实验识别可以通过丙氨酸扫
描、丙氨酸切削 (alanine shaving)或残基嫁接 (residue
grafting)技术实现,但这些都是费时费力和代价昂
贵的过程。经历了序列数据库的快速发展之后,存
储着高解析度的蛋白质及其复合物的三维结构的
PDB数据库近年来也有了快速发展。在此基础上,
依赖于对实验热点性质的研究和众多越来越成熟的
特征提取程序,目前已经有了一些计算方法能够从
界面中识别出热点。通常情况下,只有界面残基才
生命科学 第24卷108
被考虑用来进行热点残基的预测。在蛋白质结构
已知的前提下,界面残基可通过计算 SASA (例如
Yan等定义在复合物形成过程中 SASA的减少量超
过 1Å2的残基即为界面残基 ) 来确定,或通过计算
基于距离的两个蛋白质的接近程度来确定。一个性
能优良的预测系统,不但要求使用的策略能够充分
反映问题的本质,同时需要高效、稳健的识别技术。
根据使用的策略和技术的不同,可以对预测方法进
行一个粗略的分类,见表 1。
这些预测方法多数使用了已知的热点数据。对
于使用经验公式的方法而言,用其来拟合参数;对
于使用机器学习的方法而言,用其来进行训练。训
练的目的是为了将训练集中预测的和实际的状态差
异最小化。预测依赖于训练数据集的选择:可靠性、
多样性,并且对于一个成功的训练方法来说,非冗
余的黄金数据集是必需的。
基于能量的策略需要计算 ∆G。例如在计算丙
氨酸扫描预测方法中,利用结合自由能函数来计算
丙氨酸突变效应引起的 ∆G的变化 (即 ∆∆G),根据
计算出的 ∆∆G的大小标识热点残基;又如在MM/
PB(GB)SA[9] 预测方法中,运用分子动力学模拟估
计 ∆G并进行能量分解到残基。这些方法可以得到
很好的预测结果,但由于计算代价高以及操作上的
困难,不能大规模应用。
基于特征的策略,利用各种特征把热点残基与
界面上的其余残基区别开来。从序列提取的特征有
序列保守性、氨基酸理化特性、局部序列环境以及
氨基酸残基的进化序列谱等;从结构提取的特征有
溶剂可及性、形状相关性、结构保守性等;从分子
相互作用信息提取的特征有空间结构保守的理化相
互作用等。多个特征的联合在区分热点与非热点时
是有效的。
基于综合信息的策略考虑能量、各种特征以及
利用统计方法分析已有的热点数据得到的知识,以
期有效提高预测准确率和覆盖率。
经验公式是一种根据能量、特征、知识等原则
来寻找结合热点的技术。合理敏感的打分函数是成
功预测的关键。能量函数依赖于对 ∆G的计算。关
于 ∆G的计算主要有三种:使用分子动力学模拟大
规模采样,通过特定的热力学过程计算;针对蛋白
质相互作用的特点,建立 ∆G不同程度的近似模型
计算;学习已经解出的蛋白质结构,建立统计平均
势来计算。经验函数则考虑了多种因素的贡献,如
能量得分、特征得分等,以适当的权重把各项组合
起来。基于知识的函数是用统计方法分析已有的蛋
白质热点数据库得到的知识,诸如残基 -残基接触
势、残基成对偏好性和原子 -原子接触势等。经验
公式的优点是简明直观,易于理解。
已有多种机器学习技术用于热点预测。主要思
想是将热点预测问题转化为分类问题,使用已知数
据源训练分类器区别正、负样本,再用构造好的分
类器对待识别的样本进行分类决策。对于依据数值
的预测,一个界面残基有两种状态:是或不是热点
残基。对于依据概率的预测,当概率大于一个极限
值时预测为热点残基否则就是非热点残基。使用机
器学习预测涉及三个方面:热点残基数据集的构建
与特征变量的选取、机器学习的选择和分类器的构
建。下面概述几种机器学习的特点与局限。(1)遗
传算法。它是一种解决优化问题的随机搜索算法,
通过模拟进化的过程在一个由个体组成的种群中寻
找具有最高适应性 (最优函数 )的个体 (解 ),能够
在复杂空间进行全局优化搜索,具有较强的鲁棒性。
(2)人工神经网络。它由相互连接在一起的多层节
点 (常用输入、隐藏和输出三层节点 )构成,能够
在一个训练集上进行优化使得预测输出值和实际状
态下的值的差别最小化,具有较好的准确性,但失
去了透明性。(3)决策树。它是以实例为基础的归
纳学习算法,是一种逼近离散函数值的方法,分类
表1 热点预测中的策略和技术问题
策略 技术
基于能量的 计算复合物结合自由能 经验公式 能量函数
基于特征的 从序列提取特征 经验函数
从结构提取特征 基于知识的函数
从分子相互作用信息提取特征 机器学习 遗传算法
基于综合信息的 考虑能量、特征以及利用统计方法 人工神经网络
分析已有的热点数据得到的知识 决策树
支持向量机
贝叶斯网络
欧阳玉梅,等:蛋白质-蛋白质界面热点残基预测及其在线工具第1期 109
精度高,对噪声数据有很好的健壮性。(4)支持向
量机。它是一种基于统计学习理论的方法,通过把
样本从原空间非线性映射到高维特征空间,在其中
寻找到一个最优分类超平面,使得不同类别样本之
间的间隔最大化,从而达到最佳的推广能力,其优
势是可以通过构造合适的核函数有效地解决非线性
分类问题,准确性也高,但也以失去透明性为代价。
(5)贝叶斯网络。它是以贝叶斯公式为基础的基于
概率推理的图形化网络,能够将先验知识与样本信
息结合、依赖关系与概率表示结合,也能够解决
不确定性和不完整性问题。
2.2 三个典型实例
FoldX(2005年 ) [10] 热点预测系统使用一种计算
丙氨酸扫描方法。它系统地突变两个蛋白质间的侧
链为丙氨酸,而复合物的其余部分不受约束。使用
公式 ∆∆G = ∆GMUT-∆GW计算 ∆∆G。FoldX提出了一
个近似力场模型,用下列经验项的线性组合计算
∆G(单位 : kcal /mol):
其中,a~l为各项对应的权重;∆Gvdw是范德华
相互作用对自由能的贡献之和;∆GsolvH和 ∆GsolvP分
别是非极性、极性残基的溶剂化自由能;∆Gwb是由
于结合水而获得的自由能;∆Ghbond和 ∆Gel分别是氢
键和静电相互作用;∆Gkon是与复合物形成的联合
速率相关的附加静电项;∆Gmc和 ∆Gsc分别是主链
和侧链的构象熵变;∆Gclash是冲撞项 (度量结构中
的原子间的空间交迭,排斥能 )。利用 339个单点
突变的数据,拟合公式 (1)的各项权重以及能量项
中的参数,然后用它计算不同复合物中 82个单点
突变的 ∆∆G,最终结果和实验值有 0.8的相关性。
FoldX3.0(2011年 )则具有了更强的计算能力和由分
子制图、建模、仿真程序 YASARA支持的 3D友好
界面。
KFC(2008 年 ) [11-12] 与 KFC2(2011 年 ) [13] 热点
预测系统各使用了一种基于特征的机器学习方法。
KFC使用先验的实验数据训练,基于结构特征 (如
原子大小、形状特异性半径分布、界面尖端 )和生
物化学特征 (原子接触、氢键、化学型 ),由决策
树给出一个二元结论:一个残基是或不是热点。
KFC2是 KFC的一个改进版,通过支持向量机方法,
使用相同数目的正、负样本训练,在上述特征的基
础上再附加界面溶剂化、原子密度和柔韧性特征进
行预测。两个系统均可使用,都得到了比计算丙氨
酸扫描 (Robetta–Ala[14])更好的性能。
PCRPi-W(2010年 ) [15]热点预测系统鉴于特征
太少时不能清晰定义界面中的热点,把能量、结构
和进化三方面的 7项特征纳入到贝叶斯网络概率框
架下进行预测。下面说明这 7项特征。(1)相互作
用接合索引:度量一个给出的参与复合物中蛋白质
间的原子相互作用的界面残基的侧链原子的比例。
(2)拓扑地形索引:估计一个给定的界面残基的结
构小环境并计算结构近邻残基与依据残基类型的平
均接触数目的比值。(3)CON保守性索引:引用一
个由数据库搜索得到的与给定的界面残基相联系的
残基进化保守性。(4)ANCCON保守性索引:反映
一个未加工的由多重序列比对计算的位置保守性。
(5) 3DCON三维保守性索引:反映由数据库搜索得
到的三维区域结构保守性。(6) ANC3DCON保守性
索引:反映一个由多重结构比对计算的三维区域保
守性。(7) BE索引:使用 FoldX计算丙氨酸突变效
应引起的 ∆∆G,即相当于计算丙氨酸扫描。由此可
以看出,该系统把一个由经验公式得到的结果又作
为了机器学习中的特征之一,是经验公式与机器学
习有机结合的一个典范。系统还提供了可以查询的
计算热点数据库 PCRPi-DB[16]。
3 实验的与预测的热点残基数据库
Thorn和 Bogan[1]把从丙氨酸扫描突变实验得
到的热点存储到了 ASEdb数据库。wikiBID[4]是另
一个实验热点数据库,其数据来自从文献中挖掘
的由丙氨酸扫描和定点突变 (site-directed mutations)
实验技术测得的热点,引用的作者已超过 1 000位。
然而,这些数据库中的数据与已有的蛋白质相互作
用数据相比仅覆盖很小的一部分。由于实验数据的
极度匮乏,计算方法被用于热点预测。HotSprint[17]、
PCRPi-DB、ANCHOR[18]三个数据库收集的是已知
三维结构的蛋白质复合物界面中的计算注释热点,
它们是分别采用了不同的策略与技术得到的。表 2
列出了这 5个数据库。
比较发现,ASEdb和 wikiBID大小很有限,但
因为数据来自实验准确性很好,常用于界面特性的
计算分析、作为预测方法的训练或验证数据。另外
三个计算热点数据库均是大型的,尽管它们的数据
不如实验方法得到的精确度高,但可以基于它们设
计进一步的实验。特别的是,对于 PCRPi-DB系统,
用户除了可以方便地浏览和查询数据库项目外,还
可以使用众多文档和相关在线资源与项目的链接。
生命科学 第24卷110
PCRPi-DB承诺了基于 PDB数据库每周的更新而
更新。
4 热点残基预测在线工具
界面热点预测有两个竞争性的要求:预测需要
尽量覆盖更多的真实的热点,但同时又尽可能减少假
阳性。如果预测中真阳性和假阳性分别是 TP和 FP,
真阴性和假阴性分别是 TN和 FN,通常使用 4个指标
描述系统性能。准确率 (accuracy):(TP+TN)/(FP+FN+
TP+TN)、敏感性 (recall):TP/(TP+FN)、精确性 (precision):
TP/(TP+FP)和相关系数 (correlation coefficient):
当准确率和精确性达到 70%以上,就认为提供了
有意义的洞察。一些研究者为性能优良的预测系统
建立了网站服务器,见表 3。它们允许用户从提交
的蛋白质复合物结构 (个别的是序列 )来预测界面
热点残基。一般地,输出为热点残基列表,有的还
提供了结果的可视化。
这些在线工具对于从事蛋白质识别、蛋白质
复合物建模和药物设计的实验人员和计算人员都
表2 蛋白质界面热点残基数据库
表3 蛋白质界面热点残基预测在线工具
欧阳玉梅,等:蛋白质-蛋白质界面热点残基预测及其在线工具第1期 111
是极为有用的。比较发现, Robetta 、FoldX和MM/
PB(GB)SA适合为特定相互作用提供自由能改变的
计算。鉴于计算效率和性能比较,对于大规模预测,
KFC2、HotPoint、PCRPi-W和 ANCHOR是可选的。
除了 ISIS,一般地均需要蛋白质结构。ISIS是一个
基于知识的仅从序列信息出发的预测工具,尽管没
有计算丙氨酸扫描方法好,在缺少结构信息或结合
伴体时是有用的。
5 挑战
研究和识别蛋白质界面热点可以为蛋白质相互
作用和功能提供分子水平的理解,为蛋白质工程和
药物设计提供指导。除了利用生物学试验的手段外,
利用计算方法预测蛋白质相互作用的热点残基是当
前生物信息学 (包括结构生物信息学 ) 研究领域的
前沿,正在引起广泛的重视。在过去几年里,界面
热点预测方法已经有了快速的发展,取得了一定的
成功。但是它们仍处于初级阶段,还面临着众多的
挑战 [6,22]。首先,到目前为止,对决定热点残基的
生物学特征还没有完全了解;其次,实验热点数据
库太小,既影响了对热点特征的统计分析,也影响
了预测训练数据的多样性;再次,目前对于 PDB
数据库中形成复合物的蛋白质的预测是较为满意
的,但与大量的相互作用蛋白质数据相比仅覆盖很
小的一部分;最后,已存在方法的性能还有待改善,
还有必要发展准确性更高和覆盖率更好的新方法。
随着 PDB数据库和实验热点数据库的发展,相信
联合各种工具和手段的界面热点预测会越来越成功。
[参 考 文 献]
[1] Thorn KS, Bogan AA. ASEdb: a database of alanine
mutations and their effects on the free energy of binding
in protein interactions. Bioinformatics, 2001, 17(3): 284-5
[2] 佩特斯科 GA, 林格 D. 蛋白质结构与功能入门[M]. 葛
晓春, 译. 北京: 科学出版社, 2009
[3] 白红军, 来鲁华. 蛋白质相互作用: 界面分析, 结合自由
能计算与相互作用设计. 物理化学学报, 2010, 26(7):
1988-97
[4] Fischer TB, Arunachalam KV, Bailey D, et al. The binding
interface database (BID): a compilation of amino acid hot
spots in protein interfaces. Bioinformatics, 2003, 19(11):
1453-4
[5] Tuncbag N, Gursoy A, Keskin O. Identification of
computational hot spots in protein interfaces: combining
solvent accessibility and inter-residue potentials improves
the accuracy. Bioinformatics, 2009, 25(12): 1513-20
[6] 夏俊峰. 蛋白质相互作用及其结合面热点残基的预测
方法研究[D]. 安徽: 中国科学技术大学, 2010
[7] Liu Q, Li J. Protein binding hot spots and the residue-
residue pairing preference: a water exclusion perspective.
BMC Bioinformatics, 2010, 11: 244-9
[8] Shulman-Peleg A, Shatsky M, Nussinov R, et al.
MultiBind and MAPPIS: webservers for multiple align-
ment of protein 3D-binding sites and their interactions.
Nucleic Acids Res, 2008, 36: W260-4
[9] Case DA, Cheatham TE 3rd, Darden T, et al. The Amber
biomolecular simulation programs. J Comput Chem, 2005,
26(16): 1668-88
[10] Schymkowitz J, Borg J, Stricher F, et al. The FoldX web
server: an online force field. Nucleic Acids Res, 2005, 33:
W382-8
[11] Darnell SJ, Page D, Mitchell JC. Automated decision-tree
approach to predicting protein-protein interaction hot
spots. Proteins, 2007, 68(4): 813-23
[12] Darnell SJ, LeGault L, Mitchell JC. KFC Server: interac-
tive forecasting of protein interaction hot spots. Nucleic
Acids Res, 2008, 36: W265-9
[13] Zhu X, Mitchell JC. KFC2: A knowledge-based hot spot
prediction method based on interface solvation, atomic
density and plasticity features. Proteins, 2011, 79(9):
2671-83
[14] Kortemme T, Kim DE, Baker D. Computational alanine
scanning of protein-protein interfaces. Sci STKE, 2004,
219: pl2
[15] Segura Mora J, Assi S, Fernandez-Fuentes N. Presaging
critical residues in protein interfaces-web server (PCRPi-
W): A web server to chart hot spots in protein interfaces.
PLoS One, 2010, 5(8): e12352
[16] Segura J, Fernandez-Fuentes N. PCRPi-DB: a database of
computationally annotated hot spots in protein interfaces.
Nucleic Acids Res, 2011, 39: D755-60
[17] Guney E, Tuncbag N, Keskin O, et al. HotSprint: database
of computational hot spots in protein interfaces. Nucleic
Acids Res, 2008, 36: D662-6
[18] Meireles LM, Dömling AS, Camacho CJ. ANCHOR: a
web server and database for analysis of protein–protein
interaction binding pockets for drug discovery. Nucleic
Acids Res, 2010, 38: W407-11
[19] Pokala N, Handel TM. Energy functions for protein
design: adjustment with protein-protein complex affinities,
models for the unfolded state, and negative design of
solubility & specificity. J Mol Biol, 2005, 347(1): 203-27
[20] Ofran Y, Rost B. ISIS: interaction sites identified from
sequence. Bioinformatics, 2006, 23(2): e13-6
[21] Brenke R, Kozakov D, Chuang GY, et al. Fragment-based
identification of druggable ‘hot spots’ of proteins using
Fourier domain correlation techniques. Bioinformatics,
2009, 25 (5): 621-7
[22] Krüger DM, Gohlke H. DrugScorePPI webserver: fast and
accurate in silico alanine scanning for scoring protein-
protein interactions. Nucleic Acids Res, 2010, 38: W480-6
[23] Lise S, Buchan D, Pontil M, et al. Predictions of hot spot
residues at protein-protein interfaces using support vector
machines. PLoS One, 2011, 6(2): e16774