全 文 :生命科学
Chinese Bulletin of Life Sciences
第 18 卷 第 2期
2006年 4月
Vol. 18, No. 2
Apr., 2006
蛋白质 / 核酸相互作用研究方法进展
王成刚1,莫志宏2*
(1 重庆大学生物工程学院, 重庆 400030;2 重庆大学化学化工学院,重庆 400030)
摘 要:蛋白质和核酸是构成生命体最为重要的两类生物大分子,蛋白质与核酸的相互作用是分子生
物学研究的中心问题之一,它是许多生命活动的重要组成部分。研究蛋白质 / 核酸相互作用近期采用
的新技术有:核酸适体技术、生物信息学方法、蛋白质芯片技术以及纳米技术等。本文就这些新的
研究方法进行综述。
关键词:蛋白质;核酸;相互作用
中图分类号:Q 7 1 文献标识码:A
Progress in methods to study on the interactions between proteins and
nucleic acids
WANG Cheng-Gang1, MO Zhi-Hong2*
(1 College of Bioengineering, Chongqing University, Chongqing 400030, China; 2 College of Chemistry and Chemical
Engineering, Chongqing University, Chongqing 400030, China)
Abstract: Nucleic acids and proteins are two kinds of most important molecules in cells. The interaction between
proteins and nucleic acids is one of the key issues in molecular biology. Some novel methods to study on the
interaction are aptamer technology, bioinformatics, protein biochip, and nano technology. The article has
reviewed these established methods recently.
Key words: protein; nucleic acid; interaction
收稿日期:2005-09-30;修回日期:2005-11-09
作者简介:王成刚(1976 — ),男,博士研究生;莫志宏 (1965 — ),男,博士,教授,博士生导师,* 通讯作者。
文章编号 :1004-0374(2006)02-0195-04
蛋白质和核酸是构成生命体最为重要的两类生
物大分子。蛋白质与核酸的相互作用是分子生物学
研究的中心问题之一,它是许多生命活动的重要组
成部分。随着人类基因组计划的完成,大量基因被
发现和定位,基因的功能问题将成为今后研究的热
点。大多数基因的最终产物是相应的蛋白质,因此
要认识基因的功能,必然要研究基因所表达的蛋白
质。蛋白质的功能往往体现在与其他蛋白质及(或)
核酸的相互作用之中。细胞各种重要的生理过程,
包括信号的转导、细胞对外界环境及内环境变化的
反应等,都是以蛋白质与其他物质的相互作用为纽
带。所以,近年来,蛋白质间相互作用以及蛋白
质 / 核酸相互作用的研究逐渐得到重视。对于蛋白
质和核酸的相互作用,李英贤和贺福初[1]、吕鉴泉
和庞代文[2]对经典生物化学和物理化学的研究方法进
行了综述。本文重点介绍一些新的研究蛋白质 / 核
酸相互作用的方法和技术,主要从核酸适体技术、
生物信息学方法、蛋白质芯片技术以及纳米技术等
方面进行综述。
1 核酸适体技术
核酸适体(aptamer)指的是经过一种新的体外筛
选技术——指数富集配体系统进化(systematic evo-
196 生命科学 第18卷
lution of ligands by exponential enrichment,SELEX),
从随机单链寡聚核苷酸文库中得到的能特异结合蛋
白质或其他小分子物质的单链寡聚核苷酸,可以是
RNA也可以是 DNA,长度一般为 25~60个核苷酸。
SELEX的筛选流程首先是利用现有的分子生物学技
术人工合成一个含有 1014~1015 个单链寡核苷酸序列
的随机文库,序列长度往往在 25~35 个核苷酸之
间,单链的随机寡核苷酸序列容易形成可与蛋白质
等配体特异性共价结合的二级结构,在这一高亲和
力特异性结合的基础之上配体蛋白质同随机文库相
互作用,选择性分离出核酸适体后,然后通过 PCR
或 RT-PCR 等技术进行扩增。次一级文库再与配体
蛋白质相互作用,反复多次循环,即可获得与配体
蛋白质特异性高亲和力结合的核酸适体。核酸适体
与配体间的亲合力(解离常数在皮摩和纳摩之间)常要
强于抗原抗体之间的亲合力[3]。核酸适体所结合的
靶分子范围非常广泛,除蛋白质之外,还能作用于
酶、生长因子、抗体、基因调节因子、细胞黏附
分子、植物凝集素、完整的病毒颗粒、病原菌等[4]。
适体从 20 世纪 90 年代初出现以后,就得到了科研
工作者的广泛关注,适体的研究工作得到了快速的
发展。SELEX筛选技术和核酸适体的高亲和性在蛋
白质 / 核酸相互作用的研究中发挥了重要的作用。
Wen等[5]研究了同细菌噬菌体Ff 基因5蛋白(g5p) 高
亲和力结合的核酸适体,发现G富集基序对于形成
g5p 连接启动子结构,提供实际的 g5p 连接位点具
有重要的意义。White 等[6]利用 SELEX 技术研究了
一种PUM2HD (短小杆菌素同源结构域)及其RNA核
酸适体,发现在PUM2 氨基端有Ser和Glu/Ala富集
区,并且 PEB ( PUM2 连接元件)与果蝇反应元件
的 3 端具有亲缘关系,但又互不相同。Bouvent 等
[7]利用NRE(核仁蛋白识别元件) 发现了RNA茎环上
的 RBD1 和 RBD2 (折叠元件结构域),这对了解模
式蛋白识别 RNA 的结构过程具有重要意义。
核酸适体以及SELEX技术给蛋白质 /核酸相互
作用研究提供了一种新颖的研究方法,科研人员可
以控制筛选条件得到与待研究蛋白质相互结合的核
酸适体,避免了天然条件下研究蛋白质 / 核酸相互
作用的困难性。但目前对核酸适体与靶蛋白相互作
用的分析是在筛选条件与天然条件相同的假设基础
上进行的,在这种筛选条件下得到的核酸适体与蛋
白质之间的相互作用,和天然状态下的蛋白质 / 核
酸之间的相互作用到底有何异同,这是一个亟待解
决的问题,此问题的解决必将推动蛋白质 / 核酸相
互作用的研究进展。
2 生物信息学方法
生物信息学是在生命科学的研究中,以计算机
为工具对生物信息进行储存、检索和分析的科学。
它包含着生物信息的获取、处理、存储、分配、
分析和解释的所有方面。具体地说,生物信息学是
用数理和信息科学的观点、理论和方法去研究生命
现象,组织和分析呈现指数增长的生物学数据的一
门学科。Luscombe 和 Thornton[8]利用氨基酸序列的
保守性构建计算机算法来预测蛋白质/DNA复合体中
DNA 的结合位点。Selvaraj等[9]将蛋白质 /核酸复合
体中原子电荷势能作为训练数据集,利用人工智能
技术来预测蛋白质对DNA的识别位点。Ahmad等[10]
将蛋白质的序列组成、可溶解性以及二级结构等信
息数据用人工神经网络算法进行训练,构建了在线
蛋白质 / 核酸结合预测技术,预测成功率达到了
69%。此后 Ahmad 和 Sarai[11]将此技术进一步加强,
在训练人工神经网络时加入了蛋白质进化关系的信
息,使预测成功率提高了 8 .7%。
目前建立在蛋白质 / 核酸相互作用基础上的较
重要的数据库为蛋白质 - 核酸识别数据库(ht tp: / /
gibk26.bse.kyutech.ac.jp/jouhou/3dinsight/recognition.
html),利用该数据库能帮助研究者了解核酸被蛋白
质识别的机制。该数据库包括以下几个组成部分。
2.1 蛋白质-核酸复合物数据库 蛋白质-核酸复合
物数据库是一个包含蛋白质 - 核酸复合物结构数据
的数据库。这些数据根据蛋白质的识别序列和复合
物中 DNA 形式进行分类。使用者可以通过关键词、
识别序列、DNA 形式等进行搜索,并且搜索结果
可以直接链接到 3DinSight 数据库(在此处,可以通
过三维结构浏览器,如 RasMol 或者 VRML 查看含
有序列位点和突变位点的三维结构图)。该数据库
也能让使用者检测依赖于序列的构象参数和DNA的
柔韧性,并以图表形式显示结果。
2.2 核苷酸-氨基酸相互作用数据库 核苷酸-氨基
酸相互作用数据库搜集核苷酸和氨基酸间 4 埃大小
内的成对原子,能让使用者找到成对的核苷酸和氨
基酸。使用者可以指定残基名称( 核苷酸或氨基
酸)、原子类型和侧链 / 骨干。搜索后,带有距离
值的所有原子对将被显示。搜索可直接链接到
3DinSight 数据库,以 RasMol 图片形式自动地突出
展示复合物结构中所有原子对。使用者可以检测到
197第2期 王成刚,等:蛋白质 / 核酸相互作用研究方法进展
每个结构中核苷酸和氨基酸的特别相互作用。
2.3 蛋白质-核酸相互作用的热力学数据库(ProNIT)
蛋白质 - 核酸相互作用的热力学数据库包含有序
列、结构和一些热力学参量(如分裂常数、结合常
数、吉布斯自由能的转换、焓和热容量、活性)等
信息。该数据库允许使用者用不同条件(多种分类
和显示选项)搜索数据。此外,ProNIT 超链接于其
他重要的数据库,如 PDB、核酸数据库 NDB、酶
代码 EC、蛋白质信息资源 PIR 和 ProTherm 等等。
当前,在分子生物学和信息科学快速发展的影
响下,生物信息学已经成为生物领域的指导科学,
利用生物信息学方法研究蛋白质/核酸相互作用可以
大大缩短研究工作的时间,达到事半功倍的效果。
但受限于当前计算科学和算法领域的发展情况,生
物信息学得到的结果与实际的结果还存在一定的偏
差,仍需开展进一步的实验工作来进行验证。
3 生物芯片技术
生物芯片技术是基于生物大分子间相互作用的
大规模并行分析方法,使得生命科学研究中所涉及
的样品反应、检测、分析等过程得以连续化、集
成化和微型化,现已成为当今生命科学研究领域发
展最快的技术之一。目前的生物芯片主要有核酸芯
片、蛋白质芯片和糖体芯片等几大类。蛋白质芯片
是依靠手工、压印或喷墨的方法将探针蛋白点样在
化学膜、凝胶、微孔板或玻片上形成阵列,经过
与样品的杂交捕获靶蛋白,再用原子力显微镜、磷
光成像仪、光密度仪或激光共聚焦扫描仪进行检
测,获得靶蛋白表达的种类、数量及关联等信息。
蛋白质芯片已经广泛用于研究蛋白质与核酸的相互
作用,已成为一种进行高通量蛋白质与DNA或RNA
作用筛选的有效方法。Ge[12]运用蛋白质芯片检测蛋
白质与核酸相互作用,他将包括通用转录因子、激
活蛋白和辅激活蛋白在内的48种纯化蛋白质点样在
硝酸纤维素膜制成通用蛋白质芯片,用腺病毒主要
晚期启动子 64 bp 双链 DNA 片段、腺病毒主要晚
期启动子64 bp负链DNA和SV40早期前体mRNA杂
交,结果证明蛋白质芯片上的所有蛋白质都能够不
同程度地特异性识别和结合双链和单链寡核苷酸片
段,并且结合双链DNA 和单链DNA的总体模式基
本相同,说明大多数 D N A 结合蛋白既能和双链
DNA 结合,也能够和单链 DNA 结合。蛋白质芯
片与 RNA 的作用研究表明,蛋白质芯片能够成功
地分析 RNA 与蛋白质间的识别性结合。
蛋白质芯片技术最大优点在于快速和高通量,
以往科研人员作研究时一次只能研究少量生物样
品,借助蛋白质芯片,一次实验可同时研究大量生
物样本,加速了蛋白质 / 核酸相互作用的研究。蛋
白质芯片技术目前存在的问题有:(1)蛋白质芯片在
制作过程中实验条件发生微小的变化便可能引起最
后结果的不同,实验条件不易控制,使得实验结果
的可重复性相对不足;(2) 目前用于蛋白质芯片制备
的固相介质,如化学膜、凝胶和玻片都存在一些缺
点,蛋白质在固相基质表面的固定往往会造成其解
折叠,从而失去生物活性;(3)对结果的扫描、去
除背景、数据处理等,目前还不能做得很完美,会
导致假阳性、假阴性的存在。
4 纳米技术
纳米技术(nano scale technology) 是一门在
0.1~100nm空间尺度内操纵原子和分子,对材料进
行加工、制造具有特定功能的产品、或对某物质进
行研究,掌握其原子和分子的运动规律和特性的崭
新高技术学科。核酸和蛋白质等生物大分子的大小
也是在纳米尺度,随着科学技术的快速发展,越来
越多的纳米技术被用来研究生物大分子。在蛋白
质 / 核酸相互作用的研究工作中,目前使用较新的
技术是利用纳米孔技术来进行研究。纳米孔
(nanopore),可以简单地定义为内径为 1~100nm 的
微小洞孔,一般孔径应大于洞孔深度,或者处于同
一量级。如果孔的深度远大于孔径,就称之为纳米
孔道。纳米孔有天然存在的生物纳米孔,也有人工
加工的纳米孔[13~15]。它们都可以用来进行生命科学
的相关研究,但是,理想的生物化学或生物物理研
究应采用孔径稳定、坚固耐用、物化性能良好的固
体纳米孔,这样的纳米孔应该由质地坚硬的固体薄
膜材料加工制作。Li等[16]利用聚焦离子束(FIB)制作
纳米孔,利用纳米孔将双螺旋DNA从组蛋白八聚体
上剥离下来,并探测这一过程,从而可以揭示核小
体中包含的许多生物化学、物理信息。这是由于处
于电场中的核小体在电场的作用下,DNA分子穿越
纳米孔,同时由于纳米孔的阻挡力,使组蛋白不能
穿越,从而诱使 DNA从组蛋白八聚体上分离下来。
通过准确检测DNA分子穿孔过程中引起的电流阻塞
效应,可将DNA与组蛋白的相互作用的一些性质反
映出来。目前已经取得了阶段性的成果。
在纳米尺度上研究核酸与蛋白质相互作用,相
较于其他的研究方法,优点是能够在生物活性环境
198 生命科学 第18卷
中,保持生物大分子受到最少化学修饰干扰的状态
下,对生物大分子的空间结构、动态变化、生化
特性等进行直接研究。相信该技术可以提供更多、
更详细的生物大分子相互作用、蛋白质功能等方面
的信息,帮助我们解决一些深层次的生物学疑难问
题。目前阻碍此方法广泛应用的一个最大难题是如
何在纳米尺度上更好的操纵生物大分子,这需要生
物科学、电子科学、材料科学等多学科的共同进展
来推动此方法的发展和应用。
5 结语
自然界的生物学过程是通过生物体内各种大分
子之间的相互作用来实现的,揭开蛋白质 /核酸相互
作用的规律,有助于加深人类对生命现象本质的理
解。目前对于蛋白质与核酸相互作用的研究已经取
得了一定的研究成果,但仍有许多问题有待解决。
进一步研究其相互作用需要生物学、化学、医学、
物理学、计算机学及电子学等多学科的协作,随着
各种新技术在这个研究领域的应用,人类一定能在
不远的将来揭开蛋白质与核酸相互作用的规律。
[参 考 文 献]
[1] 李英贤, 贺福初. DNA与蛋白质相互作用研究方法. 生命
的化学, 2003, 23(4): 306~308
[2] 吕鉴泉, 庞代文. 核酸与蛋白质相互作用研究的新技术与
新方法. 化学进展, 2004, 16(3): 393~399
[3] Jiang Y X, Zhu C F, Ling L S, et al. Specific aptamer-protein
interaction studied by atomic force microscopy. Anal Chem,
2003, 75(9): 2112~2116
[4] Lee J F, Hesselberth J R, Meyers L A, et al. Aptamer database.
Nucleic Acids Res, 2004, 32 (Database issue): D95~D100
[5] Wen J D, Gray C W, Gray D M. SELEX selection of high-
affinity oligonucleotides for bacteriophage Ff gene 5 protein.
Biochemistry, 2001, 40(31): 9300~9310
[6] White E K, Moore-Jarrett T, Ruley H E. PUM2, a novel
murine puf protein, and its consensus RNA-binding site.
RNA, 2001, 7(12): 1855~1866
[7] Bouvent P, Allain F H, Finger L D. Recognition of pre-
formed and flexible elements of an RNA stem-loop by
nucleolin. J Mol Biol, 2001, 309(3): 763~775
[8] Luscombe N M, Thornton J M. Protein-DNA interactions:
amino acid conservation and the effects of mutations on
binding specificity. J Mol Biol, 2002, 320(5): 991~1009
[9] Selvaraj S, Kono H, Sarai A. Specificity of protein-DNA
recognition revealed by structure-based potentials: symmet-
ric/asymmetric and cognate/non-cognate binding. J Mol Biol,
2002, 322(5): 907~915
[10] Ahmad S, Gromiha M M, Sarai A. Analysis and prediction
of DNA-binding proteins and their binding residues based
on composition, sequence and structural information.
Bioinformatics, 2004, 20(4): 477~486
[11] Ahmad S, Sarai A. PSSM-based prediction of DNA binding
sites in proteins. BMC Bioinformatics, 2005, 6(1): 33
[12] Ge H. UPA, a universal protein array system for quantita-
tive detection of protein-protein, protein-DNA, protein-
RNA and protein-ligand interactions. Nucleic Acids Res, 2000,
28(2): e3
[13] Li J L, Stein D, McMullan C, et al. Ion-beam sculpting at
nanometre length scales. Nature, 2001, 412(6843): 166~169
[14] Stein D, Li J L, Golovchenko J A. Ion-beam sculpting time
scales. Phys Rev Lett, 2002, 89(27): 276106
[15] Storm A J, Chen J H, Ling X S, et al. Fabrication of solid-state
nanopores with single-nanometre precision. Nat Mater, 2003,
2(8): 537~540
[16] Li J L, Gershow M, Stein D, et al. DNA molecules and
configurations in a solid-state nanopore microscope. Nat
Mater, 2003, 2(9): 611~615