全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2014年第2期
泛素-蛋 白 酶 途 径(Ubiquitin-proteasome pathw-
ay,UPP)广泛存在于真核系统中,此途径在细胞基
本进程如 DNA 修复,细胞周期调控,机体抵御环
境胁迫等一系列通路中发挥着重要作用[1]。在一
般蛋白质降解的泛素化途径中,共需要泛素活化酶
(UBE1)、泛素结合酶(UBE2)和泛素底物连接酶
(UBE3)3 种酶的参与[2],泛素结合酶(UBE2)在
选择性降解靶蛋白中起决定性作用。不同的细胞内
有多种 UBE2 基因,目前发现酵母有 13 种,拟南芥
中有 17 种,而人类至少有 30 种。但对于昆虫 UBE2
研究报道较少,目前尚未见家蝇体内 UBE2 的相关
研究报道。有学者研究显示,当机体受到病原体如
收稿日期 :2013-07-19
基金项目 :国家自然科学基金项目(81160204),贵州省科技厅基金[黔科合(2010)3160],高校博士点学科专项科研基金(20105215120001)
作者简介 :国果,女,博士,副教授,研究方向 :昆虫分子免疫学 ;E-mail :guoguojsc@163.com
家蝇泛素结合酶基因的生物信息学分析
国果 吴沁怡 吴建伟 赵学军 付萍 张勇
(贵阳医学院 寄生虫学教研室,贵阳 550004)
摘 要 : 利用 EST 测序技术从家蝇幼虫 cDNA 文库中获得家蝇泛素结合酶基因(MD-E2)cDNA 序列,采用 NCBI、ExPASY
中的相关工具,对该基因及其编码蛋白的基本理化性质、疏水性、信号肽、二级结构和亚细胞定位等方面进行预测和分析,MEGA
软件构建了进化树。结果表明,家蝇泛素结合酶基因的 cDNA 序列具有完整的 ORF 框,全长 480 bp,一共编码 159 个氨基酸。其
编码的蛋白质理论分子量为 18.117 9 kD,等电点 8.64,无信号肽及跨膜区,属于亲水性蛋白,具有泛素结合酶家族的活性位点
(FHPNVYPSGTVCLSLL),主要分布于细胞核 ;二级结构以无规则卷曲为主,β 折叠较少。
关键词 : 家蝇 泛素结合酶 生物信息学
Bioinformatics Analysis of the Gene and Protein of Ubiquitin-
conjugated Enzyme from Musca domestic
Guo Guo Wu Qinyi Wu Jianwei Zhao Xuejun Fu Ping Zhang Yong
(Department of Parasitology,Guiyan Medical College,Guiyang 550004)
Abstract: A cDNA sequence of Musca domestic ubiquitin-conjugated enzyme(MD-E2)was obtained by in EST technology. Some
characters of the MD-E2 gene and encoded protein sequence were predicted and analyzed by bioinformatics methods in the following aspects,
such as general physical and chemical properties, hydrophobicity, signal peptide, secondary structure and localization sites in cells. Results
showed that the MD-E2 contains a complete ORF(480bp)encoding 159 amino acid with a predicted molecular weight about 18.117 9 kD and
pI 8.64. The protein encoded by MD-E2 gene has no signal peptide, and no transmembrane domains, and it is a hydrophilic protein which is
mainly located in cell nucleus. The secondary structures are mainly composed of random coil.
Key words: Musca domestic Ubiquitin-conjugated enzyme Bioinformatics
细菌和病毒攻击时,UBE2 的表达水平明显上升[3-6]。
本课题组通过构建家蝇幼虫热胁迫的 cDNA 全长文
库并进行 EST 测序,从中筛选得到了 UBE2 的表
达序列标签,并测定了其全长序列。本研究对家蝇
UBE2 基因的 cDNA 序列进行结构与功能的信息学分
析,以期为进一步揭示该基因在家蝇免疫防御体系
中的功能,挖掘新型的家蝇抗菌功能基因等提供一
定的理论及试验依据。
1 材料与方法
1.1 材料
热诱导的家蝇三龄幼虫 cDNA 质粒文库由北京
生物技术通报 Biotechnology Bulletin 2014年第2期108
华大合作构建(具体诱导条件及文库构建方法见课
题组前期论文报道[7]。
随机挑选 500 个克隆测序得到多个 EST,Wu-
blastx 方法归并 EST 获得 Unigene。对这些 Unigene
进行 BLAST 后,从中筛选获得编码家蝇 UBE2 的基
因,文库质粒编码为 004E02b。
1.2 方法
1.2.1 家 蝇 泛 素 结 合 酶 基 因 的 识 别 与 同 源 性 比
较 通 过 NCBI 网 站 的 BLASTx 程 序, 将 编 号 为
004E02b 文库质粒的插入序列与 GenBank 中的序列
进行比对,判断该序列是否为全长编码序列,寻找
该序列的同源蛋白序列,将家蝇泛素结合酶基因命
名为 MD-E2。
1.2.2 MD-E2 理 化 性 质 分 析 用 DNASTAR5.0 软
件分析 cDNA 序列和开放阅读框 ;利用瑞士生物
信息学研究所的蛋白分析专家系统(Expert Protein
Analysis System,ExPASy)提供的生物信息学工具
Protparam,分析预测蛋白质的氨基酸残基性质、分
子量及理论等电点、摩尔消光系数、重组产物在细菌、
酵母和哺乳动物细胞中的半衰期、在溶液中的稳定
性等 ;ProtScale 分析蛋白质的疏水性质。采用 Signal
P 分析信号肽序列。
1.2.3 结构及功能预测 利用 Interpro 和 PREDICTP-
ROTEIN 在线分析软件预测蛋白质中包含的结构域
和氨基酸功能位点 ;利用 PSORT Ⅱ在线分析网站分
析蛋白质在细胞内的定位。利用 PHD sec 在线服务
器和 SWISS MODEL 在线预测网站预测蛋白质的二
级结构和三级结构。
1.2.4 系统发育树 从 NCBI 数据库下载 9 个物种
的泛素结合酶基因编码蛋白序列,包括果蝇、按蚊、
金小蜂、拟谷盗属、水蚤拟穴青蟹、牛蛙、南美白
对虾和人类,利用 MEGA4.1 软件构建系统进化树。
2 结果
2.1 MD-E2 基因的序列比对
NCBI 对 MD-E2 进行 BLASTx 分析,结果(图 1)
发 现 MD-E2 基 因 与 黑 腹 果 蝇(Drosophila ananass-
ae)、埃及伊蚊(Aedes aegypti)、大红斑蝶(Danaus
plexippus)泛素结合酶基因的相似性分别为 99%、
97% 和 94%,从比对的高同源性判断该基因是家蝇
的泛素结合酶基因,也表明泛素结合酶极度保守。
ORF 全长 480 bp,编码 159 个氨基酸。
2.2 理化性质预测
利用 ProtParam 工具预测表明 MD -E2 编码蛋白
的相对分子量为 18.12 kD,理论等电点(pI 值)8.64,
含 酸 性 氨 基 酸(DE)12.58%, 碱 性 氨 基 酸(KR)
14.47%, 亲 水 性 氨 基 酸(AILFWV)、 极 性 氨 基 酸
(NCQSTY)和带电氨基酸(RKHYCDE)的比例分
别为 32.7%、20.75% 和 34.6%。可见,该蛋白在酵
母和大肠埃希菌中表达的半衰期分别大于 20 h 和
10 h,在溶液中的不稳定指数略高于 40,为 41.02,
提示稳定性稍弱。
2.3 信号肽预测和分析
分泌蛋白及细胞膜蛋白都以前体物质多肽的形
式合成,其 N 末端含有作为通过膜时指导蛋白质
跨膜转移的氨基酸序列即为信号肽。利用在线网站
Signal IP 3.0 Server 分析此蛋白,结果显示 MD-E2 基
因编码的蛋白没有信号肽,属于非分泌型蛋白。
2.4 亚细胞定位
MD-E2 基因编码蛋白的亚细胞定位分析结果
显示,其分布在细胞核、细胞质、线粒体、细胞骨
架、和分泌型囊泡的可能性分别为 56.5%、17.4%、
13%、4.3% 和 8.7%。推断 MD-E2 蛋白可能主要在
细胞核中发挥生物学作用。
2.5 结构域分析
ScanProsite 分析显示,该氨基酸序列含有完整
的泛素结合酶家族的特征性活性位点 FHPNVYPSG-
TVCLSLL(82-97aa)。Inter ProScan 分 析 显 示 其 具
有泛素结合酶家族的氨基酸保守结构域(图 2)。
MotifScan(模序)分析显示,MD-E2 含有 1 个酰胺
化位点,1 个蛋白激酶磷酸化位点 ;2 个酪蛋白激酶
Ⅱ磷酸化位点 ;1 个 N-肉豆蔻酰化位点,1 个蛋白
激酶 C 磷酸化位点 ;1 个泛素结合酶活性位点,2 个
泛素结合酶家族的特征性位点。推测 MD-E2 蛋白功
能的发挥可能与激酶磷酸化有关。
2.6 疏水性和亲水性的预测与分析
利用 Protprotscale 在线预测 MD-E2 氨基酸序列
的亲疏水性,根据氨基酸分值越低亲水性越强和分
值越高疏水性越强的规律可知,MD-E2 基因编码的
2014年第2期 109国果等 :家蝇泛素结合酶基因的生物信息学分析
蛋白多肽链第 15 位具有最低的分值-2.933(最强的
亲水性),第 116 为具有最高的分值 1.867(最强的
疏水性)(图 3)。总体而言,除了局部的疏水区域,
大部分区域为亲水性,因而整个多肽链表现为亲水
性。该结果与 ProtParam 分析结果一致。
2.7 二级结构和三级结构预测
MD-E2 蛋白没有跨膜区,Sec 预测组成 MD-E2
多肽链二级结构的 3 种类型,α 螺旋(H)、β 折叠(E)
和无规则卷曲(L)的比例是 33.33∶16.35∶50.31,
以 无 规 则 卷 曲 为 主,β 折 叠 较 少。 利 用 Swiss-
Modeling 对 MD-E2 的氨基酸序列进行蛋白质三维结
构的同源建模(图 4),可见结构中含有较多的 α 螺
612
121
181
241
301
361
421
141
481
161
541
181
601
661
721
781
841
901
961
1021
1081
1141
1
图 1 MD - E2 蛋白开放阅读框 cDNA 序列及对应编码的氨基酸序列
1.5
0.5
0
Sc
or
e
0.5
1.5
2.0
1.0
2.5
3.0
20 40 60 80
Position
100 120 140
2.0
1.0
图 3 MD-E2 基因编码蛋白疏水性分析
生物技术通报 Biotechnology Bulletin 2014年第2期110
旋和无规则卷曲,与二级结构预测结果基本吻合。
调节昆虫适应外界环境的过程中的重要蛋白之一[9],
在果蝇体内,泛素-蛋白酶体途径通过降解免疫缺失
的 Reli 蛋白而促进了果蝇体内抗菌肽基因的激活和
表达[10]。研究者把鳗弧菌(Vibrioan guillarum)注
入到贝壳的肌肉内发现,泛素结合酶的表达量有所
增加,而 Boname 和 Lehner[11]也证实了当病毒侵入
机体时,泛素结合酶基因的表达明显上调。对植物
体内泛素体系的研究结果亦表明,泛素结合酶在植
物抗胁迫反应中具有重要的作用,如在热激和重金
属诱导条件下,番茄中的泛素结合酶表达增强[12],
疣粒野生稻中泛素结合酶基因在受百叶枯病病原菌
胁迫 120 h 内随着时间延长表达逐渐增强[13],因此
我们推测,家蝇泛素结合酶可能也参与了家蝇抗病
反应的过程,也是家蝇强大的免疫防御系统中重要
的活性分子之一。
IPR000608
InterPro Match
InterProScanversion: 4.8
Sequence: Sequence_1
Length: 159
CRC64: F02575DD328CBFF7
1
Ubiquitin-conjugating enzyme, E2
Query Sequence Description
UQ_con
UBIQUITIN_CONJLMGAT_2
G3DSA:3.10.110.10
UBQ-conjugat/RWD-like
UBIQLITIN_CONJUGAT_1
PTHR24067:SF51
PTHR24067
UBCc
Launched Fri, May 17
Finished Fri, May 17
159
Ubiquitin-conjugating enzyme/RWD-like
Ubiquitin-conjugating enzyme, active site
SUMO-conjugating enzyme Ubc9
unintegrated
PF00179
PF50127
IPR016135
IPR023313
PS00183
IPR027230
PTHR24067:SF51
nolPR
PTHR24067
SM002 12
G3DSA:3.10.110.10
SSF54495
图 2 家蝇泛素结合酶结构域预测
图 4 MD-E2 蛋白三级结构预测图
Drosophila melanogaster
Musdica housefly
Daphni apulex
Anopheles gambiae str.PEST
Litopenaeus vannamei
Scyllaparamamosain
Nasoniavitripennis
Tribolium castaneum
Rana catesbeiana
Homo sapiens
2.8 系统发育树
MD-E2 基因编码蛋白与其他物种泛素结合酶基
因编码蛋白具有较高的同源性,均在 90% 以上。用
MP 法构建 10 个物种的系统发育树,结果表明,家蝇、
果蝇和冈比亚按蚊的距离最近,双翅目昆虫与甲壳
纲昆虫进化起源于共同祖先。
3 讨论
20 个世纪 80 年代以来,泛素及泛素-蛋白酶体
通路一直是生物学领域的研究热点之一。作为胞内
重要的蛋白质降解体系,泛素系统在免疫信号转导
过程中发挥着重要作用[8]。研究表明,泛素蛋白是
图 5 MP 法构建家蝇与其他真核生物泛素结合酶氨基酸序
列的系统发育树
2014年第2期 111国果等 :家蝇泛素结合酶基因的生物信息学分析
本研究对 MD-E2 的分析表明,该蛋白主要定
位于细胞核,概率为 56.5%,蛋白上具有多个磷酸
化位点,是一个功能活跃的蛋白质。同源性比较分
析结果显示,其碱基序列与已经报道的其他 9 物种
的形似性较高,均为 90% 以上,提示泛素结合酶是
一种高度保守的蛋白。本研究采用生物信息学方法
分析了 MD-E2 的理化特性和结构,不仅丰富了泛素
结合酶蛋白家族基因信息,同时为进一步研究在外
界刺激诱导下,家蝇泛素结合酶的功能与抗病特性
之间的关系,进一步开发家蝇体内丰富的抗菌物质
奠定了一定的理论基础。
4 结论
家蝇 MD-E2 基因含有完整的开放阅读框(480
bp),编码 159 个氨基酸。编码的蛋白质理论分子量
为 18.1 179 kD,等电点 8.64,无信号肽及跨膜区,
属于亲水性蛋白,具有泛素结合酶家族的活性位点,
主要分布于细胞核 ;二级结构以无规则卷曲为主,β
折叠较少。
参 考 文 献
[1] Pickart CM. Back to the future with ubiquitin review[J]. Cell,
2004, 116(2):181-191.
[2] Dikic I, Robertson M. Ubiquitin ligases and beyond[J]. BMC Biol,
2012(10):22.
[3] Núñez-Acuña G, Aguilar-Espinoza A, Chávez-Mardones J, et al.
Ubiquitin-conjugating enzyme E2-like gene associated to pathogen
response in Concholepas concholepas :SNP identification and
transcription expression[J]. Fish & Shellfish Immunology, 2012,
33(4):1065-1068.
[4] Haas TL, Emmerich CH, Gerlach B, et al. Recruitment of the linear
ubiquitin chain assembly complex stabilizes the TNF-R1 signaling
complex and is required for TNF-mediated gene induction[J]. Mol
Cell, 2009, 36(5):831-844.
[5] Li YP, Lecker SH, Chen Y, et al. TNF-alpha increases ubiquitin-
conjugating activity in skeletal muscle by up-regulating UbcH2/
E220k[J]. Federation of American Societies for Experimental
Biology Journal, 2003, 17(9):1048 -1057.
[6] Nagy V, Dikic I. Ubiquitin ligase complexes :from substrate
selectivity to conjugational specificity[J]. Biol Chem, 2010, 391
(2-3):163.
[7] 刘红美 , 张洁 . 热胁迫后家蝇幼虫 cDNA 文库构建与随机 EST
测序分析[J]. 免疫学杂志 , 2010, 26(9):772-775.
[8] 金伟军 , 姚祥春 , 吕美巧 , 等 . 泛素-蛋白酶体系统的结构、作
用和调控机制[J]. 科技通报 , 2008, 24(1):29-34.
[9] 金丰良 , 许小霞 , 张文庆 , 等 . 家蝇泛素编码区 cDNA 序列的克
隆及在原核细胞中的表达[J]. 昆虫学报 , 2008, 51(5):473-
479.
[10] Khush RS, Cornwell WD, Uram JN, et al. A ubiquitin proteasome
pathway represses the Drosophilaimmune deficient signaling
cascade[J]. Curr Biol, 2002, 12(20):1728-17371.
[11] Boname JM, Lehner PJ. What has the study of the K3 and K5 viral
ubiquitin E3 ligases taught us about ubiquitin-mediated receptor
regulation?[J]. Viruses, 2011, 3 :118-131.
[12] Lau OS, Deng XW. Effect of Arabidopsis COP10 ubiquitin
E2 enhancement activity across E2 fa milies and functional
conservation among its canonical homologs[J]. Biochem J, 2009,
418 :683-690.
[13] 蒋春苗 , 黄兴奇 , 付坚 , 等 . 疣粒野生稻泛素结合酶基因的
全长 cDNA 序列克隆与分析[J]. 作物学报 , 2012, 38(5):
808- 813.
(责任编辑 狄艳红)