全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2012年第6期
收稿日期 : 2011-12-19
基金项目 : 国家肉牛牦牛产业技术体系(CARS-38), 公益行业农业科技专项(201003061), 中央公益性科研院所基本科研业务费(16103-
22009002)
作者简介 : 吴晓云 , 男 , 硕士研究生 , 研究方向 : 动物遗传育种 ; E-mail: wxiaoyun1986@yahoo.cn
通讯作者 : 阎萍 , 女 , 研究员 , 博士生导师 , 研究方向 : 动物遗传育种 ; E-mail: pingyan@sohu.com
牛 RHOQ基因的电子克隆与生物信息学分析
吴晓云 阎萍 梁春年 郭宪 包鹏甲 裴杰 丁学智
褚敏 刘文博 焦斐 刘建
(中国农业科学院兰州畜牧与兽药研究所 甘肃省牦牛繁育工程重点实验室,兰州 730050)
摘 要: 利用电子克隆技术获得牛 RHOQ基因 cDNA序列,采用生物信息学方法对该基因及其编码蛋白的基本理化性质、
疏水性、信号肽、二级结构和亚细胞定位等方面进行预测和分析。结果表明,牛 RHOQ基因的 cDNA序列全长 1 517 bp,包含 1
个 618 bp开放阅读框,编码 205个氨基酸;其编码蛋白属疏水性蛋白,不存在信号肽及跨膜结构,定位于分泌系统囊泡;二级结
构主要以无规则卷曲和 α-螺旋为主。牛RHOQ基因编码蛋白可能具有生长因子功能,可能在神经再生和突触延伸过程中起重要作用。
关键词: 牛 RHOQ基因 电子克隆 生物信息学分析
In Silico Cloning and Bioinformatic Analysis of Bovine RHOQ Gene
Wu Xiaoyun Yan Ping Liang Chunnian Guo Xian Bao Pengjia Pei Jie Ding Xuezhi
Chu Min Liu Wenbo Jiao Fei Liu Jian
(Key Laboratory of Yak Breeding Engineering,Lanzhou Institute of Husbandry and Pharmaceutical Sciences of CAAS,Lanzhou 730050)
Abstract: A cDNA sequence of bovine RHOQ was cloned by in silico cloning in this study. Some characters of the RHOQ gene and
encoded protein sequences were predicted and analyzed by the bioinformatics methods in the following aspects, such as general physical and
chemical properties, hydrophobicity, signal peptide, secondary structure and localization sites in cells. Results showed that the full-length of
bovine RHOQ is 1 517 bp long and contains a complete ORF (618 bp) encoding 205 amino acid. The protein encoded by bovine RHOQ gene
has no signal peptide, and no transmembrane domains, it is a hydrophilic protein which is located in vesicles of secretory system. The secondary
structures are mainly composed of helix and coli. Sequence analysis indicated that this gene maybe involved in growth factor, and it may play a
crucial role in nerve regeneration and neurite elongation.
Key words: Bovine RHOQ gene In silico cloning Bioinformatic analysis
Rho(ras homologous)家族基因在控制肌动蛋
白、细胞骨架的重组、细胞黏附与迁移、细胞增殖
与凋亡、平滑肌收缩等多种生物学行为中起重要
调控作用[1-6]。Rho 家族基因包括 RHOA、RHOB、
RAC1、CDC42、RHOQ、RHOE 及 RHOD 等基因[7]。
其中 RHOQ 基因编码的蛋白质为 TC10 小结合蛋白,
TC10 小结合蛋白主要在动物脂肪组织、脑组织和肌
肉中表达[8, 9]。RHOQ 基因最初由 Drivas 等[10]于
1990 年从人畸胎瘤 cDNA 文库中克隆得到。现有研
究表明,TC10 除在控制肌动蛋白和细胞骨架的重组
方面同 Rho 基因亚家族编码蛋白有相似的作用外,
在神经再生和突触延伸过程中也发挥重要的作用。
李志宏等[11]发现,RHOQ mRNA 的表达量在面神
经损伤后急剧增加,认为 RHOQ mRNA 的表达增加
与面神经轴突的伸长密切相关。
目前,对人 RHOQ 基因的研究报道较多,但是
家畜该基因的研究报道很少。本研究用电子克隆(in
silico cloning)的方法,结合牛 cDNA 文库 EST 序列
的拼接结果,分析牛 RHOQ 基因的一般特征以及预
测其编码蛋白的二级和三级结构,旨在为进一步开
2012年第6期 117吴晓云等 :牛 RHOQ 基因的电子克隆与生物信息学分析
展牛该基因进化机制、表达特性、编码蛋白结构及
其生理功能等方面的试验研究提供基础研究资料。
1 材料与方法
1.1 生物信息学数据库和软件
NCBI 网站提供并维护的 GenBank 数据库(http:
//www.ncbi.nlm.nih.gov/)。
NCBI 网站提供的 BLAST 序列比对程序(http://
www.ncbi.nlm.nih.gov/blast/)。
序列拼接网上在线软件 CAP3(http://pbil.univ-
lyon1.fr/cap3.php)。
NCBI 网站提供的寻找开放阅读框的 ORF finder
在线程序(http://www.ncbi.nlm.nih.gov/g orf/gorf.html)。
蛋白质理化性质在线分析软件 Protparam(http://
expasy.org/tools/protparam.html)。
蛋白质疏水性在线分析软件 ProtScale(http://
expasy.org/tools/protscale.html)。
蛋白质信号肽在线分析程序 SignalP 4.0(http://
www.cbs.dtu.dk/services/SignalP/)。
蛋白质跨膜区域在线分析软件 TMHMM Server
v.2.0(http://www.cbs.dtu.dk/services/TMHMM/)。
蛋白质亚细胞定位在线分析网站 PSORT II
(http://psort.nibb.ac.jp/)。
蛋白质结构域预测在线分析软件 Interpro(http://
www.ebi.ac.uk/Tools/pfa/iprscan/)。
氨 基 酸 功 能 位 点 在 线 预 测 网 站 PREDICT
PROTEIN(http://www.predictprotein.org/)。
蛋白质二级结构在线预测网站 SOPMA(http://
npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/
npsa_sopma.html)。
蛋白质三维空间结构在线预测网站 SWISS
MODEL(http://swissmodel.expasy.org/)。
蛋白质功能在线预测网站 ProtFun(http://www.
cbs.dtu.dk/services/ProtFun/)。
1.2 牛RHOQ基因的电子克隆技术路线
以 人 RHOQ 基 因 的 cDNA 序 列(GenBank :
NM_012249)作为种子,通过 BLASTn 程序搜索
GenBank 的牛 EST 数据库。利用在线序列拼接程序
CAP3 对搜索到与人 RHOQ 基因序列相似性较高的
牛 EST 序列进行拼接。以新获得的序列重叠群为种
子重复进行上述步骤,直至不能获得延伸为止。把
电子克隆得到的牛 RHOQ 基因 cDNA 序列,利用
ORF Finder 在线程序预测牛 RHOQ 基因所编码的氨
基酸序列。
1.3 牛RHOQ基因编码蛋白质的生物信息学分析
1.3.1 理化性质分析 ExPASy 网站的在线工具
Protparam 分析牛 RHOQ 基因编码蛋白质的氨基酸
残基性质、分子量及理论等电点等信息,并用该网
站在线工具 ProtScale 分析蛋白质的疏水性质 ;利用
丹麦 Tekniske 大学生物学序列分析中心(CBS)的
SignalP3.0 和 TMHMM Server v.2.0 在线分析程序预测
蛋白质的信号肽位点和跨膜区域。
1.3.2 亚细胞定位 利用 PSORT II 在线分析网站分
析蛋白质发挥作用的细胞器。
1.3.3 结构及功能预测 利用 Interpro 和 PREDICT
PROTEIN 在线分析软件预测蛋白质中包含的结构域
和氨基酸功能位点 ;利用 SOPMA 和 SWISS MODEL
在线预测网站预测蛋白质的二级结构和三级结构 ;
利用 ProtFun 在线网站预测蛋白质的功能。
1.3.4 系统发育分析 从 NCBI 数据库下载 5 个物种
的 RHOQ 基因编码蛋白序列,包括 AAM21123.1(人,
Homo sapiens)、BAA96292.1(大鼠,Rattus norvegic-
us)、BAB91068.1 (小鼠,Mus musculus)、XP_00149-
8365.2(马,Equus caballus)和 XP_003125214.3(猪,
Sus scrofa)。多序列比对及同源性分析采用 MegAlign
软件分析 ;系统进化分析利用 MEGA4.1 软件。
2 结果
2.1 牛RHOQ基因的电子克隆和开放阅读框分析
利用人 RHOQ 基因的 cDNA 序列作为探针,对
牛 EST 数据库进行 BLASTn 检索,将得到的高度相
似的 EST 序列进行拼接,得到一条 contig。然后以
此 contig 作为种子序列,重复进行上述步骤,直至
不能获得延伸为止,最终得到一条 1 517 bp 的序列,
并通过 BLAST 序列比对确定为牛 RHOQ 基因。使用
NCBI 的 ORF Finder 程序对克隆的牛 RHOQ 基因序
列进行开放性阅读框分析,得知 RHOQ 为单外显子
基因,含有一个长度为 618 bp 的开放阅读框,编码
205 个氨基酸(图 1),起始密码子为 ATG,终止密
码子为 TGA,编码区左侧有 281 bp 的 5非翻译区。
生物技术通报 Biotechnology Bulletin 2012年第6期118
图 1 牛 RHOQ基因和编码蛋白的序列
2.2 牛RHOQ基因编码蛋白的理化性质
该蛋白分子式为 C1016H1615N259O295S15,分子量为
22.659 4 kD,理论等电点为 5.94。含有 20 种基本氨
基酸,其中含量最高的是 Leu(10.2%),含量最低
的是 Trp(0.5%);含有带负电荷的残基 24 个,正
电荷残基 22 个,其水溶液在 280 nm 处的消光系数
约 19 535。该蛋白的平均亲水系数是 0.05。另外牛
RHOQ 基因编码蛋白中含有 10 个 Cys,分别位于
第 12、24、87、144、158、159、163、198、201 和
202 位氨基酸(图 1)。
2.3 牛RHOQ基因编码蛋白的疏水性/亲水性预测
和分析
依据氨基酸分值越低亲水性越强和分值越高疏
水性越强的规律可知,牛 RHOQ 基因的编码蛋白多
肽链第 71 位 Asp 具有最低的分值 -2.456 和最强的亲
水性 ;第 87 位 Cys 具有最高的分值 3.133 和最强的
疏水性。整个多肽链表现为疏水性(图 2)。该结果
与 DNASTAR 软件分析结果基本一致。
2.4 牛RHOQ基因编码蛋白信号肽和跨膜区分析
蛋白信号肽分析,结果(图 3)表明,该蛋白
不存在信号肽,属于非分泌蛋白。编码蛋白所有氨
基酸都位于膜表面,证实牛 RHOQ 基因编码蛋白是
一种表面蛋白。
2.5 牛RHOQ基因编码蛋白的亚细胞定位
牛 RHOQ 基因编码蛋白的亚细胞定位分析结
果(表 1)可知,其分布在分泌系统囊泡的可能性
为 33.3%,分布在细胞质和高尔基体中的可能性为
图 2 牛 RHOQ基因编码蛋白疏水性分析
图 3 牛 RHOQ基因编码蛋白的信号肽分析
22.2%,分布在质膜和细胞核中的可能性为 11.1%。
推断牛 RHOQ 基因编码蛋白可能主要在分泌系统的
囊泡中发挥生物学作用。
2.6 牛RHOQ基因编码蛋白结构域和蛋白质功能
位点预测
用 Interpro 在线工具对牛 RHOQ 基因编码蛋白
2012年第6期 119吴晓云等 :牛 RHOQ 基因的电子克隆与生物信息学分析
41、121、173 位处),2 个豆蔻酰基化位点(分别位
于 60 和 148 位处)和 1 个三磷酸鸟苷的结合域(位
于 16 位处)。
2.7 二级结构和三级结构预测
用 SOPMA 服务器预测牛 RHOQ 基因编码蛋白
的二级结构,结果(图 5)表明,该蛋白由 36.10% α-
螺旋、20.98% 延伸链、4.88% β-转角和 38.05% 无规
则卷曲组成。可推断无规则卷曲 α-螺旋和延伸链是
牛 RHOQ 基因编码蛋白主要的二级结构元件,无规
则卷曲散布于整个蛋白中。将牛 RHOQ 基因编码蛋
白序列提交至 SWISS-MODEL,采用同源建模法,结
果(图 6)显示,该蛋白主要由 α-螺旋、延伸链和
无规则卷曲组成,与二级结构预测结果基本一致。
表 1 牛 RHOQ基因编码蛋白的亚细胞定位
亚细胞定位 可能性(%)
分泌系统囊泡 33.3
细胞质 22.2
高尔基体 22.2
质膜 11.1
细胞核 11.1
图 4 牛 RHOQ基因编码蛋白的结构域预测
2.8 牛RHOQ基因编码蛋白的系统发育分析
牛 RHOQ 基因编码蛋白与其他物种 RHOQ 基
因编码蛋白具有较高的同源性,均在 90% 以上。用
MP 法构建了 6 个物种的 RHOQ 基因系统发育树,
结果(图 7)表明,牛与人、马和猪在系统发育树
中距离最近,这与动物学分类结果一致。
2.9 牛RHOQ基因编码蛋白功能预测与分析
牛 RHOQ 基因编码蛋白的功能分析结果(表 2)
竖线由长至短依次为:α-螺旋(h),延伸链(e),β-转角(t),无规则卷曲(e)
图 5 牛 RHOQ基因编码蛋白的二级结构预测
可知,该蛋白具有生长因子(Growth factor)功能的
可能性是 2.261,说明其极可能发挥生长因子作用。
3 讨论
电子克隆是基于基因组计划和 EST 计划基础上
发展起来的基因克隆新方法,与传统方法相比,具
有成本低、效率高、技术要求低和针对性强等优
点[12]。采用生物信息学方法将 EST 序列进行电子序
列延伸分析,将为实践研究提供重要的基础资料[13]。
进行结构域预测,结果(图 4)显示该序列具有完
整的 Rho 家族蛋白功能域。运用 PREDICT PROTEIN
在线服务器对牛 RHOQ 基因编码蛋白分析,可知
该蛋白含有 3 个蛋白激酶 C 磷酸化位点(分别位于
167、184、189 位处),1 个磷酸腺苷磷酸化位点(位
于 186 位处),3 个肌酸激酶磷酸化位点(分别位于
生物技术通报 Biotechnology Bulletin 2012年第6期120
目前牛 EST 数据库已经非常丰富,而且 EST 数据每
天都在更新,利用电子克隆分离牛基因将极大加速
牛新基因的发现和功能鉴定研究。但应当注意,由
于某些基因存在多种剪切形式,电子克隆获得的结
果只能作为参考,所以,真正的 cDNA 序列还需通
过试验获得并进行验证。
Rho 家族基因的编码蛋白作为信号转换器或分
子开关在细胞的信号转导通路中,作用于细胞骨架
或其靶蛋白而产生多种生物效应。Rho 家族蛋白具
有自身 GTP 酶活性,其作为分子开关以 GTP 结合状
态(活性状态)和 GDP 结合状态(非活性状态)存
在,通过两者间的相互转换,引发或终止细胞级联
活化反应[14]。Rho 家族的 RHOQ 基因在促进囊泡融
合、胞外分泌和神经突触的生长过程中发挥重要作
用[8, 15]。许多研究表明,在胰岛素刺激葡萄糖运载
体 4(Glut-4)胞外分泌的过程中,主要由 RHOQ 基
因发挥调节功能[16-19]。
本研究发现牛 RHOQ 基因含有一个长度为 618
bp 的开放阅读框,编码 205 个氨基酸,该编码蛋白
序列中存在 10 个 Cys。蛋白质中 Cys 残基的巯基基
团可发生氧化反应形成二硫键,疏水氨基酸残基围
绕着二硫键,可形成局部疏水中心,拒绝水分子进
入肽的内部破坏氢键,利于形成稳定的高级结构区
域[20]。因此可以推断牛 RHOQ 基因编码蛋白中可能
含有二硫键,这也许对维持其结构稳定及功能行使
具有重要意义。该蛋白具有 Rho 基因家族保守的序
列特征,为疏水性的表面蛋白,其二级结构主要由 α-
螺旋、延伸链和无规则卷曲组成 ;其亚细胞定位在
分泌系统囊泡,该结果与 David 等[21]通过在动物细
胞中定位 RHOQ 基因编码蛋白的结果一致。蛋白质
中的功能位点可提供蛋白质的功能信息,具有重要
的生物学意义。蛋白质功能位点预测牛 RHOQ 基因
编码蛋白有 3 个蛋白激酶 C 磷酸化位点,说明该蛋
白在行使生理生化功能前或者与其他蛋白互作时可
能需要磷酸化的活化。Kazuho 等[15]发现 RHOQ 基
因编码蛋白能通过水解自身 GTP,促进囊泡的融合。
本研究发现,牛 RHOQ 基因编码蛋白在 16 位具有 1
个 GTP(三磷酸鸟苷)的结合位点,表明该蛋白可
能在促进囊泡融合过程中发挥作用。序列比对和系
统进化分析显示,牛 RHOQ 基因编码蛋白与其他物
种 RHOQ 基因编码蛋白具有较高的同源性,且与物
种进化的结果相一致,提示 RHOQ 基因可能由同一
个祖先基因进化而来,同时也反映了 RHOQ 基因编
码产物在不同物种结构上的稳定性对生物体的功能
重要性。Tanabe 等[22]发现,大鼠的 RHOQ 基因在
神经突触的生长过程中发挥关键的作用。本研究预
测牛 RHOQ 基因编码蛋白具有生长因子的功能,推
图 6 牛 RHOQ基因编码蛋白的三级结构预测
图 7 MP法构建的 RHOQ基因系统发生树
表 2 牛 RHOQ基因编码蛋白功能分析结果
GO 功能 机率
信号转导 0.224
受体 0.102
荷尔蒙 0.206
结构蛋白 0.063
运载体 0.229
离子通道 0.221
电压门控离子通道 0.116
阳离子通道 0.231
转录 0.357
转录调节 0.346
胁迫应答 0.490
免疫应答 0.129
生长因子 2.261
金属离子转移 0.020
2012年第6期 121吴晓云等 :牛 RHOQ 基因的电子克隆与生物信息学分析
测该蛋白可能作用于神经突触的生长,但其真正的
生物学功能,仍需后续的研究进行验证。
4 结论
本研究电子克隆出牛 RHOQ 基因的 cDNA 序
列并进行序列分析,结果表明,牛 RHOQ 基因的
cDNA 序列全长 1 517 bp,包含一个 618 bp 的开放阅
读框,编码 205 个氨基酸 ;其编码蛋白属于疏水性
蛋白,定位于分泌系统囊泡,二级结构主要以无规
则卷曲和 α-螺旋为主 ;该蛋白可能在神经再生和突
触延伸过程中起重要作用。
参 考 文 献
[1] Hall A. Rho GTPases and the actin cytoskeleton. Science, 1998, 279:
509-514.
[2] Tybulewicz VLJ, Henderson RB. Rho family GTPases and their
regulators in lymphocytes. Nature Reviews Immunology, 2009, 9
(9):630-644 .
[3] Boureux A, Vignal E, Faure S, et al. Evolution of the Rho family of
Ras-Like GTPases in eukaryotes. Mol Biol Evol, 2007, 24(1):
203-216.
[4] Machacek M, Hodgson L, Welch C, et al. Coordination of Rho GTPase
active ties during cell protrusion. Nature, 2009, 461(3): 99-103.
[5] Kjøller L, Hall A. Signaling to Rho GTPases. Exp Cell Res, 1999,
253 (1): 166-179.
[6] Grise F, Bidaud A, Moreau V. Rho GTPases in hepatocellular carci-
noma. Biochimica et Biophysica Acta (BBA)-Reviews on Cancer,
2009, 1795(2): 137-151.
[7] Heasman SJ, Ridley AJ. Mammalian Rho GTPases: new insights into
their functions from in vivo studies. Nature Review Molecular Cell
biology, 2008, 9(9): 690-701.
[8] Kreis P, Barnier JV. PAK signalling in neuronal physiology. Cellular
Signalling, 2009, 21(3): 384-393.
[9] van Helden SF, Hordijk PL. Podosome regulation by Rho GTPases in
myeloid cells. Eur J Cell Biol, 2011, 90(2-3): 189-197.
[10] Drivas GT, Shih A, Coutavas E, et al. Characterization of four novel
ras-like genes expressed in a human teratocarcinoma cell line. Mol
Cell Biol, 1990, 10(4): 1793-179.
[11] 李志宏 , 金岩 , 聂鑫 . 小 GTP 结合蛋白 TC10 在面神经元再生
中的表达及其意义 . 中华创伤杂志 , 2002, 18(2): 94-96.
[12] Feng YJ, Zhang HM, Jiang MG, et al. In silico cloning of ful length
cDNA of Cryphonectria parasitica ubiquitin conjugated enzyme
gene(CpUBC). Chinese J Bioinformatics, 2004, 2: 5-9.
[13] 王琦 , 李玮妮 , 王荣 .蜜蜂TPI基因克隆与生物信息学预测 .生
物技术通报 , 2011(9): 108-113.
[14] Haeusler LC, Blumenstein L, Stege P. Comparative functional
analysis of t he Rac GTPases. FEBS Lett, 2003, 555(3):
556-560.
[15] Kawase K, Nakamura T, Takaya A, et al. GTP hydrolysis by
the Rho family GTPase TC10 promotes exocytic vesicle fusion.
Developmental Cell, 2006, 11(3): 411-421.
[16] Jun HS, Hwang K, Kim YJ, et al. High-fat Diet Alters PP2A, TC10,
and CIP4 expression in visceral adipose tissue of rats. Obesity,
2008, 6(16): 1226-1231.
[17] Okada S, Yamada E, Saito T, et al. CDK5-dependent phosphoryla-
tion of the Rho family GTPase TC10α regulates insulin-stimulated
GLUT4 translocation. Journal of Biological Chemistry, 2008, 283
(9): 35455-35463.
[18] Saitoa M, Lessardb SJ, Rivas DA, et al. Activation of atypical
protein kinase Cζ toward TC10 is regulated by high-fat diet and
aerobic exercise in skeletal muscle. Metabolism Clinical and
Experimental, 2008, 57(9): 1173-1180.
[19] Chang L, Chiang SH, Saltiel AR. TC10α is required for insulin-
stimulated glucose uptake in adipocytes. Endocrinology, 2007, 148
(1):27-33.
[20] 徐国恒 . 二硫键与蛋白质的结构 . 生物学通报 , 2010, 45(5):
5-7.
[21] Michaelson D, Silletti J, Murphy G, et al. Differential localization
of Rho GTPases in live cells regulation by hypervariable regions
and Rhogdi binding. JCB, 2001, 152(1): 111-126.
[22] Tanabe K, Tachibanb T, Yamashita T, et al. The small GTP-
binding protein TC10 promotes nerve elongation in neuronal cells,
and is expression is induced during nerve regeneration in rats. J
Neurosci, 2000, 20(11): 4138- 4144.
(责任编辑 马鑫)