免费文献传递   相关文献

东亚三角涡虫Rab蛋白cDNA序列的克隆与生物信息学分析



全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2012年第2期
收稿日期 : 2011-07-25
基金项目 : 国家自然科学基金项目(30670279,30970346)
作者简介 : 姚杨 , 女 , 硕士研究生 , 研究方向 : 动物生化与分子 ;E-mail:yaoyang1220@sina.com
通讯作者 : 黄原 , 男 , 教授 , 博士生导师 , 研究方向 : 昆虫的分子进化和分子系统学 ;E-mail:yuanh@snnu.edu.cn
东亚三角涡虫 Rab 蛋白 cDNA 序列的克隆与
生物信息学分析
姚杨1 黄原2 苏杰1
(1西安医学院附属医院,西安 710077 ;2 陕西师范大学生命科学学院,西安 710062)
摘 要 : 通过构建东亚三角涡虫(Dujesia japonica)cDNA 文库,随机挑选重组阳性克隆进行测序,对部分序列进行引物步
移法测序,获得 1 个三角涡虫新基因——Rab 蛋白基因(DjR),涡虫 Rab 蛋白 cDNA 全长 2 141 bp,开放性阅读框(ORF)621
bp,编码 206 个氨基酸,相对分子量为 23.1 kD,等电点 6.59,属亲水性蛋白,主要定位于细胞质中,在氨基酸第 20 和 21 位之间
有信号肽剪切位点。有 8 个磷酸化位点。含有小 G 蛋白家族 5 个保守的鸟苷酸结合区域。同源性比较分析结果表明,其碱基序列
与已经报道的其他 23 个物种的相似性为 53%-90%,且符合种属之间的进化关系。
关键词 : 三角涡虫 Rab 蛋白 cDNA 文库 生物信息学分析
Cloning and Bioinformatic Analysis of Rab cDNA from
Dujesia japonica
Yao Yang1 Huang Yuan2 Su Jie1
(1The First Affiliated Hospital of Xian Medical University,Xian 710077 ;2College of Life Sciences of
Shaanxi Normal University,Xian 710062)
Abstract: A cDNA library was constructed from Dujesia japonica adult stage. Clones were selected randomly from the cDNA library
and were sequenced by using the method of expression sequence Tags (ESTs). Novel genes were acquired by primer walking. The Rab gene
sequence is 2 141 bp in length,contains an ORF of 621 base pairs and encodes a polypeptide of 206 residues with a predicted molecular
weight about 23.1 kD and pI 6.59. Rab protein contain five guanine nucleotide binding domains (GNB, this domain plays a key role in molecular
regulation, and are highly conserved among plants, yeasts and animals. The deduced amino acid sequence of Dujesia japonica Rab showed
53%-90% identity with the others species.
Key words: Degusia japonica Rab protein cDNA library Bioinformatic analysis
三角涡虫(Dujesia japonica)是扁形动物门涡
虫纲动物,因具有形态学的可塑性及独特的再生能
力成为再生生物学、神经生物学和发育生物学研究
的模式动物[1]。近年来,涡虫研究进入基因组学和
功能基因组学领域,这些研究有助于从基因组水平
上揭示后生动物进化、发育和再生的共同机制[2]。
Rab 蛋白是小 G 蛋白家族成员最多的亚家族,分子
量在 20-30 kD 之间,主要功能表现在物质的跨膜转
运和分泌方面[3]。
1 材料与方法
1.1 材料
1.1.1 动物及培养条件 试验用的三角涡虫采集于
陕西省西安市南五台山。传统的采集方法已经沿用
了许多年[4],但效率低下等问题仍需要解决,本研
究将采集方法进行了改进。由于涡虫有饱食后离开
诱饵的习惯,先找一处适合涡虫生长的溪流,将鸡
2012年第2期 145姚杨等 :东亚三角涡虫 Rab 蛋白 cDNA 序列的克隆与生物信息学分析
肉火腿肠或鸡肝末撒在水中,过大约 30-40 min 之后,
采集聚集在诱饵周围的涡虫,可以多处撒诱饵,增
加捕捉效率,此方法节省人力和物力。实验室中涡
虫在 15℃恒温箱中饲养[5]。
1.1.2 试剂 TaKaRa TaqTM DNA 聚合酶为(大连)
宝生物公司产品, DEPC 购自 Sigma 公司 ;胰蛋白
胨、酵母提取物购自上海生工 ;胶回收试剂盒购自
安徽优晶,CreatorTM SMARTTM cDNA Kit 和 Advantage
2PCR Kit 均 为 Clonetech 公 司 产 品 ;QIAquick Gel
Purification Kit 由 QIAgen 提供,DH10B 感受态细胞
由 Invitrogen 提供。 其他试剂均为国产分析纯。
1.2 方法
1.2.1 cDNA 文库的构建 按照 Trizol 试剂盒操作抽
提三角涡虫 RNA[6],并用 Oligotex mRNA Midi kit 纯
化 mRNA,采用 Clonetech 试剂盒的 Creator SMART
cDNA Kit 构建涡虫 cDNA 文库[7,8]。检测后核对文库
质量,菌液滴度为 6×105 cfu/mL,插入片段均大于
1 kb,分布在 1-3 kb 之间。连接产物为 10 μL,库容
为 3×106 克隆,这说明成功构建了一个高质量的涡
虫 cDNA 文库。100 ng 初溶液到 0.25 μm Millipore 纯
化膜上脱盐纯化 1 h。取 2 μL 电击转化至大肠杆菌
DH10B 中,电击 2.1 kV,放入 37℃摇床,120 r/min,
复苏 1 h。放入 50% 体积的 80% 甘油保菌。取 2 μL
菌液涂于氯霉素平板上,37℃培养过夜。
1.2.2 测序 挑选单个阳性克隆,ABI3730 进行测
序,应用 DNATools program 分析 1 000 多个克隆[9]。
然 后 根 据 前 一 次 测 序 结 果 设 计 2 条 测 序 引 物 :
5-GTGGTCTAGATGTGCACAAG-3 和 5-TGGGTCTA
GTITACTGCTGT-3,向下测序直到出现 PolyA。将
测序结果进行编辑后获得新基因的全长 cDNA 序列。
1.2.3 生物信息学分析与系统树构建 利用 NCBI
ORF Finder[10](http://www.ncbi.nlm.nih.gov/gorf/gorf.
html)在线工具查找三角涡虫 Rab 基因开放式读码
框 ;NCBI blastp 比对涡虫 Rab 蛋白及 GenBank 中的
蛋白,并用 CLUSTALW[11]软件分析三角涡虫、家鼠、
犬和人等 24 个 Rab 蛋白氨基酸序列相似性 ;使用
Mega4.0[12]软件基于 NJ 法[13]构建系统进化树。应
用 ProtParam,ProtScal,PSORT Ⅱ,TMHMM,SOP-
MA 等在线分析软件,对三角涡虫 Rab 基因进行结
构和功能的分析和预测。
2 结果
2.1 总RNA的提取
以涡虫为材料提取总 RNA,琼脂糖凝胶电泳
见图 1。电泳结果可看见清楚的 28S 和 18S 两条带,
OD260/280 为 2.01 说明涡虫未降解,18S 约是 28S 的两
倍,这种情况归因于涡虫的物种特异性。
图 1 三角涡虫总 RNA 电泳图
2.2 开放阅读框分析
利用 NCBI ORF Finder 在线对三角涡虫 Rab 基
因分析,在 +3 阅读框有最长的开放式读码框,长
度为 621 bp,编码 206 个氨基酸,起始密码子 ATG
位 于 216-219 位 核 苷 酸, 终 止 密 码 子 TAA 位 于
834-836 位核苷酸。起始于涡虫氨基酸序列的 15
位的 GDSGVGK 负责与鸟氨酸 α、β 亚基连接,40
位 的 苏 氨 酸 与 Mg2+ 连 接,DTAG(63-66) 负 责 与
Mg2+,γ 磷 酸 基 连 接,GNKVD(124-128)、 ECSAK
(153-157)识别鸟嘌呤,以上是与 GTP 结合和水解
有关的高度保守区域,C 端的 CXC 中半胱氨酸的异
戊二烯化修饰可膜锚定到膜上。该区域为膜定位信
号[14](图 2)。
2.3 DjR及其推导的氨基酸序列的同源性分析
将涡虫 Rab 蛋白与 NCBI 数据库在核苷酸和蛋
白质一级结构水平上进行同源性比较,结果(表 1)
表明,该蛋白在进化中十分保守,与其他 23 个物种
Rab 氨基酸水平的相似性为 53%-90%。序列比对说
明该蛋白氨基酸水平高度相似,说明其在近缘物种
间高度保守,因此推断 cDNA 编码的为涡虫 Rab 蛋白,
并将其命名为 DjR。
2.4 DjR蛋白的理化性质分析
利用 ExPASy 在线工具 ProtParam 预测三角涡虫
Rab 蛋白编码的氨基酸序列(表 2)表明[16],蛋白
生物技术通报 Biotechnology Bulletin 2012年第2期146
起始密码子 ATG 和终止密码子 TAA 用粗体方框表示 ;5 个保守区域的鸟苷酸结合区域用下划线标注
图 2 涡虫 Rab 蛋白基因全长序列及其编码的氨基酸序列
物种 同一性(%) 相似性(%) 物种 同一性(%) 相似性(%)
Sequenced 100 100 Marsupenaeus japonicus 77 89
Rattus norvegicus 74 87 Litopenaeus vannamei 77 89
Canis lupus familiaris 74 88 Neurospora crassa 67 80
Homo sapiens 74 88 Dictyostelium discoideum 70 82
Xenopus tropicalis 75 88 Schistosoma japonicum 32 53
Danio rerio 74 88 Schistosoma mansoni 67 82
Osmerus mordax 77 87 Caenorhabditis elegans 73 86
Trichoplax adhaerens 74 88 Brugia malayi 70 84
Pinctada martensi 74 90 Tetrahymena thermophila 67 80
Drosophila melanogaster 71 84 Paramecium octaurelia 62 77
Aedes albopictus 72 88 Leishmania donovani 48 63
Penaeus monodon 77 89 Trypanosoma brucei brucei 48 64
表 1 三角涡虫与其他近缘物种 Rab 蛋白基因氨基酸序列同源性
2012年第2期 147姚杨等 :东亚三角涡虫 Rab 蛋白 cDNA 序列的克隆与生物信息学分析
质分子量为 23.1 kD,等电点为 6.59 ;出现频率最高
的 3 种氨基酸为 Val (V) 8.7 %,Ala (A) 8.3 %,Asp
(D) 7.8 %,其中碱性氨基酸(Arg+Lys)26 个,酸
性氨基酸(Asp+Glu)26 个。不稳定系数为 30.04,
说 明 该 蛋 白 稳 定, 脂 肪 系 数 为 79.03,GRAVY
为 -0.282,说明此蛋白是亲水性的。
2.5 DjR亲疏水性、亚细胞定位预测
蛋白质的结构决定其生理功能,而氨基酸的亲
水性 / 疏水性直接影响蛋白质的结构和功能[17]。因
此,根据 Kyt 等[18]对蛋白质亲水性 / 疏水性分析原
理,利用 ExPASy ProtScal 程序,对 DjR 蛋白亲疏水
性进行分析。图 3 所示,横坐标为氨基酸序列,纵
坐标为氨基酸标度,值越大表示疏水性越强。DjR
疏水性最大值是 2.789,最小值是 -3.256,整个氨基
酸序列中亲水性多于疏水性。TMHMM 软件预测表
明此蛋白不含跨膜位点 ;PSORT Ⅱ对 DjR 蛋白质的
亚细胞定位预测[19]表明,该蛋白可能位于细胞质
中,可信度为 89%,据此推测 DjR 为胞质蛋白。另外,
经 SignalP 3.0 程序预测 DjR,结果(图 4)表明,在
第 20 位到 21 位之间 C 值达最大、S 陡峭、Y 值达
到最高峰,此处预测为信号肽剪切位点。
2.6 DjR的二级结构预测
采用 SOPMA 在线分析软件[15]预测 DjR 的二
级 结 构, 结 果( 图 5) 显 示,DjR 含 有 36.89% 的
无规则卷曲,33.01% 的 α- 螺旋,21.84% 的延伸链
和 8.25% β- 转角。可以看出,DjR 蛋白含有较多的
氨基酸种类 数量 所占比例(%) 氨基酸种类 数量 所占比例(%)
Ala (A) 17 8.3 Leu (L) 13 6.3
Arg (R) 12 5.8 Lys (K) 14 6.8
Asn (N) 10 4.9 Met (M) 5 2.4
Asp (D) 16 7.8 Phe (F) 12 5.8
Cys (C) 6 2.9 Pro (P) 7 3.4
Gln (Q) 12 5.8 Ser (S) 14 6.8
Glu (E) 10 4.9 Thr (T) 9 4.4
Gly (G) 12 5.8 Trp (W) 3 1.5
His(H) 1 0.5 Tyr (Y) 4 1.9
Ile (I) 11 5.3 Val (V) 18 8.7
表 2 DjR 序列中各种氨基酸的数量和所占比例
图 3 Rab 蛋白氨基酸序列疏水性分析 图 4 Rab 微管蛋白氨基酸序列信号肽预测
图 5 Rab 蛋白蛋氨基酸序列二级结构预测
竖线由长至短依次为 α-螺旋、延伸链、β-转角、无规则卷曲
生物技术通报 Biotechnology Bulletin 2012年第2期148
无规则卷曲和 α-螺旋,延伸链和 β-转角散布于整个
蛋白中。
2.7 DjR磷酸化位点预测
磷酸化和去磷酸化在多种真核细胞中具有重
要的作用,如新陈代谢、细胞分裂以及信号转导
等,DjR 蛋白含有比普通蛋白质更多的丝氨酸,推
测该蛋白可能含有较多的潜在磷酸化位点。利用
NetPhos2.0 Server 在线工具预测 DjR 磷酸化位点 [20],
结果(图 6)发现,有第 22、100、134、144、154、
177 和 198 位丝氨酸及第 2 位的苏氨酸可能被磷酸化。
总体 DjR 蛋白中磷酸化位点比正常蛋白多,推测功
能的发挥可能与激酶磷酸化有关。
图 6 NetPhos2.0 Server 预测 DjR 磷酸化位点
2.8 DjR cDNA序列和氨基酸序列系统进化分析
选自不同种属的 24 个 Rab 蛋白进行分析,包括:
家鼠 Rattus norvegicus(BAE17000.1)、犬 Canis lupus
familiaris(NP_001003316.1)、人 Homo sapiens(AAA
86640.1)、非洲爪蟾蜍 Xenopus(Silurana)tropicalis
(NP_001008026.1)、 斑 马 鱼 Danio rerio(NP_95722
2.1)、胡瓜鱼 Osmerus mordax(ACO09289.1)、丝盘虫
Trichoplax adhaerens(XP_002108937.1)、马氏珠母贝
Pinctada martensi(ACO40522.1)、果蝇 Drosophila mel-
anogaster (NP_524472.1)、伊蚊 Aedes albopictus(ABL
74414.1)、草对虾 Penaeus monodon(ABB70064.1)、
日本对虾 Marsupenaeus japonicus(BAG06944.1)、凡
纳滨对虾 Litopenaeus vannamei(ACT65737.1)、粗糙
脉孢菌 Neurospora crassa(XP_961487.1)、盘基网柄
菌 Dictyostelium discoideum(AAA80152.1)、日本血吸
虫 Schistosoma japonicum(CAX69526.1)、 曼 氏 裂 体
吸 虫 Schistosoma mansoni(XP_002577945.1)、 秀 丽
杆线虫 Caenorhabditis elegans(NP_496549.1)、马来
布鲁线虫 Brugia malayi(XP_001894651.1)、四膜虫
Tetrahymena thermophila(BAA88954.1)、草履虫 Para-
mecium octaurelia(AAL08054.2)、利氏曼虫 Leishm-
ania donovani(ABS58502.1)、锥虫 Trypanosoma brucei
(CAJ30027.1)。结果(图 7)表明,涡虫 Rab 蛋白
先于血吸虫聚为一支,再与扁形动物、脊椎动物、
节肢动物聚在一起。
3 讨论
自 从 1830 年 Duges 首 次 发 现 涡 虫 并 命 名 为
Planaria gonocephala 以来[21],涡虫作为一种模式生
物被用于发展及进化的研究已有 200 多年的历史。
早期的研究基于药理学和形态学研究,而分子生物
学、功能基因组学和生物信息学的发展为涡虫基因
发现和进化开辟新途径。
Rab 是 Ras 超家族中最大的家族,定位在细胞
器中,在细胞器识别机制中 Rab 是重要的识别元
件,调节大部分胞内转运事件,在囊泡的定向运输
中发挥作用。自 Novick 等[22]最早从芽殖酵母(S.
cerevisiae)中发现 Rab 蛋白以来, 已经从人类、水稻
中克隆出了 Rab 蛋白基因,其存在于所有真核生物
中,进化过程中比较保守,但不同物种表现出数量
和功能的多样性。
线虫(Caenorhabditis elegans)、果蝇(Drosophila
melanogaster) 编码 29 种 Rab 蛋白,拟南芥 (Arabidops-
is thaliana)编码 57 种 Rab 蛋白,人类(Homo sapie-
ns)有 60 余种是目前最大的家族,而最小数量的
Rab 蛋白基因在裂殖酵母(S. pomb)中仅编码 7 个
Rab 蛋白。Rab 蛋白家族成员的氨基酸序列的相似
性在 35%-80% 之间,也有大于 80%,这与本研究
得出的结论相似。
目前,利用生物信息学资源进行基因的克隆、
结构分析以及功能预测已经成为生物学研究领域的
2012年第2期 149姚杨等 :东亚三角涡虫 Rab 蛋白 cDNA 序列的克隆与生物信息学分析
热点。为了方便快捷地获得有价值的信息,许多模
式生物被看作标准的平台被用于基因功能的研究。
总之,表达序列标签法、步移法测序与生物信息学
技术三者相结合,有利于快速发展三角涡虫新基因,
同时能预测该基因功能及其表达产物性质为涡虫基
因组或蛋白组研究及进化关系提供重要根据。随着
对涡虫研究的重视,基因库中三角涡虫基因序列数
据迅猛增长,迄今为止,在 GenBank 登录的涡虫
ESTs 已达 1 104 005 条,但只对极少数 ESTs 开展了
详细研究,多数基因有待进一步研究。
4 结论
本 试 验 从 涡 虫 体 内 扩 增 出 2 141 bp 全 长 的
cDNA 序列,包含 621 bp 编码区,编码 206 个氨基酸,
与文献中所提的 Rab 蛋白编码 200 个左右氨基酸相
一致。氨基酸序列比对结果表明,DjR 与其他 23 个
物种的相似性为 53%-90%,说明氨基酸序列具有
较高的相似性。运用 Clustal X 对涡虫及多种生物的
Rab 氨基酸序列进行多重序列比对,利用 MeGa4.0
软件基因 NJ 法构建系统进化树。DjR 与血吸虫有较
近的亲缘关系,之后再与其他物种聚为一支,这与
涡虫 HSP70 构建的亲缘关系分析相一致。
参 考 文 献
[1] Sánchez Alvarado A, Kang H. Multicellularity stem cells and the
neoblasts of the planarian Schmidtea mediterranea. Experimental
Cell Research, 2005, 306(2):299-308.
[2] Sánchez Alvarado A. Freshwater planarian Schmidta mediterranea:
embryogenesis stem-cells and regeneration. Current Opinion in
Genetics & Development, 2003, 13(4):438-444.
[3] Takai Y, Sasaki T, Matozaki T. Small GTP-binding proteins.
图 7 涡虫与其他物种 Rab 氨基酸序列的进化树(节点值表示重复 1000 次的自举值)
生物技术通报 Biotechnology Bulletin 2012年第2期150
Physiological Reviews, 2001, 81(1):153-208.
[4] Deri P, Colognato R, Ross: L, et al. A karyological study on
populations of Dugesia goncephala S.I. (Turbellaria, Tricladida).
Italian Journal of Zoology, 1999, 66(3):245-253.
[5] 陈广文 , 马克学 . 淡水涡虫 : 分类地位、胚胎发生和再生 . 河南
师范大学学报 : 自然科学版 , 2008, 36(4):140-144.
[6] Gelsthorpe AR, Gelsthorpe K, Sokol RJ. Rapid isolation of total
RNA from small samples of hypocelluar dense connective tissues.
BioTechniques, 1997, 22(6):11082-1086.
[7] 曲晓娟 , 王源 , 耿文君 , 赵博生 . 东亚三角涡虫 cDNA 文库的构
建及 EST 初步分析 . 四川动物 , 2008, 27(2):205-209.
[8] He M, Xia Y. Construction and analysis of a normalized cDNA
library from Metarhizium anisopliae var. acridum germinating and
differentiating on Locusta migratoria wings. Microbiology & Virology,
2008, 291(1):127-135.
[9] Rehm BH. Bioinformatic tools for DNA/protein sequence analysis,
functional assignment of genes and protein classification. Appl
Microbiol Biotechnol, 2001, 57(5-6):579-592.
[10] Altschul SF, Madden TL, Schäffer AA, et al. Gapped BLAST and
PSI-BLAST: A new generation of protein database search programs.
Nucleic Acids Res, 1997, 25(17):3389-3402.
[11] Burland TG. DNA STARs Lasergene sequence analysis software.
Methods Mol Biol, 2000, 132(1):71-91.
[12] Tamura K, Dudley J, Nei M, Kumar S. MAGA4: Molecular
evolutionary genetics analysis (MEGA) software version 4.0.
Molecular Biology and Evolution, 2007, 24(8):1596-1599.
[13] Saitou N, Nei M. The neighbor-joining method: A new method for
reconstructing phylogenetic trees. Molecular Biology and Evolution,
1987, 4(4):406-425.
[14] 樊俊蝶 , 王伟 , 柴宝峰 , 等 . 游仆虫 Rab 蛋白基因的克隆表达
与纯化 . 中国生物化学与分子生物学报 , 2004, 20(2):200-205.
[15] Geourjon C. SOPMA: significant improvements in protein secondary
structure prediction by consensus prediction from multiple
alignments.Oxford Journals, 1995, 11(6):681-684.
[16] Gasteiger E, Hoogland C, Gattikeret A, et al. Protein identification
and analysis tools on the ExPASy server. Biomedical and Life Scie-
nces, 2005:571-607.
[17] 王庆浩 , 陈爱华 , 张伯礼 . 丹参 : 一种中药研究的模式生物 . 中
医药学报 , 2009, 37(4):1-3.
[18] 王镜岩 , 朱胜庚 , 徐长法 . 生物化学[M]. 北京 : 高等教育出
版社 , 2004:203.
[19] Nielsen H, Engelbrecht J, Brunak S. A neural network method for
identification of prokaryotic and eukaryotic signal peptides and
prediction of their cleavage sites. International Journal of Neural
Systems, 1997, 8(5):581-599.
[20] Weckwerth W, Selbig J. Scoring and identifying organism-specific
functional patterns and putative phosphorylation sites in protein
sequences using mutual information. Biochemical and Biophysical
Research Communications, 2003, 307(3):516-521.
[21] Vreys C, Schockaert ER, Michiels NK. Unusual pre-copulatory
behaviour in the hermaphroditic planarian flatworm, Dugesia
gonocephala (Tricladida, Paludicola). Ehology, 1997, 103
(3):208-221
[22] Novick P, Field C, Schekman R, et al. Identification of 23
complementation groups required for post-translational events in
the yeast secretory pathay. Cell, 1980, 21(1):205-215.
(责任编辑 马鑫)