全 文 :第 28卷第 12期
2009年 12月
水 产 科 学
F ISH ERIES SCIENCE Vol.28 No.12Dec.2009
条斑紫菜 eIF4A 基因的电子克隆与试验验证
易乐飞 ,王 萍 ,周向红
(淮海工学院 江苏省海洋生物技术重点实验室 ,江苏 连云港 222005)
摘 要:以拟南芥 eIF4A 氨基酸序列为信息探针 , 在条斑紫菜 EST(Expressed sequence tag)数据库中
找到高度相似的 EST , 通过人工序列拼接及 RT-PC R确认得到了翻译起始因子 4A(Eukary otic tr ansla-
tio n initiation facto rs 4A , eIF4 A)基因 P ye IF4A 的 cDNA序列。该 cDNA序列含有长 1278 bp 的完整
开放阅读框 , 编码蛋白(Pye IF4A)分子量 47.4 kDa ,长 425 AA 。 Pye IF4 A 与小鼠 、非洲爪蟾 、水稻和
拟南芥等多种动植物的 e IF4 A 具有较高的序列一致性 ,含有 eIF4 A 的保守基序。
关键词:条斑紫菜;翻译起始因子 4A;电子克隆
中图分类号:Q781 文献标识码:A 文章编号:1003-1111(2009)12-0775-04
收稿日期:2008-12-02; 修回日期:2009-04-17.
基金项目:江苏省海洋生物技术重点实验室开放课题(2008HS004);淮海工学院自然科学基金资助项目(Z2007035).
作者简介:易乐飞(1975-),男 ,讲师 ,硕士 ,研究方向:生物信息学和分子遗传学;E-mail:yi lefei@yahoo.com.cn.通讯作者:王萍
(1957-),女 ,教授 ,博士 ,研究方向:植物基因工程与分子生物学;E-mail:y pw ang@y ahoo.com .cn.
随着表达序列标签(Expressed sequence tag ,
ES T)数据库(dbES T)的快速和持续增长 ,电子克
隆(In silico cloning)已成为快速获得未知新基因全
长或部分 cDNA 序列的基因克隆方法之一[ 1] 。电
子克隆以数字算法为手段 ,以计算机和互联网为工
具 ,利用现有的 ES T 和生物信息数据库 ,在未注释
的生物序列上挖掘未知新基因[ 2] ;进而用生物学试
验进行编码区和功能验证 ,为后续研究提供新的线
索和基础。电子克隆与其他基因克隆方法相比 ,可
以充分利用已有数据资源 ,避免大量重复劳动 ,节
省时间和开支 ,加快新基因发现 。目前电子克隆已
广泛用于人 、小鼠等模式生物的基因分离与鉴
定[ 1] ;然而 ,条斑紫菜(Porphyra yezoensis)新基因
克隆上才刚刚起步 ,条斑紫菜基因克隆仍以常规的
试验方法为主。但随着大量条斑紫菜 ES T 序列的
出现 ,有可能也有必要采用生物信息学技术对条斑
紫菜 EST 进行搜索 、聚类 、拼接 、组装 ,以便获得潜
在的全长 cDNA 序列 。
真核生物的蛋白质合成是一个复杂的过程 ,至
少涉及到 12 种蛋白质因子 。这些因子协同地将
mRNA 、起始 tRNA 、40S 和 60S 核糖体亚单位组装
成具有肽链合成能力的 80S核糖体。其中 ,翻译起
始因子 4A(Eukary otic translation initia tion fac-
to rs 4A , e IF4A)与 eIF4B 、eIF4F 和 eIF 4H 一起
促使 mRNA 与 40S 核糖体亚单位结合。在这个重
要的调节过程中 , eIF4A 解旋 mRNA 5′非翻译区
的二级结构 ,从而协助 mRNA 与 40S 核糖体亚单
位结合和随后的起始密码子 AUG 的扫描[ 3] 。除了
在蛋白质生物合成过程中发挥作用外 ,最近的研
究[ 4-5] 还表明在 Decapentaplegic信号通路的激活过
程中 , eIF4A 通过非翻译依赖性的方式 ,促进了下
游信号成员 Mad和 Medea 的降解。目前尚无条斑
紫菜翻译起始因子 4A 基因(PyeIF4A)的相关报
道 ,笔者采用生物信息学方法 ,克隆得到了的 cD-
NA 序列 ,并对其进行了分析和试验验证 ,表明电子
克隆在条斑紫菜中同样有效。
1 材料与方法
1 .1 电子克隆
1 .1.1 数据库和软件
核酸数据库为美国国立生物技术信息中心
(Nat ional Center for Biotechnolo gy Info rmation ,
NCBI)维护的GenBank数据库[ 6] ,相似性比对使用
BLAST [ 7] 、ES T 序列组装和延伸使用 CA P3[ 8] ,开
放阅读框的寻找使用 NCBI 的 ORF Finder(ht-
tp://www .ncbi.nlm .nih .gov/gorf/go rf.html),
蛋白的基本理化特性分析使用 ProtParam[ 9] ,多序
列比对使用 ClustalW [ 10] 。
1 .1.2 电子克隆技术路线
技术路线参照文献 [ 11-12] , 稍作修改 。A .
BLAST 搜索条斑紫菜 dbES T ,下载检索到的高相
似性并且含有 eIF4A 保守序列的 EST 序列;B.将
下载的 ES T 进行第一次拼接 , 得到一个叠连群
(contig);C.将此 contig 在条斑紫菜 dbES T 上重
新搜索匹配序列 ,并下载匹配序列。D.再将匹配
序列进行拼接;E.重复搜索 、拼接 ,直到不能再延
DOI :10.16378/j.cnki .1003-1111.2009.12.021
伸为止 ,最后获得 PyeIF4A基因的 cDNA 序列 。
1.1.3 生物信息学分析
分析 cDNA 序列的 ORF ,如 ORF 前有无终止
密码子 、Kozak序列或加尾信号和 Poly(A)等;分
析编码蛋白(PyeIF4A)的氨基酸序列组成 、各种理
化性质;分析 PyeIF4A的相似性和多序列比对。
1.2 试验验证
根据电子克隆结果 ,针对 ORF 设计扩增引物。
5′引物:5′ACATCGCTCTTGCTCCCACCTC 3′,
3′引物:5′CCGCG TTGT TGTCGTCA TT TAG 3′,
预计扩增片段长 1398 bp。引物由上海生工生物工
程技术服务有限公司合成 。采用 RT-PCR方法 ,以
条斑紫菜叶状体 cDNA 为模板 ,在 PCR仪上扩增
30个循环。反应完毕后取 1 μl于 1%琼脂糖凝胶
进行电泳分析 ,确定后 ,再将 PCR产物送上海生工
进行测序 。
2 结果
2.1 PyeIF 4A基因的电子克隆
用拟南芥(Arabidopsis thaliana)eIF4A 序列
(GenBank acce ssion :NP 175829)作为查询序列对
条斑紫菜的 dbES T 进行相似性筛选 ,共获得了 49
条高度相似的条斑紫菜 ES T 。将这些 EST 进行拼
接(图 1),获得了长 1771 bp的 PyeIF4A 基因 cD-
NA 序列(图 2)。
图 1 49条 EST 拼接
参与拼 接的 49 条 EST 的 GenBank accession 分别 为:
AV431063 、 AV434561 、 AV431248 、 AV431257 、 A U197138、
A U189321 、 AU192121 、 AV434325 、 AU192371 、 A U195892、
A U187688 、 AV435745 、 AU193425 、 AU192392 、 A U195129、
A U191395 、 AU187719 、 AV435613 、 AU197132 、 A U195360、
A U191752 、 A U195906 、 AV433389 、 AV431667 、 A U189021、
A U191890 、 A V429707 、 A U192755 、 AU195026 、 AV432789、
A U189131 、 AV434702 、 AU194641 、 AU195279 、 A U187202、
AV431060 、 AV433230 、 AU186746 、 A U187085 、 A U188955、
AV433179 、 AV431768 、 AU189054 、 AV432443 、 A U188333、
AV432291 、A U191523 、AV439194 、AV437956.
图 2 P yeIF4A基因 cDNA 序列和氨基酸序列
单下划线显示 ORF ,双下划线显示引物结合位点 ,加框处显示终止密码子
2.2 PyeIF 4A cDNA 序列的分析
应用 ORF finder和标准遗传密码在 cDNA 序
列上寻找到了一条长 1278 bp的 ORF(图 2下划线
处)。ORF 含该 cDNA 的第一个 A TG 密码子 ,第
776 水 产 科 学 第 28卷
一个 A TG密码子下游的+4位是 G , -3位是 A ,
符合 Kozak 规律 。ORF 上游读码框中存在终止密
码子(图 2加框处),再结合推导的氨基酸序列 N端
同源性比较结果 ,可以认定第一个 ATG 是该基因
的起始密码子 。该 cDNA 序列的 5′非翻译区长
151 bp ,3′非翻译区长 342 bp。
2.3 PyeIF 4A编码蛋白的分析
PyeIF4A 的编码蛋白(PyeIF4A)长 425 AA ,
分子量为 47 .4 kDa ,其碱性 、酸性 、疏水性和极性氨
基酸的含量分别为 45 、59 、149和 107个 ,等电点为
4.976 。以 PyeIF4A 的氨基酸序列对 GenBank中
的非冗余的蛋白质数据库进行 Blastp分析 ,结果发
现小鼠 、非洲爪蟾(Xenopus laev is)、水稻(Oryza
sat iva)和拟南芥等多种动植物的 eIF 4A 与之极高
度相似 ,但在条斑紫菜的蛋白质数据库没有找到与
之高度相似的序列 ,所以可以肯定本研究电子克隆
的序列是一条新序列 。多序列比对(图 3)显示 Py-
eIF 4A 与它们的序列一致性(Identi ty)分别为
70%、68%、68%和 68%,序列相似性(Similarity)
分别为 83%、81 %、82%和 81%。PyeIF4A 含有
DEAD-box 家族特征性的保守基序(Motif)[ 13] (图
3):AQSGMGKT (mo tif I)、PTRELA(mo tif Ia)、
GG 、T PGR(motif Ib)、DEAD(mo tif II)、SA T(mo-
tif III)、RGID(motif V)和 HRIG RSGR(mo tif
VI)。其中 ,基序 I 、II 、III和 VI 分别参与 ATP 结
合 、A TP 水解 、核酸解链以及 ATP 水解依赖性的
RNA结合[ 14] 。
图 3 eIF4A的多序列比对和保守基序
2.4 试验验证
PCR结果电泳分析出现单一条带 , 大小约
1400 bp ,与预计大小相符(图 4)。正反测序后获得
了 PyeIF 4A 基因的部分 cDN A 序列 ,与电子克隆
结果的全程比对(篇幅所限 , 未能列出)表明 ,用
RT-PCR从叶状体中扩增出的 cDNA 片段与电子
克隆结果一致。测序结果已提交 GenBank(A cces-
sion:FJ407185)。
3 讨论
本次试验克隆的 PyeIF4A 与 DEAD-box 家族
蛋白都含有相似的保守基序 ,因此如何确定本次试
验克隆得到的是 e IF4A ,而不是 DEAD-box 家族的
一个潜在的 RNA 解旋酶呢 ?宋平等[ 14-15] 做了有益
的尝试 , 他们通过多序列比对后发现 , 典型的
e IF4A 蛋白含有下列基序组成:基序 I 的 AQSG T-
GK T 、基序 Ia 的 PTRELA 、基序 IV 的 FXNT 、基
序 V的 RGID和基序 V I 的 HRIG RXGR ,这些基
序组成与其他 DEAD-box 家族蛋白不同。除了基
序 I和 IV 外 ,本次试验克隆产物与典型的 eIF4A
图 4 PCR扩增产物电泳
1:扩增结果;M :λDNA/ EcoRI + HindIII Marker.
基序几乎一致。而且 ,本次试验克隆产物与已知的
eIF4A 具有较高的一致性(>60%), 但与其他
DEAD-box 家族蛋白的一致性较低(约 25%,篇幅
所限 ,未能列出)。因此确定本次试验克隆得到的
就是 eIF4A 。
利用电子克隆技术成功地克隆了 PyeIF4A 基
因的 cDNA序列 ,该序列得到了试验证据支持 ,表
明得到的 cDNA序列是真实存在的 、有效的 。与传
777第 12期 易乐飞等:条斑紫菜 eIF4A 基因的电子克隆与试验验证
统基因克隆的繁杂 、耗时 、效率不高的过程相比 ,电
子克隆优势明显[ 16] :⑴速度快 。包括同源性比较 、
外显子预测等工作在计算机上完成 ,只需 RT-PCR
进行序列验证 ,理论上 1个基因的克隆可在几个星
期内完成;⑵设备简单。只需能够上网的计算机和
PCR仪等即可进行试验 ,试验成本较低;⑶试验简
化。试验只涉及到 RNA 抽提 、反转录 、PCR扩增
等分子生物学的基本试验;⑷针对性强。电子克隆
都是有选择的针对某些重要基因进行克隆 ,因而工
作的可延续性强。随着更多海洋生物基因组测序
的开展以及各类数据库的不断完善 ,电子克隆技术
必将成为海洋生物新基因克隆的重要手段。
参考文献:
[ 1] Gill R W , Sanseau P.Rapid in silico cloning o f genes
using expr essed sequence tag s(EST s)[ J] .Bio technol
Annu Rev , 2000(5):25-44.
[ 2] Kent W J.Blat-Blast-like alignment too l [ J] .Genome
Res , 2002 , 12(4):656-664.
[ 3] Roge rs Jr G W , Lima W F , Merrick W C.Fur the r
characterization of the helicase activity of eIF4A sub-
strate specificity [ J] .The Journal of Biological Chem-
istry , 2001(276):12598-12608.
[ 4] L i J , Li W X.A novel function of D rosophila eIF4A
as a nega tive regulato r of Dpp/BMP signa lling that
mediates SMAD degradation [ J] .Nat Cell Bio l ,
2006 , 8(12):1407-1414.
[ 5] Affolter M , Py rowolakis G.eIF4A goes beyond transla-
tion [ J] .Nat Cell Biol , 2006 , 8(12):1319-1321.
[ 6] http:// www.ncbi.nlm.nih.gov/ database/ index.html.
[ 7] Altschul S F , Madden T L , Schaffer A A , e t al.
Gapped BLAST and PSI-BLAST:a new genera tion of
pro tein database sea rch pro gr ams [ J] .Nucleic Acids
Res , 1997 , 25(17):3389-3402.
[ 8] Huang X , Madan A.CAP3:A DNA sequence a ssem-
bly pro gr am [ J] .Genome Res , 1999 , 9(9):868-877.
[ 9] Gasteiger E , Hoog land C G A.P ro tein identification
and analy sis tools on the ExPASy se rver [ M] .The
Proteomics P roto co ls Handbook , Walke r J M , Huma-
na P ress , 2005:571-607.
[ 10] Fukami-kobayashi K , Saito N.How to make good use
of CLUS TALW [ J] .Tanpakushitsu Kakusan Koso ,
2002 , 47(9):1237-1239.
[ 11] 张德礼 , 丁培国 , 凌伦奖 , 等.人类新基因 C17or f32
的电子克隆和编码区序列 RT-PCR验证[ J] .生物化
学与生物物理进展 , 2002 , 29(4):543-549.
[ 12] 罗洪林 , 郑小龙 , 张为宇 , 等.大片吸虫成虫 FG0018
表达序列标签序列的电子克隆分析及实验验证[ J] .
中国预防兽医学报 , 2005 , 27(5):418-422.
[ 13] Song P , Zhang J , Hu J , et al.cDNA cloning , expression
and ATPase assay of a putative eIF-4A of Plasmodium
cynomolgi [ J] .Chinese Journal of Biochemistry and Mo-
lecular Biology , 2004 , 20(3):294-304.
[ 14] Tuteja R , M alho tra P , Song P , e t al.I so lation and
cha racterization of an eIF-4A homo lo gue from P las-
modium cynomolgi [ J] .Mol Biochem Parasito l ,
2002 , 124(1-2):79-83.
[ 15] 宋平 , 张竞男 , Malho tra P , 等.恶性疟原虫 abst rakt
同源基因的克隆及 DEAD 盒家族蛋白的序列分析
[ J] .动物学报 , 2004 , 50(3):420-430.
[ 16] 黄骥 , 王建飞 , 张红生 , 等.水稻葡萄糖-6-磷酸脱氢
酶 cDNA 的电子克隆[ J] .遗传学报 , 2002 , 29(11):
1012-1016.
Cilico Cloning and Verification of eIF4A Gene from Laver Porphyra yezoensis
YI Le-fei , WANG Ping , ZHOU Xiang-hong
(Jiang su Key Labora to ry of Ma rine Bio technolog y , Huaihai Institute o f Technolog y , Lianyungang 222005 , China)
Abstract:The silico cloning , verification and characterization of eukary otic t ransla tion initiat ion factors 4
A(eIF4A)genes w as conducted in cDNA of lave r Porphy ra yezoensis(PyeIF4A).T he highly similar P.
yezoensis ES Ts were obtained by Arabidopsis thal iana eIF 4A amino acids sequence as a querying probe
f rom dbES T o f GenBank and the putative cDNA sequence of PyeIF4A was assembled.Furthermore , the
cDNA of PyeIF4A was isolated by RT-PCR w ith tw o primers designed in acco rdance w ith the assembled
sequence and w as found to contain an 1278 nt of continuous complete open reading f rame encoding a poly-
peptide(PyeIF4A)o f 425 amino acids w i th a calculated molecular w eight o f 47 .4 kDa.Sequence comparison
of the PyeIF4A reveals high amino acid sequence identity with eIF4A f rom other o rganisms , such as mice Mus
musculus , toad Xenopus laev is , rice Oryza sativa and plant Arabidopsis thaliana .The PyeIF4A contained con-
served amino acids residue and sequences mo tif s closely related to function of eIF4A.
Key words:Porphy ra yezoensis ;eukary otic t ranslat ion ini tiation facto rs 4A ;si lico cloning
(责任编辑:晓 荷)
778 水 产 科 学 第 28卷