免费文献传递   相关文献

中华鲟YY肽基因电子克隆表达与生物信息学分析



全 文 :收稿日期:2008-03-05
基金项目:上海市科学技术委员会重点科技攻关项目(073205109),上海高校选拔培养优秀青年教师科研专项基金(080014),上海海洋大学
博士启动基金(070275)
作者简介:陈晓武(1976-),男,安徽人,博士,研究方向:动物发育生物学;E-mail:xwchen@shfu.edu.cn
通讯作者:施志仪(1954-),男,上海人,教授,博士,研究方向:水产动物遗传育种
中华鲟(Acipensersinesis)属硬骨鱼纲(Osteichthyes),鲟行目(Acipenseriformes),鲟科(Acipenseridae),
鲟属(AcipenserLinnaeus),是我国一级保护动物,在鱼类乃至脊椎动物的系统进化上占据重要的地位。属于
古老的鱼类,有“活化石”之称。同时,它还有重要的经济价值,其鱼子酱被称为“黑色黄金”。目前,我国的鲟
鱼养殖业正在兴起,对鲟鱼消化生理和相关基因的研究将促进养殖的成功及健康发展[1]。
肽 YY(peptideYY,PYY)一般存在于小肠末段和大肠的 L细胞中,成熟后由 36个氨基酸组成,能抑制
胃液和胰液的分泌[2]。PYY还能穿过血脑屏障进入中枢神经系统,具有调节食欲和减轻体重的作用。在人
体内,PYY作用与细胞膜上的 PYY受体,PYY受体与 G蛋白相偶联,引起系列的信号传导途径的改变。现
在已经有 PYY药物用于治疗肥胖[3]。PYY和神经肽 Y(neuropeptideY,NPY)、胰腺肽(pancreaticpolypeptide,
PP)共同属于神经肽 Y家族(NeuropeptideYFamilyofpepetides,NY)。PYY和其它一些营养因子、肽类激素
中华鲟YY肽基因电子克隆表达与生物信息学分析
陈晓武 施志仪
(上海水产大学生物技术研究中心,上海 200090)
摘 要: 以日本鳗鲡的PYY基因cDNA序列为信息探针,搜索中华鲟 EST文库,得到中华鲟 PYY的EST序列,
经过生物信息学分析。结果表明,此cDNA序列包含完整的开放读码框,所编码的蛋白质包含97个氨基酸,前28个氨基
酸为信号肽,分子量为11.03kD,理论等电点为5.54。该蛋白序列和牙鲆、河豚以及斑马鱼的PYY肽同源性较高。其中36
个氨基酸构成PAH结构域,由一个α螺旋结构和一个无规则卷曲区组成。包含中华鲟PYY在内的139条真核生物神经
肽Y蛋白质序列比对结果显示,有6个氨基酸位点高度保守,其中有5个氨基酸位于 α 螺旋上,另外1个脯氨酸位于无
规则卷曲区,提示α螺旋也可能起到重要作用。
关键词: 中华鲟 YY肽 生物信息学
TheinSilicoCloningandBioinformaticAnalysisofPeptideYY
from Acipensersinensis
ChenXiaowu ShiZhiyi
(ResearchCenterofBiotechnology,ShanghaiFisheriesUniversity,Shanghai200090)
Abstract: UsingPYYcDNAofAnguilajaponicaasaqueryprobe,ahighhomologousESTwasobtainedfrom
AcipensersinensisEST databaseofGenbank.Theful-lenghthORFof294bpcDNA wasdeducedbybioinformatic
approaches.ORFencodedfor97aminoacidsandaterminatecodon.TheN-terminal28aminoacidsconstitutedof
signalpeptide.Themolecularweightofthededucedproteinwas11.03kD,andPIwas5.54.ThePYYsfrom Danio
rerio,Paralichthysolivaceus,TakifugurubripesandAcipensersinensissharehighhomologyanda36-amino-acidmotif
namedPAH,whichwasformedbyaα-helixandairegularcoils.6conservativeaminoacidswasobtainedthrough
alignmentof139kindsofproteinsfrom NYpeptidesfamily,and5ofthoseaminoacidsweresituatedintheα-helix
andoneinthecoil.
Keywords: Acipensersinensis PeptideYY Bioinformatics
生物技术通报
BIOTECHNOLOGY BULLETIN·研究报告· 2008年第5期
2008年第5期
有密切的关系。葡萄糖、胆汁盐、脂肪和短链脂肪酸都能刺激 PYY的产生。胆囊收缩素(cholecystokinin,
CCK)、小肠血管活性肽 (vasoactiveintestinalpolypeptide,VIP)、胃泌素 (gastrin)、人胰高血糖素样肽-1
(Glucagon-likepeptide-1,GLP-1)均能调节 PYY的释放[4]。PYY对动物生长、消化和吸收具有重要作用。
1 材料与方法
使用 Blastn程序,以鳗鲡的 PYY(序列登陆号:BAD01501.1)作为信息探针,搜寻中华鲟的 EST库,得到
一条同源 EST(序列登陆号:EC324456.1);ORFfinder[5]在线预测该序列编码区。从 SMART蛋白结构数据库
中下载人、大鼠、河豚和斑马鱼等真核生物的 138条 NY家族蛋白质序列(均包含 PAH特征结构域)[6]。人
NPY蛋白结构(PDB数据库编号:1ron)[7]和猪的 NPY结构(PDB数据库编号:1f8p)[8]来自 PDB数据库,SignalP
3.0Server进行信号肽预测[9]。使用 ClustalX(version1.83)[10,11]软件对中华鲟 PPY及其同源蛋白序列进行序
列比对。Phylip(version3.63)软件构建分子系统树[12]。采用 SWISS-MODEL远程服务器,以人 PYY和猪 NPY
蛋白质结构为模板,采用同源模建的方法构建中华鲟和斑马鱼 PPY的蛋白质结构[13]。利用检测蛋白质结构
质量软件 PROCHECK对建模的结果进行分析[14,15]。使用 Pymol软件将人、斑马鱼和中华鲟的几种结构进行
叠合和比较。中华鲟 PYYcDNA序列经过注释提交 Genbank获取序列登录号。
2 结果
2.1 中华鲟 PYY基因 cDNA全长获得和序列提交
获取的中华鲟 EST序列经过预测编码区为 294bp,起始密码子为 ATG,终止密码子为 TGA。在编码区
上游同一读码框内还有 4个终止密码子,包括 1个 TAA和 3个 TAG,其 3端编码区有 362个核苷酸,包含
PolyA结构(图 1),序列提交 Genbank获取序列登录号:EU313429。推测的蛋白质包含 97个氨基酸,蛋白质
序列登录号 ABY27301.1。起始 28个氨基酸为信号肽。中华鲟 PYY蛋白质分子量为 11.03kD,理论等电点
为 5.54。共有 6个 Tyr(Y)占总氨基酸的 6.2%,11个 Leu(L)含量最高,占总氨基酸的 11.3%。
图 1 中华鲟 PYY基因 cDNA全长及推测编码的蛋白质序列
下划线的 28个氨基酸是信号肽,方框中的核苷酸表示位于同一阅读框中的终止密码子
2.2 PYY蛋白质分子系统分析与结构比较
搜索 SMART里具有 PAH蛋白质结构域的蛋白质家族,包括中华鲟 PYY共 139条蛋白质序列,其序列
登录号如下,ABY27301.1,P48098,Q9EPS2,ENSMODP00000014855,ENSFCAP00000010187,ENSEEUP0000
0002314,P51694,ENSGACP00000013144,Q7SZV5,ENSMLUP00000010537,P09475,P14765,Q6RUW3,P48097,
P57774,P41336,UPI000155F22F,UPI0000E246C2,ENSTBEP00000012852,P69092,ENSORLP00000021809,UPI
陈晓武等:中华鲟YY肽基因电子克隆表达与生物信息学分析 167
生物技术通报Biotechnology Buletin 2008年第5期
000019C2A2,P07808,Q6DMM9,ENSORLP00000009880,UPI0000F2BF19,UPI0000D9E22F,Q9U0S9,SINFRUP0
0000153449,ENSMLUP00000003756,Q58VQ3,UPI0001556130,Q9TR93,UPI0000F1F3F3,P37999,ENSGACP00
000009098,P33689,ENSDNOP00000012244,P01302,UPI000036DC25,P06304,ENSPTRP00000015749,Q9XSW6,
Q1KPW1,ENSETEP00000003411,P11967,Q9PTA0,GSTENP00021059001,Q90WF2,P80167,SINFRUP00000138
614,P29203,P81028,ENSOCUP00000009261,Q8JHE7,P69094,P41967,ENSSTOP00000006578,A0PGI7,ENSO
GAP00000007488,Q58VP9,ENSOANP00000021119,P01304,Q76CL2,Q4RHZ5,Q9I8P3,A7IZV1,P18107,Q9U0
S8,UPI0000F2E7AA,UPI000065DEAD,Q58VP8,P68248,P29204,ENSOGAP00000007490,P68010,UPI00006D2
C13,P06305,Q9PT99,ENSOCUP00000011243,P09641,P01301,P28674,Q9PW68,P31229,UPI0000F315AC,PI0
0004D4A6A,P29206,P41519,P13083,P69101,Q9PT98,Q90WF4,UPI000020134A,ENSTBEP00000014770,286
72,Q9I9D3,A5JUZ2,P68007,Q6E0K5,Q90WF3,UPI0000EB212D|,ENSORLP00000005851,ENSSARP00000004
670,ENSEEUP00000002421,Q27441,ENSMLUP00000012389,P01299,UPI0000D9E405,P41337,ENSEEUP0000
0006078,P28673,NSSTOP00000006564,Q5U8M6,UPI00005A2C9D,P29205,P41334,UPI000155E189,Q4ADV5,
P06884,P01303,Q9DGK7,P33684,P10601,ENSDNOP00000002254,P01300,P41321,P15427,ENSMLUP000000
15101,Q4RKH5,P80952,P41335,Q9I8P2,ENSOGAP00000006028,ENSGACP00000000592,UPI000013CDD0,N
SXETP00000016115,Q0IS5,Q58VQ0,
这些多肽只存在于真核生物中,其中哺乳动物中有 64种,辐鳍亚纲有 41种,软骨鱼纲只有 2种。它们
均含有 PAH的保守结构域,由 36个氨基酸组成,对这 36个氨基酸进行比对后可见其中最保守的氨基酸
位点。选取的 23条来自鱼类的 NY序列中有 19个氨基酸位点完全一致,25条 PYY中则有 14个位点不
变,幅鳍亚纲中比较有 15个氨基酸位点完全不变,脊索动物则有 2个位点不变。全部 139条真核生物 NY
序列有 6个氨基酸位点比较保守,仅有一个 Y不变(图 2)。
根据 23种鱼类的 NY构建的分子系统树表明,中华鲟和斑马鱼、河豚和牙鲆的 PYY蛋白质序列同源
性最高,均为 83.3%,和其它同源序列相比都在 60%~80%之间。这些神经肽分为包括 NPY、PYY和 PY3种
类型,没有 PP型(图 3)。
PROCHECH软件对斑马鱼和中华鲟 PYY的蛋白质结构进行评价,中华鲟 PYY蛋白质结构参数表明
图 2 组成 NY蛋白质家族 PAH结构域的 36个
氨基酸序列比较
图 3 23条鱼类神经肽 Y家族 36个氨基酸序
列的系统分析
“*”表示完全相同的氨基酸;“:”和“.”分别表示高度保守和相
对保守的氨基酸
物种名称缩写:Aj(鳗鲡);Dr(斑马鱼);Po(牙鲆);Ec(石斑鱼);
Ca(鲫鱼);Ss(中华倒刺鲃);Om(虹鳟);Dl(鲈);Ol(青鳉);Ip(斑
点叉尾鮰);Gm(大西洋鳕);Tn(黑青斑河豚);Tr(红鳍东方鲀);
Ma(胭脂鱼);As(中华鲟)
PHYLIP3.63软件构建系统树,1000次重复
计算 bootstrap值
168
2008年第5期
位于拉氏图中的氨基酸比例为 92.9%,二面角
(dihedral,-0.42)、共价键(covalent,0.33)和角距
(overal,-0.11),三者均小于 0.5,表明模拟得到
的蛋白质结构比较稳定。人 NPY、斑马鱼和中华
鲟 PYY进行蛋白质结构比较接近 (图 4),可以
进行很好的重叠,其中最保守的 6个氨基酸中有
5个(Y48,L52,H54,Y55,R61)位于 α螺旋区,仅
有 1个 P33位于无规则卷曲区。表明 α螺旋区
在 PYY发挥生理功能时发挥重要作用。
3 讨论
3.1 PYY的生理功能
PYY的生理功能在哺乳动物中研究较透彻。最近研究表明,在人体内 PYY能抑制食欲,其效应和试验
条件有复杂的关系[16]。在啮齿动物体内,PYY引起食欲减退而导致体重下降。除参与消化生理功能外,PYY
还能作为肠上皮细胞分化因子,肠上皮细胞表达特定的 PYY受体,体内和体外试验均证明 PYY通过这些
受体促进细胞分化[17]。人体内已知 4种 G蛋白偶联的 PP肽受体,包括 Y1、Y2、Y3和 Y4,均能与不同类型
的 NP结合,导致特定的细胞反应,如 Y1亚型偶联于细胞有丝分裂因子信号途径[18]。在硬骨鱼中,PYY研
究还比较少,中华鲟 PYY基因的克隆和分析对于研究该分子的进化有重要的参考价值。根据该基因的保
守性设计引物(自中华鲟的 cDNA的 276至 392位核苷酸),通过 RT-PCR能在施氏鲟和西伯利亚鲟的肠、
胰和脑组织总 RNA中扩增 117bp的 cDNA片段,而在肾、肝、肌、鳃、肝、胰、鳃和心肌组织中均没有检测到
该基因的表达(结果待发表)。PYY的组织分布特点表明其可能参与鲟鱼的消化吸收、神经调控等生理活
动。
3.2 PYY分子进化研究
神经肽(NY)在进化中分化为不同的类型,主要包括 NPY、PYY、PP3种类型。硬骨鱼中有 PY型,而没
有 PP型。河豚有 2个拷贝的 NPY,可能是由于染色体对四倍化导致,斑马鱼则缺失一个拷贝;PYY在这两
种鱼中均有 2个拷贝,第 2个拷贝也称为 PY,河豚的 NPY主要在脑中表达,而 PYY则在多种组织中表达。
在硬骨鱼中 NY家族比四足动物要复杂[19]。一般认为这个家族都来自系列的基因复制。如在人体内,NPY
主要位于 4号染色体,PPY和 PYY均位于 17号染色体(17q21和 17q21.1),二者距离很近[20];在斑马鱼体
内,PYY位于 3号染色体,PY位于 15号染色体,NPY位于 19号染色体[21]。NY家族均含有结构类似的 PAH
结构域。以此保守结构域为根据,搜索到 138种 NY家族蛋白质序列并进行分子系统分析。结果表明,克隆
的中华鲟神经肽和斑马鱼、河豚及鳗鲡的 PYY高度同源。因此,确定其为 PYY。PYY在脊椎动物中是比较
古老类型,其可能来源与更古老的软体动物[22]和涡虫[23]中的神经肽 F。PP则是由 PYY在四足动物刚出现
时候分化而来。因此,PP可能是研究四足动物早期进化很好的分子标记。
人和猪的 NPY一直是了解 NY家族三维结构的依据。使用 swiss-model的远程服务器模拟了牙鲆和斑
马鱼 PYY的三维结构,并且进行了结构稳定性评价,也证明模拟得到的结构比较稳定合理。其结合 138条
序列比对结果找出最保守的 6个氨基酸的位置,其中有 5个氨基酸都位于 α螺旋上,说明该螺旋在激素发
挥生理功能时的重要性。相关结果是 NPY分子进化的补充,也可以作为 NY神经肽基因定点突变和药物筛
选提供参考资料。
参考 文献
1 刘红柏,张颖,杨雨辉,等.水产学报,2006,30(4):531~537.
2 BoeyD,SainsburyA,HerzogH.Peptides,2007,28(2):390~395.
3 McGowanBM,BloomSR.CurOpinPharmacol,2004,4(6):583~588.
图 4 人、斑马鱼和中华鲟 PYY蛋白质结构比较
a.人 NPY b.斑马鱼 PYY c.中华鲟 PYY
d.PYY中最保守的 6个人氨基酸位置
陈晓武等:中华鲟YY肽基因电子克隆表达与生物信息学分析 169
生物技术通报Biotechnology Buletin 2008年第5期
4 BalantyneGH.ObesSurg,2006,16(5):651~658.
5 WheelerDL,BaretT,BensonDA,etal.NucleicAcidsRes,2003,31:28~33.
6 LetunicI.NucleicAcidsRes,2002,30:242~244.
7 MonksSA,KaragianisG,HowletGJ,etal.JBiomNMR,1996,8(4):379~390.
8 BaderR,BetioA,Beck-SickingerAG,etal.JMolBiol,2001,305(2):307~329.
9 htp:/www.cbs.dtu.dk/services/SignalP/.
10 HigginsDG,SharpPM.Gene,1988,73(1):237~244.
11 ChennaR,SugawareH,KoikeT,etal.NucleicAcidsRes,2003,31(13):3497~3500.
12 FelsensteinJ.Cladistics,1989,5:164~166.
13 SchwedeT,KoppJ,GuexN,etal.NucleicAcidsRes,2003,31:3381~3385.
14 LaskowskiRA,MacArthurMW,MossDS,etal.JApplCryst,1993,26:283~191.
15 MorisAL,MacArthurMW,HutchinsonEG,etal.Proteins,1992,12:345~364.
16 Perez-TilveD,NogueirasR,MaloF,etal.Endocrine,2006,29(2):383.
17 MannonPJ.Peptides,2002,23(2):383~388.
18 BerglundMM,HipskindPA,GehlertDR.ExpBiolMed,2003,228(3):217~244.
19 SundstromG,LarssonTA,BrennerS,etal.AnnNYAcadSci,2005,1040:476~478.
20 htp:/www.ncbi.nlm.nih.gov/genome/guide/human/.
21 htp:/www.ncbi.nlm.nih.gov/genome/guide/zebrafish/.
22 MauleAG,ShawC,HaltonDW,etal.Parasitology,1991,102(2):309~316.
23 CuryJ,ShawC,JohnstonCF,etal.CompBiochemPhysiol,1992,101C:269~274.
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
(上接第165页)
经软件分析,所得基因序列内部无 BamHⅠ、HindⅢ酶切位点,pMD18-T/csgC经上述 2种酶切后,不会
影响基因序列编码区的内部结构。本研究率先在我国克隆了大肠杆菌 curli菌毛的 csgC基因,并对其序列
进行了分析,为获得重组 csgC蛋白及对其结构和功能的研究奠定了基础。
参考 文献
1 曹雷,李守军.黑龙江畜牧兽医,2006,8:11~13.
2 陆承平.兽医微生物学.北京:中国农业出版社(第 3版),2001,216~219.
3 VidalO,LonginR,Prigent-CombaretC,DorelC,HooremanM,LejeuneP.JBacteriol,1998,180:2442~2449.
4 BianZ,YanZQ,HanssonGK,ThorenP,NormarkS.JInfectDis,2001,183:612~619.
5 GophnaU,BarlevM,SeijfersR,OelschlagerTA,HackerJ,RonEZ.InfectImmun,2001,69:2659~2665.
6 RyuJH,KimH,FrankJF,BeuchatLR.LetApplMicrobiol,2004,39:359~362.
7 ChirwaNT.HeringtonMB.Microbiology,2003,149(2):525~53.
8 OlsenA,JonssonA,NormarkS.Nature,1989,338:652~655.
9 ColinsonSK,EmodyL,TrustTJ,KayWW.JBacteriol,1992,174:4490~4495.
10 ColinsonSK,DoigPC,DoranJL,ClouthierS,TrustTJ,KayWW.JBacteriol,1993,175:12~18.
11 SjobringU,PohlG,OlsenA.MolMicrobiol,1994,14:443~452.
12 ArnqvistA,OlsenA,PfeiferJ,RusselDG,NormarkS.MolMicrobiol,1992,6:2443~2452.
13 RomlingU,BianZ,HammarM,SieraltaWD,NormarkS.JBacteriol,1998,180:722~731.
14 GerstelU,ParkC,RomlingU.MolMicrobiol,2003,49:639~654.
15 GibsonDL,WhiteAP,RajoteCM,KayWW.Microbiology,2007,153:1131~1140.
16 HammarM,ArnqvistA,BianZ,etal.MolMicrobiol,1995,18(4):661~70.
170