免费文献传递   相关文献

致过敏性哮喘的葎草花粉特异性变应原pTSX1 cDNA克隆的生物信息学分析



全 文 :第31卷第2期
2 0 1 0年 3月
西 安 交 通 大 学 学 报 (医 学 版 )
Journal of Xian Jiaotong University(Medical Sciences)
Vol.31 No.2
Mar.2010
致过敏性哮喘的葎草花粉特异性变应原
pTSX1 cDNA克隆的生物信息学分析
徐 晶 ,孙秀珍 ,刘 昀 ,张永红 ,李 维
(西安交通大学医学院第二附属医院呼吸内科 , 陕西西安 710004)
摘要:目的 对免疫学筛选鉴定获得的葎草花粉过敏哮喘特异性变应原阳性 pTSX1 cDNA 克隆进行生物信息学分
析。方法 运用生物信息学的序列分析 、序列比对 、基因构成和蛋白质的结构及功能进行预测。结果 pTSX1 特异
性变应原克隆序列分析表明 , 该克隆与现有的已知基因均无高度同源性。 其序列有一 615 bp 的开放阅读框(61 ~
675 bp),编码 204个氨基酸。预测 pTSX1蛋白的氨基酸序列编码蛋白很有可能为核糖体蛋白。结论 获得的葎草
花粉过敏哮喘特异性变应原阳性 pTSX1 cDNA 克隆是一个新的基因 , pTSX1 基因编码的蛋白可能是核糖体蛋白。
关键词:葎草花粉;变应原 cDNA;生物信息学;序列分析
中图分类号:R562.25   文献标志码:A    文章编号:1671-8259(2010)02-0151-05
Bioinformatical analysis of the specific allergen pTSX1 cDNA
clone of Humulus pollen in allergic asthma
XU Jing , SUN Xiu-zhen , LIU Yun , ZHANG Yong-hong , LI Wei
(Department of Respiratory Medicine , the Second Affiliated Hospi tal ,
Medical School o f Xian Jiaotong Univ ersity , Xian 710004 , China)
ABSTRACT:Object ive To make a bioinforma tical analysis of the specif ic allergen pTSX1 cDNA clone obtained
from H umulus pollen in alle rgic asthma by immunologic al scr eening and gene cloning.Methods Bioinformatic al
approaches , including sequence analysis , sequence alignmen t , genetic makeup , prote in str uc tur e and function
prediction , were used.Results The analysis of the specific allergen pTSX1 cDNA showed that the gene had no
high homology with genes known so far.The cDNA had a 615 bp length open reading f r ame and coded a protein
with 204 am ine acids.The analysis of am ine acids sequence coded by the pTSX1 cDNA showed that the protein
identity of this gene product might be one of ribosomal proteins.Conclusion The pTSX1 cDNA cloned f rom
Humulus pollen in allergic asthma is a new gene , and the protein coded by pTSX1 gene may be one of ribosomal pro-
te ins.
KEYWORDS:Humulus pollen;allergen cDNA;bioinformatics;sequence analysis
收稿日期:2009-06-15  修回日期:2009-10-30
基金项目:国家自然科学基金资助项目(No.30371336)
Supported by the National Natu ral S cien ce Foundation of
China(No.30371336)
通讯作者:孙秀珍 ,教授 ,硕士生导师.E-mail:doc-ly@sohu.com
作者简介:徐晶(1981-), 女(汉族),硕士 , 住院医师.研究方向:变应
性哮喘的特异性治疗和预防.
E-mai l:jing.xu.xj tu@gm ail.com
  花粉症是敏感个体对花粉的一种超敏反应 ,在变
态反应性疾病中最具代表性。它可引起多种过敏性
疾病 ,以支气管哮喘最常见。葎草花粉近年来已成为
我国多数地区包括西安地区夏秋季节花粉症的主要
变应原[ 1] 。构建葎草花粉 cDNA 表达文库并从中筛
选出特异性变应原是制备基因重组变应原的基础 ,因
而在诊断及治疗由其引起的过敏性疾病中具有重要
意义。我们先前报道用葎草花粉过敏哮喘患者血清
对构建好的葎草花粉 cDNA λTripIEx2噬菌体表达
文库进行免疫学筛选 ,获得了与过敏性哮喘相关的三
个葎草花粉特异性变应原 cDNA 克隆 ,经免疫学 、分
子生物学鉴定和生物信息学分析 ,可能为新基因。
生物信息学是一门由数学 、统计 、计算机与生物医
学交叉结合的新兴学科。它已广泛地渗透到医学的各
个研究领域中 ,成为生物医学发展不可缺少的重要工
具 。随着人类基因组计划的快速发展 ,生物信息学技
术在人类疾病与功能基因的发现与识别 、基因与蛋白
质的表达与功能研究方面 ,都发挥着关键的作用。在
对所有新基因的功能和特性进行研究之前 ,有必要先
充分利用生物信息学的方法对其进行预测分析。
  西 安 交 通 大 学 学 报 (医 学 版 ) 第 31 卷
为了深入了解和研究我们发现的新基因的结构
与功能 ,我们运用生物信息学研究和功能预测手段 ,
对 pTSX1 cDN A克隆进行了详尽的分析。
1 材料与方法
对葎草花粉 cDNA λT ripIEx2 噬菌体表达文库
进行滴度测定及扩增 ,先选用葎草花粉过敏的哮喘患
者的血清与大肠杆菌裂解液共同温育去除交叉抗体 ,
然后用免疫学方法筛选阳性克隆 。提取阳性重组噬
菌体 DNA ,经 EcoRⅠ和 Hind Ⅲ双酶切分析 、琼脂糖
凝胶电泳鉴定后 , DNA 序列测定并进行生物信息学
分析[ 2] 。
1.1 核酸序列分析 首先在 http://www .girinst.
org/censor/ index.php[ 3] 进行重复序列分析。http://
www.ncbi.nlm.nih.gov/VecScreen/VecScreen.html去
除载体污染。将测序得到的 DNA序列采用美国国立生
物技术信息中心(National Center for Biotechnology In-
formation , NCBI)网站的 Blast软件(ht tp://www.ncbi.
nlm.nih.gov/blast/Blast.cgi)对GenBank中的非冗余数
据库(non-redundant database , nr)进行查询 ,并两两进行
两条核酸序列之间的同源性分析[ 4](ht tp://www.ncbi.
nlm.nih.gov/blast/bl2seq/wblast2.cgi)。软件 DNA-
MAN进行核酸序列之间的多重比对分析及进化分析。
用http://www.fruitfly.org/ seq tools/promoter.html进
行基因启动子[ 5-6] 分析。GENSCAN 分析基因外显子。
NCBI网站进行基因表达谱分析及基于六相位翻译原理
查找 cDNA 序列的开放阅读框(open reading frame ,
ORF)(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)。
1.2 蛋白质分析 应用 Blast软件进行蛋白质同源
性分析 ,软件 InterPro scan预测编码蛋白的基本理化
性质 ,包括氨基酸组成 、分子质量 、等电点 。使用软件
Sopma 预测二级结构 ,软件 A nthepro t进行蛋白跨膜
区分析[ 7] 。 ht tp://genome.cbs.dtu.dk/ services/
SignalP/进行信号肽分析[ 8] 。SMART 进行蛋白质
结构功能域分析[ 9] 。Ta rgetP 对蛋白质序列进行亚
细胞定位分析 。Swiss-Model服务器进行三级结构
同源建模[ 10] 。
2 结  果
2.1 利用生物信息学对 pTSX1进行核酸序列分析
2.1.1 重复序列分析 目的片段 pTSX1没有发现
重复序列。
2.1.2 同源性分析 将测序得到的 pTSX1核苷酸
序列输入 NCBI 网站 ,利用 Blast软件在 GenBank 数
据库 Nucleot ide Co llection (nr/nt)中进行核苷酸序
列同源性(Blastn)分析(表 1)。经过 Blast比对 ,结果
显示 pTSX1 序列与 2 个毛果杨树基因 Sco re 值 >
620 ,序列一致性(identit ie s)>84%,其中与收录号为
EF145831.1 的毛果杨基因 WS0113 K15(提取自华
盛顿区域一棵 8 年生毛果杨树的新生层及韧皮部)
Score=643 ,序列一致性为 85%, E=0。该基因的产
物尚不知晓 ,但该基因编码区与拟南芥 A t4g16720
基因(其编码蛋白为核糖体蛋白 L15A)相类似 。与
一系列拟南芥克隆比对 Score >420 , 序列一致性
(identities)>79%,其中大部分编码蛋白为核糖体
蛋白。
表 1 NCBI网站列出的核苷酸同源性分析的结果
Tab.1 Nucleo tide homo lo gy analy sis result from NCBI Website
基因收录号 基因来源描述 评分 E 值 最大一致性
EF145831.1 Populus trichocarpa clone WS0113 K15 unknown mRNA 643 0 85%
EF145338.1 Populus trichocarpa clone WS01123 H19 unknow n… 627 3.00E-176 84%
AY086316.1 Arabidopsis thaliana clone 23771 mRNA , comple te… 516 7.00E-143 81%
NM 117773.3 Arabidopsis thaliana 60S ribosomal protein L15… 510 3.00E-141 81%
AF370352.1 Arabidopsis thaliana putative ribosomal pro tein… 510 3.00E-141 81%
AY075603.1 Arabidopsis thaliana AT4g16720/ dl4385c mRNA… 510 3.00E-141 81%
AY058841.1 Arabidopsis thaliana AT4g16720/ dl4385c mRNA… 510 3.00E-141 81%
AY133797.1 Arabidopsis thaliana clone U10046 puta tive… 508 1.00E-140 81%
AY143818.1 Arabidopsis thaliana A t4g16720/ dl4385c mRNA… 505 2.00E-139 81%
BX827700.1 Arabidopsis thaliana Full- leng th cDNA Com plete… 497 3.00E-137 81%
BX826781.1 Arabidopsis thaliana Full- leng th cDNA Com plete… 492 1.00E-135 81%
BX828421.1 Arabidopsis thaliana Full- leng th cDNA Com plete… 488 2.00E-134 81%
AK251069.1 Ho rdeum vulg are subsp.vulga re cDNA clone… 424 5.00E-115 79%
152
2 期 徐 晶 ,孙秀珍 , 刘 昀 ,等.致过敏性哮喘的葎草花粉特异性变应原 pTSX1 cDNA 克隆的生物信息学分析
2.1.3 两条核酸序列之间的同源性分析及核酸序列
之间的多重比对分析及进化分析 三条序列之间两
两同源性分析均没有发现明显的同源性。DNA-
MAN 软件对 3条序列进行多重序列比对 ,结果显示
3条序列的一致性为 38.69%(图 1)。
2.1.4 基因启动子 经过预测 ,pTSX1序列均不含
启动子。
2.1.5 基因外显子 pTSX1 有一个单一外显子(61
~ 675核苷酸)和 Poly A 信号(840 ~ 845核苷酸),见
图 2。
图 1 对三条序列进行多重序列对比的结果
Fig.1 The result of multiple sequence alignment
图 2 pTSX1外显子的预测
Fig.2 The predicted exon of pTSX1
2.1.6 开放阅读框的分析 pTSX1序列有一 615 bp
的开放阅读框(61 ~ 675 bp),编码 204个氨基酸。预
测该蛋白的氨基酸序列为:MGAYKYVSELWRKK-
QSDVMRFLQ RVRCWEYRQHPSIV RV T RPT RP-
DKARRLGYKAKQGYVVYRVRVRRGGRKRPV-
PKGIV YGKPTNQGVTQ LKFQRSKRPVAEERA-
GRKLGGLRVLNSYWIN EDS TYKYFEVILVDV-
AHNAVRNDPRINWLCNPVHKHRELRG LTSA-
GKKFRGLRGKGH RNYKNRPSRRATWKKNN-
TVS LPRYR。
2.2 pTSX1编码蛋白的分析
2.2.1 pTSX1核苷酸同源性的分析 所筛选得到
的葎草花粉 cDNA 克隆序列 pTSX1 翻译成氨基酸
序列后 ,在 NCBI网站使用 Blastn程序进行检索 ,所
得序列的一致性均>73%,Score 值均>200(表 2)。
选取 Score 值最高的 10项进行分析 ,其中 6 个编码
蛋白均为核糖体蛋白 ,4个为 60S 核糖体蛋白 ,2个只
说明为核糖体蛋白。其余 4 个为尚未明确的蛋白 。
由此可知 ,葎草花粉序列 pTSX1 编码蛋白很有可能
为核糖体蛋白。
2.2.2 pTSX1 蛋白产物理化性质的预测 pTSX1
基因编码 204个氨基酸 、理论分子质量约为 24.23 ku 、
等电点为 11.90 的碱性蛋白(图 3)。软件 Inter-
Proscan预测 pTSX1编码的蛋白共含有 3 454 个原
子 ,总分子式为 C1078H1740N 356O276 S4 。预测半衰期在
哺乳动物网状红细胞中为 30 h ,在酵母菌中大于20 h ,
在大肠杆菌中大于 10 h 。预测波动系数为 39.63 ,结
论为这类蛋白是稳定的 。使用软件 Sopma 预测二级
结构 ,结果显示该蛋白富含α螺旋与 β-折叠(图 4);
表 2 NCBI网站列出的氨基酸同源性分析的结果
Tab.2 Amino acid nucleotide homo logy analy sis re sult f rom NCBI Website
编码蛋白收录号 编码蛋白来源描述 评分 E 值
gb ABK93954.1 unknow n [ Populus trichocarpa] 389 6e-107
dbj BAD22764.1 ribosomal pr otein [ Bromus inermis] 378 1e-103
gb AAK67641.1 ribosomal pr otein L15 [ H omo sapiens] 375 7e-103
sp O82528 RL15 PETHY 60S ribo somal pro tein L15 >gb AAD13389.1… 375 1e-102
emb CAO70602.1 unnamed protein product [ Vitis v inifera] 363 5e-99
emb CAN68893.1 hypo thetical pro tein [ Vitis vinifera] 361 2e-98
gb ABK93503.1 unknow n [ Populus trichocarpa] 358 1e-97
ref NP 193470.1 60S ribo somal pro tein L15(RPL15B)[ Arabidop… 352 7e-96
gb ABD65137.1 60S ribo somal pro tein L15 [ Brassica ole racea] 352 9e-96
ref NP 193405.1 60S ribo somal pro tein L15(RPL15A)[ Arabidop… 352 1e-95
153
  西 安 交 通 大 学 学 报 (医 学 版 ) 第 31 卷
应用软件 Antheprot进行蛋白跨膜区分析 ,结果显示
该蛋白不含跨膜区(图 5)。信号肽分析显示 ,该序列
最有可能的信号肽位于 27 ~ 28 aa(图 6)。
2.2.3 蛋白质结构功能域的分析 基因 pTSX1预
测到一个 Ribosomal L15(2 ~ 193 aa)功能域(图 7)。
2.2.4 蛋白质亚细胞定位的分析 预测到 pTSX1
编码蛋白定位于线粒体 ,但可信度居于中等。
2.2.5 蛋白质三级结构的预测 在 Swiss-Model服
务器进行蛋白质的三级结构同源建模(图 8)。
3 讨  论
经生物信息学分析 ,目的片段 pTSX1 序列核酸
序列同源性分析与该序列编码蛋白的同源性分析相
一致 ,提示该序列为编码核糖体蛋白的核酸序列。
目的片段 pTSX1序列经预测不含启动子 。有一
个单一外显子和 Poly A 信号 。拥有一个 615 bp 的
开放阅读框 ,编码 204个氨基酸的稳定的碱性蛋白 。
编码蛋白结构功能域预测葎草花粉目的片段 pTSX1
序列编码蛋白中有一核糖体蛋白 L15(2 ~ 193 aa)的
功能域 。此预测与前同源性预测相一致。蛋白质亚
细胞定位分析预测到 pTSX1编码蛋白定位于线粒体
(可信度居于中等)。
核糖体是生物细胞中依据 mRNA所提供的遗传
信息合成蛋白质的细胞内亚结构 。核糖体是颗粒结
构 ,没有被膜 ,含 40%的蛋白质 、60%的 RNA 。蛋白
按照一定的顺序与 RNA 结合 ,组成两个核糖体亚单
体 。核糖体中的蛋白质 , rRNA 以及其他一些辅助因
子在一起提供了翻译过程所需的全部酶活性。这些
154
2 期 徐 晶 ,孙秀珍 , 刘 昀 ,等.致过敏性哮喘的葎草花粉特异性变应原 pTSX1 cDNA 克隆的生物信息学分析
酶活性只有在核糖体整体结构存在的情况下才具备。
不同种的原核生物核糖体蛋白质之间有很高的
同源性 ,序列分析和免疫反应都证明了这一点 。说明
不同物种细胞中的核糖体可能来源于共同的祖先 ,在
进化上非常保守 。在氨基酸选择上应当是随机的。
由于核糖体的功能具有普遍意义 ,所以不同种的原核
生物核糖体蛋白质之间具有很高的同源性。对核糖
体蛋白的功能有多种推测:①对 rRNA 折叠成有功
能的三维结构十分重要;②对核糖体的构象变化起到
微调作用;③在核糖体的结合位点及催化位点上与
rRNA 共同作用 。
目前 ,用于变态反应性疾病诊断及特异性免疫治
疗(SI T)的变应原仍为粗制浸出液 ,存在诸多问题:
成分复杂 ,且容易为外源性的毒性物质污染;在治疗
中长期使用可能会出现过敏反应 ,严重者可致死亡;
成分和浓度不稳定 ,很难确定有效的治疗剂量 。1998
年WHO的指导性文件中要求在免疫治疗中应使用
标准化的变应原疫苗 。随着分子克隆技术的发展 ,重
组变应原疫苗近年来成为研究的热点。
基因重组疫苗是利用基因工程的方法 ,将变应原
的某个抗原基因或某几个抗原表位在体外进行扩增
和表达 ,获取表达产物作为免疫原 。但其免疫原性较
弱 ,需要进行免疫修饰。与粗制浸出液相比 ,纯化或
重组变应原具有如下优点:可大规模生产 ,能保持较
高的纯度;可定量化 、标准化 ,稳定性好 ,易于质控;特
异性高 ,提高了诊断敏感性 ,并推进了特异性免疫治
疗 ,有利于试剂的发展。目前 ,体外试验及皮肤试验
的结果显示 ,大部分基因重组变应原的活性与天然变
应原提取液相当 。上述结论已被某些基因重组变应
原结构分析的结果所证实 。例如 ,由大肠杆菌所表达
的基因重组变应原 Der p 2 的 IgE抗体反应性与纯
化的天然 Der p 2无差别。实际上 Der p 2及桦树花
粉主要致敏蛋白组分Bet v 1的三维结构测定是用基
因重组变应原来完成的 。有研究者[ 11-12] 应用重组变
应原疫苗进行皮肤试验和体外血清学试验 ,证实它和
相应的天然变应原提取物一样安全 、有效。而且由于
制剂稳定 、纯度高 ,所以诊断实验的标准化也大大提
高。作为治疗用重组变应原疫苗的基础结构经过改
造 ,明显降低了 IgE的结合力 ,可诱导人体保护性免
疫应答。碱基定向突变也为基础性研究提供帮助 ,有
助于认识变应原蛋白引起变应原性的三维结构 ,能够
进行广泛 、深入的免疫学以及发病机制的研究 。
本次研究为进一步探索过敏性哮喘发病的分子
机制 、特异性免疫治疗 、制备重组变应原疫苗或核酸
疫苗并进一步应用于临床奠定了基础。
参考文献:
[ 1] 孙秀珍 , 李玉馥 ,赵子慎.西安地区气传花粉动态的初步调查
[ J] .环境与健康杂志 , 1994 , 11(2):80-81.
[ 2] 刘红涛 , 范天黎 ,鲁照明 ,等.杜氏盐藻光系统 Ⅱ反应中心蛋白
D1基因的克隆及序列分析 [ J] .郑州大学学报:医学版 , 2008 ,
43(6):1123-1126.
[ 3] KOHANY O , GENTLES AJ , HANKUS L , et al.Annotation ,
submiss ion and scr eening of repet it ive elements in Repbase:
Repbase submit ter and censor [ J] .BMC Bioinf ormat ics , 2006 ,
25(7):474.
[ 4] TATUSOVA TA , MADDEN TL.Blas t 2 s equences , a new tool
for comparing p rotein an d nucleot ide s equences [ J] .FEMS Mi-
crobiol L et t , 1999 , 177(1):187-188.
[ 5] REESE MG.Applicat ion of a t ime-delay neural n etwork to p ro-
mo ter anno tat ion in th e Dr osophila melanogaster gen ome [ J] .
Comput Chem , 2001 , 26(1):51-56.
[ 6] YANDELL M , MOORE B , SALAS F , et al.Genome-wid e a-
nalysis of h uman dis ease alleles reveals that their locarions are
correlated in paralogous pr oteins [ J] .PLoS Compu t Biol , 2008 ,
4(11):e1000218.
[ 7] COMBET C , BLANCHET C , GEOURJON C , et al.NPS@:Net-
work Protein Sequence Analysis [ J] .Trends Biochem Sci , 2000 , 25
(3):147-150.
[ 8] BENDTSEN JD , NI ELSEN H , VON HEIJNE G , et al.I m-
pr oved pr ed iction of sign al pept ides:SignalP 3.0 [ J] .Mol Biol ,
2004 , 340(4):783-795.
[ 9] LETUNIC I , DOERKS T, BORK P.SMART 6:recen t updates
and new developments [ J] .Nucleic Acids Res , 2009 37(Data-
base issue):D229-232.
[ 10] ARNOLD K , BORDOLI L , KOPP J , et al.The SWISS-MOD-
EL Workspace:A web-based en vironmen t f or protein st ructure
h omology mod eling [ J] .Bioinformatics , 2006 , 22(2):195-201.
[ 11] NIEDERBERGER V , STUBNER P , SPI TZAUER S , et al.Skin
test results but not serology reflect immediate type respiratory sensi-
tivity:a s tudy performed wi th recombinant allergens molecules [ J] .
In vest Dermatology , 2001 , 117(5):848-851.
[ 12] NIKOLAIZ IK WH , WEI CHEL M , BLASER K , et al.In tr acu-
t an eous tes t wi th recombinan t aller gens in cys tic fibrosis patien ts
with allergic br onchopulmonary aspergillosis and Asp er gi llus al-
lergy [ J] .Am J Respi rat Cri t Care Med , 2002 , 165(7):916-
921.
(编辑 韩维栋)
155