免费文献传递   相关文献

应用傅立叶变换回旋共振质谱对小立碗藓新蛋白的序列分析



全 文 :  第 26卷增刊
2007年 9月 
分析测试学报
FENXICESHIXUEBAO(JournalofInstrumentalAnalysis)
Vol. 26
Sep.2007  
基金项目:北京市自然科学基金项目(2062022)
作者简介:王红霞(1970-), 女 , 甘肃张掖人 , 副研究员 , 010-66931434, E-mail:whx@proteomics.cn
应用傅立叶变换回旋共振质谱对
小立碗藓新蛋白的序列分析
王红霞 , 王 杰 , 何 昆 , 高彦飞 , 薛 燕 , 魏开华 , 张学敏 , 杨松成
(国家生物医学分析中心 , 北京 100850)
  随着蛋白质组学研究的不断深入 , 植物蛋白质组学也在蓬勃发展 。与人或动物蛋白质组学相比 ,
植物蛋白质组学研究的特点之一是大部分植物的基因组测序没有完成 , 因此有许多新蛋白需要测序及
进一步深入研究。对新蛋白进行测序的方法主要有串联质谱法(包括各种 ESIMS/MS和 MALDI-TOF
-TOFMS), 和 Edman降解法 , 其中串联质谱法有不少优点 。
由于傅立叶变换回旋共振质谱(FT-ICRMS)具有很高的分辨率和质量准确度 , 因此是新蛋白测
序的最佳工具。本研究应用纳升液相色谱联用四极杆傅立叶变换回旋共振串联质谱仪对经双向电泳分
离后的植物小立碗藓(physcomitrelapatens)的两个蛋白进行序列分析 , 共测定了 15个肽段序列 , 序列
长度在 10个氨基酸左右 , 相对分子质量在 1 000 ~ 3 000 u之间 , 误差均在 10 ppm以内。经 Mascot的
离子查询 、 序列标签查询以及 BLAST查询 , 均未得到有意义的结果 , 表明这两个蛋白为新蛋白。 FT-
ICR-MS提供的可靠序列可用于新蛋白的基因克隆和蛋白表达。该研究表明 , 高分辨 、 高灵敏 、 高质
量准确度的 FT-ICRMS在植物新蛋白研究中将发挥非常重要的作用 。
1 实验部分
1.1 试 剂
色谱纯乙腈(ACN, FisherScientific公司), 甲酸(FA, Sigma公司), 实验用水为 Mili-Q纯水器
制备的去离子水 。
1.2 样品来源
经双向电泳分离 , 胶内酶切后的小立碗藓(physcomitrelapatens)蛋白点 303和 431酶解原液各 5
μL由首都师范大学崔素霞教授提供。双向电泳及酶切方法见文献 [ 1] 。
1.3 NanoLC-FT-ICRMS/MS测定条件及方法 [ 2]
FT-ICRMS是美国布鲁克公司的 9.4TApexQeFT-ICR串联质谱仪 , 配备 ApoloI纳升喷雾源 。
喷雾针为 NewObjective公司产品 。毛细管电压在 1 600 ~ 1 800V之间 。扫描范围 300 ~ 3 000u。样品测
定采用 DDA的 MS/MSboost方式 。MS的采集时间为 0.5s, MS/MS的采集时间为 2 s。碰撞能量随 m/
z和带电荷数自动改变 。纳升液相系统为德国安捷伦公司的 1100系统 , 配备自动进样器和脱气泵 。纳
升色谱柱和脱盐柱分别为安捷伦公司的 Zorbax300SB-C18(75μmi.d., 15cmlength, 3.5 μmparticle
size)和 Zorbax300SB-C18 trapcolumn(300μmi.d., 0.5cmlength, 5μmparticlesize)。流速为 250
nL/min, 5μL样品自动进样 。流动相 A为含 0.1%FA, 5%ACN的水 , B为含 0.1%FA, 5% H2O的
ACN。脱盐流动相为含 0.1%FA的水 , 流速 20 μL/min, 脱盐时间 3 min。分离柱洗脱梯度如下:0到
40 min内 B相从 0%线性增加至 40%, 进样 5min后开始采集 。质谱控制软件为 Apex1.0, 液相控制软
件为 Hystar1.0 (BrukerDaltonics)。
1.4 数据分析方法
数据分析软件为 DataAnalysis3.4(BrukerDaltonics), 将每个样品的所有 MS/MS数据产生为 1个
mgf文件(包含各个母离子及碎片信息), 首先通过搜索引擎 Mascot(www.matrixscience.com)的 离子查
询方式(MS/MSionsearchprogram)进行检索。检索条件如下:NCBInr数据库 , 全部种属 , 胰蛋白酶酶
—7—
  第 26卷 分析测试学报 增刊  
切 , 蛋氨酸 M氧化和半胱氨酸 C的碘乙酰氨烷基化选为可变修饰 , 肽段误差为 10 ppm, 碎片离子误差
为 0.01u。如果未得到有意义的结果 , 则人工读序列 , 得到如表 1所示的序列及质量信息 。我们再次
通过搜索引擎 Mascot序列查询方式的肽序列标签方式检索 , 检索条件同上。另外 , 我们还对每个肽段
的序列进行 BLAST检索 , 检索时只输入序列 , 其它条件不限。
2 结果与讨论
2.1 点 303与 431的测序结果
点 303和 431经 MALDI-TOFMS的 PMF鉴定后 , 没有得到有统计学意义的结果。因此取 5μL酶
解原液用 nanoLC-FT-ICRMS/MS进一步分析 , 以确定这两个蛋白是否为新蛋白并获得氨基酸序列供
基因克隆。测序后首先将所有 MS/MS数据形成的 .mgf文件通 Mascot搜索引擎的离子查询方式(MS/
MSionSearch)进行查询 , 没有得到有统计学意义的结果 。经人工读序 , 点 303共得到 8个测序效果好
的肽段 , 点 431共得到 7个测序效果好的肽段 。然后我们按照序列查询的肽序列标签方式对每个肽段
查询 , 仍没有得到有统计学意义的结果 。最后 , 我们又进行了 BLAST查询 , 也没有得到任何同源蛋
白 。上述查询结果表明 , 这两个蛋白质确实为新蛋白。表 1和表 2分别为点 303和 431的序列测定信
息 。图 1为 m/z786.414 0双电荷离子的 MS/MS图 , 测定序列及误差在图中标出 , 误差均在 0.002 u
以内。
表 1 点 303的 8个肽段序列测定信息
m/z Charge Startmass Sequence Endmas
519.589 9 2 450.284 1 EGDHTE 1 118.527 6
543.832 7 2 387.273 0 T[ IL] SAEV 987.589 4
554.783 0 2 375.225 4 GVDTDF 1 009.489 6
617.322 9 2 361.246 0 ESSENNV 1 120.553 4
687.851 4 2 303.178 6 QGEEET[ IL] V 1 188.591 7
709.351 0 2 305.182 9 YGTSA[ IL] EY 1 189.580 0
786.414 0 2 306.414 0 EQ[ IL] PVDGVDT 1 359.665 5
1 020.507 8 3 348.167 9 WDHVEE[ IL] [ IL] [ IL]ATG 1 711.860 0
表 2 点 303的 8个肽段序列测定信息
m/z Charge Startmass Sequence* Endmas
568.643 9 3 331.235 6 E[ IL] KDEEV[ IL] 1 286.740 2
612.854 7 2 389.216 3 D[ IL]AAVGP 1 012.552 9
628.849 9 2 388.232 1 E[ IL] [ IL] [ IL] VD 1 070.629 3
677.005 7 3 416.252 5 RQVDSTGDDEP 1 615.782 3
778.393 8 2 335.194 1 [ IL] EAMTEAVA 1 250.641 9
816.385 5 2 303.178 8 VDSTGDDEP[ IL] 1 331.621 2
1021.513 7 2 391.195 5 DT[ IL]E[ IL] QDN[ IL] PV 1 628.835 1
  *[ IL]表示可能为 I或 L, 因相对分子质量完全相同 , 不能区分 , Startmass和 Endmass分别为序列中第 1个氨基酸和最后 1个氨
基酸对应峰的质量数(见图 1)。
2.2 讨 论
由于基因组测序的不完全 , 植物蛋白质组研究中经常会遇到新蛋白。新蛋白是指在数据库中没有
的蛋白 。要确定 1个新蛋白 , 最好用来自该蛋白的 2个以上的可靠的肽段序列进行数据库检索 , 均得
不到有统计学意义的结果 。在本研究中 , 我们分别测定了小立碗藓中点 303的 8个肽段序列和点 413
中的 7个肽段序列 , 经多种方式的数据库检索 , 未得到任何有意义的结果 , 表明这两个蛋白点确实为
新蛋白 。
—8—
  第 8期 分析测试学报 增刊  
图 1 蛋白斑点 303中 m/z786.414 0双电荷离子的 MS/MS图(标识有氨基酸序列及误差)
Q-FT-ICRMS由于具有很高的分辨率和质量准确度 , 因此在测序时能够区分 Q和 K, F的氧化
形式 M。更重要的是在序列分析时高质量准确度可大大提高序列正确性。如图 1所示 , 与理论值相比 ,
所有误差均小于 0.002u, 这是其它任何质谱无法比拟的 。因此测定的序列准确可靠 , 可用于进一步基
因克隆 。与 nanoLC联用后 , 不仅可提高灵敏度 , 还方便省事 , 实现自动化分析。由于量少 , 文献报道
酶解原液常用于 MALDI-TOFMS分析 , 在本实验中 , 我们用酶解原液也得到了很好的结果 , 这更有
利于样品制备 , 不需要进一步提取。因此 , nanoLC-FT-ICRMS/MS是研究植物新蛋白的强有力工
具 , 在植物蛋白质组研究中将发挥重要作用。
参考文献:
[ 1]  CUISX, HUANGF, WANGJ, etal.[ J] .Proteomics, 2005, 5:3162– 3172
[ 2]  MATTHIASW, JENSF, GOKHANB.[ J] .JAmSocMassSpectrom, 2003, 14:553-561
SequenceAnalysisofNewProteinsfromPhyscomitrelaPatens
bynanoLC-Q-FT-ICRTandemMassSpectrometry
WANGHong-xia, WANGJie, HEKun, GAOYan-fei, XUEYan, WEIKai-hua,
ZHANGXue-min, YANGSong-cheng
(NationalCenterofBiomedicalAnalysis, Beijing 100850, China)
Abstract:TwonewproteinsfromphyscomitrelapatensweresequencedbynanoLC-FT-ICRtandemmass
spectrometry.Eightandsevenpeptidesweresequencedforspot303 andspot413 respectively.Database
searchwasperformedthroughthesearchengineMascot(www.matrixscience.com)byMS/MSionsearchpro-
gramandSequenceTagprogram.Blastwasperformedtoo.Nostatisticalsignificantresultswereobtainedfrom
databasesearch.Thereliableaminoacidsequencescanbeusedforgenecloneduetohighmassaccuracy.
ThisresearchindicatesthatnanoLC-FT-ICRtandemmasspectrometrictechniqueispowerfultoolsfornew
proteinsequenceanalysisandwilplayanimportantroleinplantproteomicsresearch.
Keywords:FT-ICRMS;Tandemmassspectrometry;DeNovosequencing;Physcomitrelapatens
—9—