免费文献传递   相关文献

~(18)O内标质谱法比较定量蛋白质组学计量的数学算法



全 文 :生物技术通报
BIOTECHNOLOGY BULLETIN·技术与方法· 2009年第 1期
收稿日期:2008-07-03
作者简介:齐孟文(1956-),男,副教授,研究方向为核农学
18O 内标质谱法作为一种快速发展的比较定量
蛋白质组学方法,在蛋白质表达调控机理推定及疾
病标志物发现等重要研究领域都极具应用前景。在
该方法中,作为比较的蛋白组在 H218O 中被酶解,酶
解肽段被 1 个或 2 个 18O 原子所标记, 使质量谱移
动 2 个或 4 个 Du。 而作为参照的蛋白质组则在普
通 H2O 中被酶解,然后将两组蛋白质的酶解产物等
量混合, 用质谱法对肽或蛋白质进行相对差别定
量。 常采用的质谱为激光基质解析飞行质谱(MALDI-
TOF-MS), 在胰蛋白酶肽段的分子分布范围内,其
同位素峰族是可以精确分辨的。 但此时 18O 标记肽
相对于参照肽的同位素峰族仅有 2 个或 4 个 Du 位
移,由于位移相对较小 ,与参照肽的自然同位素峰
族间相互有重叠,相对定量不能直接得出,需要发
展有效的数学解析算法对质谱进行解析。
1 18O标记及其主要特点
基于稳定性同位素标记的定量蛋白质质谱分
析,就标记而言一般可分为以下 3 类 [1]:(1)体内代
谢标记,即通过细胞培养对蛋白质进行标记 ,该方
法是一种转录前无蛋白质歧视的全域性标记过程,
但方法仅限于能够被培养的原核生物体系,对日常
蛋白质定量而言,其试验成本和试验操作分析均不
具有比较优势;(2)体外化学标记,该方法是一种转
化后氨基酸专性标记法,代表方法有同位素亲和标
签法(ICAT)及其后续开发的类似方法 。 蛋白质通
过与标签试剂反应而被标记,该方法通过对含赖氨
酸标记肽的选择分离操作,可明显降低分析样品的
复杂性,然而其局限性是不能标记无赖氨酸或赖氨
酸丰度的低的蛋白质。赖氨酸是蛋白质中丰度较低
的一种氨基酸,在人类蛋白质组适合质谱定性的质
18O内标质谱法比较定量蛋白质组学计量的数学算法
齐孟文
(中国农业大学,北京 100093)
摘 要: 18O内标蛋白质质谱定量分析是一种极具前景的比较蛋白组学研究技术, 虽然该方法与迄今所有内标法
相比有一系列优点, 但是由于其质谱是由 16O未标记品种, 单及双 18O标记品种分子同位素峰簇相互迭加所构成的复杂
谱,定量分析的关键是发展有效的质谱解析算法。 有鉴于此,综述和讨论了 18O内标质谱差异比较蛋白质分析过程中,分
子同位素簇分布的简化计算方法,以及质谱混和谱解析的数学方法。
关键词: 18O内标法 定量蛋白质组学 数学算法
Mathematical Algorithms for Differential Quantitative Proteomics
by Mass Spectrometry Using 18O-labeled Internal Standards
Qi Mengwen
(China Agricultural University,Beijing 100093)
Abstract: Relative quantization of proteins by mass spectrometry using 18O-labeled internal standards is a
promising method for differential quantitative proteomics,having a series of advantages over other stable isotope
labeling. But isotope clusters of 18O-labeled species is overlaps with natural isotope clusters of non-labeled species,thus,
effective algorithm is to be critical to quantitative analysis. Therefore,the mathematical method for analyzing 18O-labeled
peptides was summarized and discussed.
Key words: 18O-labeled internal standards Quantitative proteomics Mathematical algorithms
生物技术通报 Biotechnology Bulletin 2009年第 1期
量序列中 (800~2 500 kD),约有 14%不含赖氨酸 ;
(3)体外酶促标记,18O 标记是在胰蛋白酶水解蛋白
质的过程中或过程后, 按一步法或两步法使 H218O
水中的 18O 结合到被酶解的肽段,即肽段 C 段赖氨
酸(K)/精氨酸(R)的羧基上,标记肽的单同位素分
子质量相对移动 2 个或 4 个 Da(结合 1 个 18O 或 2
个 18O)。 相对于上述其它标记法,18O 标记具有如下
优点:(1)18O 酶促标记过程具有高度专一性, 无标
记副产物产生;(2)所有的酶解肽段被标记,都用于
蛋白质定性与定量分析,有利于从数据统计学上提
高分析精度;(3)蛋白质的胰蛋白酶切位点丰度适中,
在现有质谱的质量分析范围对所有蛋白都有合适
的酶解肽段,因此 18O 标记对蛋白质是全域的;(4)
确定的羧基端标记有利于肽序列测定时将 b 型肽
离子与 y 型肽离子相区分;(5)标记操作简单,又因
为可采用两步法标记,可于蛋白质分析过程相机选
定所要标记的肽,具有较大机动性;(6)内标准在样
品准备伊始引入,可有效排除后续制备及分析过程
对差别比较的影响。 以上优势说明,18O 内标质谱法
是一种极具前景的差异比较蛋白质组学研究方法。
2 18O内标法质谱构成解析
18O 内标法蛋白质的肽谱, 每一个肽的同位素
峰族谱都是由未标记肽 、1 个 18O 原子标记和 2 个
18O 标记肽的同位素分布的部分重叠线性迭加而成
的,了解并确定其构成的同位素峰簇分布是进行质
谱解析的基础。
2.1 18O 标记类型及其分布
用胰蛋白酶在 H218O 中酶解蛋白质, 蛋白质被
酶解的同时, 水中的 1 个被 18O 结合到胰蛋白酶肽
段羧基末端的赖氨酸 (K)或精氨酸 (R)的羧基上 ,
形成 1 个 18O 原子标记的肽段,结合到羧基上的 18O
和原有的 16O 原子是共轭的, 此时若继续使酶与肽
接触 ,羧基与水则发生可逆地氧原子交换 ,使第 2
个 18O 被结合上去,形成 2 个 18O 标记的肽 [2]。 标记
的肽依照标记方式 16O,18O1,18O2 呈现为二项式 (a+
b)2 分布, 其中 a 和 b 分别是非完全 18O 富集水中
16O 和 18O 的丰度。因此,未标记 16O 分子、1 个 18O 和
2 个 18O 标记肽分子理论丰度分别为 a2,2ab 和 b2。
试验表明, 实际标记物的 18O 标记类型与理论预测
很好吻合 [3,6]。
2.2 肽质谱的同位素峰簇分布
生物分子中的元素大多均由相应的同位素构
成 ,如 2H (0.0156% ),13C (1.108% ),15N (0.366% )17O
(0.037%),18O(0.204%),33S(0.75%)和 34S(4.22%),
因此蛋白质或肽段的质谱由同位素峰簇构成。在分
子离子[M+H]+同位素峰簇中,若单同位素分子的质
量记为 M0,依次相距 1 个 Da 的同位素分子记为 Mi
(i=1,2..n), 则分子的同位素质量分布可以用扩展
的多项式分布描述 [4]。 但一般情况下并不需要求出
所有可能的同位素质量分布项,在质谱解析中一般
仅须考虑前 6~10 个质量峰, 这些峰的累加贡献几
乎接近总分布的百分之百。同位素峰簇分布可按如
下简化法进行近似计算 [5],结果能很好满足分析精
度的要求。
设分子中氢 (H)、碳 (C)、氮 (N)、氧 (O)和硫
(S)原子的个数用 h,c,n,o,s 表示 ,元素同位素原
子的摩尔分数用 xk 表示 ,即 H 和 2H(x1,x2),12C 和
13C (x12,x13),14N 和 15N (x14,x15),16O,17O 和 18O, (x16,
x17,x18)等 ,则按照概率论计算各同位素分子 Mi 的
概率或同位素峰的相对强度,并 M0 对规一化,有:
M0=x
h
1·xc12·x
n
14·x
o
16·x
s
32 (1)
M1 /M0 =hx2 /1! x1 +cx13 /1! x12 +nx15 /1! x14 +ox17 /1! x16
+sx33 /1! x32 (2)
定义
m1 =
i
Σki (xi1 /xi0 ) (3)
其中,i 代表分子中的某元素,ki 为该元素原子
的个数 ,xi1/xi0 元素 i 的质量+1 的重同位素原子与
普通同位素原子的摩尔数之比,则(2)式简写为
M1/M0=m1/1! (4)
同理有
M2 /M1 =h(h-1)x
2
2 /2! x
2
1 +c(c-1)x
2
13 /2! x
2
12
+n(n-1)x
2
15 /2! x
2
14 +o(o-1)x
2
17 /2! x
2
16
+s(s-1)x
2
33 /2! x
2
32 +hx2 /x1 [cx13 /x12 +nx15 /
x14 +ox17 /x16 +sx33 /x32 ]+cx13 /x12 [nx15 /x14
+ox17 /x16 +sx33 /x32 ]+nx15 /x14 [o17 /o16
+sx33 /x32 ]+ox17 /x16 [sx33 /x32 ]+ox18 /x16
+sx34 /x32 (5)
56
2009年第 1期
取近似,h(h-1)≈h2,c(c-1)≈c2 等,且定义
m2 =
i
Σki (xi2 /xi0 )
=ox18 /x16 +sx34 /x32 (6)
其中 ,xi2/xi0 为元素 i 的质量+2 的重同位素原
子与普通同位素原子的摩尔数之比。采用简化表达
式有
M2 /M0 =m
2
1 /(2!0!+m2 /(0!1!)
=m
2
1 [1/(2!0!)+m2 /m
2
1 /(0!1!)] (7)
同样,若取近似
n-1
i
仪(k-i)≈kn ,则有
M3 /M0 =m
3
1 [1/(3!0!)+m2 /m
2
1 (1!1!)] (8)

M4 /M0
=m
4
1 [1/(4!0!)+m2 /m
2
1 (2!1!)+m
2
2 /m
4
1 (0!2!)] (9)
更一般的表达式有
Mn /M0 =m
n
1
n /2
i=0,1,2
Σ(m2 ) i /m2i1 (n-2i)!1! (10)
由公式可见 ,在该近似计算中 ,分子同位素峰
的归一化强度 Mn/M0 只是 m1 和 m2 的函数,计算过
程得以极大的简化。
3 相对比较之肽和蛋白质的定量
在 18O 内标胰蛋白酶解蛋白质的肽谱分析中 ,
特定肽分子的质谱是由未标记品种(16O)和标记品
种,即 1 个 18O 原子(18O1)及 2 个 18O 原子(18O2)肽的
同位素峰簇部分重叠而形成的 1 个更大的同位素
峰簇,其理论分布模式见图 1。 依据其质谱的构成
特点,现有的定量质谱数学解析算法,一般可分为
特征峰标定法和回归分析法两种。
3.1 特征峰标定法 [6]
该方法选择未标记品种、1 个 18O 和 2 个 18O 标
记品种相应的单同位素分子峰作为特征峰,经对其
它非本品种对此特征峰的贡献进行扣除校正,以得
到实际品种(
16
O,
18
O1和
18
O2 )的强度,即:
16O=[M]-(a×18O1) (11)
18O1=[M+2]-16O·(A2/A0)16 O +(a×
18O1) (12)
18
O2 =[M+4]-
18
O1·(A2 /A0 )18O1-
16
O(A4 /A0 )16O (13)
式中,(Ai/A0) 是相应品种离子同位素质量+i 的分
子数与单同位素分子数的比值,可由 2.2 的理论公
式计算求得;a 是标记品种因 H218O 含有 a%H216O 未
能完全标记所引起的修正,因标记效率在肽与肽之
间是变化的,一般以平均估计值给出。 实际计量过
程由测得的混合谱 [M+i]的数据逐次替代可解出各
品种含量,肽或蛋白质的相对定量最终由相应品种
的比值 16O/(18O1+18O2)确定。
3.2 回归分析法 [7,8]
如图 1 所示,混合样品中某肽段的同位素质量
谱是各个品种同一肽段离子同位素峰簇的线性迭
加,假设相互比较品种的含量分别为 C1 和 C2,各自
单独存在时肽段的前 6 个同位素质量峰(累积分布
近似为 100%)的相对强度分别为(a1i)和(a2i),混合
样品肽段的前 6 个同位素峰的相对强度为
(Mi)(Σa1i =1,Σa2i =1 和ΣMi =1),则有:
C1a11+C2a21=(C1+C2)M1
C1a12+C2a22=(C1+C2)M2
…… (14)
C1a16+C2a26=(C1+C2)M6
在上式中,用相对含量 X1=C1/(C1+C2)和 X2=C2/(C1+
C2)作替换,并用矩阵表示:
ATX=M (15)
其中,A=(aij)(2×6)为转换矩阵,可由理论计算或
由实验对各品种单独测定得到,X (2×1)为解矢量和 M
(6×1)为为谱强度矢量。 方程的最小二乘回归解为
X=(AAT)-1AM (16)
转换矩阵可由实验测定或由概率理论计算确
定,一但确定了转换矩阵,由所测定的样品肽段的
同位素峰簇矢量,就可由回归方程解出差异比较肽
的相对含量,进而由各标识肽的统计平均求解差异
比较蛋白的相对含量,确定其相对丰度变化。
图 1 18O 内标质谱法肽的同位素峰簇理论构成
M M+2 M+4 M+6
齐孟文:18O内标质谱法比较定量蛋白质组学计量的数学算法 57
生物技术通报 Biotechnology Bulletin 2009年第 1期
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
( 上接第 39页)
9 Viallard JF,Lacombe F,Belloc F,et al. Cancer Radiother,2001,5
(2):109~129.
10 Sherr CJ. Cell,2004,116(2):235~246.
11 AladjemMI,Pasa S,Parodi S,et al. Sci STKE,2004,2004(222):8.
12 Kakihana M,Yahata N,Hirano T,et al. Oncol Rep,2002,9(1):
43.
13 Yang DG,Liu L,Zheng XY. Ageing Research Reviews,2008,7:
137~146.
14 Haga K,Ohno SI,Yugawa T,et al. Cancer Sci,2007,98(2):147~
54.
15 Sawa H,Kamada H,Ohshima TA,et al. Journal of Neuro-Oncology,
1999,42:45~57.
16 Soria JC,Morat L,Commo F,et al. Br J Cancer,2001,84(4):
504.
17 李建萍,张小清,谢明.中国肿瘤临床,2006,33(12):690~692.
18 周希江,方向明.临床血液学杂志,2002,15(4):156~158.
19 王琼书,刘宏,张蔚,等.肿瘤防治研究,2006,33(1):36~38.
20 Simon M,Park TW,et al. Journal of Neuro-Oncology,2001,55:
149~158.
21 李贵新,李国庆,等. 世界华人消化杂志,2002,10:591.
4 结语
18O 内标质谱差异分析法是一种极具发展前景
的定量比较蛋白质组学方法,方法学上具有许多无
可比拟的优势, 但是由于 18O 标记分子相对于未标
记分子其质量只有 2 或 4 个 Du 的移动, 而任何分
子的质谱峰实际上都是由同位素峰簇构成的,因此
实际测定的肽段的质谱峰是由两差异比较比较品
种肽段的同位素峰簇按其相对含量的比例线性叠
加而构成的,定量比较结果只有通过对混合谱进行
解析才能得到, 而解析的前提是确定转换矩阵,即
确定各叠加成分分子同位素峰簇的分布及其贡献,
然后才是确定解析的代数方法。该文介绍了计算分
子同位素峰簇分布的简化算法(Benlian Wang,2007),
在该方法中,分子同位素质量峰的归一化强度只是
两个基本参量 m1 和 m2 的函数,而这 2 个参量可由
品种分子的同位素构成方便地求得。该方法的引入
将极大简化分子同位素峰簇分布的计算,且采用的
方法对计算精度几乎没有影响。 此外,介绍了按线
性叠加原理进行混合质谱解析的两种常用的代数
方法。 所述的方法将能为发展 18O 内标质谱法比较
定量蛋白质组学提供理论指导。
参考文献
1 Bantscheff M,Dümpelfeld B,Kuster B.Rapid Communications in
Mass Spectrometry,2004,18:869~876.
2 Angel PM,Orlando R. Analytical Biochemistry,2006,359:26~34.
3 Fernández-de-Cossio J,Gonzalez JJ,Aatomi Y. Rapid Communica-
tions in Mass Spectrometry,2004,18:2465~2472.
4 Snider RK. American Society for Mass Spectrometry,2007,18:1511~
1516.
5 Wang BL,Sun S,Anderson DR. Analytical Biochemistry,2007,
367:40~48.
6 Johnson KL,Muddiman DC. American Society for Mass Spectrometry,
2004,15:437~445.
7 Mirgorodskaya OA,Kozmin YP,Titov MI. Rapid Communications in
Mass Spectrometry,2000,14:1226~1232.
8 Mason CJ,Therneau TM,Eckel-Passow J. Molecular & Cellular
Proteomics,2007,6(2):305~318.
58