全 文 :植物生理学报 Plant Physiology Journal 2016, 52 (3): 317–324 doi: 10.13592/j.cnki.ppj.2015.0618 317
收稿 2015-11-23 修定 2016-02-04
资助 国家自然科学基金(31272494)、浙江省自然科学基金
* 通讯作者(E-mail: majinzjl@163.com)。
张振亚, 裴翠明, 马进*
浙江农林大学风景园林与建筑学院, 浙江临安311300
摘要: 通过高通量多组学数据的整合分析, 可以为诠释植物耐盐分子机制提供新思路。以南方型紫花苜蓿‘Millennium’为
材料, 对正常培养和盐胁迫条件下的2个样品根系进行转录组和蛋白质组关联分析, 以期发现紫花苜蓿耐盐相关候选基
因。结果表明: 蛋白质组和转录组相关性并不高, 定量蛋白和基因关联系数为−0.0013; 变化趋势相反差异蛋白和基因的表
达关联系数为−0.3648; 变化趋势相同差异蛋白和基因的表达关联系数为0.2620。鉴定出与差异蛋白表达趋势相同的差异
基因25个, 上调表达14个, 下调表达11个, 这些差异基因涉及代谢、信号转导、蛋白质降解、防御、抗氧化、细胞骨架、
膜与转运、转录和其他未知等方面的功能。另外, 关联分析发现TIP1;1型水通道蛋白(AQP)、钙调素结合蛋白(CaMBP)、
研究表明: 利用转录组和蛋白质组的关联研究技术可以有效地发现紫花苜蓿耐盐相关候选基因, 为阐明紫花苜蓿对盐胁迫
关键词: 南方型紫花苜蓿; 盐胁迫; 蛋白质组; 转录组; 关联
剧, 盐碱已成为影响农作物生产的主要危害因子,
研究, 对从分子水平上改良农作物耐盐性、提高
称为“牧草之王”, 在我国种植面积达183万hm2, 居
世界第5位, 种植地区以北方为主。近年来, 国外
成功培育了一些高秋眠级紫花苜蓿品种, 为我国
南方地区引种紫花苜蓿奠定了基础, 但因其耐盐
能力有限, 限制了其在南方盐碱地大面积种植(马
进等2011, 2015)。利用现代生物学技术, 创制南方
在盐胁迫下, 植物启动众多基因响应, 目前已
protein 2, PRP2)、吡咯啉-5-羧酸合成酶(Δ1-pyrro-
line-5-carboxylate synthetase, P5CS)、紫花苜蓿解
旋酶(Medicago sativa helicase 1, MH1)、果糖-1,6-
二磷酸醛缩酶(fructose-1,6-bisphosphate aldolase,
ALD)、未知功能域家族蛋白(domain of unknown
function, DUF)、GDP-甘露糖-3′,5′-表异构酶
(GDP-mannose-3′,5′-epimerase, GME)、类受体蛋
白激酶(stress-induced protein kinase gene 1, SIK1)、
同源异型盒(homeobox 2, HB2)、NAC转录因子
(NAC transcription factor 2, NAC2)和冷诱导蛋白
(rare cold inducible 2A, RCI2A)等耐盐基因(Winicov
等1997; Ginzberg等1998; Luo等2009; Ma等2014;
郭鹏等2014; 李明娜等2014; 申玉华等2015)。另
外, Postnikova等(2013)以耐盐性不同的紫花苜蓿
为研究对象, 通过转录组(transcriptome)分析鉴定
苜蓿的蛋白质组学分析, 鉴定出94个盐胁迫差异
对象, 分析鉴定出33种盐响应差异蛋白。由于紫
tative trait locus, QTL)控制的复杂性状, 单纯从单
面性, 可能无法完全解析其盐胁迫应答的关键分
基因是遗传信息的携带者, 而蛋白质则是基
中, 涉及到一整套精细的表达调控机制, 如转录调
此, 要全面探究生物体的复杂生命活动, 需要同步
检测mRNA和蛋白质的表达量, 并进行数据整合
(data integration)分析, 这已成为当前生物学领域研
究的热点(Muers 2011; Vogel和Marcotte 2012)。另
外, 对于转录组测序(RNA sequencing, RNA-seq)的
海量数据, 如何从中挖掘出有价值的关键基因, 也
是一个值得深思的问题。目前, 尚未见到转录组
测序结合定量蛋白组学(quantitative proteomics)技
料, 运用转录组测序和同位素标记相对和绝对定
量(isobaric tag for relative and absolute quantitation,
达蛋白和差异基因, 并将获得的蛋白质组与转录
组数据进行关联分析, 获得一些可能作为紫花苜
蓿耐盐的潜在候选基因, 为紫花苜蓿盐胁迫的应
1 试验材料及处理
选择高秋眠级南方型紫花苜蓿(Medicago sa-
tiva L.) ‘Millennium’为材料(马进等2011), 将种子
先用75%酒精消毒10 min, 然后用灭菌水清洗3次,
灭菌水中浸泡2 h后于20°C生长箱内发芽。7 d后,
V/V)的塑料盆中, 每天浇Hoagland营养液。30 d后,
将生长整齐一致的紫花苜蓿幼苗分为2组, 一组加
入250 mmol·L-1 NaCl溶液胁迫处理72 h, 另一组以正
幼苗根部组织, 在液氮中保存备用(马进等2015)。
2 转录组测序分析表达差异基因
用TRNzol Reagent试剂盒提取紫花苜蓿盐处
理与对照根部组织RNA, 将根部组织样品送往深
文件经碱基识别(base calling)转化为原始序列数据
(raw data), 然后对原始序列数据过滤, 得到有效数
据(clean data), 再采用短reads比对软件SOAPaligner/
cago truncatula)进行比对, 合格后运用RPKM (reads
per kb per million reads)法计算基因表达量。差异
表达基因筛选标准为差异表达倍数(fold change)
≥2、错配率(false discover rate, FDR)<0.05以及
3 iTRAQ联合二维液相色谱-串联质谱(2D LC–
理, 用Brandford法进行蛋白的浓度测定, 经十二烷
基硫酸钠-聚丙烯酰胺凝胶电泳(sodium dodecyl
sulfate-polyacrylamide gel electrophoresis, SDS-
PAGE)检测后, 取样品等量蛋白经胰蛋白酶(tryp-
sin)酶解成肽段后, 用iTRAQ 117和115标记未经处
理的幼根蛋白, iTRAQ 113和119标记250 mmol·L-1
NaCl胁迫72 h幼根蛋白, 最后将混合标记好的4组
样品进行等量混合, 对混合后的肽段使用强阳离
子交换色谱(strong cation exchange chromatography,
CX)预分离, 分离后联合2D LC–MS/MS分析, 采用
选标准是P≤0.05, 且差异倍数>1.20 (上调)或<0.83
4 关联分析
水平的皮尔逊相关系数(Pearson correlation coeffi-
cient), 确定蛋白和mRNA的相关性强弱。
1 组学分析
1.1 转录组测序数据
(total base pairs)数为5 426 577 900和5 427 101 160,
经过去除杂质处理分别得到60 295 310 (对照)和
60 301 124 (盐处理)个reads的净序列数, 比对到基
因组的序列(total mapped reads)分别有31 503 017
和30 538 130条(表1)。按照差异表达基因筛选标
准, 检测到31 907个基因表达量发生了改变, 其中
2 758个基因表达上调, 1 420个表达下调。
1.2 iTRAQ定量蛋白质组数据
spectra number) 376 983张, 匹配到的谱图数是29
共有3 857个蛋白共同表达。按照差异蛋白的标准
筛选, 共得到534个差异蛋白, 其中上调281个, 下
张振亚等: 基于转录组和蛋白质组关联研究技术筛选紫花苜蓿耐盐相关候选基因 319
2 蛋白质组和转录组关联
2.1 蛋白质组与转录组关联数量关系
进行关联, 当某一个基因在mRNA水平和蛋白质水
平均可以检测到有表达量时, 则认为这个基因的
差异3个范围中, 能关联到的蛋白质和基因数量关
系如表2所示。由表2可以看出, 有3 543个基因在
mRNA和蛋白质水平均得到鉴定, 其中2 114个基
因在mRNA水平和蛋白质水平均有表达, 534个差
2.2 蛋白质组与转录组的相关性
系, 依据mRNA水平和蛋白质水平的表达结果, 采
表1 RNA-seq序列与参考基因组的比对
Table 1 Summary of RNA-seq reads mapping to the reference genome
Reads概括 对照样本 盐处理样本
Reads的净序列数 60 295 310 60 301 124
总碱基对数/bp 5 426 577 900 5 427 101 160
匹配上基因组的总reads数(比例) 31 503 017 (52.25%) 30 538 130 (50.64%)
完全匹配序列数(比例) 5 092 810 (8.45%) 4 135 861 (6.86%)
特异匹配的序列数(比例) 30 253 588 (50.18%) 19 897 850 (33.00%)
表2 关联转录组和蛋白质组数量
Table 2 Number of associated transcriptomics and proteomics
类型 蛋白质数量 基因数量 关联数量
鉴定 3 857 31 907 3 543
定量 2 234 31 907 2 114
差异表达 534 5 412 191
和基因的表达等3种关联类型, 分别分析蛋白质组
与转录组的相关性。结果表明, 紫花苜蓿根用250
mmol·L-1 NaCl胁迫72 h后, 定量蛋白和基因的表达
呈负相关关系, 其间的相关性并不高, 相关系数为
−0.0013; 变化趋势相反的差异蛋白和基因的表达
呈负相关关系, 相关系数为−0.3648; 变化趋势相同
的差异蛋白和基因的表达呈正相关关系, 相关系
数为0.2620 (图1)。
2.3 关联到差异基因
将转录组和蛋白质组数据关联分析, 发现有
差异表达, 其中上调表达14个, 下调表达11个, 这些
还原酶家族蛋白(pyridine nucleotide-disulfide ox-
idoreductase family protein, PNDOFP)、锌结合乙
醇脱氢酶家族蛋白(zinc-binding alcohol dehydroge-
nase family protein, ZBDH)、TIP1;1型水通道蛋白
(aquaporin, AQP)、钙调素结合蛋白(calmodulin-
图1 蛋白质与基因表达关联
Fig.1 Correlation expressed quantitative proteins and genes
A: 定量蛋白和基因的表达关联; B: 变化趋势相反的差异蛋白和基因的表达关联; C: 变化趋势相同的差异蛋白和基因的表达关联。
binding protein, CaMBP)、C2H2型锌指蛋白(zinc
finger protein, ZFP)、蔗糖合成酶(sucrose synthase,
nase inhibition protein, PGIP)等; 下调差异基因如
leasing enzyme-like protein, AARE)、磷脂酶A1
(phospholipase A1, PLA1)和肌动蛋白相关蛋白4A
(actin-related protein 4A, ARPS4A)等。
讨 论
近年来, 系统生物学已逐渐成为后基因组学
过转录组学和蛋白质组学数据关联分析, 可以深
入理解基因和蛋白质之间的内在联系。此外, 通
方面具有重要的意义(Maier等2011; Wu等2014)。
表3 关联到与差异蛋白变化趋势相同的差异基因
Table 3 Correlating to differentially expressed genes at the same trend with differentially expressed proteins
NCBI登记号 基因名称
蛋白差异 基因差异 最小错误
倍数 倍数 发现率
能量代谢 AES72380.1 锌结合乙醇脱氢酶家族蛋白(ZBDH) 2.010 18.501 6.60×10-156
KEH29779.1 吡啶核苷酸二硫键氧化还原酶家族蛋白(PNDOFP) 2.141 2.424 1.39×10-95
氨基酸代谢 KEH27832.1 假定酰基氨基酸释放酶蛋白(AARE) 0.613 −10.626 2.22×10-8
碳水化合物代谢 KEH24408.1 蔗糖合成酶(SS) 1.377 1.269 5.26×10-36
AET05184.2 6-磷酸葡萄糖酸脱氢酶NAD结合域蛋白(PDNP) 0.804 −1.484 6.79×10-7
信号转导 KEH23302.1 LRR类受体激酶(LRR-RLK) 1.911 12.773 1.96×10-41
AET05574.1 钙调素结合蛋白(CaMBP) 2.120 2.124 2.63×10-37
AES90319.2 磷脂酶A1 (PLA1) 0.742 −1.542 7.30×10-39
蛋白质降解 AES95157.1 26S蛋白酶体RPT亚基(RPT) 0.606 −1.320 2.73×10-4
防御 AES66588.1 病程相关蛋白(PR) 1.640 2.159 4.31×10-82
AES65083.1 抗病反应蛋白(DRRP) 0.635 −2.234 3.14×10-145
KEH37153.1 β-1-3葡聚糖酶(β-1,3-Glu) 1.935 1.203 4.83×10-140
KEH33525.1 胚胎发育晚期富集蛋白(LEA) 1.417 2.660 3.49×10-24
KEH24447.1 多聚半乳糖醛酸酶抑制蛋白(PGIP) 1.506 11.899 4.71×10-4
细胞骨架 AES72796.2 肌动蛋白4A (ARPS4A) 0.811 −1.363 7.63×10-33
转录 AES90014.1 C2H2型锌指蛋白(ZFP) 1.321 2.330 5.71×10-9
抗氧化 AES90668.1 III类过氧化物酶(PRXs) 1.707 1.006 7.73×10-12
膜与转运 KEH24058.1 TIP1;1型水通道蛋白(AQP) 1.321 2.135 3.78×10-34
AES67953.1 膜内嵌转运家族蛋白(TIPs) 0.667 −3.414 2.63×10-37
KEH36695.1 ABC转运家族蛋白(ABC) 1.528 9.180 2.46×10-5
其他未知功能 AES68094.1 F18G18-200植物蛋白(PP) 0.771 −4.030 2.58×10-17
AES60756.1 清蛋白(AP) 0.695 −3.013 1.03×10-136
KEH36780.1 细胞外真皮糖蛋白(EDGP) 0.529 −1.976 5.51×10-27
AES82360.1 真菌蛋白酶A(FPA) 0.814 −2.598 2.80×10-105
AES62048.1 木葡聚糖内切葡聚糖酶抑制特异蛋白(XEIP) 3.271 3.355 1.32×10-278
鉴定的蛋白质数量少, 导致mRNA与蛋白质之间的
相关性较高(Anderson和Seilhamer 1997; Gygi等
的不断发展与完善, 通过蛋白质组与转录组学数
据, 发现mRNA和蛋白质之间的相关性较弱(Lack-
ner等2012; Yang等2013)。Huang等(2013)发现集胞
藻(Synechcoystis sp.) PCC 6803在氮缺乏24和48 h
后, mRNA与蛋白质之间的相关系数分别为0.0400
和0.0001, 但Li等(2015)利用蛋白质组学和转录组
学关联分析技术, 对砀山梨(Pyrus bretschneideri)果
实发育3个时期(前期、中期和后期) mRNA与蛋白
质的相关性进行研究, 发现砀山梨果实发育3个发
0.6336、0.4113和0.7049。本研究发现, 当紫花苜
蓿根在250 mmol·L-1 NaCl胁迫72 h后, 定量蛋白和
基因的表达呈现较弱的负相关关系(图1), 这可能
张振亚等: 基于转录组和蛋白质组关联研究技术筛选紫花苜蓿耐盐相关候选基因 321
致所导致(吴松锋等2005; Dembinsky等2007; de
Godoy等2008)。此外, 研究也发现, 变化趋势相反
的差异蛋白和基因的表达呈负相关关系(图1), 提
挥着重要的作用(Washburn等2003; Ghazalpour等
2011; Galland等2014)。对于采用转录组测序获得
的海量数据, 如何从中挖掘出有价值的关键基因
组关联分析, 挖掘紫花苜蓿耐盐相关候选基因, 发
水平均显著差异表达, 其中上调表达14个, 下调表
达11个(表3), 这些基因可能作为研究紫花苜蓿耐
在钙信号转导途径中, 由于钙调素(calmodulin,
CaM)本身不具备酶或转录因子活性, 必须通过其
功能及基因表达。Xu等(2011)研究发现, 拟南芥
(Arabidopsis thaliana)中超表达CaMBP可提高转基
因植株对盐胁迫的抗性。许多研究证实, 磷脂酶
(phospholipase, PL)和受体蛋白激酶(receptor-like
protein kinases, RLKs)参与非生物和生物胁迫的信
号传导过程(Munnik和Vermeer 2011; Shen等2011;
OsPLDβ1可作为负调控因子参与水稻(Oryza sativa)
对逆境胁迫响应。在烟草(Nicotiana tabacum)中超
异基因, 其中1个LRR-RLK (KEH23302.1)和1个
CaMBP (AET05574.1)上调, 1个PLA1 (AES90319.2)
下调(表3), 推测这些基因有可能是紫花苜蓿参与
盐胁迫能够产生活性氧(reactive oxygen spe-
cies, ROS), 过量的ROS会造成植物氧化胁迫。过
氧化物酶(peroxidase, POD)可分成3个亚家族(class
I、II和III)。Wang等(2015)研究发现, 过表达III类
过氧化物酶(peroxidase, PRXs)基因可增强玉米(Zea
差异基因(AES90668.1)表达上调(表3), 推测该基
在长期进化过程中, 会逐渐形成一套完善的防御
机制, 一些防御相关蛋白基因参与了植物响应生
迫响应下, 水稻根中抗病蛋白(disease resistance-re-
sponsive protein, DRRP)、β-1,3-葡聚糖酶(glucan
endo-1,3-β-glucosidase-like protein, β-1,3-Glu)和病
程相关蛋白(pathogenesis related protein, PR)表达
上调(Chitteti和Peng 2007; Zhang等2009; Li等
2010)。研究证实, 多聚半乳糖醛酸酶抑制蛋白是
植物重要的防卫蛋白, 可同真菌多聚半乳糖醛酸
酶(polygalacturonase, PG)结合参与植物的响应抗
病过程(De Lorenzo等2001; Juge 2006)。此外, 胚胎
晚期富集蛋白(late embryogenesis abundant protein,
对盐胁迫的抗性(Duan和Cai 2012)。本研究关联
到1个PR (AES66588.1)、1个β-1,3-Glu (KEH37153.1)、
1个LEA (KEH33525.1)和1个PGIP (KEH24447.1)等
差异基因表达上调(表3), 暗示着在紫花苜蓿参与
盐胁迫应答过程中, 这些防御蛋白基因可能发挥
转录因子(transcription factor, TF)是转录调控
中的核心功能蛋白, 在植物逆境胁迫应答过程中
生化过程。Sun等(2010)研究发现, ZPF179基因在
基因, 在转录和蛋白水平同时表达上调(表3), 推测
系统中的通道蛋白, 它在响应植物各种逆境中发
挥一定的作用(Forrest和Bhave 2007; Ligaba和Kat-
suhara 2009; Shen等2011; Hove和Bhave 2011)。液
泡膜内嵌蛋白(tonoplast intrinsic proteins, TIPs)是
AQP中的一种类型。据报道, TIPs的表达受盐胁
(Kaldenhoff和Fischer 2006)。本研究关联到1个
上调(表3), 推测该基因可能参与了紫花苜蓿盐胁
迫应答过程。作为跨膜ABC (ATP binding cassette)
和次生代谢物运输, 而且在响应非生物胁迫中也
起到重要的调控作用(Cai和Gros 2003)。研究表明,
调(表3), 推测该基因可能参与了紫花苜蓿盐胁迫
在碳水化合物代谢中, 关联到差异基因2个,
其中1个表达上调, 1个表达下调。在氨基酸代谢
中, 关联到1个差异基因表达下调。在能量代谢中,
联到的差异基因, 其中已证实蔗糖合成酶(sucrose
synthase, Sus)基因可能参与植物对盐胁迫的响应
过程(王敏华等2014), 另外, 关联到的差异基因与
盐逆境之间的关系尚不明确, 还有待深入研究。
Screening of candidate salt tolerance–related genes in alfalfa based on
transcriptome–proteome correlation research techniques
ZHANG Zhen-Ya, PEI Cui-Ming, MA Jin*
Faculty of Landscape Architecture, Zhejiang Agriculture and Forestry University, Lin’an, Zhejiang 311300, China
Abstract: Integrative analysis of high-throughput multi-omics data would provide innovative perspectives on
the molecular mechanisms of plant adaptation to salt stress. Correlation analysis of transcriptomic and proteom-
ic was performed in two southern type alfalfa (Medicago sativa ‘Millenium’) samples of control and Na-
Cl-treated samples in order to find salt tolerance–related candidate genes in alfalfa. Moderate correlations be-
tween transcriptome and proteome levels were found in this study. Correlation between gene expression and
that of quantified protein was −0.0013, as results of a correlation of 0.2620 between genes and proteins with a
similar expression trend and that of −0.3648 between those showed opposite trends. Tewnty-five differentially
expressed genes showed the same trend as proteins, among which 14 were up-regulated and 11 were down-reg-
ulated. These differentially expressed genes were involved in various biological processes such as metabolism,
signal transduction, posttranslational modification, protein turnover, chaperones, defense mechanisms, antioxi-
dant, cytoskeleton, transcription and function unknown. In addition, association analysis indicates that differen-
tially expressed genes such as TIP1;1 type aquaporin (AQP), calmodulin-binding protein (CaMBP), leucine-rich
repeat receptor-like kinase (LRR-RLK), C2H2 type zinc finger protein (ZFP), β-1,3-glucanase (β-1,3-Glu), late
embryogenesis abundant protein (LEA), sucrose synthase (SS), ABC transporter family protein, class III peroxi-
dases (PRXs), etc., played an important role in alfalfa response to salt stress. The research indicates that tran-
scriptome/proteome-associated research technique was effective to find salt tolerance–related candidate genes
in order to provide a new clue for further investigation of the salt tolerance mechanisms in alfalfa.
Key words: southern type alfalfa; salt stress; proteome; transcriptome; correlation
Received 2015-11-23 Accepted 2016-02-04
This work was supported by the National Natural Science Foundation of China (Grant No. 31272494), Zhejiang Provincial Natural Science Foun-
dation (Grant No. LY16C170003), and the Innovation Project of Graduate Students of The Top Key Discipline of Forestry of Zhejiang Province
(Grant No. 201533).
*Corresponding author (E-mail: majinzjl@163.com).