全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2012年第11期
木质纤维素生物质是地球上来源最丰富的生物
质资源[1,2],若能将其有效降解成糖类(如葡萄糖、
木糖、低聚木糖、阿拉伯糖等)物质,以这些糖类
收稿日期 : 2012-04-10
基金项目 : 国家重点基础研究发展计划(“973”计划)(2010CB732201), 中央高校基本科研业务费专项资金项目(201112G026), 国家自然
科学基金项目(31170067)
作者简介 : 龙传南 , 男 , 博士研究生 , 研究方向 : 生物能源 ; E-mail: longcn2004@126.com
通讯作者 : 龙敏南 , 男 , 教授 , 研究方向 : 生物质资源利用 ; E-mail: longmn@xmu.edu.cn
东方肉座菌 EU7-22 纤维素酶基因的克隆及序列分析
龙传南1 成奕瑾1 邬小兵2 刘健1 龙敏南1,2
(1 厦门大学能源研究院,厦门 361005 ;2 厦门大学生命科学学院,厦门 361005)
摘 要 : 东方肉座菌 EU7-22 与 XC-9、里氏木霉、康宁木霉、黑曲霉、斜卧青霉进行产纤维素酶比较,结果表明菌株 EU7-
22 具有较高的产纤维素酶能力及完整的纤维素酶系。根据里氏木霉和绿色木霉的外切葡聚糖酶,内切葡聚糖酶及 β-葡萄糖苷酶相
关基因序列,设计引物 PCR 扩增出菌株 EU7-22 cbh Ⅰ、cbh Ⅱ、eg Ⅰ、eg Ⅱ及 bgl Ⅰ。基因序列经 NCBI Blast 分析表明,cbh Ⅰ
与绿色木霉 cbh1 基因(FJ871063)同源性最高达 99% ;cbh Ⅱ与康宁木霉 cbh2 基因(DQ504304)同源性最高达 99% ;eg Ⅰ与
长枝木霉 eg1 基因(GU144298)同源性最高达 99% ;eg Ⅱ与绿色木霉 eg2 基因(EF602036)同源性最高达 99% ;bgl Ⅰ与菌株
Trichoderma sp. SSL bgl 基因(FJ040193)同源性最高达 100%。5 种纤维素酶基因编码的相应氨基酸序列与其他木霉纤维素酶的氨
基酸序列相似性也非常高。对上述纤维素酶基因编码的相应蛋白的分子量、等电点、N-糖基化位点、信号肽序列进行分析 ;对纤
维素结合区及糖基水解酶家族特征结构区进行了定位 ;用 SWISS-Model 模拟了酶蛋白的三级结构。
关键词 : 东方肉座菌 纤维素酶 基因 同源性
Cloning and Sequence Analysis of Cellulase Genes from
Hypocrea orientalis EU7-22
Long Chuannan1 Cheng Yijin1 Wu Xiaobing2 Liu Jian1 Long Minnan1,2
(1School of Energy Research,Xiamen University,Xiamen 361005 ;2School of Life Sciences,Xiamen University,Xiamen 361005)
Abstract: The fungi of Hypocrea orientalis EU7-22, Hypocrea orientalis XC-9, Trichoderma reesei, Trichoderma koningii, Aspergillus niger
and Penicillium decumbens were investigated to produce cellulase. The results indicated that the strain EU7-22 had highly cellulase activities
in comparison with other fungi, and possessed of integrated cellulase system. According to the reported cellobiohydrolase, endoglucanase and
β-glucosidase gene sequences of T. reesei and Trichoderma viride, the primers were designed and five cellulase genes(cbhⅠ, cbhⅡ, egⅠ, egⅡ,
bgl Ⅰ)were successfully cloned by PCR. By conducting sequence alignment analysis with NCBI Blast, it was found that the homology of same
cellulase genes between strain EU7-22 and other Trichoderma were: 99% to cbh1(FJ871063)from T. viride;99% to cbh2(DQ504304)from T.
koninqii ;99% to eg1(GU144298)from Trichoderma longibrachiatum ;99% to eg2(EF602036)from T. viride ;100% to bgl(FJ040193)
from Trichoderma sp. SSL. Furthermore, the corresponding amino acid sequences were also quite similar. The molecular weight, isoelectric point,
N-glycosylation sites and signal peptide sequence of these cellulase genes encoding the corresponding protein were analyzed. The cellulose-
binding domain and conserved domains of glycosyl hydrolases family were confirmed. By using SWISS-Model, the tertiary structure of cellulase
proteins were predicted and simulated.
Key words: Hypocrea orientalis Cellulase Gene Homology
物质为平台进一步转化加工成人类所必需的生物基
燃料、生物基化学品和生物基材料[3,4],对解决当
前世界面临的能源危机、环境污染和粮食短缺等问
2012年第11期 111龙传南等 :东方肉座菌 EU7-22 纤维素酶基因的克隆及序列分析
题具有重大的战略意义。
纤维素酶在天然纤维素生物质分解过程中发挥
关键作用。它是一个复杂的多酶体系,由许多具有
高效协同作用的水解酶组成,任何单一的纤维素酶
组分都难以高效地水解纤维素。根据纤维素酶催化
功 能, 可 分 为 外 切 β-1,4-葡 聚 糖 酶(exo-1,4-β-D-
glucanase,EC 3.2.1.91,简称 CBH),内切 β-1,4-葡
聚 糖 酶(endo-1,4-β-D-glucanase,EC 3.2.1.4, 简 称
EG) 及 β-1,4-葡 萄 糖 苷 酶(β-1,4-glucosidase,EC
3.2.1.21,简称 BGL)等 3 种组分[5]。
东方肉座菌(Hypocrea orientalis)属于木霉属,
菌株 EU7-22( 原命名为灰绿曲霉 EU7-22),在菌
株 XC-9[6] 基础上诱变育种获得。本研究拟对菌
株 EU7-22,XC-9 与 里 氏 木 霉(Trichoderma reesei ;
Hypocrea jecorin),康宁木霉(Trichoderma koningii),
黑 曲 霉(Aspergillus niger), 斜 卧 青 霉(Penicillium
decumbens)产纤维素酶能力进行比较 ;并且首次从
菌株 EU7-22 中克隆外切葡聚糖酶基因,内切葡聚糖
酶基因及 β-葡萄糖苷酶基因。采用生物信息学方法
分析酶蛋白的性质,以期为后续开展纤维素酶的基
因工程与蛋白质工程研究奠定基础。
1 材料与方法
1.1 材料
1.1.1 主 要 试 剂 PCR 扩 增 试 剂,DNA Marker 和
pMD19-T 载体均购于宝生物工程(大连)有限公司;
胶回收试剂盒购于天根生化科技(北京)有限公司;
对硝基酚 -β- 纤维二糖(pNPC),对硝基酚-β-葡糖
苷(pNPG),对硝基酚(pNP)购于 Sigma 公司。其
他试剂购于上海生工生物工程技术服务有限公司和
国药集团化学试剂有限公司。
1.1.2 菌株及培养基 菌株 :东方肉座菌(H. orient-
alis)EU7-22,东方肉座菌 XC-9,大肠杆菌(Escherichia
coli)DH5α 为本实验室保存。里氏木霉(T. reesei,H.
jecorin,编号 40358),购于中国工业微生物菌种保藏
管理中心:斜卧青霉(P. decumbens,编号 3.686),黑
曲霉(A. niger,编号 3.316),康宁木霉(T. koningii,
编号 3.2774)购于中国微生物菌种保藏管理委员会
普通微生物中心。
PDA培养基:马铃薯 200 g 洗净,去皮,切成小块,
煮沸 30 min,6 层纱布过滤,定容至 1 L,加葡萄糖
20 g,自然 pH ;固体培养基按 2% 浓度加入琼脂粉。
LB 培养基 :胰蛋白胨 10 g,酵母提取物 5 g,
氯化钠 10 g,用去离子水定容至 1 L ;固体培养基按
2% 浓度加入琼脂粉。
产纤维素酶培养基 : 2%(W/V)甘蔗渣(粉碎
过 40 目筛网),1%(W/V)麸皮,0.5% 蛋白胨,2.5
g/L KH2PO4,Mandels 营养液,pH5.2。
1.2 方法
1.2.1 粗酶液制备 将浓度约为 106 孢子 /mL 的不
同丝状真菌菌液接入产纤维素酶培养基中,30℃,
180 r/min 振 荡 培 养 4 d 后, 将 发 酵 液 常 温 离 心
(6 000 r/min,10 min),上清液即为粗酶液。
1.2.2 纤维素酶活测定
1.2.2.1 滤纸酶活(FPA activity)测定[7] 将 What-
man NO.1 滤纸(50 mg,1 cm×6 cm)卷成小卷,放进
25 mL 具塞刻度试管中,加入 1.5 mL 柠檬酸钠缓冲液
(50 mmol/mL,pH5.0),再加入用相同缓冲液适当稀
释(使吸光度值在最适量程范围内,即 0.2-1.0)的
0.5 mL 酶液,轻轻摇匀,使滤纸完全浸泡在液体中,
50℃保温 1 h 后,按 DNS 法测定并换算出还原糖含
量。以 100℃水浴灭活 5 min 的粗酶液为空白对照
(下同)。以每分钟催化底物水解生成 1 μmol 还原糖
定义为一个国际酶活单位(IU)。
在此酶活测定中,丝状真菌东方肉座菌 EU7-22、
里氏木霉、东方肉座菌 XC-9 和康宁木霉所产酶液,
分别稀释 5 倍、3 倍、3 倍、2 倍 ;黑曲霉,斜卧青
霉所产酶液不稀释。
1.2.2.2 内切葡聚糖酶活(CMC activity)测定[7] 移
取稀释酶液(东方肉座菌 EU7-22、里氏木霉、东方
肉座菌 XC-9 和康宁木霉所产酶液,分别稀释 10 倍、
6 倍、6 倍和 4 倍;黑曲霉,斜卧青霉所产酶液不稀释)
0.5 mL 于 25 mL 具塞刻度试管中,加入 2% CMC-Na
的柠檬酸 - 柠檬酸钠缓冲液(pH5.0)1.5 mL,然后
50℃水浴 30 min,按 DNS 法测定并换算出还原糖含
量。以每分钟催化底物水解生成 1 μmol 还原糖定义
为一个国际酶活单位(IU)。
1.2.2.3 外切葡聚糖酶(CBH activity)与 β-葡萄糖
苷酶(BGL activity)酶活测定[8] 移取稀释酶液(东
生物技术通报 Biotechnology Bulletin 2012年第11期112
方肉座菌 EU7-22、里氏木霉、东方肉座菌 XC-9、康
宁木霉和黑曲霉所产酶液,分别稀释 10 倍、6 倍、3 倍、
2 倍 和 2 倍 ;斜 卧 青 霉 所 产 酶 液 不 稀 释 )50 μL
于 离 心 管 中, 加 入 50 μL 用 柠 檬 酸 钠 缓 冲 液(50
mmol/mL,pH5.0)配制的 pNPC(5 mmol/L)(用于
CBH 酶活测定)和 pNPG(5 mmol/L)(用于 BGL 酶
活测定),50℃水浴 30 min,再加入 1 mL Na2CO3(0.5
mol/L)终止反应。在 405 nm 波长下测定吸光值。
一个酶活力单位(IU)定义为每分钟催化底物水解
生产 1 μmol pNP 所需的酶量。
不同丝状真菌产纤维素酶能力比较,根据 3 次
重复产酶试验,所测定的酶活为依据。
1.2.3 菌 株 总 DNA 提 取 东 方 肉 座 菌 EU7-22 经
PDA 液体培养基培养 36 h 后,按照 SDS 裂解法提取
总 DNA[9]。
1.2.4 引物设计与合成 根据 GenBank 中里氏木霉
及绿色木霉外切葡聚糖酶Ⅰ基因(cbh Ⅰ :GenBank
登录号 GL985084 和 AY368686.1);外切葡聚糖酶Ⅱ
基 因(cbh Ⅱ :GenBank 登 录 号 GU724763.1 和 AY-
368688.1);内切葡聚糖酶Ⅰ基因(egⅠ :GenBank 登
录号 AY928809.1 和 AY343986.1);内切葡聚糖酶Ⅱ
基因(eg Ⅱ:GenBank 登录号 DQ178347.1 和 AY368-
688.1);β-葡萄糖苷酶Ⅰ基因(bglⅠ :GenBank 登录
号 U09580.1 和 FJ882071.1)的序列,分别设计 5 对
引物(表 1),引物由上海生工生物工程有限公司
合成。
Taq 酶, 利 用 引 物 对 CBHⅠ-F&R、CBHⅡ-F&R、
EGⅠ-F&R、EGⅡ-F&R 和 BGLⅠ-F&R 进 行 PCR
扩增,分别获得 cbhⅠ、cbhⅡ、egⅠ、egⅡ及 bglⅠ
基因片段。扩增 cbhⅠ基因的反应程序为 :94℃预
变 性 5 min ;94 ℃ 变 性 30 s,57 ℃ 退 火 45 s,72 ℃
延伸 2 min,30 个循环 ;72℃充分延伸 10 min。扩
增 cbh Ⅱ、eg Ⅰ和 eg Ⅱ基因的反应程序为 :94℃预
变性 5 min ;94℃变性 30 s,55℃退火 45 s,72℃延
伸 2 min,30 个循环 ;72℃充分延伸 10 min。扩增
bgl Ⅰ基因的反应程序为 :94℃预变性 5 min ;94℃
变性 30 s,54℃退火 45 s,72℃延伸 2.5 min,30 个
循环 ;72 充分延伸 10 min。
PCR 扩增产物经胶回收试剂盒纯化后,连接到
pMD19-T 载体上,转化 E. coli DH5α 感受态细胞中,
先进行蓝白斑筛选,然后用 M13 通用引物对阳性克
隆子进行筛选和测序验证(北京六合华大基因科技
股份有限公司)。
1.2.6 纤维素酶基因序列的生物信息学分析 将克
隆基因序列在 GenBank 数据库中进行同源性比对
(http://www.ncbi.nlm.nih.gov/ BLAST);根据 BLAST 比
对的结果,分析基因内含子位置并去掉内含子,利
用 Primer Premier 5.0 进行核酸及蛋白质序列分析 ;
用 ProtParam 工具[10]分析基因编码蛋白质的氨基
酸序列组成、相对分子质量、等电点等理化性质
(http://web.expasy.org/protparam);利用 SignalP-4.0 软
件[11] 分 析 N-末 端 信 号 肽 序 列(http://www.cbs.dtu.
dk/services/SignalP/);利 用 NetNGlyc 软 件[12] 进 行
蛋白质 N-糖基化位点预测(http://www.cbs.dtu.dk/serv
ices/NetNGlyc);利用 Prosite motif search[13] 对蛋白
质的功能位点进行搜索(http://prosite.expasy.org/);
利用 SWISS-Model[14]预测和模拟蛋白质的三级结构
(http://swissmodel.expasy.org/workspace/index.php?)。
2 结果
2.1 丝状真菌产纤维素酶能力比较
丝状真菌东方肉座菌(H. orientalis)EU7-22,东
方肉座菌(H. orientalis)XC-9,里氏木霉(H. jeco-
rin),康宁木霉(T. koningii,),黑曲霉(A. niger),
斜卧青霉(P. decumbens)液态发酵产纤维素酶能力
比较,结果如图 1 所示。产外切葡聚糖酶(CBH)
表 1 东方肉座菌纤维素酶基因 PCR 扩增引物
引物名称 引物序列(5-3) 扩增基因
CBH Ⅰ -F ATGTATCGGAAATTGGCCCTCATCTC cbh Ⅰ
CBH Ⅰ -R TTACAGGCACTGAGAGTAGAATTCGTTC cbh Ⅰ
CBH Ⅱ -F ATGATTGTCGGCATTCTCACC cbh Ⅱ
CBH Ⅱ -R TTACAGGAACGATGGGTTTGC cbh Ⅱ
EG Ⅰ -F ATGGCGCCCTCAGTTACA eg Ⅰ
EG Ⅰ -R CTAAAGGCATTGCGAGTAG eg Ⅰ
EG Ⅱ -F ATGAACAAGTCCGTGGCTCCAT eg Ⅱ
EG Ⅱ -R CTACTTTCTTGCGAGACACG eg Ⅱ
BGL Ⅰ -F ATGCGTTACCGAACAGCAG bgl Ⅰ
BGL Ⅰ -R CTACGCTACCGACAGAGTGCT bgl Ⅰ
1.2.5 纤维素酶基因的克隆 以提取的东方肉座菌
EU7-22 总 DNA 为模板,采用 TaKaRa 公司的高保真
2012年第11期 113龙传南等 :东方肉座菌 EU7-22 纤维素酶基因的克隆及序列分析
的能力,东方肉座菌 EU7-22 > 里氏木霉 > 东方肉
座菌 XC-9> 黑曲霉 > 康宁木霉 > 斜卧青霉 ;产内切
葡聚糖酶(EG)的能力,东方肉座菌 EU7-22 > 里
氏木霉 > 东方肉座菌 XC-9> 康宁木霉 > 黑曲霉 > 斜
卧青霉 ;产 β-葡萄糖苷酶(BGL)的能力,东方肉
座菌 EU7-22> 里氏木霉 > 东方肉座菌 XC-9> 康宁木
霉 > 黑曲霉 > 斜卧青霉 ;产滤纸酶活(FPA)的能
力,里氏木霉略大于东方肉座菌 EU7-22> 东方肉座
菌 XC-9> 康宁木霉 > 黑曲霉 > 斜卧青霉。结果表明,
出东方肉座菌 EU7-22 不但产酶能力强,而且纤维素
酶酶系齐全,是一株比较有潜力的菌株,被应用于
生物能源领域。在后续试验中,该菌株的主要纤维
素酶基因也成功被克隆。
外切葡聚糖酶Ⅱ基因全长 1 583 bp(GenBank
登录号 JQ238605),与康宁木霉 cbh2 基因(DQ504304)
同源性最高达到 99%。根据康宁木霉,里氏木霉
及绿色木霉 cbh2 基因内含子位置,分析菌株 EU7-
图 1 不同丝状真菌产纤维素酶能力比较
H.orientalis
EU7-22
H.orientalis
XC-9
菌株
H.jecorina T.koningii A.niger P.decumbens
FPA⍫ᙗ
CMC⍫ᙗ
CBH⍫ᙗ
BGL⍫ᙗ
4.0
3.0
2.0
㓔㔤
㍐䞦
⍫ᙗ
IU
/m
L
0.0
0.5
2.5
3.5
2.2 PCR扩增纤维素酶基因片段
以东方肉座菌 EU7-22 总 DNA 为模板,利用引
物对 CBHⅠ-F&R、CBHⅡ-F&R、EGⅠ-F&R、EGⅡ-
F&R 和 BGLⅠ-F&R 分别进行 PCR 扩增,获得外切
葡聚糖酶Ⅰ基因(cbh Ⅰ,约 1 700 bp)片段,外切
葡聚糖酶Ⅱ基因(cbh Ⅱ,约 1 600 bp)、内切葡聚
糖酶Ⅰ基因(eg Ⅰ,约 1 600 bp)片段,内切葡聚
糖酶Ⅱ基因(eg Ⅱ,约 1 300 bp)片段和 β-葡萄糖
苷酶Ⅰ基因(bgl Ⅰ,约 2 400 bp)片段。PCR 产物
进行琼脂糖凝胶(1.0%)电泳,结果(图 2)显示,
PCR 反应均扩增出单一的 DNA 条带,基因片段的大
小与预期一致。
2.3 纤维素酶基因序列Blast分析
序列测定结果经 NCBI Blast 分析 :东方肉座菌
EU7-22 外切葡聚糖酶Ⅰ基因全长 1 680 bp(GenBank
登录号 JQ238604),与绿色木霉 cbh1 基因(FJ871063)
同源性最高达到 99%。根据绿色木霉、里氏木霉
及康宁木霉 cbh1 基因内含子位置,分析菌株 EU7-
22 cbh Ⅰ基因含有 2 个内含子,位于 462-527 bp 与
1 225-1 293 bp 处。利用 Primer Premier 5.0 将 cbh Ⅰ
基因(去掉内含子)翻译成相应氨基酸序列(编码
514 个氨基酸)并进行 Protein blast,结果显示,cbh
Ⅰ基因编码的蛋白质属于糖基水解酶家族 7A,与绿
色木霉外切葡聚糖酶Ⅰ(ACZ06578)氨基酸序列同
源性最高达到 100%。
图 2 纤维素酶基因 PCR 扩增片段的琼脂糖凝胶电泳
M. 200 bp DNA Marker ;1. cbh Ⅰ ;2. cbh Ⅱ ;3. eg Ⅰ ;4. eg Ⅱ ;5. bgl Ⅰ
1000
2000
bp
1000
2000
bp
1000
2000
bp
1000
2000
bp
1000
2000
bp
M 1 M 2 M 3 M 4 M 5
22 cbh Ⅱ基因含有 3 个内含子位于 93-143 bp、528-
583 bp 及 832-894 bp 处。利用 Primer Premier 5.0 将
cbh Ⅱ基因(去掉内含子)翻译成相应氨基酸序列(编
码 470 个氨基酸)并进行 Protein blast,结果显示
生物技术通报 Biotechnology Bulletin 2012年第11期114
cbh Ⅱ基因编码的蛋白质属于糖基水解酶家族 6,与
康宁木霉外切葡聚糖酶Ⅱ(ABF56208)氨基酸序列
同源性最高达到 100%。
内切葡聚糖酶Ⅰ基因全长 1 566 bp(GenBank
登录号 JQ238606),与长枝木霉 eg1 基因 (GU144298)
同源性最高达 99%。根据长枝木霉、里氏木霉、绿
色木霉 eg1 基因内含子位置,分析菌株 EU7-22 eg Ⅰ
基 因 含 有 2 个 内 含 子 位 于 771-893 bp 和 1 490-
1 546 bp 处。利用 Primer Premier 5.0 将 egⅠ基因(去
掉内含子)翻译成相应氨基酸序列(编码 461 个氨
基酸)并进行 Protein blast,结果显示,egⅠ基因编
码的蛋白质属于糖基水解酶家族 7B,与长枝木霉内
切葡聚糖酶Ⅰ(ACZ34302)氨基酸序列同源性最高
达 100%。
内切葡聚糖酶Ⅱ基因全长 1 257 bp(GenBank
登录号 JQ238607),与绿色木霉 eg2 基因(EF602036)
同源性最高达 99%。根据绿色木霉,里氏木霉 eg2
基因内含子位置,分析菌株 EU7-22 eg Ⅱ基因不含
内含子。利用 Primer Premier 5.0 将 eg Ⅱ基因翻译
成相应氨基酸序列(编码 418 个氨基酸)并进行
Protein blast,结果显示,eg Ⅱ基因编码的蛋白质属
于糖基水解酶家族 5,与绿色木霉内切木聚糖酶Ⅱ
(ADJ10267)氨基酸序列同源性最高达 100%。
β-葡萄 糖 苷 酶 Ⅰ 基 因 全 长 2 369 bp(GenBank
登 录 号 JQ904600), 与 菌 株 Trichoderma sp. SSL bgl
基因(FJ040193)同源性最高达 100%。根据菌株
Trichoderma sp. SSL,绿色木霉,里氏木霉 bgl Ⅰ基
因内含子位置,分析菌株 EU7-22 bgl Ⅰ基因含有 2
个内含子位于 66-135 bp 和 1 896-1 959 bp 处。利用
Primer Premier 5.0 将 bgl Ⅰ基因(去掉内含子)翻
译成相应氨基酸序列(编码 744 个氨基酸)并进行
Protein blast,结果显示,bgl Ⅰ基因编码的蛋白质属
于糖基水解酶家族 3,与菌株 Trichoderma sp. SSL 葡
萄糖苷酶(ACH92574)氨基酸序列同源性最高达
100%。
2.4 纤维素酶基因编码蛋白质ProtParam、NetNG-
lyc及SignalP分析
ProtParam 分析表明,东方肉座菌 EU7-22 CBHⅠ,
CBHⅡ,EGⅠ,EGⅡ及 BGLⅠ酶蛋白相对分子质量
分别为 54.23、49.61、48.16、44.22 和 78.21 kD ;等
电点分别为 4.58、4.91、4.72、4.96 和 5.96。
NetNGly 分析显示,东方肉座菌 EU7-22 CBHⅠ
酶蛋白含有 4 个 N-糖基化位点(N62SST、N81ETC、
N287TSF、N401ETS);CBHⅡ酶蛋白含有 3 个 N-糖基
化位点(N38WSG、N312ASS、N333ITS);EGⅠ酶蛋白
含有 5 个 N-糖基化位点(N78TTL、N164GSL、N204GTL、
N208TSG、N366PSN);EGⅡ酶蛋白含有 1 个 N-糖基化
位点(N124FTG);BGLⅠ酶蛋白含有 1 个 N- 糖基化
位点(N239TTW)。
SignalP 分析表明,东方肉座菌 EU7-22 CBH Ⅰ酶
蛋白 N-末端前 1-17 个氨基酸(MYRKLALISAFLAT-
ARA)为信号肽序列 ;CBH Ⅱ酶蛋白 N-末端前 1-18
个氨基酸(MIVGILTTLATLATLAAS)为信号肽序列;
EG Ⅰ酶蛋白 N-末端前 1-22 个氨基酸(MAPSVTLP-
LTTAMLALVRLVAA)为信号肽序列 ;EG Ⅱ酶蛋白
N-末端前 1-21 个氨基酸(MNKSVAPLLLAASTLVG-
GVAA)为信号肽序列;BGL Ⅰ酶蛋白 N-末端前 1-19
个氨基酸(MRYRTAAALALAAAPFVTA)为信号肽
序列。
2.5 纤维素酶蛋白Prosite motif search及SWISS-
Model三维结构模拟
纤维素酶分子的结构大多具有独立活性的两个
结构域,其中一部分是只能水解可溶性纤维素,但
不能水解不溶性纤维素,并且具有催化功能,被
称 为 催 化 结 构 域(core or catalytic domaim,CD);
另一部分能吸附于纤维素表面,但对纤维素降解
作 用 不 大, 被 称 为 结 合 结 构 域(cellulose-binding
domain,CBD),CBD 在纤维素酶中位于氨基端或羧
基端 ;CD 与 CBD 之间通过一段高度糖基化的连接
桥(linker)相连。
利用 Prosite motif search 对蛋白质的功能位点
进行分析,CBH Ⅰ酶蛋白含有 1 个纤维素结合域
(CBD):C486GGIGYSGPTVCASGTTCQVLNEFYSQC513。
CBH Ⅱ酶蛋白含有 2 个糖基水解酶家族 6 的特征序
列(V190VYDLPDRDCAALASNG206,L238LVIEPDS-
LA247)及 1 个纤维素结合域(C34GGQNWSGPTCCASG
STCVYSNDYYSQC61)。EG Ⅰ酶蛋白含有 1 个纤维素
结合域(CBD):C433GGIGYTGCKTCTSGTTCQYGND-
2012年第11期 115龙传南等 :东方肉座菌 EU7-22 纤维素酶基因的克隆及序列分析
YYSQC460。EG Ⅱ酶蛋白含有 1 个糖基水解酶家族 6
的特征序列(V232WFGIMNEPH241)及 1 个纤维素结
合 域(C29GGIGWSGPTNCAPGSACSTLNSYYAQC56)。
BGLⅠ酶蛋白不含有任何特征序列。
利用 SWISS-Model 预测和模拟纤维素酶蛋白催
化结构域与结合结构域的三级结构,如图 3 所示。
A. CBH Ⅰ酶蛋白 CD 域 ;B. CBH Ⅰ酶蛋白 CBD 域 ;C. CBH Ⅱ酶蛋白 CD 域 ;D. CBH Ⅱ酶蛋白 CBD 域 ;E. EG Ⅰ酶蛋白 CD 域 ;
F. EG Ⅰ酶蛋白 CBD 域 ;G. EG Ⅱ酶蛋白 CD 域 ;H. EG Ⅱ酶蛋白 CBD 域 ;I. BGL Ⅰ酶蛋白 CD 域
图 3 SWISS-Model 模拟纤维素酶 CD 与 CBD 域三级结构
A B C D
F G H IE
3 讨论
天然纤维素生物质是地球上最丰富却未被有效
利用的可再生资源,高效地将纤维素生物质全组分
转化为生物燃料对解决人类目前面临的能源短缺有
重要的战略意义。根据纤维素酶酶活测定结果,东
方肉座菌 EU7-22,相比其他丝状真菌(里氏木霉,
康宁木霉、黑曲霉和斜卧青霉),表现较强的产纤维
素酶能力,并且拥有完整的纤维素酶酶系。
Goedegebuur 等[15]总结,在 T. reesei 中至少产
生 7 种纤维素酶(CBH I、CBH II、EG I、EG II、EG
III、EG IV 和 EG V),这些 CBHs 与 EGs 在菌株分泌
的纤维素酶中所占含量分别为 >50%、20%、15%、
10%、1%、<1% 和 <1%。 而 CBH I、CBH II、EG I
和 EG II 4 种酶的含量总和超过 95%,可见在纤维素
降解过程中,发挥巨大功能。EGs 与 CBHs 先分解
纤维素产生纤维二糖,进一步被 β-葡萄糖苷酶分解
产生葡萄糖。因此,东方肉座菌 EU7-22 的主要纤维
素酶基因(cbh I、cbh II、eg I、eg II 和 bgl I)被克隆。
这些基因序列及其内含子的位置、数量、长短以及
编码氨基酸序列的保守性,可为纤维素酶家族亚群
的分类提供依据[15]。
对纤维素酶蛋白进行糖基化及信号肽分析,可
为异源表达研究酶蛋白提供指导意义。如在酵母中
表达研究酶基因,需要去除信号肽序列[16]。因此,
必须先了解清楚该酶蛋白有没有信号肽序列,具体
有多少个氨基酸为信号肽序列。表达的酶蛋白有没
有活性,活性的高低如何,这涉及到酶蛋白糖基化
问题[17]。
SWISS-Model 预测和模拟蛋白质的三级结构。
CBH Ⅰ酶蛋白催化结构域的三级结构,如图 3-A,
参考模板为 H. jecorina Cel7A(PDB:2v3i),且该区域
两者氨基酸序列相似性达 97.01% ;CBD 结构域位于
该蛋白质的羧基端,其三级结构如图 3-B,参考模
板为 H. jecorina CBH I 的 C-末端区域(PDB:1cbh)[18],
且该区域两者氨基酸序列相似性达 91.67%。
CBH Ⅱ酶蛋白催化结构域的三级结构如图 3-C,
参 考 模 板 为 H. jecorina Cel6A(PDB:1qk2)[19], 且
该区域两者氨基酸序列相似性达 98.90% ;CBD 结
构域位于该蛋白质的氨基端,其三级结构如图 3-D,
参考模板为 H. jecorina CBH I 纤维素结合域(PDB:
1az6)[20], 且 该 区 域 两 者 氨 基 酸 序 列 相 似 性 达
70.97%。
生物技术通报 Biotechnology Bulletin 2012年第11期116
EGⅠ酶蛋白催化结构域的三级结构如图 3-E,
参 考 模 板 为 H. jecorina Cel7B(PDB: 1eg1)[21], 且
该区域两者氨基酸序列相似性达 95.15% ;CBD 结
构域位于该蛋白质的 C 端,其三级结构如图 3-F,
参考模板为 H. jecorina CBH I 的 C-末端区域(PDB:
1cbh)[18], 虽 然 模 拟 图 与 图 3-B( 外 切 葡 聚 糖 酶
Ⅰ CBD 结 构 域 ) 相 同, 但 是 该 区 域 与 H. jecorina
外切酶 I 纤维素结合域的氨基酸序列相似性只有
72.22%。
EGⅡ酶蛋白的催化结构域的三级结构如图 3-G
所示,参考模板为 H. jecorina Cel5A(PDB: 3qr3)[22],
且该区域两者氨基酸序列相似性达 94.80% ;CBD
结构域位于该蛋白质的 N 端,其三级结构如图 3-H
所示,参考模板为 H. jecorina CBH I 的 C-末端区域
(PDB: 1cbh)[18],虽然模拟图与图 3-B(外切葡聚糖
酶Ⅰ CBD 结构域)相似,但是该区域与 H. jecorina
外切酶 I 纤维素结合域的氨基酸序列相似性仅有
62.86%。
BGLⅠ酶蛋白只含有催化结构域,其三级结构
如图 3-I,参考模板为 Kluyveromyces marxianus Cel3
(PDB: 3abz)[23],且该区域两者氨基酸序列相似性
达 23.75%。
Prosite motif search 分析的酶蛋白纤维素结合域
氨基酸序列及位置与 SWISS-Model 预测及分析的序
列完全符合。通过对纤维素酶蛋白各功能域分析及
预测,可为进一步构建具有高催化效力的酶蛋白突
变体提供重要依据[24,25]。
4 结论
本研究证明东方肉座菌 EU7-22 相比其他丝状真
菌(里氏木霉、康宁木霉、黑曲霉和斜卧青霉)具
有较高的产纤维素酶能力,并具有完整的纤维素酶
系。菌株 EU7-22 主要纤维素酶基因(cbhⅠ、cbhⅡ、
egⅠ、egⅡ和 bglⅠ)被成功克隆。序列分析表明,
与木霉属其他菌株相应的基因相似性均达 99%,氨
基酸序列相似性均为 100%,并具有糖基水解酶家族
特征序列。CBHⅠ、CBHⅡ、EGⅠ、EGⅡ及 BGLⅠ
的 分 子 量 分 别 为 54.23、49.61、48.16、44.22 和
78.21 kD ;等电点分别为 4.58、4.91、4.72、4.96 和
5.96 ;含有糖基化位点数分别为 4、3、5、1 和 1 个。
CBHⅠN 端前 17 个氨基酸,CBHⅡ N 端前 18 个氨
基酸,EGⅠN 端前 22 个氨基酸,EGⅡ N 端前 21 个
氨基酸及 BGLⅠN 端前 19 个氨基酸为信号肽序列。
这些纤维素酶蛋白 CD 及 CBD 域的三级结构被模拟。
参 考 文 献
[1] 曲音波 . 木质纤维素降解酶系的基础和技术研究进展 . 山东大
学学报 : 理学版 , 2011, 46(10): 160-170.
[2] Sukumaran RK, Singhania RR, Mathew GM, et al. Cellulase
production using biomass feed stock and its application in
lignocellulose saccharification for bio-ethanol production. Renew
Energ, 2009, 34(2): 421-424.
[3] Kamm B, Kamm M. Biorefineries-multi product processes. Adv
Biochem Engin Biotechnol, 2007, 105: 175-204.
[4] 方诩 , 秦玉琪 , 李雪芝 , 等 . 纤维素酶与木质纤维素生物降解转
化的研究进展 . 生物工程学报 , 2010, 26(7): 864-869.
[5] Chtistian P. The Trichoderma cellulase regulatory puzzle. Enzyme
Microb Tech, 1993, 15(2): 90-99.
[6] Xu C, Long MN, Wu XB, et al. Screening and characterization of a
high cellulase producing strain Aspergillus glaucus XC9. Front Biol
China, 2006, 1: 35-40.
[7] Ghose TK. Measurement of cellulase activities. Pure Appl Chem,
1987, 59: 257-268.
[8] Saha BC. Production, purification and properties of endoglucanase
from a newly isolated strain of Mucor circinelloides. Process Biochem,
2004, 39: 1871-1876.
[9] 汪天虹 . 分子生物学实验[M]. 北京 : 北京大学出版社 , 2009:
21-22.
[10] Wilkins MR, Gasteiger E, Bairoch A, et al. Protein identification
and analysis tools on the ExPASy Server. Methods Mol Biol, 1999,
112: 531-552.
[11] Petersen TN, Brunak S, Heijne GV, et al. SignalP 4.0: discrimina-
ting signal peptides from transmembrane regions. Nat Methods,
2011, 8: 785-786.
[12] Gupta R, Brunak S. Prediction of glycosylation across the human
proteome and the correlation to protein function. Pacific Symposium
on Biocomputing, 2002, 7: 310-322.
[13] Sigrist CJA, Cerutti L, de Castro E, et al. PROSITE, a protein
domain database for functional characterization and annotation.
Nucleic Acids Res, 2010, 38: 161-166.
2012年第11期 117龙传南等 :东方肉座菌 EU7-22 纤维素酶基因的克隆及序列分析
[14] Arnold K, Bordoli L, Kopp J, et al. The SWISS-MODEL Workspace:
A web-based environment for protein structure homology modeling.
Bioinformatics, 2006, 22: 195-201.
[15] Goedegebuur F, Fowler T, Phillips J, et al. Cloning and relational
analysis of 15 novel fungal endoglucanases from family 12 glycosyl
hydrolase. Curr Genet, 2002, 41: 89-98.
[16] Song JZ, Liu BD, Liu ZH, et al. Cloning of two cellobiohydrolase
genes from Trichoderma viride and heterogenous expression in yeast
Saccharomyces cerevisiae. Mol Biol Rep, 2010, 37: 2135-2140.
[17] Hui JPM, White TC, Thibault P. Identification of glycan structure
and glycosylation sites in cellobiohydrolase II and endoglucanases I
and II from Trichoderma reesei. Glycobiology, 2002, 12: 837-849.
[18] Kraulis J, Clore GM, Nilges M, et al. Determination of the three-di-
mensional solution structure of the C-terminal domain of cellobiohy-
drolase I from Trichoderma reesei. A study using nuclear magnetic
resonance and hybrid distance geometry-dynamical simulated anne-
aling. Biochemistry, 1989, 28: 7241-7257.
[19] Zou J, Kleywegt GJ, Ståhlberg J, et al. Crystallographic evidence for
substrate ring distortion and protein conformational changes during
catalysis in cellobiohydrolase Ce16A from Trichoderma reesei.
Structure, 1999, 7(9): 1035-1045.
[20] Mattinen ML, Kontteli M, Kerovuo J, et al. Three-dimensional stru-
ctures of three engineered cellulose-binding domains of cellobiohy-
drolase I from Trichoderma reesei. Protein Sci, 1997, 6(2): 294-
303.
[21] Kleywegt GJ, Zou JY, Divne C, et al. The crystal structure of the
catalytic core domain of endoglucanase I from Trichoderma reesei
at 3.6 Å resolution, and a comparison with related enzymes. J Mol
Biol, 1997, 272: 383-397.
[22] Lee TM, Farrow MF, Arnold FH, et al. A structural study of
Hypocrea jecorina Cel5A. Protein Sci, 2011, 20(11): 1935-1940.
[23] Yoshida E, Hidaka M, Fushinobu S, et al. Role of a PA14 domain
in determining substrate specificity of a glycoside hydrolase family
3 β-glucosidase from Kluyveromyces marxianus. Biochem J, 2010,
431(1): 39-49.
[24] Carrard G, Koivula A, Soderlund H, et al. Cellulose-binding
domains promote hydrolysis of different sites on crystalline
cellulose. Proc Natl Acad Sci USA, 2000, 97(19): 10342-10347.
[25] Lantz SE, Goedegebuur F, Hommes R, et al. Hypocrea jecorina
CEL6A protein engineering. Biotechnol Biofuels, 2010, 3: 20.
(责任编辑 李楠)