免费文献传递   相关文献

Gene Cloning and Alternative Splicing of CCoAOMT Subfamily Genes from Eucalyptus camaldulensis

赤桉CCoAOMT亚家族的基因克隆及可变剪接分析


通过同源克隆策略和RACE技术获得赤桉CCoAOMT亚家族2个成员的全长cDNA序列。CCoAOMT 1 基因的全长cDNA序列为1 020 bp,其中可读框ORF长度为738 bp,5’-UTR为106 bp,3’-UTR为176 bp;CCoAOMT 2 基因的全长cDNA序列为1 047 bp,其中可读框ORF长度为741 bp,5’-UTR为125 bp,3’-UTR为158 bp。CCoAOMT 1CCoAOMT2 基因都由5个外显子组成,主要的区别在于前者第1个内含子存在5’端可变剪接位点,形成2条不同长度的mRNA,一条的ORF长度为738 bp,而另一条比前者缺失了42 bp,但不影响其余氨基酸的读码框顺序。赤桉CCoAOMT 1 基因在茎段中可变剪接发生在5—9月间,是桉树一年中树高和直径增长最快的阶段,这个可变剪接可能与组织器官生长发育有关。蛋白质三维结构分析表明,CCoAOMT能形成正确的酶活性中心与底物结合位点。抑制CCoAOMT基因表达,降低桉树木质素对于减少制浆造纸工业污染具有重要意义。

In this study, the homology-based RT-PCR method and the rapid amplification of cDNA ends (RACE) method were used to clone full-length cDNAs of two CCoAOMT subfamily genes in Eucalyptus camaldulensis. The full-length cDNA of CCoAOMT 1 gene is 1 020 bp and contains 738 bp ORF, 106 bp 5‘-UTR and 176 bp 3‘-UTR, and the full-length cDNA of CCoAOMT 2 gene is 1 047 bp and contains 741 bp ORF, 125 bp 5‘-UTR and 158 bp 3‘-UTR.The alignment result showed that CCoAOMT 1 and CCoAOMT 2 genomic DNA both contain five exons. Their main difference lay in that there was a alternative 5‘ splice site at the CCoAOMT 1 ‘s first intron, which could result in formation of two mRNA with different lengths. One mRNA contains 738 bp ORF, and the other has a 42 bp deletion, however this splicing doesn‘t change the reading frame sequence of posterior amino acids. The alternative splicing of CCoAOMT 1 gene expresses from May to September, at the most vigorous growing stages of Eucalyptus stem, suggesting that this alternative splicing may involve in the development or growth of tissues and organs. Analysis result of protein‘s three-dimensional structure showed that the CCoAOMT can form the correct active center of enzyme and the substrate binding site. Limitation of the CCoAOMT genes‘ expression by genetic manipulation may serve as a way to reduce the lignin content in Eucalyptus, which presents a significant prospect in reducing pollutants generated from pulping industry.


全 文 :第 50 卷 第 5 期
2 0 1 4 年 5 月
林 业 科 学
SCIENTIA SILVAE SINICAE
Vol. 50,No. 5
May,2 0 1 4
doi:10.11707 / j.1001-7488.20140508
收稿日期: 2013 - 09 - 25; 修回日期: 2014 - 01 - 08。
基金项目: 湖南省研究生科研创新项目(CX2013B360;CX2013A02) ;湖南省科技计划重点项目(2011NK2019)。
* 张党权为通讯作者。
赤桉 CCoAOMT亚家族的基因克隆及可变剪接分析*
谷振军1,2 章怀云1,2 张党权1,2 谢耀坚3 何含杰1,2
陈丽莉2 彭 宽1,2 刘 果3 杨 丹2
(1. 经济林培育与保护省部共建教育部重点实验室(中南林业科技大学) 长沙 410004;
2. 中南林业科技大学 林业生物技术湖南省重点实验室 长沙 410004; 3. 国家林业局桉树研究开发中心 湛江 524022)
摘 要: 通过同源克隆策略和 RACE 技术获得赤桉 CCoAOMT 亚家族 2 个成员的全长 cDNA 序列。CCoAOMT1
基因的全长 cDNA 序列为 1 020 bp,其中可读框 ORF 长度为 738 bp,5’-UTR 为 106 bp,3’-UTR 为 176 bp;
CCoAOMT2 基因的全长 cDNA 序列为 1 047 bp,其中可读框 ORF 长度为 741 bp,5’-UTR 为 125 bp,3’-UTR 为 158
bp。CCoAOMT1 和 CCoAOMT2 基因都由 5 个外显子组成,主要的区别在于前者第 1 个内含子存在 5’端可变剪接位
点,形成 2 条不同长度的 mRNA,一条的 ORF 长度为 738 bp,而另一条比前者缺失了 42 bp,但不影响其余氨基酸的
读码框顺序。赤桉 CCoAOMT1 基因在茎段中可变剪接发生在 5—9 月间,是桉树一年中树高和直径增长最快的阶
段,这个可变剪接可能与组织器官生长发育有关。蛋白质三维结构分析表明,CCoAOMT 能形成正确的酶活性中心
与底物结合位点。抑制 CCoAOMT 基因表达,降低桉树木质素对于减少制浆造纸工业污染具有重要意义。
关键词: 桉树; 木质素; CCoAOMT 亚家族; 基因克隆; 可变剪接; 生物信息学注释
中图分类号: S718. 46 文献标识码: A 文章编号: 1001 - 7488(2014)05 - 0062 - 08
Gene Cloning and Alternative Splicing of CCoAOMT Subfamily
Genes from Eucalyptus camaldulensis
Gu Zhenjun1,2 Zhang Huaiyun1,2 Zhang Dangquan1,2 Xie Yaojian3
He Hanjie1,2 Chen Lili2 Peng Kuan1,2 Liu Guo3 Yang Dan2
(1 . Key Laboratory of Cultivation and Protection for Non-Wood Forest Trees (Central South University of Forestry and Technology),
Ministry of Education Changsha 410004; 2 . Hunan Provincial Key Laboratory of Forestry Biotechnology Central South University of
Forestry and Technology Changsha 410004; 3 . China Eucalypt Research Centre Zhanjiang 524022)
Abstract: In this study,the homology-based RT-PCR method and the rapid amplification of cDNA ends ( RACE)
method were used to clone full-length cDNAs of two CCoAOMT subfamily genes in Eucalyptus camaldulensis. The
full-length cDNA of CCoAOMT1 gene is 1 020 bp and contains 738 bp ORF,106 bp 5’-UTR and 176 bp 3’-UTR,
and the full-length cDNA of CCoAOMT2 gene is 1 047 bp and contains 741 bp ORF,125 bp 5’-UTR and 158 bp
3’-UTR. The alignment result showed that CCoAOMT1 and CCoAOMT2 genomic DNA both contain five exons. Their
main difference lay in that there was a alternative 5’splice site at the CCoAOMT1’s first intron,which could result
in formation of two mRNA with different lengths. One mRNA contains 738 bp ORF,and the other has a 42 bp
deletion,however this splicing doesn’t change the reading frame sequence of posterior amino acids. The alternative
splicing of CCoAOMT1 gene expresses from May to September,at the most vigorous growing stages of Eucalyptus
stem, suggesting that this alternative splicing may involve in the development or growth of tissues and organs.
Analysis result of protein’s three-dimensional structure showed that the CCoAOMT can form the correct active center
of enzyme and the substrate binding site. Limitation of the CCoAOMT genes’expression by genetic manipulation may
serve as a way to reduce the lignin content in Eucalyptus,which presents a significant prospect in reducing pollutants
generated from pulping industry.
Key words: Eucalyptus; lignin; CCoAOMT subfamily; gene cloning; alternative splicing; bioinformatics annotation
第 5 期 谷振军等: 赤桉 CCoAOMT 亚家族的基因克隆及可变剪接分析
桉树(Eucalyptus)是目前世界上最重要的制浆
造纸原料(谢耀坚等,2007),是全球三大速生材树
种之一,并有望成为新型生物质能源树种 (周群英
等,2013)。近年来,基因组学研究取得了突破性进
展。由日本 Kazusa DNA 研究中心(KDRI)与王子纸
业(Oji Paper)合作完成了赤桉 ( E. camaldulensis)
(2n = 22,基 因 组 约 654 Mb ) 的 基 因 组 测 序
(Hirakawa et al.,2011),获得了 4. 2 倍覆盖度的基
因组草图;由美国能源部(DOE)的联合基因组学研
究所 ( JGI)与 IEuGC-EUCAGEN 合作完成了巨桉
(E. grandis) (2n = 22,基因组约 560 Mb) 和蓝桉
(E. globulus)(2n = 22,基因组约 650 Mb)的基因组
测序(Paiva et al.,2011; Myburg et al.,2011),获得
了 8 倍 覆 盖 度 的 基 因 组 框 架 图。可 变 剪 接
( alternative splicing)是基因组学研究内容之一。植
物基因组中约有 60% 的基因存在 1 个或多个可变
剪接(Reddy et al.,2013),参与光合作用、胚胎发
育、信号传导、逆境胁迫响应和开花调控等重要生理
活动(Reddy,2007)。
木质素是复杂的苯丙烷单体聚合物,在植物细
胞壁中作为一种填充和粘合物质,与纤维素和半纤
维素之间相互紧密粘合。据报道,双子叶植物中的
木质素主要由愈创木基单体(G 木质素单体)和紫
丁香基单体(S 木质素单体)组成,并聚合形成愈创
木基 -紫丁香基木质素(G-S 木质素) (李潞滨等,
2007)。在 木 质 素 单 体 合 成 途 径 中,CCoAOMT
(Caffeoyl-CoA O-methyltransferase,咖啡酯乙酰辅酶
A 氧 位 - 甲 基 转 移 酶 ) 亚 家 族 是 OMT ( O-
methyltransferase,氧位 -甲基转移酶)基因家族的主
要成员,可以控制双子叶植物 G-S 木质素的含量,及
G 木质素单体与 S 木质素单体的比例(谷振军等,
2010)。而木质素的单体比例对制浆造纸过程中木
质素去除难易程度具有重要影响 (Weng et al.,
2010; Li et al.,2011)。将木质素从纤维素和半纤
维素中去除,会产生大量造纸废液并严重污染环境
(Anterola et al.,2002; Wei et al.,2008)。因此,通
过实施 CCoAOMT 基因操作去除或降低桉树木质素
对于减少制浆造纸工业污染具有重要意义。研究表
明,反义 RNA 抑制 CCoAOMT 基因表达的转基因烟
草(Nicotiana tabacum) (Meyermans et al.,2000)和
转基因杂种杨 ( Populus tremula × Populus alba )
( Jouanin et al.,2000; Wei et al.,2008)中,总木质素
含量可降低 10%以上,G 木质素单体含量下降,S /G
的比值升高。致使木质素单体之间 ( β-β,β-1,β-5
和 5-5)的碳 -碳共价键数量减少,木质素单体之间
的缩合连接点降低,因而在制浆中木质素更容易被
去除(Chen et al.,2001)。基于 CCoAOMT 是决定木
质素单体组分比例和木质素去除难易程度的关键基
因,本研究通过同源克隆和 RACE 技术获得赤桉
CCoAOMT 基因的全长序列,并对该基因进行可变
剪接表达分析,为深入研究桉树 CCoAOMT 基因的
功能提供信息。
1 材料与方法
1. 1 样品采集
赤桉为中南林业科技大学株洲校区的 15 年生
植株,用于提取基因组 DNA 和总 RNA 的样品均在
同一单株采集。于 3 月初和 6 月中旬分别采集当年
生叶片和茎段,用于克隆 CCoAOMT 基因的 gDNA
和 cDNA。采集跨度 8 个月份的茎段和叶片样品,
用于研究 CCoAOMT1 基因的可变剪接表达规律,采
取时间分别为 4 月上旬、5 月中旬、6 月中旬、7 月中
旬、8 月中旬、9 月中旬、10 月中旬、11 月下旬。采集
的样品洗净后,于液氮中运输,至实验室后超低温冰
箱保存。
1. 2 引物设计
通过分析 CCoAOMT 亚家族的基因序列特点,
依据保守 DNA 序列设计同源克隆引物,基于同源片
段测序结果设计 RACE 引物,依据 cDNA 全长序列
设计 gDNA 全长克隆引物(表 1)。为避免基因组污
染,CCoAOMT1 可变剪接的正向引物和反向引物分
别设计在第 1 个外显子与第 3 个外显子。
1. 3 试验方法
1. 3. 1 基因组 DNA 和总 RNA 的提取 采用改良
CTAB 法 (刘果等,2013 ) 提取赤桉叶片基因组
DNA。赤桉茎段仔细环剥去皮后,快速刮取次生木
质部材料,结合采用改良 CTAB 法 ( Sangha et al.,
2010) /植物 RNA 试剂盒 ( Omega)法提取和纯化
总 RNA。
1. 3. 2 CCoAOMT 基因保守片段的 cDNA 克隆 使
用 Invitrogen ThermoScript kit 进行 cDNA 第 1 条链的
合成。以此为模板,使用 CCoAOMT1-aF、CCoAOMT1-
aR 和 CCoAOMT2-aF、CCoAOMT2-aR 引物及 Takara
Pyrobest 酶进行 PCR 扩增,程序为: 预变性(94 ℃,5
min); 变性(94 ℃,40 s)、退火(45 s)、延伸(72 ℃,
120 s),35 个循环; 总延伸 (72 ℃,8 min)。扩增
CCoAOMT1 和 CCoAOMT2 基因的退火温度分别为
62 ℃、58 ℃。纯化回收目的产物,连接至 pMD-18T
载体,转化大肠杆菌(Escherichia coli)DH5α 菌株后送
阳性克隆到深圳华大基因公司进行测序。
36
林 业 科 学 50 卷
表 1 赤桉 CCoAOMT 基因克隆及可变剪接分析引物
Tab. 1 Primers used for gene cloning and alternative splicing analysis of Eucalyptus CCoAOMT
试验名称
Experiment
引物名称
Primer name
核酸序列
Primer sequence(5’- 3’)
基因保守片段的 cDNA 同源克隆
Cloning the conserved region of cDNA fragment
CCoAOMT1-aF AGAGAGTTTGAATCAATGGCCACCG
CCoAOMT1-aR AGAATGAACCCTGATCATAAGGACTTGA
CCoAOMT2-aF AGCTCTGGCAGCCAACGCAGAG
CCoAOMT2-aR CATGCAACGGTTCAAAGACAATA
基因全长的 RACE 克隆
Cloning the full-length cDNA fragment
CCoAOMT1 - 3’RACE1 GTATGTGAGGTACTACAGGGAT
CCoAOMT1-3’RACE2 CCGCTCAGGAAGTATGTG
CCoAOMT2-3’RACE1 TATTCGTGGACGCTGACAAG
CCoAOMT2-3’RACE2 GATGGCATCACCCTGTG
CCoAOMT1-5’RACE1 CCATAGGGTGTTGTCGTAG
CCoAOMT1-5’RACE2 TGGATGACCGGCAGGCCAAG
CCoAOMT2-5’RACE1 AACGGTAGTTCCTCATTTCATC
CCoAOMT2-5’RACE2 ACCACGGAGCCGTTCCACAG
基因组 gDNA 全长序列的克隆
Cloning the full-length genomic DNA fragment
CCoAOMT1-gF AGAGAGTTTGAATCAATGGCCACCG
CCoAOMT1-gR AGAATGAACCCTGATCATAAGGACTTGA
CCoAOMT2-gF AGCTCTGGCAGCCAACGCAGAG
CCoAOMT2-gR CATGCAACGGTTCAAAGACAATA
CCoAOMT1 基因可变剪接的表达分析
Analysing the profile of alternative splicing in CCoAOMT1
CCoAOMT-a13spF CAGACCCAAGCCGGGAGGCA
CCoAOMT-a13spR CATGGTGTTCTTGGCGTTGATGAG
AtAcin2-F CACTGTGCCAATCTACGAGGGT
AtAcin2-R GCTGGAATGTGCTGAGGGAAG
1. 3. 3 CCoAOMT 基因全长 cDNA 的 RACE 克隆
1)3’-RACE 扩增 使用 SuperScriptTMⅡ逆转录酶和
包含 oligo(dT)的 Adapter Primer (AP)锚定引物进
行 cDNA 第 1 链的合成,再使用 3’RACE 引物分别
与试剂盒通用引物 AUAP 进行第 1 轮 PCR 与巢式
PCR 扩增,获得目的基因 cDNA 的 3’端侧翼序列。
PCR 程序为: 预变性(95 ℃,3 min); 变性(94 ℃,
30 s)、退火(50 ℃,45 s)、延伸(72 ℃,45 s),35 个
循环; 总延伸(72 ℃,10 min)。
2) 5’-RACE 扩 增 OligdT 反 转 录 后,按 照
Invitrogen RACE 试剂盒说明书的操作步骤,分别使
用 5’-RACE1 引物和 AAP 引物进行第 1 轮 PCR,程
序为: 预变性(94 ℃,5 min); 变性(94 ℃,30 s)、
退火(50 ℃,45 s)、延伸(72 ℃,45 s),35 个循环;
总延伸 (72 ℃,10 min)。第 2 轮巢式 PCR 使用
AUAP 引物与 5’-RACE2 引物,程序为: 预变性
(94 ℃,5 min); 变性(94 ℃,30 s)、退火(58 ℃,
45 s)、延伸 ( 72 ℃,60 s),35 个循环; 总延伸
(72 ℃,10 min)。
1. 3. 4 CCoAOMT 基因的 gDNA 克隆 分别使用
CCoAOMT1-gF /CCoAOMT1-gR、 CCoAOMT2-gF /
CCoAOMT2-gR 这对特异引物,以叶片基因组 DNA
为模板,使用 Takara LA Taq 酶进行长距离 PCR 扩
增,程序为: 预变性(95 ℃,5 min); 变性(95 ℃,
40 s)、退火(60 ℃,45 s)、延伸(72 ℃,3 min),35
个循环; 总延伸(72 ℃,15 min)。
1. 3. 5 CCoAOMT1 基因的可变剪接表达分析 通
过改良 CTAB 法提取总 RNA,采用 DNase ( RNase
Free) 去 除 残 留 的 基 因 组 DNA,使 用 Invitrogen
ThermoScript kit 进行 cDNA 第 1 条链的合成。以
Acting2 管家基因作为内参,检测赤桉 CCoAOMT1 基
因可变剪接的时空表达,程序为: 预变性 (94 ℃,
2 min); 变性(94 ℃,30 s)、退火(52 ℃,30 s)、延
伸 ( 72 ℃,30 s ),28 个循环; 总延伸 ( 72 ℃,
1 min)。扩增产物通过 5%非变性 PAGE 电泳进行
检测。
1. 3. 6 生 物 信 息 学 分 析 DNA 测 序 结 果 用
ContigExpress 进行拼接获得完整序列,通过 NCBI
BLAST 进行序列比对分析,采用 NCBI ORF Finder
寻找候选基因的开放读码框,使用 NCBI Splign
(Kapustin et al.,2008)预测基因组序列中的外显子
区域及长度,使用 NCBI CDD (Marchler-Bauer et al.,
2011)和 ExPASy 分析氨基酸序列中的保守结构域,
采用 ClustalX 进行氨基酸多序列比对,使用 MAGE5
软件 ( Tamura et al., 2011 ) 最 大 似 然 法 ( max
likelihood)构建进化树,1 000 次重复抽样运算。采
用 Protein blast 在 PDB 数据库中搜索同源性高且结
构已测定的蛋白作为三维结构模板,并将目的蛋白
氨基酸序列与模板序列同时提交至 Swiss-Model
(Arnold et al.,2006),获得目的蛋白初始三维结构
46
第 5 期 谷振军等: 赤桉 CCoAOMT 亚家族的基因克隆及可变剪接分析
模型,采用 NAMD(Phillips et al.,2005)的 CHARMM
力场优 化侧 链 构 象,利 用 ProCheck ( Laskowski
et al.,1993)和 Errat(Colovos et al.,1993)验证模型
的合理性和评估模型构建的精炼程度; 搜索 NCBI
Pubchem 数据库获得与目的蛋白对接的配体模型;
利用 AutoDock 4. 2(Morris et al.,2009)将配体与目
的蛋白进行对接,进行构象聚类分析,选取最低能量
构象作为配体 -目的蛋白复合物的对接构象,采用
PyMOL 绘制三维立体结构图(Seeliger et al.,2010),
使用 POV-Ray 进行着色渲染。
2 结果与分析
2. 1 赤桉 CCoAOMT 基因全长克隆与序列分析
2. 1. 1 cDNA 全长克隆 以赤桉茎段韧皮部总
RNA 为模板,通过同源克隆法扩增出 CCoAOMT1 的
2 条不同长度的 cDNA 片段(电泳图略),片段较长
的为 794 bp(命名为 CCoAOMT1-L,GenBank 登录号
HM106291),片段较短的为 752 bp ( CCoAOMT1-
Δ42,GQ889423),通过 3’-RACE 和 5’-RACE 技术
分别获得 cDNA 的 3’端(212 bp)和 5’端(479 bp);
采用 ContigExpress 软件拼接出赤桉 CCoAOMT1 的
全长 cDNA 序列(1 020 bp),其 ORF 长度为 738 bp。
采用引物 CCoAOMT2-aF /R 扩增出 1 条长度为 875
bp 的 cDNA 片段(命名为 CCoAOMT2,GQ889422),
3’-RACE 和 5’-RACE 技术分别获得 cDNA 的 3’端
(208 bp)和 5’端(718 bp); 采用 ContigExpress 软件
拼接出赤桉 CCoAOMT2 的全长 cDNA 序列 (1 047
bp),其 ORF 长度为 741 bp。
将所获得的赤桉 CCoAOMT 基因核苷酸序列翻
译为氨基酸序列,并在 Swiss-Prot 蛋白质专家数据库
中进行 Blast 比对,结果显示目的序列与其他植物
CCoAOMT 高 度 相 似。 本 文 克 隆 的 赤 桉
EcCCoAOMT1-L(氨基酸序列登录号为 ADI43381)
和 EcCCoAOMT1-Δ42 ( ACX37697 ) 与 蓝 桉
CCoAOMT1(UniProtKB 登录号: O81185,下同)、冈
尼桉 ( E. gunnii) CCoAOMT1 (O04854)、葡萄 ( Vitis
vinifera)CCoAOMT1(Q43237)等基因的氨基酸序列
具有较高的相似性 (图 1 )。而本文克隆的赤桉
EcCCoAOMT2(氨基酸序列登录号为 ACX37696)与
蓝 桉 CCoAOMT2 ( Q9SWB8 )、百 日 草 ( Zinnia
elegans)CCoAOMT1(Q41720)等基因的氨基酸序列
具有较高的相似性。
图 1 利用最大似然估计法构建赤桉与其他陆生植物 CCoAOMT 基因的进化树
Fig. 1 Maximum Likelihood phylogeny of CCoAOMT gene from E. camaldulensis and other plants
2. 1. 2 基因组 DNA 全长克隆 以赤桉基因组
DNA 为 模 板,分 别 采 用 CCoAOMT1-gF /R 和
CCoAOMT2-gF /R 引 物,获 得 了 CCoAOMT1 和
CCoAOMT2 的 gDNA 全长序列(图略)。序列分析结
果 显 示,CCoAOMT1 的 gDNA 为 1 756 bp
( GU109373 ),没 有 出 现 缺 失 42 bp 的 条 带;
CCoAOMT2 的 gDNA 为 1 966 bp(GU109372)。
2. 2 赤桉 CCoAOMT 基因的外显子分析与可变剪
接识别
CCoAOMT1 的 2 条 cDNA 序列的 ClustalX 比对
结果表明,CCoAOMT1-Δ42 除了比 CCoAOMT1-L 缺
失 42 bp 外,其他区域序列完全相同。采用 Splign
程序进行外显子分析,结果表明,CCoAOMT1 基因组
序列中包含 5 个外显子,CCoAOMT1-Δ42 的 cDNA
中缺失的 42 bp 是在第 1 个外显子的区域(表 2,图
2A,B)。CCoAOMT1-L 是从 CCoAOMT1 基因可编码
区域的( CDS) 109 bp 处开始剪切,而 CCoAOMT1-
Δ42 则从 CDS 的 67 bp 处开始剪切(图 3),2 个剪切
方式都符合内含子 GT-AG 边界规则,且缺失 42 bp
的剪切方式不影响其余氨基酸的读码框顺序(图
4)。CCoAOMT2 基因组序列中亦含有 5 个外显子
(表 2,图 2C)。与 CCoAMT1-L 相比,CCoAOMT2 在
56
林 业 科 学 50 卷
第 5 外显子编码序列上多出 3 bp,多编码 1 个氨基
酸,其余外显子的长度完全相同,编码的氨基酸序列
也基本相同(图 4)。
表 2 赤桉 CCoAOMT 基因的外显子分析
Tab. 2 Exon analysis of E. camaldulensis CCoAOMT gene
外显子
Exon
CCoAOMT1-L CCoAOMT1-Δ42 CCoAOMT2
基因组
位置
Genomic
range
cDNA
位置
cDNA
range
长度
Length / bp
基因组
位置
Genomic
range
cDNA
位置
cDNA
range
长度
Length / bp
基因组
位置
Genomic
range
cDNA
位置
cDNA
range
长度
Length / bp
1 16 - 108 1 - 93 93 16 - 66 1 - 51 51 8 - 100 1 - 93 93
2 239 - 318 94 - 173 80 239 - 318 52 - 131 80 189 - 268 94 - 173 80
3 442 - 586 174 - 318 145 442 - 586 132 - 276 145 394 - 538 174 - 318 145
4 740 - 871 319 - 450 132 740 - 871 277 - 408 132 821 - 952 319 - 450 132
5 1428 - 1715 451 - 738 288 1428 - 1715 409 - 696 288 1551 - 1841 451 - 741 291
图 2 赤桉 CCoAOMT 基因组序列的外显子结构
Fig. 2 Exon profile in CCoAOMT gDNA of E. camaldulensis
图 3 CCoAOMT1 的第 1 个外显子可变剪接位点
Fig. 3 Alternative splicing site in exon 1 of CCoAOMT1
图 4 赤桉 CCoAOMT 亚家族的氨基酸序列比对
Fig. 4 Amino acid alignment of CCoAOMT subfamily
2. 3 赤桉 CCoAOMT1 基因可变剪接的时空表达
分析
可变剪接的正向引物和反向引物分别设计在
CCoAOMT1 的第 1 个外显子与第 3 个外显子中,因
而 CCoAOMT1-L 与 CCoAOMT1-Δ42 的预期扩增条带
的长度分别为 228 bp 和 186 bp。通过非变性 PAGE
电泳检测 PCR 产物 (图 5 ),结果显示,在叶片中
CCoAOMT1-L 基因在 4—10 月都有表达,而仅在 7
月和 8 月检测到 CCoAOMT1-Δ42 的可变剪接表达;
在茎段中在 4—11 月都检测到 CCoAOMT1-L 基因的
表达,而 CCoAOMT1-Δ42 则在 5—9 月都有可变剪接
表达。
图 5 赤桉叶片和茎段中 CCoAOMT1 基因的可变剪接表达
Fig. 5 Alternative splicing expression profile of
CCoAOMT1 in E. camaldulensis leaves and stems
2. 4 赤桉 CCoAOMT 的酶活中心与底物结合位点
分析
通过 NCBI 的 CDD 程序分析保守结构域,表明
赤桉 CCoAOMT1-L,CCoAOMT1-Δ42 和 CCoAOMT2
基因所编码的蛋白中都含有 1 个相同的结构域,属
于 AdoMET-MTases 超家族(利用腺苷蛋氨酸的转甲
基酶 超 家 族,OMT 也 属 于 其 中 成 员 ) 的
Methyltransfer-3 亚家族。通过 ExPASy 预测,其 N 端
包含 1 个帮助形成二聚体的结构域,C 端包含 1 个
Methyltransfer-3 亚家族的结构域,其中含有 3 个潜
在 的 SAM 结 合 位 点 “ LIDLVKVGGLI ”,
“VAPADAPLRKYV”,“ALAVDPRIEI”,以及 1 个
“VVDVGGGTG”二 价 金 属 阳 离 子 绑 定 区 域。
CCoAOMT 能催化转移腺苷蛋氨酸( SAM)上的甲基
66
第 5 期 谷振军等: 赤桉 CCoAOMT 亚家族的基因克隆及可变剪接分析
至相应底物的苯环上第 3 位或第 4 位、第 5 位上的
羧基氧位。通过蛋白质三维结构同源建模,利用
AUTODOCK 软件将 SAH [SAM 甲基供体失去 1 个
甲基而转化成 SAH (S -腺苷高半胱氨酸)]结合到
蛋白质酶活催化口袋中(图 6),表明 CCoAOMT 蛋
白质的酶活性中心能形成正确的“口袋”。结构分
析结果表明,赤桉 CCoAOMT 与紫花苜蓿(Medicago
truncatula) CCoAOMT 的蛋白结构 ( Ferrer et al.,
2005)类似,其酶活性中心 SAM 结合位点和底物结
合位点在其蛋白质的 C 端,而赤桉 CCoAOMT1 基因
的可变剪接产生的缺失发生在编码蛋白质的 N 端,
该可变剪接不会影响酶活性中心的三维结构。
图 6 赤桉 CCoAOMT1 的三维结构及 SAM /SAH 甲基供体和催化底物结合位点
Fig. 6 SAM /SAH binding site and catalytic domain basing on 3D structure of CCoAOMT1
3 讨论
抑制 CCoAOMT 基因的表达能降低体内木质素
含量、提高木质素单体 S /G 的比例,使得木质素在
制浆中更容易去除(Meyermans et al.,2000; Wei et
al.,2008)。CCoAOMT 蛋白为依靠 S 腺苷蛋氨酸的
氧位 - 甲 基 转 移 酶 ( S-adenosyl-L-Met ( SAM )-
dependent OMT),其 N 端含有蛋白质二聚体化结构
域(dimerization domain),氨基酸序列在不同物种之
间保守性不高,而其 C 端则是氧位 -甲基转移酶家
族 - 3(OMT - 3)的催化活性结构域,其一级结构和
三级结构在不同物种间都高度保守 ( Ferrer et al.,
2005)。通过分析所克隆的赤桉 CCoAOMT1 和
CCoAOMT2 基因的全长序列,二者所编码的蛋白质
C 端序列保持高度一致。基因外显子预测与蛋白结
构分析结果显示,CCoAOMT1 和 CCoAOMT2 蛋白的
N 端二聚体化结构域均是由基因的第 1 个外显子编
码,而 C 端的催化活性中心则是由基因的第 3、第 4
和第 5 个外显子编码。对于 CCoAOMT1 基因而言,
第 1 个内含子的下游 42 bp 还存在 1 个 5’端可变剪
接位点(5’splice site),使得 CCoAOMT1 基因能编
码 2 种 mRNA ( CCoAOMT1-L 和 CCoAOMT1-Δ42 )。
由于 CCoAOMT 蛋白的 OMT 酶活性中心位于其 C
端,而 CCoAOMT1-Δ42 基因的可变剪接发生在第 1
个外显子上,因而这个可变剪接不会改变所编码蛋
白质的 C 端 OMT 酶活中心结构,其氧位甲基转移酶
的催化活性亦不会受到影响。
蛋白突变研究结果表明,植物 OMT 蛋白的二聚
体化在酶底物识别上起到关键作用 ( Hoffmann
et al.,2001),而异源二聚体蛋白能对其他结构类似
的底物表现出 OMT 酶活性(Frick et al.,1999)。基
于紫花苜蓿 CCoAOMT 的蛋白质晶体结构研究结果
(Ferrer et al.,2005 ) 和蜡 样芽 孢杆 菌 ( Bacillus
cereus) BcOMT2 蛋白(在三维结构和功能上与紫花
苜蓿 CCoAOMT 类似的 OMT 酶)的二聚体化机制研
究结果(Cho et al.,2008),推测发生在 N 端二聚体
化结构域上的可变剪接将导致赤桉 CCoAOMT1-Δ42
蛋白与其他 CCoAOMT 蛋白之间形成异源二聚体蛋
白,使其能识别咖啡酰乙酰辅酶 A ( CCoAOMT 底
物)和与其结构类似的其他化合物作为催化底物,
扩大木质素合成前体的来源。因而,可认为这一可
变剪接方式是 CCoAOMT 实现蛋白功能多样性的重
要机制。
与其他生物相比,植物有其特异的剪切体识别
机制(Barta et al.,1986),不同基因间的内含子可变
剪接识别方式和剪切组装机制差异较大(Koncz et
al.,2012 )。到 目 前 为 止,拟 南 芥 ( Arabidopsis
thaliana)(Baek et al.,2008; Filichkin et al.,2010)、
毛 竹 ( Phyllostachys edulis ) ( Peng et al., 2010;
2013)、毛果杨 ( Populus trichocarpa ) ( Ko et al.,
76
林 业 科 学 50 卷
2012; Bao et al.,2013 ) 等基因组学研究都表明
CCoAOMT 基因在木质部中高丰度表达,但没有关
于 CCoAOMT 基因可变剪接的直接研究报道。为了
进一步探索赤桉 CCoAOMT1 基因可变剪接的作用,
进行了不同月份茎段和叶片中 CCoAOMT1-L 和
CCoAOMT1-Δ42 的表达分析,结果显示在叶片中仅
7 月和 8 月有可变剪接表达,在茎段中可变剪接则
发生在 5—9 月之间,而这段时期是桉树胸径快速增
长期,是一年中木质部生长轮的早材形成阶段 (陈
文 友, 2001; 施 钊 筑 等, 1990 )。 Yoshinaga 等
(1997)对木质部生长轮的亚细胞观测结果表明,在
一年周期中,早材木质素中富含 G 木质素单体,而
晚材中则富含 S 木质素单体。基于本文的可变剪接
表达结果,推测赤桉 CCoAOMT1 的可变剪接与早材
中 G 木质素单体的大量沉淀有相关性,其可能的机
制是,在桉树茎段生长旺盛时期,通过 CCoAOMT1-
Δ42 异源二聚体蛋白的结构类似底物识别功能,从
而在 G 木质素合成前体缺乏的情况下也能维持 G
木质素生物合成通路的稳定。
本文获得的桉树 CCoAOMT 亚家族的基因全长
cDNA 与基因组 DNA 序列,是木质素单体合成与单
体比例调控的关键基因,将为进一步研究细胞壁木
质素沉积机制、木质素含量降低及木质素更容易去
除的转基因育种研究提供理论依据和基因资源。对
于目前热点的低木质素转基因林木定向育种研究而
言,通过 RNA 干扰技术抑制 CCoAOMT 基因表达或
敲除 CCoAOMT 基因都是良好的育种策略。
参 考 文 献
陈文友 . 2001. 巨桉人工林树高直径年生长分析研究 . 四川林业科
技,22(1) : 73 - 75.
谷振军,张党权,黄青云,等 . 2010. 木质素合成关键酶基因与造纸
植物转基因改良应用研究 . 中南林业科技大学学报,30(3) : 67
- 74.
李潞滨,刘 蕾,何聪芬,等 . 2007. 木质素生物合成关键酶基因的
研究进展 . 分子植物育种,5(6S) : 45 - 51.
刘 果,张党权,谢耀坚,等 . 2013. 桉树 Genomic-SSR 和 EST-SSR
引物的快速筛选与通用性研究 . 林业科学,49 (2) : 127 - 133.
施钊筑,黄连胜 . 1990. 柠檬桉生长情况调查报告 . 福建林业科技,
61(3) : 42 - 47.
谢耀坚,谭晓风 . 2007. 尾叶桉遗传资源引进及其生物学入侵风险
评估 . 中南林业科技大学学报,27(6) : 169 - 173.
周群英,陈少雄,韩斐扬,等 . 2013. 短周期尾巨桉能源林生物量与
能量特征研究 . 热带亚热带植物学报,21 (1) : 45 - 51.
Anterola A M,Lewis N G. 2002. Trends in lignin modification: a
comprehensive analysis of the effects of genetic manipulations /
mutations on lignification and vascular integrity. Phytochemistry,61
(3) : 221 - 294.
Arnold K, Bordoli L, Kopp J, et al. 2006. The SWISS-MODEL
workspace: a web-based environment for protein structure homology
modelling. Bioinformatics,22(2) : 195 - 201.
Baek J M,Han P, Iandolino A, et al. 2008. Characterization and
comparison of intron structure and alternative splicing between
Medicago truncatula,Populus trichocarpa, Arabidopsis and rice.
Plant Mol Biol,67(5) : 499 - 510.
Bao H,Li E,Mansfield S D, et al. 2013. The developing xylem
transcriptome and genome-wide analysis of alternative splicing in
Populus trichocarpa ( black cottonwood ) populations. BMC
Genomics,14: 359.
Barta A,Sommergruber K,Thompson D,et al. 1986. The expression of
a nopaline synthase-human growth hormone chimaeric gene in
transformed tobacco and sunflower callus tissue. Plant Molecular
Biology,6(5) : 347 - 357.
Chen C,Baucher M,Holst C J,et al. 2001. Biotechnology in trees:
Towards improved paper pulping by lignin engineering. Euphytica,
118(2) : 185 - 195.
Cho J H,Park Y,Ahn J H,et al. 2008. Structural and functional
insights into O-methyltransferase from Bacillus cereus. J Mol Biol,
382(4) : 987 - 997.
Colovos C,Yeates T O. 1993. Verification of protein structures: patterns
of nonbonded atomic interactions. Protein Sci,2(9) : 1511 - 1519.
Ferrer J L,Zubieta C,Dixon R A,et al. 2005. Crystal structures of
alfalfa caffeoyl coenzyme A 3-O-methyltransferase. Plant Physiol,
137(3) : 1009 - 1017.
Filichkin S A,Priest H D,Givan S A, et al. 2010. Genome-wide
mapping of alternative splicing in Arabidopsis thaliana. Genome
Res,20(1) : 45 - 58.
Frick S, Kutchan T M. 1999. Molecular cloning and functional
expression of O-methyltransferases common to isoquinoline alkaloid
and phenylpropanoid biosynthesis. The Plant Journal,17 (4) : 329
- 339.
Hirakawa H,Nakamura Y,Kaneko T,et al. 2011. Survey of the genetic
information carried in the genome of Eucalyptus camaldulensis. Plant
Biotechnology,28(5) : 471 - 480.
Hoffmann L,Maury S,Bergdoll M,et al. 2001. Identification of the
enzymatic active site of tobacco caffeoyl-coenzyme A O-
methyltransferase by site-directed mutagenesis. Journal of Biological
Chemistry,276(39) : 36831 - 36838.
Jouanin L,Goujon T,Nadai V,et al. 2000. Lignification in transgenic
poplars with extremely reduced caffeic acid O-methyltransferase
activity. Plant Physiology,123(4) : 1363 - 1374.
Kapustin Y,Souvorov A,Tatusova T,et al. 2008. Splign: algorithms
for computing spliced alignments with identification of paralogs. Biol
Direct,3: 20.
Ko J H,Kim H T,Wang I H, et al. 2012. Tissue-type-specific
transcriptome analysis identifies developing xylem-specific promoters
in poplar. Plant Biotechnol J,10(5) : 587 - 596.
Koncz C, Dejong F, Villacorta N, et al. 2012. The spliceosome-
activating complex: molecular mechanisms underlying the function of
a pleiotropic regulator. Front Plant Sci,3: 9.
Laskowski R A,MacArthur M W,Moss D S,et al. 1993. PROCHECK:
86
第 5 期 谷振军等: 赤桉 CCoAOMT 亚家族的基因克隆及可变剪接分析
a program to check the stereochemical quality of protein structures.
Journal of Applied Crystallography,26(2) : 283 - 291.
Li X,Chapple C. 2011. Understanding lignification: Challenges beyond
monolignol biosynthesis. Plant Physiology,154: 449 - 452.
Marchler-Bauer A,Lu S,Anderson J B,et al. 2011. CDD: a Conserved
Domain Database for the functional annotation of proteins. Nucleic
Acids Res,39(Database issue) : D225 - 229.
Meyermans H,Morreel K,Lapierre C,et al. 2000. Modifications in
lignin and accumulation of phenolic glucosides in poplar xylem upon
down-regulation of caffeoyl-coenzyme A O-methyltransferase, an
enzyme involved in lignin biosynthesis. J Biol Chem,275 ( 47 ) :
36899 - 36909.
Morris G M,Huey R,Lindstrom W, et al. 2009. AutoDock4 and
AutoDockTools4: Automated docking with selective receptor
flexibility. J Comput Chem,30(16) : 2785 - 2791.
Myburg A A,Grattapaglia D,Tuskan G A,et al. 2011. Assembly and
annotation of the Eucalyptus genome sequence. Plant & Animal
Genome XIX Conference W226. The Eucalyptus Genome Network
(EUCAGEN) : 15 - 19.
Paiva J A P,Prat E,Vautrin S,et al. 2011. Advancing Eucalyptus
genomics: identification and sequencing of lignin biosynthesis genes
from deep-coverage BAC libraries. BMC Genomics,12: 137.
Peng Z H,Lu T,Li L,et al. 2010. Genome-wide characterization of the
biggest grass,bamboo,based on 10,608 putative full-length cDNA
sequences. BMC Plant Biology,10(1) : 116.
Peng Z H,Lu Y,Li L,et al. 2013. The draft genome of the fast-growing
non-timber forest species moso bamboo (Phyllostachys heterocycla) .
Nat Genet,45(4) : 456 - 461.
Phillips J C,Braun R,Wang W, et al. 2005. Scalable molecular
dynamics with NAMD. Journal of Computational Chemistry,26
(16) : 1781 - 1802.
Reddy A S,Marquez Y,Kalyna M,et al. 2013. Complexity of the
alternative splicing landscape in plants. Plant Cell,25(10) : 3657
- 3683.
Reddy A S. 2007. Alternative splicing of pre-messenger RNAs in plants
in the genomic era. Annu Rev Plant Biol,58: 267 - 294.
Sangha J,Gu K,Kaur J,et al. 2010. An improved method for RNA
isolation and cDNA library construction from immature seeds of
Jatropha curcas L. BMC Research Notes,3(1) : 126.
Seeliger D,Groot B L. 2010. Ligand docking and binding site analysis
with PyMOL and Autodock /Vina. J Comput Aided Mol Des,24
(5) : 417 - 422.
Tamura K,Peterson D,Peterson N,et al. 2011. MEGA5: molecular
evolutionary genetics analysis using maximum likelihood,
evolutionary distance,and maximum parsimony methods. Molecular
Biology and Evolution,28(10) : 2731 - 2739.
Wei J H,Wang Y Z,Wang H Z,et al. 2008. Pulping performance of
transgenic poplar with depressed caffeoyl-CoA O-methyltransferase.
Chinese Science Bulletin,53(22) : 3553 - 3558.
Weng J K, Akiyama T, Bonawitz N D, et al. 2010. Convergent
evolution of syringyl lignin biosynthesis via distinct pathways in the
lycophyte Selaginella and flowering plants. Plant Cell,22 ( 4 ) :
1033 - 1045.
Yoshinaga A,Fujita M,Saiki H. 1997. Cellular distribution of guaiacyl
and syringyl lignins within an annual ring in oak wood. Mokuzai
Gakkaishi,43(5) : 384 - 390.
(责任编辑 徐 红)
96