免费文献传递   相关文献

RACE Cloning and Bioinformatics Analysis of Flax COMT Gene

RACE法克隆亚麻COMT基因及生物信息学分析



全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2013年第12期
亚麻是我国重要的纤维原料作物和特色经济作
物,在纺织、造纸、建材及环保等领域发挥着不容
低估的作用,具有广阔的发展前景。随着全球石油、
煤炭等重要自然资源日益枯竭,亚麻作为一种重要
的天然纤维植物将发挥越来越重要的作用。我国既
是亚麻生产的大国,又是亚麻制品加工的大国,但
我国亚麻在纤维品质上与国外有较大的差距,如长
麻率和梳成率较西欧低 30% 以上,在纤维支数、纤
维强力、纤维单产等性状方面亟待提高。因此我国
有一半上的亚麻源料依赖进口。
木质素是影响亚麻纤维产量和质量的一个重要
因素。它是在一系列合成酶催化下使苯丙氨酸或酪
氨酸逐步转化为木质素单体最终聚合而成的酚类多
收稿日期 :2013-06-05
基金项目 :国家自然科学基金项目(31000745),国家麻类产业技术体系(CARS-19-E14)
作者简介 :龙松华,男,硕士,研究方向 :植物分子生物学 ;E-mail :longsonghua79452@163.com
通讯作者 :王玉富,研究员,研究方向 :亚麻育种和栽培 ;E-mail :chinaflax@126.com
RACE 法克隆亚麻 COMT 基因及生物信息学分析
龙松华1  乔瑞清1  陈信波2  邱财生1  邓欣1  郭媛1  郝冬梅1  王玉富1
(1. 中国农业科学院麻类研究所,长沙 410205 ;2. 湖南农业大学作物基因工程湖南省重点实验室,长沙 410128)
摘 要 : 利用 RACE 技术克隆得到亚麻木质素合成关键酶基因 COMT 基因的 cDNA 全长序列,该基因 cDNA 全长 1 726 bp
(GenBank 登录号为 KC832865)。含有 1 104 bp 完整的开放阅读框,5 非编码区长 423 bp,3 非编码区长 199 bp。对序列进行生物
信息学分析的结果 :编码的蛋白由 367 个氨基酸组成(其中亮氨酸 38 个,丙氨酸 32 个和丝氨酸 28 个),相对分子量为 40 kD,等
电点 pI 为 5.7;蛋白质二级结构以无规则卷曲和 α-螺旋为主;构建系统进化树表明与赤桉(Eucalyptus camaldulensis)亲缘关系最近。
关键词 : 亚麻 木质素 COMT 基因 RACE 生物信息学分析
RACE Cloning and Bioinformatics Analysis of Flax COMT Gene
Long Songhua1 Qiao Ruiqing1 Chen Xinbo2 Qiu Caisheng1 Deng Xin1
Guo Yuan1 Hao Dongmei1 Wang Yufu1
(1. The Institute of Bast Fiber Crops,Chinese Academy of Agricultural Sciences,Changsha 410205 ;2. Crop Gene Engineering Key Laboratory
of Hunan Province,Hunan Agricultural University,Changsha 410128,)
Abstract:  Full length of gene of flax COMT was cloned using the method of RACE. The gene was 1726 bp in length, of which, the open
reading frame was 1 104 bp, encoding 367 amino acid residues and having a molecular weight of 40 kD, with a 5 non-coding region of 423 bp
and a 3 non-coding region of 199 bp. The gene was submitted to GenBank with a number of KC8328645. The coding protein was with pI of 5.7,
in secondary structure of protein of which, random coil and α-helix were abundant category. Phylogenetic tree based on COMT genes submitted to
GenBank of different plant showed that flax clustered together with Eucalyptus camaldulensis.
Key words:  Flax Lignin COMT gene RACE Bioinformatics analysis
聚体,木质素含量和单体组成对其最终用途起着决
定性作用。在木质素生物合成途径中,木质素 G 单
体向 S 单体转化主要是由两种酶 :F5H(松柏醛脱
氢酶)和 COMT(咖啡酸 / 5-羟基阿魏酸 -O-甲基转
移酶)控制[1,2],其中 COMT 主要参与 S 木质素的
生物合成[3-5]。在杨树[6]、烟草[7]、苜蓿[8]、火炬松[9]
中都有正义或反义抑制 COMT 活性从而降低木质素
对纤维品质影响的报道。亚麻木质素代谢关系到纤
维的产量和质量问题,COMT 作为木质素代谢过程
的重要的基因,对研究改良纤维品质有着重要的意
义。而有关亚麻 COMT 全长基因克隆的研究尚未见
报道。因此,本研究以亚麻为材料,利用 RACE 方
法对其 COMT 全长基因进行克隆,并对其进行生物
2013年第12期 79龙松华等 :RACE 法克隆亚麻 COMT 基因及生物信息学分析
信息学方面的研究,以期为亚麻 COMT 基因的应用
提供理论依据。
1 材料与方法
1.1 材料
供试材料为亚麻品种派克斯,种植在湖南省长
沙市中国农业科学院麻类研究所试验基地。11 月
上旬播种,5 月上旬等亚麻进入花期,取样,去除
茎的上下两端,剥取茎皮,立刻在液氮中冷冻,放
置 -80℃保存。
大肠杆菌 DH5α 为天根生化科技公司产品,克
隆载体 pMD18T 购自大连宝生物工程公司。琼脂
糖 BMBIO 分 装,T4 DNA 连 接 酶、DL-2000 DNA
Marker TaKaRa 大连生物技术公司产品,TBE、胰蛋
白胨、氯化钠、酵母提取物、氨苄青霉素等试剂除
特别注明均为国产分析纯 ;总 RNA 提取试剂盒使
用 OMEGA 公 司 的 E.Z.N.A.Plant RNA Kit 试 剂 盒 提
取,凝胶回收试剂盒 Fermentas 的 GeneJETTM GEL
Extraction Kit,Clontech 公 司 的 SMARTerTM RACE
cDNA Amplification Kit 试 剂 盒,Invitrogen 公 司 的
5RACE System for Rapid Amplification of cDNA Ends,
Version 2.0 试剂盒。
1.2 方法
1.2.1 RNA 提取 取冷冻的亚麻表皮纤维,放入干
净的研钵中,加入适量液氮,快速研磨样品。研磨
成粉末后,用称量纸取出适量样品粉末,放入液氮
预冷的 EP 管内,每管装入的组织样品量大约为 100
mg。具体方法按照试剂盒说明进行。提取的 RNA
进行电泳检测。
1.2.2 引物合成 根据本项目组成员已经克隆的
亚麻 COMT 基因片段序列(367 bp),分别设计了
3RACE、5RACE 的特异性引物及扩增 COMT 全长
序列的引物(表 1)
1.2.3 5RACE 采用 Invitrogen 公司的 5RACE Sys-
tem for Rapid Amplification of cDNA Ends,Version 2.0
试剂盒获得该基因的 5 端序列。使用 SUPERSCRIPT
II RT 酶和引物 R582-1 对总 RNA 进行目的基因第一
链 cDNA 的合成。使用 RNase Mix 对合成的 cDNA
进 行 去 RNA 处 理。 使 用 DNA Purification System :
GLASSMAX DNA isolation spin cartridges 对经 RNAase
处理过的 cDNA 进行纯化。使用 TdT 酶和 dCTP 对
纯化后的 cDNA 进行末端加上多聚 C。
使用引物 R582-2 和试剂盒里面带的桥连铆钉引
物 AAP 对已经加 dC 尾的 cDNA 进行 PCR 第一轮扩
增(94℃ 预变性 2 min ;30 个循环,每个循环包括 :
94℃变性 30 s,55℃退火 30 s,72℃延伸 60 s ;结
束循环后 72℃延伸 7 min)。将第一轮 PCR 产物稀释
100 倍作为模板,使用引物 R582-3 和试剂盒里面带
的桥连通用扩增引物 AUAP 进行巢式 PCR 第二轮扩
增(PCR 反应条件同第一轮)。将 PCR 产物进行电泳,
回收纯化,连接到 pMD18T 载体上,进行 DNA 测序。
1.2.4 3 RACE Clontech 公司的 SMARTerTM RACE
cDNA Amplification Kit 试剂盒获得该基因的 3 端序
列。使用逆转录酶 SMARTScribeTM Reverse Transcrip-
tase 和引物 3 CDS primer A 对总 RNA 进行逆转录合
成 cDNA。使用引物 325-1 和 UPM,以上面合成的
cDNA 为模板进行第一轮 PCR 扩增。(94℃ 预变性
5 min ;30 个循环,每个循环包括 :94℃变性 30 s,
70℃退火 30 s,72℃延伸 1 min ;结束循环后 72℃延
伸 7 min。)将第一轮 PCR 扩增产物稀释 50 倍,然
后用引物 325-2 和 UPM 进行第二轮 PCR 扩增(PCR
反应条件同第一轮)。将 PCR 产物进行电泳,回收
纯化,连接到 pMD18T 载体上,进行 DNA 测序。
1.2.5 COMT 的全长拼接及测序 对 3 RACE 及 5
RACE 获得的 cDNA 片段进行拼接,并用引物扩增
COMT 全长序列,PCR 产物电泳检测,回收纯化片段,
连到载体 pMD18T 进行 DNA 测序。
1.2.6 序列生物信息学分析 对获得的亚麻木质素
合成酶基因 COMT 的全长序列,进行生物信息学分
析。使用 NCBI 网站上的 Blastn 进行核苷酸序列同源
性分析,利用 DNAssist 进行蛋白质的等电点、分子
表 1 PCR 所用引物
类型 编号 引物序列(5-3’)
5RACE R582-1 TTCCTGACGACGGTA ATTCCTGACGAT
TGGCAAACATGTCACC
R582-2 GACGCCAGGAAGAGCAGGGG
R582-3 GGAAGGGTGCTTGGATAGGAT
3 RACE 325-1 GCGTCCCCACTGGAGATGCCATTTTC
325-2 GGACACGAGCCTGGCGACGAGGAACG
扩增全长引物 QC582F AACCACTACTACCACTTCTTCC
QC582R GCAGCTTTTCACACATTACTTGC
生物技术通报 Biotechnology Bulletin 2013年第12期80
量计算和一些理化性质预测,蛋白质的二级结构分
析采用 Sompa 网站在线进行分析及预测(http://npsa-
pbil.ibcp.fr/ cgi-bin/npsa_automat.pl?page=npsa _sopma.
html),蛋白质的三级结构预测使用 3D-PSSM(http://
www.sbg.bio.ic.ac.uk/phyre2/html/ page.cgi?id=index),
应用 MEGA4.0 软件进行多序列比对,并构建系统进
化树。
2 结果
2.1 总RNA的提取
亚麻总 RNA 的提取电泳结果见图 1。由图可以
看出,提取的亚麻总 RNA 的 28S 和 18S 条带清晰,
说明所提取的 RNA 完整性较好。经测定,所提取总
RNA 的 OD260/OD280=1.96,较接近 2,说明提取 RNA
样品纯度较高。适于进行 RACE 操作。
分析,得到一条长约 600 bp 的特异扩增条带,见图 3。
克隆测序实际大小为 600 bp。
28S
18S
图 1 亚麻总 RNA
2.2 亚麻COMT基因的5RACE
根 据 已 知 的 亚 麻 COMT 基 因 片 段, 设 计 5,
RACE 引物,以亚麻茎秆茎皮总 RNA 为模板,进行
两轮 PCR,产物经 1.0% 琼脂糖凝胶电泳分析,检测
到特异扩增条带,大小分别为 1 000 bp 以上,见图 2。
切胶回收纯化测序之后证明是目的条带,克隆测序
实际大小为 1 131 bp。
2000
bp
1000
500
250
100
图 2 COMT 的 5RACE
图 3 COMT 的 3RACE
图 4 COMT 的全长扩增
2.4 COMT全长序列扩增
以 5RACE 及 3RACE 的测序结果为依据设计
引物,进行亚麻木质素合成酶 COMT 的全长序列的
扩增。1% 琼脂糖凝胶电泳检测 PCR 产物,得到一
条长度在 1 000-2 000 bp 之间的片段,见图 4。测序
结果实际大小为 1 726 bp。
2.3 亚麻COMT基因的3RACE
以亚麻茎秆表皮总 RNA 为模板,进行 3RACE
两轮 PCR 扩增。PCR 产物经 1.0% 琼脂糖凝胶电泳
750
bp
500
2000
bp
1000
2.5 亚麻COMT基因cDNA序列同源性分析
经克隆测序获得的 COMT 的 cDNA 全长,Gen-
Bank 登录号为 KC832865。该序列全长 1 726 bp,含
有 1 104 bp 完整的开放阅读框,5 非编码区长 423
bp,3 非编码区长 199 bp。 NCBI 上 Blastn 结果分
析表明,亚麻 COMT 基因的核苷酸序列与 GenBank
中其他生物的 DNA 或 cDNA 序列具有较高的同源
性,如与赤桉(Eucalyptuscamaldulensis)COMT 相似
性为 78%。
2.6 亚麻COMT氨基酸理化性质及亲水性分析
利用生物信息学软件 DNAssist 对 COMT 基因氨
基酸理化性质进行预测,结果表明该基因由 367 个
氨基酸组成 ;相对分子量为 40 kD ;等电点 pI 为 5.7。
COMT 基因 cDNA 编码产物的氨基酸组成成分分析
结果,见表 2。
2013年第12期 81龙松华等 :RACE 法克隆亚麻 COMT 基因及生物信息学分析
表 2 亚麻 COMT 基因 cDNA 编码产物的氨基酸组成
氨基酸类别 氨基酸 数量 类别总数 所占百分比(%)
非极性氨基酸 甘氨酸(G) 27 198 54.0
甲硫氨酸(M) 15
色氨酸(W) 3
苯丙氨酸(F) 17
脯氨酸(P) 20
异亮氨酸(I) 19
亮氨酸(L) 38
缬氨酸(V) 27
丙氨酸(A) 32
极性不带电氨基酸 丝氨酸(S) 28 88 24.0
苏氨酸(T) 22
半胱氨酸(C) 10
酪氨酸(Y) 8
天冬氨酸(N) 12
谷氨酰胺(Q) 8
带正电荷氨基酸 赖氨酸(K) 22 42 11.4
精氨酸(R) 8
组氨酸(H) 12
带负电荷氨基酸 天冬氨酸(D) 21 39 10.6
谷氨酸(E) 18
从表 2 可看出,亚麻 COMT 基因 cDNA 编码产
物的氨基酸组成包括了 20 种基本氨基酸。其中亮氨
酸出现最多(38 个),其次是丙氨酸(32 个)和丝
氨酸(28 个),出现最少的是色氨酸(3 个)。从氨
基酸的类型来看,9 种非极性氨基酸总共计 198 个,
占总数的 54% ;6 种不带电的极性氨基酸共计 88 个,
占总数的 24% ;3 种带正电荷的氨基酸共计 42 个,
占总数的 11.4% ;2 种带负电荷的氨基酸共计 39 个,
占总数的 10.6%。从整体上看,COMT 蛋白中非极
性氨基酸的数量略高于极性氨基酸。因此可以推断,
COMT 蛋白的疏水部分略高于亲水部分。
2.7 COMT编码的蛋白质二级结构预测
利用在线软件 Sompa 分析 COMT 的二级结构参
数。亚麻 COMT 编码的蛋白质二级结构分析结果表
明,该蛋白质的 α-螺旋(α-helix)占 46.05%,延伸
主链(Extended strand)占 14.17%,β-转角(β-turn)
占 6.54%, 无 规 则 卷 曲(Random coil) 占 33.24%。
COMT 的主要结构是 α-螺旋 ;其次是无规则卷曲。
50 100 150 200 250 300
α-螺旋 :蓝色 ;延伸主链 :红色 ;β-转角 :绿色 ;无规则卷曲 :紫色(颜色标识见电子版)
图 5 COMT 的二级结构
2.8 COMT编码的蛋白质三级结构预测
利用 3D-PSSM 预测 COMT 蛋白质序列的三级结
构,如图 6。此结构模拟图是以 C1KYZC 蛋白作为
模体分析的,与该蛋白的相似度为 81%,预测的可
信度为 100%。预测的结构模拟图包含了 355 全氨基
酸,占总数的 97%。从图中可以看出,COMT 基因
编码蛋白三级结构中含有丰富的 α-螺旋和无规则卷
曲,少量的 β-转角。与二级结构预测结果一致。
2.9 COMT基因氨基酸编码产物同源性分析
为了比较亚麻 COMT 与其他物种的 COMT 氨基
酸序列的相似性,更清楚地看出亚麻与其他物种亲
缘关系,采用 MEGA4.0 软件对氨基酸序列进行比对,
并构建系统进化树(图 7)。从图 7 可以看出,亚麻
(Linum usitatissimum)COMT 基因与赤桉(Eucalyptus
camaldulensis)、牵牛花(Ipomoea nil)COMT 基因聚
为一支,表明其亲缘关系较近。苎麻与亚麻同属麻
类作物,但与白桦(Betula platyphylla)聚为一支,
与亚麻亲缘关系较远。毛白杨(Populus tomentosa)
杨树类聚为一类,与亚麻亲缘关系也较远。
图 6 COMT 蛋白序列三级结构预测
生物技术通报 Biotechnology Bulletin 2013年第12期82
3 讨论
亚麻木质素含量为 3.5%-5%,近年来,随着北
方的亚麻南移到西南种植后,木质素含量大大上升,
达到 7%-8%。木质素含量过高会影响纤维品质,还
会增加脱胶过程中工业的污染。木质素合成过程中
的 S-单体形成的新途径及 G 向 S 木质素转化的关键
酶引起了人们的关注,新的研究表明 COMT 是 S 木
质素合成中的关键酶,且与 G 向 S 木质素的转化
密切相关。经研究发现,COMT 在不同的植物上表
达存在差异性,这可能与不同的植物的组织木质素
构成程度有一定的联系 :亚麻的 COMT 基因在根、
花期木质部表达量最高,韧皮部较低[10];玉米的
COMT 基因只在根里表达量较高[11];小麦的 COMT
基因在叶,茎和根中的表达量相似[12];杨树 COMT
基因在木质部充分表达,但在叶片中却没有表达[13]。
本研究利用 RACE 方法首次克隆到亚麻木质
素合成关键酶基因 COMT 基因全长序列,提交到
GenBank,并进行了系统的生物信息学分析,对功能
进行预测,对研究亚麻木质素代谢相关研究筛选一
个重要基因。所克隆的亚麻 COMT 基因与赤桉、牵
牛花亲缘关系近,与同属于韧皮纤维作物的苎麻以
及杨树类等,亲缘关系较远。亚麻木质素 COMT 基
因的克隆及分析,为亚麻 COMT 基因的应用提供理
论依据,为进一步利用转基因等手段降低木质素含
gi | 429326470 Populus tomentosa ∋ⲭᶘ
gi | 224118508 Populus trichocarpa ∋᷌ṁ
gi | 156145680 Populus deltoides 㖾⍢唁ᶘ
gi | 114199048 Malus domestica 㤩᷌
gi | 32440933 Rosa chinensis var. spontanea অ⬓ᴸᆓ㣡
gi | 6760443 Fragaria x ananassa 㥹㧃
gi | 254935147 Jatropha curcas 哫ᷛṁ
gi | 459958131 Betula platyphylla ⲭẖ
gi | 109255537 Boehmeria nivea 㣾哫
gi | 357464229 Medicago truncatula ᡚᖒ㤌㬯
gi | 336390553 Glycine max བྷ䉶
gi | 154091348 Leucaena leucocephala 䬦ਸ⅒
gi | 68159362 Acacia auriculiformis བྷਦ⴨ᙍ
gi | 253509569 Gossypium hirsutum ỹ㣡
gi | 508776460 Theobroma cacao ਟਟṁ
gi | 396591 Nicotiana tabacum ✏㥹
gi | 5732000 Li qui dambar styraciflua े㖾ᷛ俉
gi | 307090030 Camellia sinensis 㥦
gi | 262474806 Eucalyptus camaldulensis 䎔ṹ
gi | 97974184 Ipomoea nil ⢥⢋㣡
KC832865 Linum usitatissimum ӊ哫
1.2 1.0 0.8 0.6 0.4 0.2 0.0
图 7 植物 COMT 同源关系图
量,提高亚麻纤维品质的分子育种奠定了基础。
4 结论
克隆亚麻木质素合成关键酶基因 COMT 全长
序列基因序列已注册到 GenBank,序列登录号为
KC832865。该序列全长 1 726 bp,含有 1 104 bp 完
整的开放阅读框,5 非编码区长 423 bp,3 非编码
区长 199 bp。所编码的蛋白质由 367 个氨基酸组成,
相对分子量为 40 kD,等电点 pI 为 5.7。亚麻 COMT
基因 cDNA 编码产物的氨基酸组成包括了 20 种基本
氨基酸,该蛋白的疏水部分略高于亲水部分。COMT
的二级结构主要是 α-螺旋,其次是无规则卷曲。以
C1KYZC 蛋白作为模体(相似度为 81%)进行蛋白
三级结构预测。
参 考 文 献
[1] 郭昭 , 赵一玲 , 刘景利 , 等 . 木质素合成酶咖啡酸 3-O-甲基转
移酶(COMT)的遗传调控研究[J]. 分子植物育种 , 2006, 6(S):
122-126.
[2] 薛永常 , 李金花 , 卢孟柱 , 等 . 木质素单体生物合成途径及其修
订[J]. 林业科学 , 2003, 39(6):149-153.
2013年第12期 83龙松华等 :RACE 法克隆亚麻 COMT 基因及生物信息学分析
[3] Meyermans H, Morreel K, Lapierre C, et al. Modifications in lignin
and accumulation of phenolic glucosides in poplar xylem upon down-
regulation of caffeoyl-coenzyme A O-methyltransferase, an enzyme
involved in lignin biosynthesis[J]. The Journal o f Biological
Chemistry, 2000, 275(47):36899-36909.
[4] Pincon G, Maury S, H offmann L, et al . Repression of O-methyltran-
sferase genes in transg enic tobacco affects lignin synthesis and plant
growth[J]. Phyto Chemistry, 2001, 57(7):1167-1176.
[5] Piquemal J, Chamayou S, Nadaud I, et al . Down- regulation of caffeic
acid O-methyltransfer -ase in maize revisited using a transgenic
approach[J]. Plant Physiology, 2002, 130 :1675-1685.
[6] Tsai CJ, Popko JL, Mielke MR, et al. Suppression of O-methyltrans-
ferase gene by homologous sense transgene in quaking aspen causes
red-brown wood phenotypes[J]. Plant Physiol, 1998, 117 :101-
112.
[7] Atanassova R, Favet N, Martz F, et al. Altered lignin composition
in transgenic tobacco expressing O-methyltransferase sequences in
sense and antisense orientation[J]. Plant Journal, 1995, 8(4):
4654-77.
[8] Guo DJ, Chen F, Inoue K, et al. Downregulation of caffeic acid
3-O-methyltransferase and caffeoyl CoA 3-O-methyltransferase in
transgenic alfalfa :impacts on lignin structure and implications for
the biosynthesis of G and S lignin[J]. The Plant Cell, 2001, 13 :
71-388.
[9] Li L, Popko JL, Zhang XH, et al. A novel multifunctional
O-methyltransferase implicated in a dual methylation pathway
associated with lignin biosynthesis in loblolly pine[J]. Proceeding
of the National Academy of Sciences USA, 1997, 94(10):5461-
5466.
[10] 王进 , 陈信波 , 高原 , 等 . 亚麻木质素合成关键酶基因表达分
析[J]. 作物学报 , 2009, 35(8):1468-1473.
[11] Wei JH, Song YR. Advances in study of lignin biosynthsis and
manipulation[J]. Acta Botanica Sinica, 2001, 43(8):771-
779.
[12] Ma QH, Xu Y. Characterization of a caffeic acid 3-O-methyltransfe-
rase from wheat and its function in lignin biosynthesis[J]. Bioch-
imie, 2008, 90(3):515-524.
[13] 薛永常 , 李金花 , 卢孟柱 , 等 . 木质素单体生物合成途径及其
修订[J]. 林业科学 , 2003, 39(6):146-153.
(责任编辑 狄艳红)