免费文献传递   相关文献

Cloning and Bioinformatics Analysis of Gene GbHCT from Gossypium barbadense

海岛棉GbHCT基因克隆及生物信息学分析



全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2016, 32(4):80-86
收稿日期 : 2015-07-18
基金项目 :棉花生物学国家重点实验室开放课题基金资助项目(CB2015A26),国家自然基金项目(31360264),国家大学生创新创业训练
计划项目(201510758001),新疆维吾尔自治区自然科学基金资助项目(2014211A025 ;2013211B19),新疆维吾尔自治区高技
术研究发展计划(201411103),中国博士后科学基金(2015M582741),新疆维吾尔自治区优秀博士后普通资助
作者简介 :崔雪,女,研究方向 :生物技术 ;E-mail :1067526924@qq.com
通讯作者 :倪志勇,男,博士,副教授,研究方向 :棉花纤维品质改良研究 ;E-mail :nizhiyong@126.com
海岛棉 GbHCT 基因克隆及生物信息学分析
崔雪1  加得拉·吐留汗1  于月华1  陈全家1  申丽婕1  叶佳丽1  杨飓立1   
陶顺1  倪志勇1,2
(1. 新疆农业大学农学院 新疆农业大学农业生物技术重点实验室,乌鲁木齐 830052 ;2. 中国农业科学院棉花研究所 棉花生物学国家重点
实验室,安阳 455000)
摘 要 : 克隆海岛棉木质素合成关键酶基因 GbHCT 全长 cDNA 序列,分析其在纤维不同发育时期的表达情况。根据海岛棉
转录组数据中的 HCT 序列设计引物,采用 RT-PCR 技术克隆基因,通过生物信息学方法分析 GbHCT 的 cDNA 序列和氨基酸序列。
通过分析转录组数据研究 GbHCT 在纤维不同发育时期的表达。从海岛棉中克隆了 1 个编码 HCT 的基因 GbHCT,开放阅读框长度
为 1 311 bp,编码 436 个氨基酸,蛋白质分子量为 48.58 kD,等电点为 6.03。GbHCT 氨基酸序列中含有 HTLGD 和 DFGWG 2 个保
守基序。GbHCT 氨基酸与陆地棉、亚洲棉和雷蒙德氏棉 HCT 一致性较高,与其他植物中的 HCT 氨基酸的一致性为 55.7%-60.7%。
转录组数据分析发现 GbHCT 在纤维不同发育阶段都有表达,在 5 DPA 的纤维中表达量最高,表明该基因可能参与棉花纤维的发育。
关键词 : 海岛棉 ;HCT ;基因克隆 ;生物信息学
DOI :10.13560/j.cnki.biotech.bull.1985.2016.04.010
Cloning and Bioinformatics Analysis of Gene GbHCT from
Gossypium barbadense
CUI Xue1 JIADELA·Tuliuhan1 YU Yue-hua1 CHEN Quan-jia1 SHEN Li-jie1 YE Jia-li1 YANG Ju-li1
TAO Shun1 NI Zhi-yong1,2
(1. College of Agronomy,Xinjiang Agricultural University,Key Laboratory of Agricultural Biological Technology,Xinjiang Agricultural
University,Urumqi 830052 ;2. Institute of Cotton Research,Chinese Academy of Agricultural Sciences,State Key Laboratory of Cotton
Biology,Anyang 45500)
Abstract: This study is to isolate full-length cDNA of a key enzyme gene GbHCT related to lignin metabolism in cotton(Gossypium
barbadense L.),and analyze the expression of GbHCT in the different developing stages of cotton’s fiber. The primers were designed according
to the HCT sequence in transcriptome data of sea island cotton,then the gene was cloned using RT-PCR,and the cDNA sequence and the
amino acid sequence of GbHCT were analyzed by bioinformatics methods. The expressions of gene GbHCT in developing fibers of cotton were
analyzed from the transcriptome data of sea island cotton. A gene encoding HCT,designated as GbHCT,was isolated from G. barbadense. The
full-length of the GbHCT consisted of a 1,311 bp open reading frame(ORF)encoding 436 amino acids. The molecular weight of protein was
48.58 kD,with an isoelectric point(pI)of 6.03. The deduced amino acid sequence of the GbHCT had two conservative motifs HTLGD and
DFGWG. The deduced amino acid sequence had a high homology with HCT from Gossypium hirsutum,Gossypium arboretum and Gossypium
raimondii,however,it showed 55.7%-60.7% identities with HCTs of other plants. Analyzing the transcriptome data of sea island cotton
revealed that gene GbHCT was expressed in all different development stages of fiber,and the peak of expression reached in 5 days post anthers
(DPA)fiber cells,suggesting that this gene may be involved in fiber development.
Key words: Gossypium barbadense L. ;HCT ;gene cloning ;bioinformatics
2016,32(4) 81崔雪等:海岛棉 GbHCT基因克隆及生物信息学分析
棉花是世界上最重要的纤维作物之一,棉纤维
品质优劣直接影响纺织品的市场竞争力[1,2]。棉花
为锦葵科棉属,棉属有 52 个种,包括 4 个栽培棉
种、47 个野生棉种。现广泛种植的陆地棉和海岛棉
为异源四倍体栽培种[3]。 陆地棉适应性广且产量高,
占我国所产原棉的 99%。海岛棉在我国目前只有新
疆生产,海岛棉纤维的长度、细度和强力等方面优
于陆地棉[4,5]。棉花育种家一直致力于培育具有产
量和品质兼备的棉花品种,利用基因工程技术将海
岛棉中纤维品质形成相关基因转入陆地棉中来改良
其纤维品质是一种有效的方法。从分子水平上研究
海岛棉优质纤维形成的机理,克隆纤维发育相关基
因尤为重要。最近研究表明苯丙烷代谢途径及其产
物在棉花纤维品质形成过程中具有重要的作用[6-9],
对参与苯丙烷代谢途径的基因功能及作用机理开展
研究,有望为改良纤维品质提供新的候选基因。莽
草酸 / 奎宁酸羟基肉桂酰转移酶(shikimate /quinate
hydroxycinnamoyl transferase,HCT)在苯丙烷 C3 羟
基化的上、下游起着双重调节作用,是苯丙烷代谢
途径中的关键酶之一[10]。在本生烟[11](Nicotiana
benthamiana)和紫花苜蓿[12](Medicago sativa)中,
沉默 HCT 基因导致减少转基因植株愈创木基木质素
(guaiacyl lignin,G-lignin)和紫丁香基木质素(syringyl
lignin,S-lignin)的含量,增加对 - 羟苯基木质素(p-
hydroxyphenyl lignin,H-lignin)的含量。在辐射松[13]
(Pinus radiata)中,沉默 HCT 基因导致转基因植株
木质素含量减少 42%,这些研究表明通过改变 HCT
的活性能够调控木质素代谢。迄今,已经从本生
烟[11]、紫花苜蓿[12]、棕色棉(Gossypium hirsutum
L.)[14]、茶树(Camellia sinensis L.)[15-19]等植物中
克隆了 HCT 基因并鉴定了基因的功能,但海岛棉中
HCT 基因的克隆研究尚未报道。本研究前期采用转
录组测序方法对海岛棉品种新海 21 胚珠,以及不同
发育时期的纤维的转录本进行分析,从转录组数据
中获得 HCT 的序列,根据 HCT 序列设计引物,从
海岛棉品种新海 21 中克隆了 1 个 GbHCT 基因,分
析了其序列和蛋白质的亲疏水性,二级和三级结构,
亚细胞定位、跨膜域和信号肽,并利用转录组数据
分析该基因的表达模式,旨为进一步研究海岛棉
GbHCT 基因的功能奠定基础。
1 材料和方法
1.1 植物材料
收集海岛棉品种新海 21(Gossypium barbadense
L cv. Xinhai 21)生长至三叶期的叶片,液氮迅速冷冻,
于 -80℃保存备用。
1.2 方法
1.2.1 RNA 的 提 取 及 cDNA 第 一 链 的 合 成 按
Trizol 试剂盒(Invitrogen)使用说明,提取叶片总
RNA。利用 first strand cDNA Synthesis 试剂盒(Thermo
Fisher)反转录合成 cDNA 第一链。按说明书配制反
转录第一链合成反应体系。
1.2.2 GbHCT 基因的克隆 根据海岛棉胚珠转录组
数据中的 HCT 基因序列设计一对引物,nHCT-F :
5 - A T G G A G A T T A C T A T A A A G G A G T C T G C - 3
和 n H C T - R :5 - T T A A A A C T C A T A A A
TAAGTTTTTCAAAAA-3, 以 合 成 海 岛 棉 品 种 新 海
21 叶片的 cDNA 第一链为模板,扩增基因的开放阅
读框(ORF)。按 TransStart Taq DNA 酶说明书体系
进行 PCR 反应液的配制。PCR 程序为 :94℃预变性
5 min,94℃变性 30 s,56℃复性 45 s,72℃延伸 1
min 30 s,共 35 个循环 ;72℃延伸 10 min。PCR 产
物连接到 pMD18-T(TaKaRa)载体,菌液 PCR 检测
后的阳性克隆送上海美季公司测序。
1.2.3 生 物 信 息 学 分 析 利 用 DNAMAN 软 件 和
Blast 检索 GenBank 进 行 多 重 序 列 比 较 和 同 源 性
分析。利用 Clustalx 1.83 软件和 MEGA 4.1 软件构
建 系 统 发 生 树。 用 Protparam(http://www.expasy.
org/tools/protparam)在线预测蛋白的分子质量、等电
点及基本性质 ;利用 GOR IV 程序预测蛋白质的二
级 结 构(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.
pl?page =npsa_gor4.html)。 利 用 Swiss-Model(http://
swissmodel.expasy.org)程序预测蛋白质的三级结构。
用 ProtScale(http://web.expasy.org/protscale/)分析蛋
白质的亲水 / 疏水性。利用 PSORT 程序(http://www.
psort.org/)对蛋白的亚细胞定位进行预测分析。利用
TMpred(http://www.ch.embnet.org/software/TMPRED_
form.html)预测跨膜域。利用 SignalP 程序(http://www.
cbs.dtu.dk/services/SignalP-3.0/)预测信号肽。
1.2.4 GbHCT 表达模式分析 查找本实验室海岛
生物技术通报 Biotechnology Bulletin 2016,Vol.32,No.482
棉纤维发育不同时期的转录组数据,获得在 0、5、
10、15 和 25 DPA 中 GbHCT 对 应 转 录 组 中 unigene
的 reads 数,用 RPKM 值表示 GbHCT 基因的相对表
达量。
2 结果
2.1 GbHCT基因的克隆及序列分析
根据海岛棉转录组数据中的 HCT 序列设计引
物,从海岛棉中克隆了一个编码 HCT 的基因 GbHCT
(图 1)。GbHCT 基因开放阅读框长度为 1 311 bp,编
码 436 个氨基酸,GenBank 登录号为 KT378286。使
用 Protparam 在线预测 GbHCT 蛋白质分子量为 48.58
kD,等电点为 6.03,分子式为 C2206H3425N581O636S10。
GbHCT 与其他植物的 HCT 氨基酸序列进行比对发
现其氨基酸序列中含有 HTLGD 和 DFGWG 2 个保守
基序(图 2)。BLAST 陆地棉基因组数据发现 GbHCT
对应陆地棉 CotAD-76176,定位于第 11 号染色体
28871744-28873146(+),含有 1 个内含子。
说明 GbHCT 和其他植物的 HCT 蛋白亲缘关系较远。
2.2 GbHCT蛋白的二级,三级结构和亲疏水性预

利用 GOR IV 程序预测蛋白质的二级结构,如
图 4 所 示 GbHCT 蛋 白 由 436 个 氨 基 酸 残 基 组 成,
其 中 27.52%(120 个 ) 氨 基 酸 残 基 可 能 形 成 α 螺
旋,21.10%(92 个)氨基酸残基可能形成延伸链,
51.38%(224 个)氨基酸残基可能形成无规卷曲。
利用 SWISS-MODEL 数据库进行 GbHCT 蛋白质
的三级结构分析,采用同源建模的方法,选择比对
率最高的中粒咖啡 Coffea canephora HCT 蛋白(SMTL
id 4g0b.1)作为参照,得到 GbHCT 蛋白的三级结构
图(图 5)。
利用 ProtScale 对 GbHCT 蛋白进行亲水 / 疏水
性分析。结果如图 6 所示,GbHCT 蛋白 436 个氨基
酸当中疏水性氨基酸最大值为 2.444,亲水性氨基酸
最小值为 -2.744,亲水性总平均值为 -0.151,推测
GbHCT 蛋白是亲水性蛋白。
2.3 GbHCT蛋白的亚细胞定位、跨膜域和信号肽
预测
利用 Psport 在线预测 GbHCT 蛋白的亚细胞定
位,结果表明定位于叶绿体基质的可能性为 47.9%,
定位于细胞质的可能性为 45.0%,定位于微体(过
氧物酶体)的可能性为 44.3%,定位于叶绿体类囊
体膜的可能性为 13.1%。因此推测 GbHCT 蛋白可能
定位于叶绿体基质。TMpred 在线预测表明 GbHCT
蛋 白 存 在 一 个 跨 膜 域, 位 于 301-319 个 氨 基 酸。
SignalP 预测表明 GbHCT 蛋白没有信号肽。
2.4 GbHCT基因的表达模式
检索海岛棉纤维转录组数据发现,GbHCT 基因
在 5 DPA 的纤维中表达量最高,RPKM 值为 145 4.89。
在 10,15 DPA 的 纤 维 中 表 达 量 逐 渐 降 低, 在 25
DPA 表达量最低,RPKM 值为 22(图 7)。根据 Gb-
HCT 的表达量推测该基因可能参与棉纤维发育进程。
3 讨论
木质素代谢是苯丙烷代谢途径重要分支代谢途
径。最近一些研究表明,木质素的生物合成及在成
熟纤维中的含量与棉花纤维的品质有一定的关系。
Fan 等[7]发现酚类化合物结合成熟棉花纤维的细胞
bp
2000
1000
bp
1311
M 1
M :DL2000 Marker ;1 :PCR 产物
图 1 GbHCT 基因的扩增
同 源 性 分 析 表 明,GbHCT 氨 基 酸 与 陆 地 棉
CotAD-76176 的氨基酸序列仅相差 1 个氨基酸,一
致性达到 99.77%。与亚洲棉 GaHCT(KHG20214.1),
雷 蒙 德 氏 棉 GbHCT(XP_012455202.1) 和 棕 色 棉
GhHCT(KF749428.1) 的 一 致 性 分 别 为 99.54%,
97.02% 和 60.7%。与其他植物中的 HCT 氨基酸的
一致性为 55.7%-60%(图 2)。系统发生树(图 3)
分 析 发 现 GbHCT 和 陆 地 棉 CotAD-76176, 亚 洲 棉
和雷蒙德氏棉 HCT 成为一个分支,而棕色棉 HCT
(KF749428.1)和其他植物的 HCT 聚在一个分支,
2016,32(4) 83崔雪等:海岛棉 GbHCT基因克隆及生物信息学分析
图 2 GbHCT 与其他植物的 HCT 氨基酸序列比对分析
生物技术通报 Biotechnology Bulletin 2016,Vol.32,No.484
壁,而且在棉花纤维次生壁形成阶段编码催化木质
素代谢途径中最后一步反应的酶基因 GhCAD6 为上
调表达。Al-Ghazi 等[6]发现在陆地棉和海岛棉中编
码催化从苯丙烷到对香豆酸途径的酶基因 PAL,C4H
和 4CL 具有相似的表达水平。而且在纤维发育早期
这些基因是非常高的表达,C4H 表达与纤维长度性
状正相关。Wang 等[9]发现 GhmiR397 可能在棉纤
维起始阶段起正调控子作用,在野生型棉花胚珠中,
GhmiR397 介导的基因沉默下调控漆酶基因的表达,
漆酶的减少导致木质素产物减少,结果细胞壁表皮
Hibiscus cannabinus
Gossypium hirsutum
Arabidopsis thaliana
Populus trichocarpa
Cucumis sativus
Trifolium pratense
Salvia miltiorrhiza
Solenostemon scutellarioides
Cynara cardunculus
Ipomoea batatas
Coffea canephora
Pinus radiata
Gossypium raimondii
Gossypium arboreum
Gossypium barbadense
Gossypium hirsutum
图 3 GbHCT 蛋白与其他植物的 HCT 蛋白的系统发生树分析
50 150100 250200 350300
图中最长竖线代表 α 螺旋,中长竖线代表延伸链,最短竖线代表无规卷曲
图 4 GbHCT 蛋白的二级结构
图 5 GbHCT 蛋白的三级结构同源建模
50
Sc
or
e
3
2
1
0
-1
-2
-3
150100 250200
Position
350300 400
图 6 GbHCT 蛋白的亲 / 疏水性分析
2016,32(4) 85崔雪等:海岛棉 GbHCT基因克隆及生物信息学分析
细胞松弛,促进纤维膨胀和起始。Han 等[8]研究发
现 WLIM1a 在棉花次生壁增厚期可以作为一个转录
因子通过结合 4CL1,CCR1 和 CAD6 启动子中 PAL-
box 顺式作用元件上调这些基因的表达,从而使得超
表达转基因棉花株系的木质素含量相对于野生型含
量增加,因而影响纤维次生壁成分,使得纤维变细。
这表明木质素或木质素类似酚类化合物可能影响纤
维发育质量。对本课题组海岛棉转录组测序数据分
析发现苯丙烷代谢途径中包括 HCT 基因在内的多个
基因在纤维发育的不同时期表达,本研究利用转录
组数据从海岛棉中克隆了 GbHCT 基因,对其序列进
行了生物信息学分析。肖向文等[15]从棕色棉中克
隆了一个 HCT 基因发现,该基因在 16 DPA 的胚珠
中表达最高,在花瓣、茎和纤维中表达量次之,在
叶片中的表达量最低。本研究发现海岛棉 GbHCT 基
因在 5 DPA 的纤维中表达量最高,HCT 基因在棕色
棉和海岛棉中表达时期的差异可能与两者品质的优
劣有一定的关系,下一步将通过转化海岛棉来分析
GbHCT 基因的生物学功能。
4 结论
从 海 岛 棉 中 克 隆 了 1 个 编 码 HCT 的 基 因
GbHCT,开放阅读框长度为 1 311 bp,编码 436 个
氨基酸,蛋白质分子量为 48.58 kD,等电点为 6.03。
GbHCT 氨基酸序列中含有 HTLGD 和 DFGWG 2 个保
守基序。预测了 GbHCT 蛋白的二级、三级结构、亲
疏水性、跨膜域和信号肽。GbHCT 氨基酸与陆地棉
CotAD-76176 仅相差 1 个氨基酸,与其他植物中的
HCT 氨基酸的一致性为 55.7%-60.7%。GbHCT 在纤
维不同发育阶段都有表达,在 5 DPA 的纤维中表达
1600
1400
1200
1000
800
600
400
200
0
R
PK
M
0 DPA
35.09
1454.89
587.73
121.59
22
5 DPA 10 DPA 15 DPA 25 DPA
图 7 GbHCT 基因的表达分析
量最高,表明该基因可能参与棉花纤维的发育。
参 考 文 献
[1] 喻树迅 , 王子胜 . 中国棉花科技未来发展战略构想[J]. 沈阳
农业大学学报 :社会科学版 , 2012, 14(1):3-10.
[2] 喻树迅 . 我国棉花生产现状与发展趋势[J]. 中国工程科学 ,
2013, 15(4):9-13.
[3] 李付广 , 袁有禄 . 棉花分子育种进展与展望[J]. 中国农业科
技导报 , 2011, 13(5):1-8.
[4] Li F, Fan G, Wang K, et al. Genome sequence of the cultivated
cotton Gossypium arboreum[J]. Nature Genetics, 2014, 46(6):
567-572.
[5] Wang K, Wang Z, Li F, et al. The draft genome of a diploid cotton
Gossypium raimondii[J]. Nature Genetics, 2012, 44(10):
1098-1103.
[6] Al-ghazi Y, Bourot S, Arioli T, et al. Transcript profiling during fiber
development identifies pathways in secondary metabolism and cell
wall structure that may contribute to cotton fiber quality[J]. Plant
and Cell Physiology, 2009, 50(7):1364-1381.
[7] Fan L, Shi WJ, Hu WR, et al. Molecular and biochemical evidence
for phenylpropanoid synthesis and presence of wall-linked phenolics
in cotton fibers[J]. Journal of Integrative Plant Biology, 2009, 51
(7):626-637.
[8] Han LB, Li YB, Wang H Y, et al. The dual functions of WLIM1a in
cell elongation and secondary wall formation in developing cotton
fibers[J]. The Plant Cell, 2013, 25(11):4421-4438.
[9] Wang ZM, Xue W, Dong CJ, et al. A comparative miRNAome
analysis reveals seven fiber initiation-related and 36 novel miRNAs
in developing cotton ovules[J]. Molecular Plant, 2012, 5(4):
889-900.
[10] Hoffmann L, Maury S, Martz F, et al. Purification, cloning, and
properties of an acyltransferase controlling shikimate and quinate
ester intermediates in phenylpropanoid metabolism[J]. Journal
of Biological Chemistry, 2003, 278(1):95-103
[11] Hoffmann L, Besseau S, Geoffroy P, et al. Silencing of hydroxycin-
namoyl-Coenzyme A shikimate/quinate hydroxycinnamoyl- transfe-
rase affects phenylpropanoid biosynthesis[J]. The Plant Cell,
2004, 16(6):1446-1465.
[12] Chen F, Reddy MSS, Temple S, et al. Multi-site genetic modulation
of monolignol biosynthesis suggests new routes for formation of
生物技术通报 Biotechnology Bulletin 2016,Vol.32,No.486
syringyl lignin and wall-bound ferulic acid in alfalfa(Medicago
sativa L. )[J]. Plant Journal, 2006, 48 :113-124.
[13] Wagner A, Ralph J, Akiyama T, et al. Exploring lignification
in conifers by silencing hydroxylcinnamoyl-CoA :shikimate
hydroxycinnamoyltransferase in Pinus radiate[J]. Proceedings of
the National Academy of Sciences of the United States of America.
2007, 104(28):11856-11861.
[14] 谢素霞 , 程琳 , 曾威 , 等 . 茶树 HCT 基因的克隆及表达[J].
东北林业大学学报 , 2013, 41(6):19-22, 37.
[15] 肖向文 , 朱奇朗 , 刘海峰 , 等 . 棉花莽草酸 / 奎宁酸羟基肉桂
酰转移酶基因(GhHCT)的克隆、生物信息学分析及表达特
性[J]. 农业生物技术学报 , 2014, 22(5):572-579.
[16] 何柳 , 徐晓兰 , 王振中 , 等 . 金银花莽草酸 / 奎宁酸香豆酰转
移酶(LjHCT)基因克隆与序列分析[J]. 世界科学技术 - 中
医药现代化 , 2014, 16(2):263-268.
[17] 王雪霞 , 曹方 , 薛永常 . 杨树木质素合成酶 hct 基因的克隆及
核苷酸序列分析[J]. 辽宁林业科技 , 2009, 6 :4-7.
[18] 葛文雅 , 惠伟 , 闫洪波 , 等 . 鸭梨 PbHCT3 基因的克隆及表达
分析[J]. 西北植物学报 , 2012, 32(5):871-875.
[19] 刘伟 , 李高 , 杨杞 , 等 . 柠条锦鸡儿 HCT 基因克隆及序列分
析[J]. 内蒙古农业大学学报 , 2014, 35(1):77-82.
(责任编辑 狄艳红)