免费文献传递   相关文献

Molecular Cloning and Functional Analysis of a GDSL Lipase Gene from Gossypium hirsutum L.

一个棉花GDSL脂肪酶基因的克隆与功能分析


GDSL and GXSXG lipases are two important sub-families of lipases. Unlike the GXSXG motif-containing lipases, GDSL lipases have a GDSL motif and are active in hydrolysis and synthesis of abundant ester compounds. In this experiment, a EST sequence (GenBank accession No: DR458916) was screened based on extremely significant expression differences at fiber initiation stages between lintless-fuzzless XinWX and linted-fuzzless XinFLM isogenic lines by 29K cotton genome array hybridization. Using the EST sequence as queries, the Gossypium EST database (http://www.ncbi.nlm.nih.gov/) was screened and the corresponding cDNA sequences containing a complete ORF were assembled. Further, the ORF information was reconfirmed in transcriptional and genomic level. As a result, a novel gene encoding GDSL lipase was cloned, and the gene was designated as GhGDSL (Gossypium hirsutum GDSL; GenBank accession number: KC186125). GhGDSL included an open reading frame of 1 065 bp that encoded a polypeptide of 354 amino acids. The genome sequence indicated that GhGDSL had four introns and five exons. The homolog of GhGDSL had one copy in diploid cotton species G. herbaceum and G. raimondii and two copies in tetraploid cotton species G. hirsutum acc. TM-1 and G. barbadense cv. Hai 7124, respectively. Sequence alignment from different cotton species showed GhGDSL homoelogs in tetraploid were evolved independently, with more variations in D-subgenome than in A-subgenome. GhGDSL homoelogs in tetraploid were located on chromosome 4 (Chr. A4) and chromosome 22 (Chr. D4) by developing subgenome-specific SNP marker, respectively. Q-PCR analysis showed that GhGDSL was accumulated highly in ovule and fiber tissue at 3–10 days post anthesis (DPA), with expression peak at 8DPA in Hai7124 and high expression from 5DPA to 10 DPA in TM-1. The association analysis between GhGDSL and the traits related to fiber and seed qualities in corresponding [(TM-1×Hai7124)×TM-1] BC1S1 individuals showed that GhGDSL homolog in A-subgenome was significantly correlated with the seeds’ fat content (P=0.048), and GhGDSL homolog in D-subgenome was very significantly correlated with the seeds’ protein content (P=0.008). These results suggested that GhGDSL might be functionally important in the metabolic process of lipid and protein in seeds and in the process of fiber development.


全 文 :作物学报 ACTA AGRONOMICA SINICA 2013, 39(7): 1164−1171 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn

本研究由国家重点基础研究发展计划(973计划)项目(2011CB109300)资助。
* 通讯作者(Corresponding author): 郭旺珍, E-mail: moelab@njau.edu.cn
Received(收稿日期): 2012-11-21; Accepted(接受日期): 2013-03-11; Published online(网络出版日期): 2013-04-23.
URL: http://www.cnki.net/kcms/detail/11.1809.S.20130423.1327.001.html
DOI: 10.3724/SP.J.1006.2013.01164
一个棉花 GDSL脂肪酶基因的克隆与功能分析
佟祥超 王丽曼 胡文静 张雪颖 张天真 郭旺珍*
南京农业大学作物遗传与种质创新国家重点实验室 / 教育部杂交棉创制工程研究中心, 江苏南京 210095
摘 要: GDSL脂肪酶与 GXSXG脂肪酶是 2个重要的脂肪酶亚家族。其中, GDSL家族脂肪酶具有水解酶活性, 能水
解多种酯类物质。本试验根据新乡小吉无绒无絮(XinWX)和无绒有絮(XinFLM)近等基因系纤维起始期 29K芯片竞争
杂交结果, 选择了一个在纤维起始期具有极显著表达差异的 EST序列(GenBank登录号为 DR458916), 以该序列信息
为探针, 利用电子克隆方法并进行 cDNA及基因组全长基因 PCR扩增、测序验证, 克隆获得一个陆地棉 GDSL脂肪
酶基因(GhGDSL; GenBank登录号为 KC186125)。该基因 ORF长 1065 bp, 编码 354个氨基酸, 含有 5个外显子和 4
个内含子。该基因在二倍体棉种基因组中含一个拷贝, 在四倍体棉种基因组中含 2个拷贝。序列比对显示该基因在四
倍体棉种的 2个亚组中独立进化, 且 D亚组比 A亚组变异大。染色体定位显示该基因 2个拷贝分别位于 A4 (Chr. 4)
和 D4 (Chr. 22)染色体上。定量 RT-PCR结果表明, GhGDSL在开花后 3~10 d的纤维组织中表达量高, 其中在海 7124
中表达高峰在 8DPA, 在 TM-1 中表达高峰从 5DPA 持续到 10DPA。利用[(TM-1×Hai7124)×TM-1]的 BC1S1群体开展
GhGDSL功能与纤维、种子品质性状关联分析, 发现该基因 A亚组的拷贝与种子脂肪含量存在显著相关(P=0.048); D
亚组的拷贝与种子蛋白含量存在极显著相关(P=0.008)。推测 GhGDSL 基因功能与种子中脂肪、蛋白代谢相关, 同时
也参与纤维伸长过程。
关键词: GDSL脂肪酶; 克隆; 表达; 基因定位; 关联分析; 棉花
Molecular Cloning and Functional Analysis of a GDSL Lipase Gene from Gos-
sypium hirsutum L.
TONG Xiang-Chao, WANG Li-Man, HU Wen-Jing, ZHANG Xue-Ying, ZHANG Tian-Zhen, and GUO
Wang-Zhen*
State Key Laboratory of Crop Genetics and Germplasm Enhancement, Hybrid Cotton R&D Engineering Research Center, Ministry of Education,
Nanjing Agricultural University, Nanjing 210095, China
Abstract: GDSL and GXSXG lipases are two important sub-families of lipases. Unlike the GXSXG motif-containing lipases,
GDSL lipases have a GDSL motif and are active in hydrolysis and synthesis of abundant ester compounds. In this experiment, a
EST sequence (GenBank accession number: DR458916) was screened based on extremely significant expression differences at
fiber initiation stages between lintless-fuzzless XinWX and linted-fuzzless XinFLM isogenic lines by 29K cotton genome array
hybridization. Using the EST sequence as queries, the Gossypium EST database (http://www.ncbi.nlm.nih.gov/) was screened and
the corresponding cDNA sequences containing a complete ORF were assembled. Further, the ORF information was reconfirmed
in transcriptional and genomic level. As a result, a novel gene encoding GDSL lipase was cloned, and the gene was designated as
GhGDSL (Gossypium hirsutum GDSL; GenBank accession number: KC186125). GhGDSL included an open reading frame of
1065 bp that encoded a polypeptide of 354 amino acids. The genome sequence indicated that GhGDSL had four introns and five
exons. The homolog of GhGDSL had one copy in diploid cotton species G. herbaceum and G. raimondii and two copies in
tetraploid cotton species G. hirsutum acc. TM-1 and G. barbadense cv. Hai 7124, respectively. Sequence alignment from different
cotton species showed GhGDSL homoelogs in tetraploid were evolved independently, with more variations in D-subgenome than
in A-subgenome. GhGDSL homoelogs in tetraploid were located on chromosome 4 (Chr. A4) and chromosome 22 (Chr. D4) by
developing subgenome-specific SNP marker, respectively. Q-PCR analysis showed that GhGDSL was accumulated highly in
第 7期 佟祥超等: 一个棉花 GDSL脂肪酶基因的克隆与功能分析 1165


ovule and fiber tissue at 3–10 days post anthesis (DPA), with expression peak at 8DPA in Hai 7124 and high expression from
5DPA to 10 DPA in TM-1. The association analysis between GhGDSL and the traits related to fiber and seed qualities in corre-
sponding [(TM-1×Hai 7124)×TM-1] BC1S1 individuals showed that GhGDSL homolog in A-subgenome was significantly corre-
lated with the seeds’ fat content (P=0.048), and GhGDSL homolog in D-subgenome was very significantly correlated with the
seeds’ protein content (P=0.008). These results suggested that GhGDSL might be functionally important in the metabolic process
of lipid and protein in seeds and in the process of fiber development.
Keywords: GDSL lipase; Cloning; Expression; Gene mapping; Association analysis; Cotton
植物脂肪酶根据编码蛋白催化活性区域氨基酸
序列的保守型分为 GXSXG脂肪酶和 GDSL脂肪酶。
其中, GDSL家族脂肪酶具有水解酶活性, 能水解多
种酯类物质。与微生物和动物的脂肪酶研究相比 ,
植物脂肪酶基因的克隆起步较晚, 近年来随着分子
生物技术的发展, 特别是模式植物拟南芥和水稻全
基因组测序的完成, GDSL脂肪酶的相关报道也逐渐
增多, 有大量水稻[1]、油菜[2]、苜蓿[3]GDSL 脂肪酶
基因及其相关功能的报道。
GDSL 家族脂肪酶作用主要分为三大类: (1)参
与脂类代谢。拟南芥 GDSL脂肪酶 Arab-1基因在种
子萌发过程中表达, 行使水解酶活性 [4]; (2)参与植
物应激反应。Oh 等[5]研究表明, 拟南芥 GDSL 脂肪
酶 GLIP1基因可能触发植物体内针对真菌侵染的抗
病信号, 兼具水解酶活性和抗菌活性; (3)参与植物
次生代谢物合成。Rupperl 等 [6]研究指出 , 萝芙木
(Rauvolfia serpentina)的 GDSL基因参与催化生成阿
吗碱(ajmaline)的次生代谢。
棉花既是重要的纤维作物, 又是重要的油料作
物, 在国民经济中占有重要地位。阐明纤维和胚珠
的发育进程及其相关基因表达特征为充分发挥这一
重要经济作物的经济价值奠定了基础。棉纤维的分
化和发育可以分为起始期(initiation)、伸长或初生壁
合成期(elongation or primary cell wall synthesis)、次
生壁合成期(secondary cell wall synthesis)以及成熟
期(maturation)[7] 4 个相互重叠的阶段。伴随着棉纤
维发育, 胚珠中与油脂和蛋白代谢相关的基因均表
达并参与相应代谢过程。Ji 等[8]利用 cDNA 消减杂
交和微阵列技术比较野生型棉纤维和无绒无絮突变
体开花后 10 d的表达差异, 发现 280条差异表达的
cDNA 片段。进一步分析发现在纤维伸长发育过程
中显著上调表达的 172 个基因中, 29 条参与长链脂
肪酸生物合成的各种上游通路, 如 MAPK 通路、生
长素信号通路等。因此, 脂肪酸代谢途径, 不仅在种
子发育进程中参与棉籽大量脂肪酸的形成, 而且在
维持棉纤维生长、发育过程中也起重要作用。
本研究室前期研究完成了新乡小吉无绒无絮
(XinWX)和无绒有絮(XinFLM)近等基因系纤维发育
起始期 29K 芯片竞争杂交 , 获得一批差异表达基
因。本研究从中选择了一个在纤维起始期二者具有
极显著表达差异的 EST 序列 (NCBI 登录号为
DR458916), 以该序列信息为探针 , 开展了该基因
的克隆及相关特征分析研究。明确了该基因结构和
表达特征, 通过定量表达和关联分析表明该基因在
棉花种子和纤维发育中扮演重要角色。
1 材料与方法
1.1 试验材料
选用二倍体 A 染色体组的阿非利加棉(G. her-
baceum var. africanum)、D染色体组的雷蒙德氏棉(G.
raimondii)和异源四倍体栽培棉种陆地棉遗传标准
系 TM-1 (G. hirsutum acc. TM-1)和海岛棉海 7124 (G.
barbadense cv. Hai 7124), 将其种植于南京农业大学
牌楼实验基地。
1.2 目的基因的获得与分析
以获得的 EST 序列为探针, 对陆地棉的 dbEST
数据库(http://www.ncbi.nlm.nih.gov/)进行 tBlastn 比
对。将获得的 EST序列用 CAP3拼接, 用 Blastn方式
对拼接结果进行检索, 直至检出的 Contig 不能再延
伸。对最长 Contig 进行 ORF 预测, 利用 NCBI 中
Blastp 功能搜索与该基因相似的序列, 通过比较将其
分类命名。根据该序列电子克隆结果设计扩增 ORF
和全长基因引物, 分别以陆地棉遗传标准系 TM-1 基
因组DNA和开花后 10DPA的纤维组织 cDNA为模板,
克隆该基因并测序验证(表 1)。由南京金斯瑞生物科技
有限公司完成所有引物合成和 DNA序列测定。
每一基因分别从来自 TM-1和海 7124中的阳性
克隆中随机挑选 10个克隆, 从雷蒙德氏棉和阿非利
加棉的阳性克隆中随机挑选 3个克隆, 进行测序。利
用在线软件 Gene Structure Display Server (GSDS,
http://gsds.cbi.pku.edu.cn/chinese.php)进行基因结构
分析。利用 ClustalX (Ver 2.0.12)进行多重序列比对,
利用 MEGA5 (http://www.megasoftware.net/)进行进
化树分析。
1166 作 物 学 报 第 39卷


表 1 本研究所用引物
Table 1 Primer pairs used in this study
基因
Gene
引物
Primer
引物序列
Sequences information (5′–3′)
用途
Purpose
Y 8991F CGGTGGTGTGAAGAAGCCTCAT His3
Y 8991R AATTTCACGAACAAGCCTCTGGAA
内标对照
Reference gene as control
Y5705F GTTGCTTCCCTGCTTAATTT
Y9759R GAAGGGATTTGACAGATACCAAGAAACTAAA
扩增 ORF所用的 RT-PCR引物
RT-PCR primers for ORF amplification
Y5705F GTTGCTTCCCTGCTTAATTT
Y5705R CAAGCAGTGAACGATCTCAA
Y8302F TAAGACACCAGTGCCCTACAGATAC
Y8302R TAGAGCCGTTGGTGGCAATGTA
Y9759F TACATTGCCACCAACGGCTCTA
Y9759R GAAGGGATTTGACAGATACCAAGAAACTAAA
扩增全长基因所用的 3套巢式引物
Three sets of nested primers for amplifying the
full length of the gene
Y9408F GTGAATCCATTTGAGCCCTGTT
Y9408R CTACGGAACAAGGATGGCGA
Q-PCR分析
Q-PCR analysis
Y8441F ACTCTTTTTCTTCTTCTTTTTTTCTTCCTATTTCCG
Y8441R AGACAGCTCCTTGTTGTCATGAGTTGTCTGT
用于A亚组GhGDSL 拷贝染色体定位的SNP引物
SNP primers for chromosome location of GhGDSL
homolog in A-subgenome
Y9363F GGAGGTAAAATGTAATTTGATTCCTAATACAGGCGT
GhGDSL
Y9363R TCCCAAGTTATGGATGCGTTTCAGGTT
用于D亚组GhGDSL 拷贝染色体定位的SNP引物
SNP primers for chromosome location of GhGDSL
homolog in D-subgenome

1.4 染色体定位
基因定位作图群体为[(TM-1×海 7124)×TM-1]的
BC1 群体, 群体大小为 138 个单株[9]。根据基因在
TM-1 和海 7124 中的序列差异, 设计亚基因组专化
的 SNP标记引物(表 1), 通过 PAGE胶电泳检测该基
因在 BC1 作图群体中的分离情况 , 然后利用
JoinMap3.0 对多态性数据进行连锁分析[10], 将结果
整合到我室构建的海陆遗传图谱上[11], 用 MapChart
完成基因定位图谱的制作[12]。
1.5 关联分析
分别于 2003、2004、2005 和 2008 年重复调查
了 TM-1和海 7124亲本及 [(TM-1×海 7124)×TM-1]
的 BC1S1家系的 5 个纤维品质性状指标, 即纤维长
度(fiber length, FL)、纤维强度(fiber strength, FS)、
马克隆值(micronaire value, FM)、纤维伸长率(fiber
elongation, FE)和纤维整齐度(fiber uniform, FU)。分
别在 2003 年和 2004 年重复测定种子油分和蛋白含
量。由农业部棉花品质监督检验测试中心测定纤维
品质; 国家谷物品质监督检验测试中心泰安分中心
测定油分和蛋白含量。由南京农业大学棉花研究所
提供上述数据。基于上述数据和目标基因在[(TM-1×
海 7124)×TM-1] BC1中 2种基因型, 利用 t测验进行
目标基因与性状的关联分析。
1.6 总 RNA和 DNA的提取
分别将 TM-1和海 7124的种子浸泡水中 24 h左
右, 再转入营养钵 30℃光照培养箱培养, 每日光照
与黑暗各 12 h, 待小苗生长到 5~6片真叶时, 分别采
收其根、茎和叶 ; 在植株生长盛花期 , 分别采集
TM-1和海 7124开花前 1 d (–1DPA)、开花后 0、1、
3和 5 d (DPA)的胚珠和纤维混合物, 开花后 8、10、
14、17、20和 23 d (DPA)的纤维, 开花后 8、10、14、
17、20和 23 d (DPA)的胚珠。将样品迅速置液氮冷
冻并保存在–70℃冰箱。用 CTAB法[13]从新鲜幼嫩的
叶片提取 DNA。用改进的热硼酸法[14]提取不同纤维
发育时期的纤维细胞总 RNA。用 CTAB-酸酚法提取
根、茎和叶总 RNA[15]。
1.7 实时荧光定量 Q-PCR分析
将提取的目标组织、器官总 RNA 反转录成
cDNA, 稀释 10倍取 1 μL用于实时荧光定量 PCR分
析。以 His3 为内参, 在荧光定量 PCR 仪上(iQ5 型,
Bio-Rad, USA)扩增, 反应体系为 cDNA 1 μL、10
μmol L–1正向和反向引物各 0.5 μL、2×SYBR (Roche)
溶液 10 μL, 加无菌超纯水至 20 μL 于专用的定量
PCR管中, 扩增条件为 95℃预变性 10 min; 94℃变
性 15 s, 60℃退火 15 s, 72℃延伸 30 s, 40个循环;
72℃延伸 10 min, 以熔解曲线结束。参照 ΔΔCt法[16]
分析定量结果 , 目的基因相对表达量=2–ΔCt; ΔCt=
第 7期 佟祥超等: 一个棉花 GDSL脂肪酶基因的克隆与功能分析 1167


Ct 目的基因−Ct,His3。
2 结果与分析
2.1 基因全长 cDNA的获得及其序列分析
以本试验获得的 EST 序列信息为探针, 搜索
NCBI 棉花 EST 数据库中与此序列同源的目标序列,
通过电子拼接克隆, 获得该候选基因的最大 ORF。
进一步设计扩增全长 ORF 的引物, 以 TM-1 开花后
10DPA 的纤维组织 cDNA 为模板, 通过扩增产物测
序验证, 获得一个含完整 ORF的 cDNA序列。ORF长
度为 1065 bp, 可编码 354个氨基酸。用 Expasy pI/Mw
程序预测该基因编码的氨基酸一级结构, 其等电点
8.77, 分子量 39.33 kD。根据 NCBI CDS (http://www.
ncbi.nlm.nih.gov/Structure/cdd/)分析 , 其编码的氨基
酸残基含有 GDS(L)-motif, 在 50~330氨基酸之间有
属于 SGNH_hydrolase superfamily保守域。BlastX比
对发现其与蓖麻(Ricinus communis)和麻疯树(Jatropha
curcas)中的 GDSL 类基因同源性最高, 分别为 72%
和 75%, 因此将该基因命名为 GhGDSL (Gossypium
hirsutum GDSL; GenBank登录号为 KC186125)。
2.2 分子系统进化分析
为了进一步了解新发现的 GhGDSL基因的系统
进化分类 , 从 TAIR (http://www.arabidopsis.org/in-
dex.jsp/)上下载拟南芥 107个 GDSL脂肪酶基因序列,
用MEGA5与 GhGDSL基因序列构建系统发生树(图
1), 使用 Neighbor-Jioning 法, 其中 BootStrap 值为
1000。根据序列的同源性将进化分析结果分成 3 组
(Group I~III), GhGDSL与拟南芥 GDSL基因家族中
的 Group III 同源性最高 , 其中相似度最高的是
AT2G36325.1和 AT3G09930.1 (NP_187604.1)。拟南芥
Group III中大部分基因的功能与种子油脂代谢有关[17],
推测 GhGDSL在种子油脂代谢过程中发挥作用。


图 1 GhGDSL与拟南芥 GDSL脂肪酶聚类分析
Fig. 1 Phylogenetic analysis of GhGDSL and GDSL lipases subfamily in Arabidopsis
107个拟南芥 GDSL脂肪酶基因序列从 TAIR (http://www.arabidopsis.org/index.jsp/)网站下载。
Subfamily of 107 GDSL lipases was downloaded from TAIR (http://www.arabidopsis.org/index.jsp/).

1168 作 物 学 报 第 39卷


2.3 不同棉种 GhGDSL同源基因结构分析
基因结构分析表明(图 2), 该基因包含 5个外显
子, 4个内含子, 与 GDSL脂肪酶基因家族大多数基
因的内含子数目一致[17]。不同棉种中 GhGDSL的同
源基因序列在第 2 个内含子位置, 均存在 A 组和 A
亚组与 D组和 D亚组之间明显差异。序列进化分析
显示该基因在四倍体棉种中形成 A亚组和 D亚组两
大分支, 可明确追溯到其祖先来源, 说明在四倍体
棉种中 GhGDSL A亚组与 D亚组重复基因是独立进
化的。进一步比较 TM-1和海 7124中来源同一亚组
基因的同源性, 发现在这 2 个棉种中来源于 D 亚组
的基因其变异程度高于 A亚组, 说明在进化进程中,
GhGDSL的同源基因在 A亚组中的拷贝比 D亚组保
守性高(图 3)。


图 2 GhGDSL类同源基因在不同棉种中的结构比较
Fig. 2 Gene structure of GhGDSL orthologs in four cotton species
A: 阿非利加棉; D: 雷蒙德氏棉; TM-1_At: TM-1的 A亚组; TM-1_Dt: TM-1的 D亚组; H7124_At: 海 7124的 A亚组; H7124_Dt: 海
7124的 D亚组。
A: G. herbaceum L. var. africanum; D: G. raimondii; TM-1_At: A subgenome of G. hirsutum acc.TM-1; TM-1_Dt: D subgenome of G. hirsu-
tum acc. TM-1; H7124_At: A subgenome of G. barbadense cv. Hai 7124; H7124_Dt: D subgenome of G. barbadense cv. Hai 7124.


图 3 GhGDSL类同源基因在不同棉种中的系统进化
Fig. 3 Phylogenetic analysis for GhGDSL orthologs in four
cotton species
基因来源同图 2。Gene origins are the same as those in Fig. 2.

2.4 染色体定位
根据来源于 TM-1和海 7124棉种间的 GhGDSL
同源基因其相应基因组序列上 SNP 位点差异, 分别
开发出这 2个棉种在 A、D亚组专化的 SNP引物(表
1)。利用该引物仅可在海 7124中扩增出相应的目标
产物, 因此在[(TM-1×海 7124) ×TM-1]BC1群体中可
根据扩增产物的有无确定来源于 TM-1和海 7124的
2种基因型。将在群体中获得的多态分离信息, 利用
JoinMap 3.0作图软件与我们实验室的骨架标记整合,
将该基因在四倍体中的 2个拷贝分别定位于A4 (Chr.
4)和 D4 (Chr. 22)部分同源染色体上, 其中来源于 A
亚组的拷贝(GhGDSL-At)其两侧标记分别为 E10M15-
100和NAU2363-200, 来源于D亚组的拷贝(GhGDSL-
Dt)其两侧标记分别为 BNL1047-680 和 Gh591-155
(图 4)。

图 4 GhGDSL基因的染色体定位
Fig. 4 Mapping of GhGDSL homologs in tetraploid cotton

2.5 定量分析
Q-PCR分析表明, 在海 7124中, GhGDSL在根、
茎、叶、–1、0、1DPA 中表达量低, 3~14DPA 纤维
中表达量逐渐由高到低 , 其中 8DPA 表达量最高 ,
17DPA 以后的纤维组织以及 8DPA 以后胚珠中表达
量均很低。在 TM-1中, GhGDSL在 5~10DPA纤维组
织中表达量明显高于其他纤维发育时期和其他组织,
推测该基因主要在纤维伸长期发挥作用。由 Q-PCR
结果可知(图 5), GhGDSL在海 7124和 TM-1中表达
模式基本相似, 其表达高峰均在纤维伸长期的纤维
组织中。在海 7124中最高表达峰在 8DPA, 在 TM-1
中最高表达峰由 5DPA 持续到 10DPA, 高表达时期
长, 但最高表达值没有在海 7124中高。
第 7期 佟祥超等: 一个棉花 GDSL脂肪酶基因的克隆与功能分析 1169



图5 GhGDSL基因在TM-1和海7124中定量表达分析
Fig. 5 Q-PCR analysis of GhGDSL in TM-1 and Hai 7124
R, S, L, –1 d, 0 d, 1 d, 3 d, 5 d, 8 d, 10 d, 14 d, 17 d, 20 d, 23 d, 8 do, 10 do, 14 do, 17 do, 20 do, 23 do分别代表根, 茎, 叶, –1, 0, 1, 3, 5
DPA胚珠纤维混合物, 8, 10, 14, 17, 20, 23 DPA纤维, 8, 10, 14, 17, 20, 23 DPA胚珠。“A”表示材料之间极显著差异, “a”表示材料之间
显著差异。
R, S, L, –1 d, 0 d, 1 d, 3 d, 5 d, 8 d, 10 d, 14 d, 17 d, 20 d, 23 d, 8 do, 10 do, 14 do, 17 do, 20 do, 23 do indicated root, stem, leaf, –1, 0, 1, 3, 5
DPA mixture of ovule and fibers, 8, 10, 14, 17, 20, 23 DPA fibers, 8, 10, 14, 17, 20, 23 DPA ovules, respectively. “A” means the significant
difference at the 0.01 probability level, “a” means the significant difference at the 0.05 probability level.

2.6 关联分析
利用专化扩增海 7124基因组的四倍体 A、D亚
组 SNP 标记, 筛选[(TM-1×海 7124)×TM-1]的 BC1
作图群体获得的分离群体标记信息 , 与来源于
BC1S1群体多年份的纤维品质、种子油分和蛋白等性
状指标进行关联分析。结果显示, 关联分析未检测
到该基因功能与纤维长度、强度、细度等品质的关
联性, 但检测到该基因 A 亚组的拷贝与种子脂肪含
量存在显著相关 (P=0.048), 在 [(TM-1×海 7124)×
TM-1] BC1 分离群体中, 陆地棉纯合基因型均值脂
肪含量为 36.11%, 而海陆杂合基因型均值脂肪含量
为 35.26%; D 亚组的拷贝与种子蛋白含量存在极显
著相关(P=0.008), 在[(TM-1×海 7124)×TM-1] BC1分
离群体中 , 陆地棉纯合基因型均值蛋白含量为
37.60%, 而海陆杂合基因型均值蛋白含量为
40.86%。说明该基因参与种子中油脂代谢及蛋白形
成。研究发现 , 尽管来源于四倍体 A、D 亚组的
GhGDSL2 个拷贝分别与种子中脂肪或蛋白含量关
联, 但群体中 2 种基因型种子脂肪含量和蛋白含量
的总和基本接近, 这与种子中油脂与蛋白质含量之
和是稳定常数相一致[18]。
3 讨论
GDSL 脂肪酶作为重要的脂肪酶基因家族之一,
在植物生长发育等多种生理活动中扮演重要角色。
Beisson 等[19]发现拟南芥中的 Arab-1 只在萌发种子
的黄化苗中发挥作用, 说明该类基因参与种子萌发
过程。GDSL 脂肪酶也在花器官发育及植物抗逆性
中发挥作用。如已经鉴定花粉外壁中的胞外脂肪酶
EXL1~6 [20], 以及 CaGLIP1 对胡椒疾病易感性和非
生物胁迫的耐受性有调控作用[21]。
棉纤维和棉籽中的脂肪蛋白均是重要的相关
产业原料。GDSL 家族脂肪酶具有水解酶活性, 参
与脂肪酸代谢。本研究克隆的 GhGDSL 基因与拟
南芥 107 个 GDSL 脂肪酶家族基因中 73 个基因结
构类似。说明该基因在进化中的保守性。系统进化
分析显示 GhGDSL与 AT2G36325.1和 AT3G09930.1
(NP_187604.1)相似度最高, 它们属于拟南芥 GDSL
基因家族中的 Group III, 可能参与种子的油脂代
谢[17]。
脂肪酶是脂代谢中的关键酶, 能催化长链脂肪
酸甘油酯水解为甘油和长链脂肪酸。脂肪酸是生物
体中重要的组成成分, 可作为重要的信号分子参与
细胞的生长发育[22], 细胞中脂肪酸的组成、含量以
及存在形式对细胞的生存和正常生长都具有重要的
意义。在棉纤维细胞伸长过程中, 参与脂肪酸合成和
延长途径中的大部分基因均上调表达[23]。Qin 等[22]发
现在胚珠培养基中加入外源饱和超长链脂肪酸
(VLCFA; C20:0~C30:0)可以显著提高棉纤维细胞的
伸长, 而加入抑制 VLCFA 生物合成的乙草胺(ACE)
则可以阻止纤维生长, 同时对棉花中 4个 KCS (超长
链脂肪酸合成的限速酶)的研究发现, 在开花后 10
或 15 d纤维伸长阶段检测到不同的 KCS基因相对于
开花当天的转录水平增加了 8~35倍。而相对于短纤
维种质, 长纤维棉花在快速伸长阶段(开花后 10 d)
含有的所有 4 种 KCS 转录物, 其量几乎是短纤维的
2 倍。Gou 等[24]通过对纤维快速伸长期、次生壁合
成期的转录组以及代谢组研究, 发现脂肪酸合成、
1170 作 物 学 报 第 39卷


代谢相关基因在纤维伸长期具有较高的表达, 在次
生壁合成时期表达开始逐渐降低。总的脂肪酸含量
也在纤维伸长期达到最大值, 而到开花后 21 d显著
降低。表明脂肪酸合成与代谢相关的基因参与棉纤
维的伸长。本研究克隆的 GhGDSL基因主要在胚珠
发育早期及纤维伸长期高表达, 推测该基因通过参
与脂质代谢而促进纤维的伸长。当纤维细胞快速伸
长时, 脂肪酶与其他相关酶协同发挥作用, 催化分
解油脂类物质生成糖类, 提供纤维细胞扩展中所必
需的养料和能量。
本研究表明, 该基因 A 亚组的拷贝与种子脂肪
含量显著相关, D 亚组的拷贝与种子蛋白质含量极
显著相关。Wei 等[25]研究发现, 油菜中 GDSL 脂肪
酶基因 BnSDP1 在低油品系种子中转录水平高于高
油品系, 推测 GhGDSL 在种子油脂代谢过程中起着
重要作用。棉籽作为棉花主要的副产品之一, 是可
再生的“绿色能源”, 能用于工业生产及食品、药品和
保健品研制, 为人类使用。尽管 GhGDSL 主要在纤
维发育早期及伸长期表达量最高, 但其与棉籽中脂
肪及蛋白含量的相关性, 也提示我们进一步阐明该
类基因在种子发育进程中的功能及作用机制, 进而
应用生物技术手段操纵其表达, 培育棉籽高油或高
蛋白品种。研究结果无论对促进人类身体健康, 还
是缓解工业能源压力, 均有积极的意义。
4 结论
克隆了一个含 GDSL 基元的棉花新基因
GhGDSL, 其 ORF全长 1065 bp, 编码 354个氨基酸,
含有 5 个外显子和 4 个内含子。在二倍体棉种阿非
利加棉和雷蒙德氏棉基因组中含 1 个拷贝, 在四倍
体陆地棉和海岛棉基因组中存在 2 个拷贝, 分别定
位于 A4 (Chr. 4)、D4 (Chr. 22)部分同源染色体上。
该基因与拟南芥中第 3 类 GDSL 脂肪酶家族同源性
高, 主要参与种子发育相关的油脂代谢, 且在胚珠
发育早期及纤维伸长期高表达。在四倍体棉种中该
基因 A 亚组的拷贝与种子脂肪含量显著相关, D 亚
组的拷贝与种子蛋白含量极显著相关。推测
GhGDSL 基因功能与种子发育和纤维伸长过程中油
脂代谢及蛋白形成有关。
References
[1] Kim Y. Cloning and expression of a lipase gene from rice (Oryza
sativa cv. Dongjin). Mol Cells, 2004, 18: 40–45
[2] Roberts M R, Foster G D, Blundell R P, Robinson S W, Kumar A,
Draper J, Scott R. Gametophytic and sporophytic expression of
an anther-specific Arabidopsis thaliana gene. Plant J, 1993, 3:
111–120
[3] Pringe D, Dickstein R. Purification of ENOD8 proteins from
Medicago sativa root nodules and their characterization as estera-
ses. Plant Physiol Biochem, 2004, 42: 73–79
[4] Brick D J, Brumlik M J, Buckley J T, Cao J X, Davies P C, Misra
S, Tranbarger T J, Upton C. A new family of lipolytic plant en-
zymes with members in rice, Arabidopsis and maize. FEBS Lett,
1995, 377: 475–480
[5] Oh I S, Park A R, Bae M S. Kwon S J, Kin Y S, Lee J E, Kang N
Y, Lee S, Cheong H, Park O K. Secretome analysis reveals an
Arabidopsis lipase involved in defense against Alternaria brassi-
cicola. Plant Cell, 2005, 17: 2832–2847
[6] Rupperl M, Woll J, Giritch A, Genady E, Ma X Y, Stochigt J.
Functional expression of an ajmaline pathway-specific esterase
from Rauvolfia in a novel plant-virus expression system. Planta,
2005, 222: 888–898
[7] Basra A, Malik C P. Development of the cotton fiber: Interna-
tional fibers. In: Basra A M ed. Cotton Fibers. New York: Ha-
worth Press, 1984. pp 231–267
[8] Ji S J, Lu Y C, Feng J X, Wei G, Shi Y H, Fu Q, Liu D, Luo J C,
Zhu Y X. Isolation and analyses of genes preferentially expressed
during early cotton fiber development by subtractive PCR and
cDNA array. Nucl Acids Res, 2003, 31: 2534–2543
[9] Song X L, Wang K, Guo W Z, Zhang J, Zhang T Z. A comparison
of genetic maps constructed from haploid and BC1 mapping
populations from the same crossing between Gossypium hirsutum
L. and Gossypium barbadense L. Genome, 2005, 48: 378–390
[10] Van Ooijen J W, Voorrips R E. JoinMap Version 3.0: Software
for the Calculation of Genetic Linkage Maps. Wageningen, the
Netherlands: CPRO-DLO, 2001
[11] Guo W Z, Cai C P, Wang C B, Wang C B, Han Z G, Song X L,
Wang K, Niu X W, Wang C, Lu K Y, Shi B, Zhang T Z. A mi-
crosatellite-based, gene-rich linkage map reveals genome struc-
ture, function, and evolution in Gossypium. Genetics, 2007, 176:
527–541
[12] Voorrips R E. MapChart: software for the graphical presentation
of linkage maps and QTLs. J Heredity, 2002, 93: 77–78
[13] Paterson A H, Brubaker C L, Jonathan F. Rapid method for ex-
traction of cotton (Gossypium spp.) genomic DNA suitable for
RFLP or PCR analysis. Plant Mol Biol Rep, 1993, 11: 122–127
[14] Wu Y-T(武耀廷), Liu J-Y(刘进元). A modified hot borate
method for efficient isolation of total RNA from different cotton
tissues. Cotton Sci (棉花学报), 2004, 16(2): 67–71 (in Chinese
with English abstract)
[15] Jiang J-X(蒋建雄), Zhang T-Z(张天真). Tissues with CTAB
acidic phenolic method. Cotton Sci (棉花学报), 2003, 15(3):
166−167 (in Chinese with English abstract)
[16] Licak K J, Schmittgen T D. Analysis of relative gene expression
第 7期 佟祥超等: 一个棉花 GDSL脂肪酶基因的克隆与功能分析 1171


data using Real-time quantitative PCR and the 2(-delta delta C(t))
method. Method, 2001, 25: 402–408
[17] Ling H, Zhao J Y, Zuo K J, Qiu C X, Yao H Y, Qin J, Sun X F,
Tang K X. Isolation and expression analysis of a GDSL-like li-
pase gene from Brassica napus L. J Biochem Mol Biol, 2006, 39:
297–303
[18] Sun S-K(孙善康), Chen J-H(陈建华), Xiang S-K(项时康), Wei
S-J(魏守军). Study on the nutritional quality of cotton seeds. Sci
Agric Sin (中国农业科学), 1987, 20(5): 12–16 (in Chinese with
English abstract)
[19] Beisson F, Arondel V, Verger R. Assaying Arabidopsis lipase ac-
tivity. Biochem Soc Transact, 2000, 28: 773–775
[20] Mayfield J A, Fiebig A, Johnstone S E, Preuss D. Gene families
from Arabidopsis thaliana pollen coat proteome. Science, 2001,
292: 2482–2485
[21] Hong J K, Choi H W, Hwang I S, Kin D S, Kim N H, Choi D S,
Kim Y J, Hwang B K. Function of a novel GDSL-type pepper li-
pase gene, CaGLIP1, in disease susceptibility and abiotic stress
tolerance. Planta, 2008, 227: 539–558
[22] Qin Y M, Hu C Y, Pang Y, Kastaniotis A J, Hilunen J K, Zhu Y
X. Saturated very-long-chain fatty acids promote cotton fiber and
Arabidopsis cell elongation by activating ethylene biosythesis.
Plant Cell, 2007, 19: 3692–3704
[23] Shi Y H, Zhu S W, Mao X Z, Feng J X, Qin Y M, Zhang L,
Cheng J, Wei L P, Wang Z Y, Zhu Y X. Transcriptome profiling,
molecular biological, and physiological studies reveal a major
role for ethylene in cotton fiber cell elongation. Plant Cell, 2006,
18: 651–664
[24] Gou J Y, Wang L J, Chen S P, Hu W L, Chen X Y. Gene expres-
sion and metabolite profiles of cotton fiber during cell elongation
and secondary cell wall synthesis. Cell Res, 2007, 17: 422–434
[25] Wei M-Y(魏明玉), Zhou J(周佳), Yan S-Z(闫素珍), Wang Z(王
政), Tan X-L(谭小力). Cloning and expression analysis of an
oil-content related lipase (BnSDP1) gene in Brassica napus. Chin
Oil Crop Sci (中国油料作物学报), 2011, 33(4): 338–343 (in
Chinese with English abstract)