全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2011 年第 10 期
三种豆科植物 DGAT1 基因家族的分子
特征与进化分析
朱红霞1 胡利宗2,3 邓小莉1 蔺芳1
(1新乡学院,新乡 453003;2中国科学院遗传与发育生物学研究所,北京 100101;3中国科学院研究生院,北京 100039)
摘 要: 二脂酰甘油酰基转移酶广泛存在于动物、植物及酵母中,是催化三脂酰甘油生物合成的关键酶。在大豆、苜蓿
和百脉草基因组中共挖掘到 7 个 DGAT1 基因,并剖析该基因的分子特征与进化关系。基因结构分析表明,3 种豆科植物
DGAT1 基因的外显子数目变异大,其范围为 3 - 16。蛋白特征分析显示,3 种豆科植物分享 8 个保守基序,同时发现 2 个大豆
物种特有的保守基序。EST数目统计分析结果表明,该基因在 3 种植物的根、茎、叶、花、子叶与体细胞胚中表达,其中花器官
表达量最高,EST数目占了 34%。进化分析揭示了 DGAT1 基因是一个古老的基因家族,在植物演化历程中基因数目发生扩
增现象,但其功能区仍然保持较高的保守性。
关键词: 豆科植物 基因 保守基序 进化
Molecular Characterization and Evolutionary Analysis of DGAT1
Gene Family in Three Fabaceae Plants
Zhu Hongxia1 Hu Lizong2,3 Deng Xiaoli1 Lin Fang1
(1Xinxiang College,Xinxiang 453003;2 Institute of Genetics and Developmental Biology,
Chinese Academy of Sciences,Beijing 100101;3Graduate University of Chinese Academy of Sciences,Beijing 100039)
Abstract: Acyl-CoA:diacylglycerol acyltransferases that have been found extensively in animals,plants and fungal,are key en-
zymes that catalyze the final step of triacylglycerol biosynthesis. In this study,a total of seven DGAT1 genes were isolated from soybean,
barrel medic,and crowtoe,and molecular characterization and evolutionary relationship of these genes were further investigated based on
in silico method. Structural analysis of DGAT1 genes displayed that the number of exons range from 3 to 16 in three Fabaceae plants.
Ten protein conserved motifs were identified by MEME suite. Eight conserved motifs were shared across three Fabaceae plants. One con-
served motif was only found in soybean DGAT1 proteins;the other was shared between soybean and crowtoe DGAT1 protein. EST count
analysis demonstrated that DGAT1 gene expresed in root,stem,leaves,flower,cotyledon,and somatic embryo,and most highly expressed
in flower in which 34% ESTs were found. Phylogenic investigation indicated that gene duplication events were found in ancient DGAT1
family but functional regions in DGAT1 proteins were still conserved during an evolutionary process. The result would provide the clue
for functional investigation about DGAT1 gene family in plants.
Key words: Fabaceae Gene Conserved motif Evolution
收稿日期:2011-05-03
作者简介:朱红霞,女,助教,研究方向:分子生物学;E-mail:lgl0077@ 163. com
通讯作者:邓小莉,女,硕士,副教授,研究方向:植物遗传学;E-mail:xldeng207@ 126. com
二脂酰甘油酰基转移酶是催化三脂酰甘油生物
合成最后一步的酶,是 Kennedy途径中的关键酶[1]。
该酶广泛存在于植物的不同器官中,如叶片、花瓣、
果实、花粉囊以及正在发育中的种子中[2]。它催化
酰基链从辅酶 A 酯转移到 sn-1,2-二脂酰甘油 DAG
的 sn-3 位上的反应,从而形成 TAG。早期研究主要
集中于模式植物与重要的油料作物,例如大豆[3]、
拟南芥[4]、旱金莲[5]和油桐[6]。近年来,模式植物
生物技术通报 Biotechnology Bulletin 2011 年第 10 期
和一些重要油料作物的 DGAT1 基因的酶活性[7]、
蛋白跨膜拓扑与立体结构[8,9]、表达情况[1]以及亚
细胞定位[6]也逐渐被阐明。
尽管模式植物和一些重要油料作物的 DGAT1
基因已有较多研究,但未见从全基因组水平分析豆
科植物 DGAT1 基因家族进化的报道。基于 3 种豆
科模式植物全基因组序列资源,本研究以三酰甘油
合成途径关键酶 DGAT1 基因家族为研究对象,系
统分析了 DGAT1 基因家族成员的基因结构、蛋白
保守基序、表达谱及进化关系。旨在揭示 DGAT1
基因家族的进化事件,为探索植物油脂合成的分
子机理奠定基础,为植物 DGAT1 基因功能研究提
供线索。
1 材料与方法
1. 1 数据来源
本研究涉及的 DGAT1 基因相关序列主要来自
NCBI数据库(http:/ /www. ncbi. nlm. nih. gov /,拟南
芥基因组序列 TAIR 数据库(http:/ /www. arabidop-
sis. org /) ,水稻基因组序列 TIGR 数据库(http:/ /
rice. plantbiology. msu. edu /)。其它物种 DGAT1 基
因序列主要来源于 Phytozome 数据库(http:/ /www.
phytozome. net /)。
1. 2 方法
1. 2. 1 基因分离与结构分析 利用 DGAT1 蛋白
的保守基序对 Phytozome 数据库进行检索,同时
以关键词“Diacylglycerol acyltransferase”检索 NC-
BI 数据库,最终获得大豆、苜蓿与百脉草的
DGAT1 基因相关序列。采用 GSDS 在线工具(ht-
tp:/ / gsds. cbi. pku. edu. cn /)绘 制 基 因 的 结
构图[10]。
1. 2. 2 蛋白保守基序分析 利用 MEME 工具(ht-
tp:/ /meme. nbcr. net /meme4_1 /cgibin /meme. cgi)对
3 种豆科植物蛋白的保守基序进行分析[11]。
1. 2. 3 表达谱分析 以 DGAT1 基因家族成员的
开放阅读框(ORF)作为检索序列,利用 BLASTn
工具在 GenBank 中 dbEST 数据库搜索相应的
EST序列,设置参数如下:最大相似性大于 95%,
EST 序列长度大于 200 bp 和期望值小于 1e-10。
基于检索到的 EST 序列,找到最佳匹配的 Uni-
Gene,利用 EST 组织表达谱推测 DGAT1 基因的
表达情况。
1. 2. 4 系统进化分析 基于不同物种 DGAT1 蛋白
的氨基酸全长序列,基因进化树被构建。DGAT1 蛋
白序列多重比对由 Clustal X 软件完成,参数为默认
值[12]。采用邻接法(Neighbor-Joining Method)构建
基因系统发生树[13],其输出借助于 MEGA 软件
完成[14]。
2 结果
2. 1 DGAT1 基因的鉴定与结构
通过 Pfam (http:/ /pfam. sanger. ac. uk /)和
SMART(http:/ / smart. embl-heidelberg. de /)在线工
具确认,在大豆、苜蓿和百脉草的基因组中共鉴定出
7 个 DGAT1 基因,分别命名为 GmDGAT1a - Gm-
DGAT1e、LjDGAT1 和 MtDGAT1,这些基因的详细信
息被列举在表 1 中。根据 DGAT1 基因的结构特点,
可分为两类:第一类内含子较少,即 3 - 4 个内含子,
例如 GmDGAT1a 和 GmDGAT1d;第二类内含子较
多,即 9 - 16 个内含子,如 GmDGAT1b、LjDGAT1 和
MtDGAT1 等(图 1)。根据已报道的 DGAT1 基因结
构情况,可推测大豆 GmDGAT1a 和 GmDGAT1d 是
截断基因,很可能是进化过程中丢失基因的部分区
段,形成假基因。
表 1 大豆、苜蓿和百脉草 DGAT1 基因家族成员信息
基因名称 基因位点 基因组位置
读码框
(bp)
外显子
(内含子)
MtDGAT1
AC174465
_23. 4
11155432 -
11160404
1573 9(8)
LjDGAT1
AP006408
_14
30698 -
36459
1527 14(13)
GmDGAT1a
Glyma
09g07510
6413192 -
6414050
198 3(2)
GmDGAT1b
Glyma
09g07520
6430353 -
6435829
1185 9(8)
GmDGAT1c
Glyma
13g16560
20486452 -
20494264
1497 16(15)
GmDGAT1d
Glyma
15g18750
15640128 -
15640924
347 4(3)
GmDGAT1e
Glyma
17g06120
4324935 -
4333073
1515 15(14)
461
2011 年第 10 期 朱红霞等:三种豆科植物 DGAT1 基因家族的分子特征与进化分析
图 1 大豆、苜蓿与百脉草 DGAT1 家族成员的基因结构
2. 2 DGAT1 蛋白的保守基序
保守基序分析结果(图 2)显示,3 个豆科植物
中,共享了 8 个保守基序,分别是保守基序 1、2、4、
6、7、8、9、10;除了 GmDGAT1b,大豆 4 个 DGAT1 基
因成员和百脉草 DGAT1 基因共享了保守基序 3,但
苜蓿 DGAT1 基因不包括保守基序 3;保守基序 5 只
存在于大豆的 GmDGAT1c和 GmDGAT1e中。
由图 2 可以看出,GmDGAT1a 和 GmDGAT1d 是
完整 DGAT1 基因的部分片段,很可能没有功能。因
此,保守基序 3 是大豆和百脉草在进化过程产生的
新基序。
图 2 大豆、苜蓿与百脉草蛋白保守基序的组织结构图
2. 3 DGAT1 基因组织表达谱
由于 LjDGAT1 没有对应的 UniGene,而 Gm-
DGAT1a和 GmDGAT1d很可能是假基因,因此,本试
验仅研究了 GmDGAT1b - GmDGAT1c、GmDGAT1e 和
MtDGAT1的表达谱。EST数目统计结果(图 3)显示,
大豆和苜蓿 DGAT1基因在根、茎、叶、花、子叶与体细
胞胚中均有表达;其中花器官表达量最高,EST 数目
占了 34%;根和叶子器官中表达量最低,仅占 5%。
图 3 DGAT1 基因组织表达结果
2. 4 物种 DGAT1 进化分析
为揭示 DGAT1 基因成员间的亲缘关系,1 个小
立碗癣 DGAT1 蛋白、3 个江南卷柏 DGAT1 蛋白、1
个拟南芥 DGAT1 蛋白、2 个水稻 DGAT1 蛋白与 3
种豆科植物的 DGAT1 蛋白用于系统发生分析。进
化分析结果(图 4)表明,仅有 1 对苜蓿 /大豆 DGAT1
蛋白位于系统发生树的同一分支,说明该基因起源
于两个物种分化之前。此外,还发现大多数 DGAT1
蛋白都是同类物种聚在一起,这意味着基因起源于
物种分化之后的基因扩增。
图 4 物种 DGAT1 氨基酸序列进化树
561
生物技术通报 Biotechnology Bulletin 2011 年第 10 期
3 讨论
豆科植物 DGAT1 基因成员数目分析表明,该基
因家族在大豆、苜蓿与百脉草基因组中扩增现象并
不明显。基因结构、保守基序以及表达谱研究结果
说明了该基因家族在进化过程保持较高的保守性。
从全基因组水平看,大豆 DGAT1 基因成员较多,说
明大豆在进化过程 DGAT1 基因发生了多次重复,
Soltis等[15]的研究也支持了这一结论。系统进化树
揭示了不同物种的 DGAT1 基因被分为 4 个不同的
类群,这些不同类群内的基因可能在功能上有所差
异,但 GmDGAT1a 和 GmDGAT1d 并不具有 DGAT1
基因典型的结构和保守基序,推测它们很可能是截
断基因。根据 Ohno[16]的基因重复模型,推测 Gm-
DGAT1a和 GmDGAT1d不具有编码蛋白的功能,仅
以假基因的形式存在于基因组中。尽管这些结论有
待试验验证,但却为大豆 DGAT1 基因功能研究提供
有用线索。
参 考 文 献
[1]唐桂英,柳展基,单雷. 二酰基甘油酰基转移酶(DGAT)研究进
展.中国油料作物学报,2010,32(2) :320-328.
[2]Hobbs DH,Chaofu L,Hills MJ. Cloning of a cDNA encoding diacylg-
lycerol acyltransferase from Arabidopsis thaliana and its functional
expression. FEBS Lett,1999 452:145-149.
[3]Wang HW,Zhang JS,Gai JY,et al. Cloning and comparative analysis
of the gene encoding diacylglycerol acyltransferase from wild type
and cultivated soybean. Theor Appl Genet,2006,112:1086-1097.
[4]Zou JT,Wei YD,Jako C,et al. The Arabidopsis thaliana TAG1 mu-
tant has a mutation in a diacylglycerol acyltransferase gene. Plant J,
1999,19:645-653.
[5]Xu JY,Francis T,Mietkiewska E,et al. Cloning and characterization
of an acyl-CoA-dependent diacylglycerol acyltransferase (DGAT1)
gene from Tropaeolum majus,and a study of the functional motifs of
the DGAT protein usingsite-directed mutagenesis to modify enzyme
activity and oil content. Plant Biotechnology Journal,2008,6(8) :
799-818.
[6]Shockey JM,Gidda SK,Chapital DC,et al. Tung tree DGAT1 and
DGAT2 have nonredundant functions in triacylglycerol biosynthesis
and are localized to different subdomains of the endoplasmic reticu-
lum. Plant Cell,2006,18:2294-2313.
[7] Jako C,Kumar A,Wei Y,et al. Seed-specific over-expression of an
Arabidopsis cDNA encoding a diacylglycerol acyltransferase enhances
seed oil content and seed weight. Plant Physiol,2001,126:861-874.
[8]Mishra S,Dwivedi SP,Dwivedi N,et al. A molecular model for dia-
cylglycerol acyltransferase from Mortierella ramanniana var. angulis-
pora. Bioinformation,2009,3(9) :394-398.
[9]Pamela JM,Sandra LS,Shanna LB,Scot JS. Topological orientation of
Acyl-CoA:Diacylglycerol Acyltransferase-1 (DGAT1)and identifi-
cation of a putative active site histidine and the role of the N termi-
nus in Dimer /Tetramer formation. The Journal of Biological Chemis-
try,2010,285:37377-37387.
[10]Guo AY,Zhu QH,Chen X,et al. GSDS:a gene structure display
server. Hereditas,2007,29(8) :1023-1026.
[11]Bailey TL,Williams N,Misleh C,et al. MEME:discovering and an-
alyzing DNA and protein sequence motifs. Nucleic Acids Res,
2006,34:369-373.
[12]Thompson JD,Gibson TJ,Plewniak F. The CLUSTAL_X windows
interface:flexible strategies for multiple sequence alignment aided
by quality analysis tools. Nucleic Acids Res,1997,25:4876-4882.
[13]Saitou N,Nei M. The neighbor-joining method:a new method for re-
constructing phylogenetic trees. Mol Biol Evo,1987,4 (4) :
406-25.
[14]Tamura K,Dudley J,Nei M,et al. MEGA4:molecular evolutionary
genetics analysis (MEGA)software version 4. 0. Molecular Biology
and Evolution,2007,24:1596-1599.
[15]Soltis DE,Soltis PS. Polyploidy:recurrent formation and genome e-
volution. Trends in Ecology and Evolution,1999,14(9) :348-352.
[16]Ohno S. Evolution by gene duplication[M]. Berlin:Springer-Ver-
lag,1970:1-160.
(责任编辑 李楠)
661