全 文 :书中国油料作物学报
Chinese Journal of Oil Crop Sciences
2014,36( 3) : 289 - 299
doi: 10. 7505 / j. issn. 1007 - 9084. 2014. 03. 001
芸薹属 AC基因组中 SUC基因家族的鉴定与进化分析
袁午舟,周荣芳,童超波,程晓晖,黄军艳,于景印* ,董彩华* ,刘胜毅
(中国农业科学院油料作物研究所,农业部油料作物生物学与遗传育种重点实验室,湖北 武汉,430062)
摘要:为分析芸薹属 AC基因组中 SUC基因(负责蔗糖和质子同向转运的蛋白基因)家族的扩张与丢失,基于
已公布的白菜和尚未公布的甘蓝及甘蓝型油菜基因组数据对 SUC 基因进行全基因组鉴定,并分析基因结构域特
征、生化特征、进化关系和表达特性。依据 HMMER程序构建的 SUC基因家族的 HMM(隐马尔科夫)模型,在白菜、
甘蓝、甘蓝型油菜中,各检索出 12、11 和 24 个 SUC候选基因;通过用 SUC 家族特征进行筛选,最终各保留了 12、4
和 7 个 SUC基因;通过对 SUC基因在拟南芥、白菜、甘蓝和甘蓝型油菜中的系统发育分析,SUC基因家族在芸薹属
物种中分成了 3 个亚类。利用 MCscan对这 4 个物种基因组的共线性分析,结果表明 SUC基因家族成员在芸薹属
物种基因组加倍后以及白菜和甘蓝杂交形成油菜以后发生了不同程度的丢失。同时,序列生化特性预测结果表明
SUC蛋白是属于偏碱性的疏水性蛋白且结构稳定;表达谱分析显示,所有 SUC基因基本上在所有的组织中都有不
同程度的表达;启动子分析表明,SUC基因的启动子区富含 LTRE、ABRE、MYC、MYB和 W - box等逆境应答相关顺
式作用元件,因而该基因可能也与抗逆性相关。
关键词:白菜;甘蓝;甘蓝型油菜;全基因组;SUC基因家族;分类;进化分析
中图分类号:Q754,S565. 4 文献标识码:A 文章编号:1007 - 9084(2014)03 - 0289 - 011
Genome -wide identification and phylogenetic analysis of SUC gene
family in B. rapa,B. oleracea and B. napus
YUAN Wu - zhou,ZHOU Rong - fang,TONG Chao - bo,CHENG Xiao - hui,
HUANG Jun - yan,YU Jing - yin* ,DONG Cai - hua* ,LIU Sheng - yi
(Oil Crops Research Institute,Chinese Academy of Agricultural Sciences,Key Laboratory of Biology and
Genetic Improvement of Oil Crops,Ministry of Agriculture,Wuhan 430062,China)
Abstract:To understand the sucrose transporter (SUC)gene family expansion and lost in Brassicacea plants,
a genome - wide search was carried out to identify SUC genes in B. rapa,B. oleracea and B. napus. Gene struc-
ture,domain feature,and phylogenetic relationship were also performed. Based on the gene family characteristics,
12 SUC genes in B. rapa,4 in B. oleracea,and 7 in B. napus were identified. Syntenic relationship analysis indica-
ted that these 3 species experienced different gene loss resulting in different gene retention rates. Protein sequence
feature showed that they had alkaline amino acids for hydrophobic and stable protein structure. Observation of tran-
scriptomic data indicated that all SUC genes were expressed in the examined tissues of root,stem,leaf,flower,si-
lique and callus. In conserved motifs of promoter regions,a large number of stress - responsive cis - acting ele-
ments were found,such as LTRE,ABRE,MYC,MYB and W - box,which indicated that SUC genes might be in-
volved in stress - responsive pathways.
Key words:Brassica rapa;B. oleracea;B. napus;Genome - wide;SUC;Identification;Phylogenetic analysis
收稿日期:2013-11-22
基金项目:国家 973 计划(2011CB109300);国家 863 计划(2013AA102602) ;湖北农业科技创新中心
作者简介:袁午舟(1989 -) ,男,湖北宜昌人,硕士研究生,主要从事植物病理学研究
* 通讯作者:于景印(1980 -),助理研究员,主要从事油料作物比较基因组学研究,E - mail:yujyinfor@ gmail. com;
董彩华,副研究员,主要从事油菜功能基因组研究,E - mail:dongch@ oilcrops. cn
蔗糖是高等植物光合作用产生的同化物的主要 运输形式,主要在绿色组织中合成,然后通过韧皮部
转运到库组织,为非光合组织提供能量和碳骨架。
蔗糖转运主要通过 3 类蛋白:Suc /H + symporter,Suc
facilitators (SUF)以及 Suc /H + antiporter。生理生化
实验表明了 Suc /H + antiporter 的存在,但还没有鉴
定出催化 Suc /H + antiport 的蛋白和基因[1]。SUF
是参与蔗糖被动运输的转运子,与 Suc /H + symport-
er蛋白结构具有很大的相似性,但并不是所有的植
物都具有 SUF 基因,SUF 可能具有物种的特异
性[2,3]。Suc /H + symporter又被称为 Suc transporters
(SUT)或 Suc carriers (SUC),几乎在所有的植物中
广泛存在,是 MFS 家族中的一个亚家族 GPH (Gly-
coside - Pentoside - Hexuronide)一个分支,在结构上
具有 MFS家族的典型特征:12 个及其以上的跨膜
域,同时 SUC蛋白的 N -端和 C -端位于细胞质一
侧,并在蛋白中部有一个大的胞质环,将 SUC 蛋白
分成两个各含 6 个跨膜域的结构,这一特征在植物
中是高度保守的[4]。SUC 不仅是转运途径中的关
键因子,同时也是联系源库代谢的信号转导元件,当
植物体受到外界变化的刺激,如温度、光周期、病原
等,蔗糖转运子会被精密调控,从而改变其转运活
性,来适应环境的变化[5,6]。有研究表明在土豆中,
下调或过表达蔗糖转运基因,会使土豆的开花、块茎
生长及避荫反应受到影响,并提出 StSUT4 可能是由
光敏色素 B 控制,同时蔗糖是光信号和 GA 信号之
间的联系物质之一,两者共同调控块茎生长[7]。
已有的报道显示拟南芥有 9 个 SUC 基因,At-
SUC6 和 AtSUC7 因没有正确的可变剪切形式,被认
为是假基因[8],AtSUC1 主要是在花器官中表达,与
花粉囊的开裂及花粉管的生长相关,同时授粉能诱
导其在珠柄处表达,因而可能参与配子体的发
育[9]。AtSUC1 启动子中发现了一个脱落酸响应元
件,故推测 AtSUC1 涉及到脱落酸调控和蔗糖信号
传输[10]。AtSUC2 是拟南芥 SUC家族的一个主效基
因,负责韧皮部处蔗糖装载与运输[11]。AtSUC3 表
达部位非常广泛,大都位于非光合组织中,其功能可
能是为库组织转运蔗糖,并因其在叶肉细胞与维管
束间隙表达,从而推测其可能有收集蔗糖的作
用[12,13]。AtSUC4 位于液泡膜上,负责液泡膜内外的
蔗糖交换[14]。AtSUC5 是在胚乳特异表达的蔗糖转
运基因,其功能可能是将质外体的蔗糖转运进胚乳,
从而供胚的发育与生长[15]。AtSUC8 和 AtSUC9 都
是在花组织中特异表达,具体功能并不清楚,且 at-
suc9 突变体在短日照条件下有提前开花的性状,推
测 AtSUC9 具有延迟开花的功能[16]。2012 年有人
通过绿藻、轮藻、红藻类相关物种,以及拟南芥、水
稻、卷柏和苔藓类等单双子叶的系统发育分析将
SUC基因分为了Ⅰ、Ⅱ、Ⅲ三类。Ⅰ类是双子叶植物
韧皮部装载和维持正常的花粉发育所必需的[18]。
Ⅱ和Ⅲ类在单子叶和双子叶植物中都存在,Ⅱ类又
分为两个小类ⅡA和ⅡB,ⅡA相对于ⅡB 有一个更
长的中央细胞质环(central cytoplasmic loop) ,单子
叶植物用ⅡB来进行韧皮部装载。Ⅲ类位于液泡膜
上,功能是伴随着质子流,将液泡内的蔗糖转运进胞
质[14,17 ~ 19]。但是相应的 SUC 基因家族鉴定及进化
分析在芸薹属 AC 基因组中还没有被研究过,仅在
2011 年李付鹏等从油菜种子产量数量性状基因座
共定位了一个 SUC 基因,通过关联分析,该基因与
有效分枝数、角果数和千粒重显著相关[20]。
有研究表明大约在 1 800 万年前,芸薹属祖先
和拟南芥发生分化[21],然后于 1 300 ~ 1 700 万年前
芸薹属祖先基因组进行了一次全基因组的三倍
化[22 ~ 24],并于 400 万年前进一步分化成白菜和甘
蓝,最后约 5 000 年前,由白菜和甘蓝杂交加倍形成
甘蓝型油菜。本研究以模式植物拟南芥为参照对
象,对十字花科芸薹属的重要经济作物和模式植物
白菜(B. rapa,AA,n = 10),甘蓝(B. oleracea,CC,n
=9)和甘蓝型油菜(B. napus,AACC,n = 19)中的
SUC基因家族进行全基因组范围的鉴定和比较分
析,通过基因结构、保守结构域、启动子元件分析、基
因三倍化和同线性分析,结合组织表达数据,探讨了
拟南芥和芸薹属祖先经历分化、基因组三倍化以及
白菜和甘蓝杂交形成甘蓝型油菜后,SUC 基因家族
的扩张和丢失情况,以及由于扩张和丢失造成的基
因功能分化和功能保留。在此基础上对白菜、油菜
和甘蓝型油菜中 SUC基因功能进行预测,为下一步
AC 基因组中 SUC 基因的功能验证与利用提供参
考,同时对芸薹属基因组加倍后基因家族扩张 /丢失
的生物学信息做了有益的补充。
1 材料与方法
1. 1 材料
白菜的全基因组序列下载于 Brassica Database
(http:/ /brassicadb. org /brad)[25];甘蓝全基因组数
据下 载 于 Bolbase (http:/ / ocri - genomics. org /
bolbase)[26];油菜基因组数据由本研究所测序获得;
转录组数据下载于 NCBI (http:/ /www. ncbi. nlm.
nih. gov /)。拟南芥 SUC 基因序列和蛋白序列下载
自 TAIR(http:/ /www. arabidopsis. org)。
1. 2 SUC候选基因的鉴定
基因家族含有 GPH_sucrose(TIGR01301)结构
092 中国油料作物学报 2014,36(3)
域,在 TIGRFAMS(http:/ /www. jcvi. org /cgi - bin /
tigrfams / index. cgi)数据库中下载 TIGR01301 的种
子序列,用 ClustalW[27]对序列进行比对,将比对结
果构建一个 SUC 蛋白结构特异的隐马尔科夫模型
(HMM)[28],并用该模型检索拟南芥、白菜、甘蓝和
油菜蛋白数据库,然后将得到的白菜 SUC 蛋白序列
用 ClustalW进行比对,重新构建一个 HMM模型,再
一次检索白菜蛋白数据库,直至穷尽整个白菜数据
库;甘蓝和油菜用同样的方法,搜索出 SUC 基因家
族成员。
采用在线软件 TMHMM(http:/ /www. cbs. dtu.
dk /services /TMHMM/)和 hmmtop(http:/ /www. enz-
im. hu /hmmtop /)预测 SUC 候选基因的跨膜结构域
数,依据蔗糖转运蛋白家族的跨膜结构特征对搜索
结果进行筛选,获取 SUC基因家族的基因。
1. 3 SUC基因家族的序列比对和系统发育分析
采用 ClustalW2 进行多序列比对后,应用 MEGA
5. 1(http:/ /megasoftware. net)[29]Neighbor - Joining
法构建系统发生树,bootstrap 值设为 1 000,对 SUC
蛋白序列进行初步聚类分析。利用获得的 SUC 相
关基因,提取对应的 gff 文件,获得各基因内含子数
目、基因结构以及其匹配 GPH_sucrose(TIGR01301)
结构域的区段等详细信息,并用在线工具 Fancygene
(http:/ /bio. ieo. eu / fancygene /)绘出基因结构图。
1. 4 SUC基因家族的三倍化分析
以参数 1E - 05,对白菜、甘蓝和油菜全基因组
的蛋白序列和拟南芥全基因组的蛋白序列作
BLAST[30],然后利用获取的白菜、甘蓝、油菜和拟南
芥的基因组序列,使用 MCscan[31]软件找基因组间
的共线性区段,确定三个物种的三倍化区段,基因密
度大的为 LF,基因密度次之的为 MF1,基因密度最
小的为 MF2[25]。
1. 5 SUC基因家族的保守结构域和 motif的分析
提取 SUC基因家族保守的 GPH_sucrose结构域
的区段,利用 ClustalW2 进行序列比对,并利用在线
工具 Weblogo (http:/ /weblogo. berkeley. edu / logo.
cgi)绘出结构域 LOGO 图,调查序列特征及其保守
氨基酸出现频率。
1. 6 SUC基因家族的蛋白特性分析和启动子区域
的顺式作用元件分析
采用在线软件 ProtParam(http:/ /web. expasy.
org /protparam /)预测 SUC 蛋白的理论分子量(mo-
lecular weight,Mw)、等电点(theoretical pI)、GRAVY
(grand average of hydropathy);采用在线软件 TargetP
1. 1(http:/ /www. cbs. dtu. dk /services /TargetP /)预
测蛋白的信号肽。利用在线软件 PLACE(http:/ /
www. dna. affrc. go. jp /PLACE /signalscan. html)分析
SUC基因起始密码子上游 2 000 bp 序列中的 LTRE
(低温响应元件,low - temperature responsive ele-
ment,CCGAC)、ABRE (ABA - responsive element,
ACGTG)、MYC (CACATG)、MYB (TAACCA)和 W
- box(TGAC)等顺式作用元件。
1. 7 转录组数据分析
利用白菜、甘蓝和甘蓝型油菜转录组数据,以
RPKM(reads per kilobases per million reads)值比较
基因在不同组织内的表达丰度。从 TAIR(http:/ /
www. arabidopsis. org)上下载拟南芥的芯片表达数
据,进行表达分析。
RPKM计算公式如下:RPKM =(109 × C)÷
(N × L)
其中:C 为比对到某个基因的 reads 数;N 为样
本比对到所有基因的总 reads数;L 为基因长度。拟
南芥选取根、茎、叶、花、雄蕊、角果和胚珠等 6 个组
织。白菜和甘蓝选取根、茎、叶、花、角果和愈伤组
织。油菜选取了 7 个组织数据:根、茎、叶、花、角果、
胚珠和果皮(油菜转录组数据由本课题组测序获
得)。将数据进行以 2 为底的对数转换,以 Cluster
3. 0进行聚类,并用 TreeView1. 60[32]查看聚类结果。
2 结果与分析
2. 1 SUC基因的鉴别
利用构建的隐马尔科夫模型 HMM 在拟南芥蛋
白数据库中进行了检索,共获得 9 个 SUC 基因,与
目前文献报道的完全一致,说明本研究构建的 HMM
模型能够准确地预测蔗糖转运家族保守结构域。在
此基础上检索出 12 个白菜 SUC 候选基因,11 个甘
蓝 SUC候选基因和 24 个油菜 SUC候选基因。
通过在线软件对跨膜域结构的预测,白菜的 12
个候选基因全部具有 12 个以上的跨膜结构域,甘蓝
的 11 个候选基因仅有 4 个符合蔗糖转运家族的跨
膜结构特征,油菜中符合蔗糖转运家族跨膜结构特
征的有 7 个(表 1)。
2. 2 SUC基因家族的序列比对和系统发育分析
通过系统发育分析,SUC 基因家族主要分为 3
个大的亚家族:SUC2,SUC3 和 SUC4 三类。其中 At-
SUC1 对应的同源基因为 Bra016103、Bra007991、
Bra003906、Bra017654和 Bna0541420;AtSUC2 的同源
基因有 Bra024532、Bra012340、Bol023546、Bol012334、
Bna0629970、Bna0108820 和 Bna0780710;AtSUC3 的
同源基因为 Bra024802、Bra026576、Bol015177 和
192袁午舟等: 芸薹属 AC基因组中 SUC基因家族的鉴定与进化分析
Bna0130680;AtSUC4 的同源基因有 Bra019972、
Bra031692、Bol031227、Bna0537600 和 Bna0713630;
AtSUC9的同源基因有 Bra009167和 Bra005883(图 1)。
SUC3 与其他两个亚族的结构有显著差异,属于
typeⅡ的ⅡA类基因[19],其多肽链相较于其他两类
SUC具有更长的中央细胞质环和 N 端[33],其 cDNA
编码长度为 1 700bp 左右,内含子数目为 12 个以
上,而 SUC2 和 SUC4 类基因的 cDNA 编码长度在
1 500bp左右,内含子数目在 2 ~ 4 个左右。油菜的
Bna0541420 其基因结构与其他基因有明显差异,内
含子数目为 10,cDNA编码长度为 2 259bp(表 2)。
表 1 SUT候选同源基因及跨膜结构域
Table 1 Number of TMS in putative SUT genes searched by HMM
Bra TMS Bol TMS Bna TMS Bna TMS
Bra016103 12 Bol003493 9 Bna0541420 18 Bna0687400 7
Bra007991 12 Bol034930 9 Bna0629970 12 Bna0583680 7
Bra003906 12 Bol040095 9 Bna0108820 12 Bna0261700 7
Bra017654 12 Bol023546 12 Bna0780710 12 Bna0362850 7
Bra024532 12 Bol012334 12 Bna0537600 12 Bna0720800 7
Bra012340 12 Bol007207 10 Bna0713630 12 Bna0636940 7
Bra024802 12 Bol015177 12 Bna0130680 12 Bna0266410 7
Bra026576 12 Bol036777 6 Bna0673870 10 Bna0410050 7
Bra019972 12 Bol031227 12 Bna0160610 8 Bna0412440 7
Bra031692 12 Bol043972 10 Bna0124880 6 Bna0417160 5
Bra009167 12 Bol015443 8 Bna0692910 7 Bna0534130 4
Bra005883 12 Bna0117250 10 Bna0385610 2
注:采用 TMHMM和 hmmtop预测跨膜域,以跨膜域数多的为准
Note:The most number of TMS was selected when TMHMM and hmmtop was used for TMS prediction of putative SUT genes
注:同种颜色显示的是拟南芥 SUC对应的同源基因;分支上的数字是 bootstrap;结构图中黑色矩形为外显子,细线为内含子
Note:Genes in the same color cassette are homologous (paralogous or orthologous) ,numbers of branches indicate degree of confidence.
The black cassettes are exons and lines stand for introns
图 1 SUC基因系统发育树及基因结构示意图
Fig. 1 Phylogenetic tree of SUC genes and their exon / intron structures
292 中国油料作物学报 2014,36(3)
表 2 具有标准 SUC保守结构的基因信息
Table 2 Information about genes with standard conserved domain GPH_sucrose in screened SUC genes
基因号
Identifier
编码区
CDS /bp
内含子
Intron
结构域
Domain /aa
基因号
Identifier
编码区
CDS /bp
内含子
Intron
结构域
Domain /aa
Bna0108820 1 527 3 22 ~ 496 Bra005883 1 433 2 13 ~ 477
Bna0780710 1 527 3 22 ~ 496 AT5G06170 1 476 2 29 ~ 491
Bra024532 1 527 3 22 ~ 496 AT5G43610 1 479 2 29 ~ 492
Bol023546 1 527 3 22 ~ 496 AT1G66570 1 476 2 29 ~ 491
Bra012340 1 542 3 27 ~ 501 AT2G14670 1 479 2 29 ~ 492
Bna0629970 1 542 3 27 ~ 501 Bna0130680 1 572 13 -
Bol012334 1 527 3 22 ~ 496 Bra024802 1 785 12 56 ~ 295,318 ~ 585
AT1G22710 1 539 3 29 ~ 500 Bra026576 1 707 13 53 ~ 559
AT1G71890 1 539 2 30 ~ 500 Bol015177 1 716 13 49 ~ 300,295 ~ 562
Bra003906 1 545 3 29 ~ 502 AT2G02860 1 785 13 60 ~ 581
AT1G71880 1 542 2 29 ~ 501 AT1G09960 1 533 4 39 ~ 503
Bra007991 1 542 2 29 ~ 501 Bra031692 1 506 4 25 ~ 495
Bra016103 1 527 2 24 ~ 497 Bol031227 1 506 4 25 ~ 495
Bra017654 1 470 3 9 ~ 482 Bna0537600 1 527 4 36 ~ 502
Bna0541420 2 259 10 - Bna0713630 1 524 4 35 ~ 501
Bra009167 1 479 3 30 ~ 492 Bra019972 1 524 3 35 ~ 501
注:-代表没有检测出明显的保守区段 Note:- indicates no conserved domain were found
2. 3 SUC基因家族的三倍化分析
通过对拟南芥、白菜、甘蓝和油菜的共线性分
析,AtSUC1 在白菜、甘蓝和油菜中各对应 3 个同源
基因,其中在油菜的 3 个同源基因全位于油菜的 A
亚基因组上。AtSUC2、AtSUC3、AtSUC4 分别在白菜、
甘蓝和油菜中各对应两个同源基因,AtSUC2 和 At-
SUC4 在油菜中的同源基因全位于油菜的 C 亚基因
组上,AtSUC3 对应的同源基因则于油菜的 A 和 C
亚基因组上各一个。AtSUC5、AtSUC6 和 AtSUC7 在
线性化区段上没有对应的同源基因,AtSUC8 没有在
线性化区段上,AtSUC9 在白菜和甘蓝中各有 2 个同
源基因,在油菜中有 4 个同源基因,A、C基因组上各
有 2 个(表 3)。
表 3 拟南芥 SUC基因在白菜、甘蓝和甘蓝型油菜共线性区的同源基因
Table 3 Homologous SUC genes in syntenic regions of B. rapa,B. oleracea and B. napus genomes
AtSUCs BraLF BolLF Bna - A - LF Bna - C - LF BraMF1 BolMF1
AtSUC1 Bra016103* Bol003493 Bna0261700 NA Bra007991* Bol034930
AtSUC2 Bra024532* Bol023546* NA Bna0780710* Bra012340* Bol012334*
AtSUC3 Bra024802* Bol007207 Bna0130680* Bna0673870 Bra026576* Bol015177*
AtSUC4 Bra019972* Bol036777 NA Bna0537600* Bra031692* Bol031227*
AtSUC5 NA NA NA NA NA NA
AtSUC6 NA NA NA NA NA NA
AtSUC7 NA NA NA NA NA NA
AtSUC9 Bra009167* Bol043972 Bna0534130 Bna0417160 NA NA
AtSUCs Bna - A -MF1 Bna - C -MF1 BraMF2 BolMF2 Bna - A -MF2 Bna - C -MF2
AtSUC1 Bna0362850 NA Bra003906* Bol040095 Bna0636940 NA
AtSUC2 NA Bna0629970* NA NA NA NA
AtSUC3 NA NA NA NA NA NA
AtSUC4 NA Bna0124880 NA NA NA NA
AtSUC5 NA NA NA NA NA NA
AtSUC6 NA NA NA NA NA NA
AtSUC7 NA NA NA NA NA NA
AtSUC9 NA NA Bra005883* Bol015443 Bna0410050 Bna0412440
注:* 指具有 12 个跨膜结构的基因 Note:* indicates SUC gene with 12 transmembrane domains
总体来说,在共线性区,拟南芥只有 5 个 SUC
基因对应同源基因,在白菜和甘蓝中各有 11 个与之
对应。白菜的 11 个 SUC基因很好地保留了 SUC跨
膜域结构特征,而甘蓝满足跨膜结构域的基因则只
有 4 个(表 1),其他 7 个基因可能产生了功能分化
或退化,不再执行转运蔗糖的功能。油菜中共有 13
个线性对应的 SUC 基因,A、C 基因组上各有 6 和 7
个,A基因组上的 6 个只有一个保留了 SUC 跨膜域
392袁午舟等: 芸薹属 AC基因组中 SUC基因家族的鉴定与进化分析
特征,C基因组上 7 个则有 3 个保留下来,因而可以
看出 SUC基因家族成员在芸薹属物种加倍后发生
了不同程度的丢失。共线性区段寻找的拟南芥 SUC
各对应同源基因包含在 HMM 同源搜索结果中,但
在 HMM同源搜索结果中,白菜多了一个 SUC基因,
油菜则有 3 个基因在线性对应区段之外,同时聚类
分析所产生的基因分类结果与共线性分析寻找到的
SUC基因分类一致,除了 AtSUC9 与所对应的同源
基因并不是完全属于同一个分枝,但这可能与 At-
SUC6、AtSUC7、AtSUC8 和 AtSUC9 来自同一个祖先
基因的基因倍增事件有关[8]。
注:A图显示部分跨膜区及保守氨基酸位点;B图为 SUC基因的 motif分布及序列;氨基酸的高度与该氨基酸的保守性正相关
Note:A shows partial transmembrane domain of SUCs and their highly conserved amino acid;
B shows the distribution of motifs in SUC genes;the height of amino acid in graphic represents the conservation of amino acid
图 2 SUC蛋白部分跨膜域及其 motif序列
Fig. 2 Partial transmembrane domains of SUCs and their motifs
2. 4 SUC基因家族的保守结构域和 motif的分析
利用 TIGRFAM数据库对 SUC家族成员进行结
构域搜索,得到其结构域区段(表 3) ,域长 476 个残
基左右。通过 ClusterW2 的序列比对分析,发现该
结构域的保守区段主要集中在前 6 个跨膜单元中,
前 5 个跨膜结构的保守氨基酸所占比例都在 35%
以上,并且跨膜结构之间的间区也在 35%以上,最
高的是在 TMS2 和 TMS3 之间,为 66. 6%。后 6 个
跨膜单元中保守氨基酸最多的是在 TMS7 和 TMS10
达到了 35%,第 12 个跨膜区却并没有保守氨基酸。
跨膜间区保守氨基酸最多的是在 TMS11 和 TMS12
之间,达到了 42. 9%(图 2A)。同时通过 MEME[34]
进行 motif分析,发现在所有的 SUC基因内都存在 3
个保守的 motif序列,结构与序列如图 2B所示,氨基
492 中国油料作物学报 2014,36(3)
酸显示的高度表明其出现的频率。其中 Motif1 和
Motif2 具有 32 个残基,Motif3 为 31 个残基。目前在
SUC家族中共有 6 个氨基酸位点被探讨过与 SUC
转运功能的关系,AtSUC1 的 His65,OsSUT1 的
Asp177、Arg188、Asp331、Arg335 和 Glu336。其中
Asp177、Arg188、Asp331 被其他氨基酸代替后导致
SUC转运活性完全丧失,Arg335 和 Glu336 被代替
后会导致转运活性的降低,而 AtSUC1 的 His65 是一
个可变的修饰位点,被 C 取代后,SUC 活性完全丢
失,而被 K和 R取代后,其转运活性增强[35,36]。
在白菜、甘蓝、油菜的 GPH_sucrose 结构域中
His38、Asp130、Arg141、Asp334、Asp336 和 Glu341 高
度保 守,分 别 与 AtSUC1 的 His65,OsSUT1 的
Asp177、Arg188、Asp331、Arg335 和 Glu336 对应。在
这 6 个氨基酸残基中,除 Asp130 和 Arg141 外,其余
4 个残基预测全位于胞膜外侧,因而这 4 个残基可
能在与底物的互作中有重要功能。
2. 5 SUC基因家族的蛋白特性分析和启动子区域
的顺式作用元件分析
SUC 蛋白大致分为两类,一类其蛋白长度为
500 个左右的氨基酸残基,54kD 左右的分子量,9. 0
以上的 pI 值,属于碱性蛋白。另一类蛋白长度有
560 个以上的氨基酸残基,大于 60kD 的分子量,其
等电点为 6. 0 左右,是属于偏酸性蛋白。但所有的
SUC蛋白其 GRAVY 值都在 0. 4 以上,是属于疏水
性蛋白,其稳定性指数值也表明其结构都很稳定。
通过预测,Bra017654 和 Bna0541420 可能为分泌蛋
白,Bna0537600 可能为叶绿体蛋白,其余全无明显
的信号肽(表 4)。
表 4 SUC蛋白特性及启动子元件信息
Table 4 Basal promoter element and characteristics of SUC
基因号
Identifier
SUC 蛋白特征 SUC protein features 启动子基础元件 Basal elements of promoters
长度
Length
分子量
MW/kD pI
疏水性
GRAVY
稳定性
Instability
信号肽
Loc ABRE LTRE MYC MYB W - box
Bna0108820 508 54. 02 9. 26 0. 481 28. 84 other 2 0 1 2 10
Bna0780710 508 54. 02 9. 26 0. 481 28. 84 other 2 0 1 2 10
Bra024532 508 54 9. 19 0. 468 28. 99 other 0 0 0 4 8
Bol023546 508 54. 02 9. 26 0. 481 28. 84 other 2 0 1 2 9
Bra012340 513 54. 5 9. 2 0. 477 29. 86 other 2 0 2 2 10
Bna0629970 513 54. 56 9. 04 0. 48 30. 18 other 0 0 0 4 5
Bol012334 508 54 9. 03 0. 487 30. 76 other 0 0 0 4 8
AT1G22710 512 54. 54 9. 19 0. 475 26. 98 other 2 0 0 3 10
AT1G71890 512 54. 83 8. 87 0. 455 37. 99 other 2 0 0 2 14
Bra003906 514 54. 8 9. 27 0. 522 37. 71 other 0 0 1 8 15
AT1G71880 513 54. 86 9. 04 0. 472 36. 23 other 3 1 1 4 10
Bra007991 513 54. 6 9. 18 0. 541 37. 72 other 3 1 1 6 11
Bra016103 508 54. 26 9. 18 0. 54 36. 71 other 3 2 0 4 18
Bra017654 489 52. 32 9. 38 0. 476 34. 58 Secretory 0 4 0 7 9
Bna0541420 752 78. 553 9. 54 0. 604 36. 63 Secretory 1 0 2 4 17
Bra009167 492 52. 6 9. 07 0. 588 36. 01 other 2 1 0 3 11
Bra005883 477 50. 91 8. 84 0. 616 34. 46 other 2 5 0 4 7
AT5G06170 491 52. 58 9. 13 0. 62 34. 58 other 3 1 0 1 12
AT5G43610 492 52. 72 9. 33 0. 545 38. 89 other 3 0 1 0 13
AT1G66570 491 52. 97 9. 12 0. 529 38. 08 other 1 0 0 5 12
AT2G14670 492 52. 75 9. 32 0. 586 35. 73 other 1 0 0 0 0
Bna0130680 609 65. 178 6. 01 0. 419 37. 25 other 4 1 0 4 11
Bra024802 594 63. 55 6. 39 0. 332 37. 16 other 4 1 0 5 11
Bra026576 568 60. 64 6. 16 0. 433 34. 7 other 2 1 0 3 13
Bol015177 571 60. 95 5. 88 0. 428 30. 86 other 3 1 1 3 16
AT2G02860 594 63. 97 5. 59 0. 322 36. 84 other 4 1 3 4 9
AT1G09960 510 54. 78 9. 35 0. 533 34. 3 other 6 0 0 0 9
Bra031692 501 53. 61 9. 2 0. 482 39 other 3 1 2 0 14
Bol031227 501 53. 69 9. 19 0. 483 38. 49 other 1 2 3 5 7
Bna0537600 508 54. 47 9. 4 0. 511 35. 2 chloroplast 4 0 1 2 7
Bna0713630 507 54. 314 9. 32 0. 54 33. 77 other 4 1 2 0 4
Bra019972 507 54. 28 9. 32 0. 542 33. 77 other 4 2 3 6 9
592袁午舟等: 芸薹属 AC基因组中 SUC基因家族的鉴定与进化分析
PLACE分析显示,所有 SUC基因的启动子区域
都含有多个 WRKY元件,最多含有 18 个,91. 3%的
成员含有 MYB元件,最多有 8 个,最少有 2 个;56%
的成员含有 LTRE和MYC元件,有 80%的成员含有
ABRE脱落酸响应元件(表 4),这些元件都与逆境
应答作用相关,因而 SUC 基因也可能参与抗逆性
反应。
2. 6 转录组数据分析
拟南芥所选取的组织为根、茎、叶、花、雄蕊、角
果及胚珠,白菜和甘蓝的转录组数据包括根、茎、叶、
花、角果和愈伤组织,甘蓝型油菜的转录组为根、茎、
叶、花、角果、胚珠和果皮。通过对 SUC 基因转录组
数据分析,发现 SUC 基因基本上都有不同程度的
表达。
在拟南芥中,9 个 SUC 基因与文献中所描述的
一致,AtSUC1、AtSUC3 和 AtSUC5 主要在根、花和角
果等库组织中高量表达,而在茎和叶中以 AtSUC2
表达最强,AtSUC6、AtSUC7、AtSUC8、AtSUC9 表达整
体 偏 低。 在 白 菜 中,Bra016103、Bra007991、
Bra003906 和 Bra017654 同属于 AtSUC1 的同源基
因,其中 Bra003906 在所有组织中的表达值都高于
AtSUC1 在白菜中的其他同源基因,而 Bra017654 在
花和愈伤组织中没有检测到表达数据,仅在角果中
表达高,可能是角果特异的表达基因。AtSUC2、At-
SUC3 和 AtSUC4 的同源基因的表达量在选取的组
织中都有高水平的表达。Bra009167 和 Bra005883
为 AtSUC9 的同源基因,其在组织中表达丰度明显
偏低,在愈伤组织中没有检测到表达值,应没有参与
愈伤组织的蔗糖转运。甘蓝的四个 SUC 基因,其表
达丰度都相对较高。在油菜中,Bna0541420 为 At-
SUC1 的同源基因,在胚珠的表达丰度显著高于其他
组 织,也 可 能 是 种 子 特 异 的 表 达 基 因。
Bna0629970、Bna0108820 和 Bna0780710 是 AtSUC2
的同源基因,在所有组织中都有表达,且差异不大,
是表达丰度最高的一类 SUC 基因。AtSUC4 的同源
基因 Bna0537600 和 Bna0713630 在根和胚珠中明显
偏高。AtSUC3 的同源基因 Bna0130680 则是在角
果、胚珠、茎中有高表达(图 3)。
注:A为拟南芥,B为白菜,C为油菜,D为甘蓝;亮绿色为低量表达;红色为高量表达,灰色示未取值
Note:A,Arabidopsis thaliana;B,Brassica rapa;C,Brassica napus;D,Brassica oleracea;
light green indicates low expression,red indicates high expression and grey indicates value missing
图 3 SUC基因在根、茎、叶、花、角果、愈伤等组织中的表达差异
Fig. 3 Expression profiles of SUC genes in root,stem,leaf,flower,silique and callus
3 讨论
SUT /SUC(Sucrose transporter /carrier)是 MFS
家族中的一个亚家族 GPH /cation symporter family的
一个分支,因而该基因家族成员应同时满足 MFS 家
族的结构特征及含有其家族的功能结构域 GPH_su-
crose (TIGR01301)两个条件。通过用 TIGR01301
的 HMM模型搜索出 SUC 候选基因,应都属于 SUC
的同源基因,但部分基因并不满足 12 个跨膜结构的
特征,这可能在基因进化过程中,与该类基因获得新
692 中国油料作物学报 2014,36(3)
的功能或者是功能逐渐丧失有关,其中 Bna0130680
虽然具有 12 个跨膜域,但由 TMHMM 预测其 N 端
位于胞外,严格来说并不是完全满足 N -端和 C -
端位于细胞质侧的结构特征,但由 Interproscan (ht-
tp:/ /www. ebi. ac. uk /Tools /pfa / iprscan /)预测仍具
有蔗糖转运功能,因而可推测 N -端和 C -端位于
细胞质侧的结构特征并不一定适用于所有 SUC
基因。
在油菜中,Bna0541420 包含 18 个跨膜结构,与
其他 SUC基因家族成员有较大差异,因而在探讨
GPH_sucrose特征时并没有加入该序列。MFS 家族
成员的跨膜结构曾有证据表明是以 6 - TMS 为单
元,由 tandem intragenic duplication 产生[37],也有分
子模型提出 12 个 TMS 是由 3 - TMS 为单元经 2 次
连续复制而成[38],因而 Bna0541420 基因的 18 个跨
膜结构形成可能与此相关。油菜中 Bna0108820 不
在共线性区段上,其与 Bna0780710、Bol023546 蛋白
序列一致性达到了 100%,CDS 序列一致性为
99. 85%,因而 Bna0108820 的产生可能与基因重复
事件相关。
AtSUC2 同源基因是整个 SUC 基因家族中最保
守的一类,其 Bna0108820、Bna0780710、Bol023546
和 Bra024532 同位于 AtSUC2 分支的第一个分支,前
三个的蛋白序列一致性达到了 100%,Bra024532 蛋
白序列与其他 3 个基因也只有 2 个位点上的差异。
第 二 个 分 支 上 的 Bol012334、Bra012340 和
Bna0629970 其 一 致 性 也 为 99. 16%,除 了
Bra012340、Bna0629970 比 Bol012334 在 N 端多了 4
个残基,其序列之间只有 5 个位点的差异,同时 At-
SUC2 与两个分支的一致性分别为 93. 57% 和
94. 74%,因而可以看出该基因在拟南芥、白菜、甘蓝
和油菜之间较高的保守性,从侧面也说明该基因功
能对植物体来说非常关键。
从共线性比较分析和系统发育关系可知,白菜、
甘蓝和油菜中都没有 AtSUC5、6、7、8 对应的同源基
因,而 AtSUC9 和 6、7、8 的祖先基因可能是由一个更
古老的基因分化而来[12],同时 AtSUC1 与 AtSUC5 也
位于同一个进化分支,因而可推测拟南芥在最初仅
有 AtSUC1、AtSUC2、AtSUC3、AtSUC4、AtSUC9,5 个
SUC基因时,芸薹属基因组进行了一次三倍化全基
因组加倍[21 ~ 23],并分化成白菜和甘蓝,此时白菜和
甘蓝各具有 11 个 SUC基因;随着物种的不断进化,
拟南芥由 5 个 SUC基因增加为 9 个;同时白菜的 11
个 SUC基因则全部保留下来,并且还获得一个游离
的 SUC基因 Bra017654,而甘蓝的 11 个 SUC则只有
4 个基因保存了蔗糖转运功能,丢失了 7 个基因,最
后白菜与甘蓝杂交加倍形成甘蓝型油菜。从 SUC
的进化发展可看出,其在甘蓝中的变化更为剧烈。
从共线性区段上来看,油菜形成之初,应具有 13 个
SUC基因,A、C基因组上各有 6 和 7 个,但最终保留
SUC功能的各自只有 1 个和 3 个,但随着物种的进
化,又有 3 个基因具有了 SUC 功能,最终形成了 7
个 SUC基因。
同时根据表达水平,SUC 基因在白菜、甘蓝、甘
蓝型油菜的基因扩张和三倍化后,所产生的同源基
因表达并不是保持完全一致,而是产生了分化。例
如,AtSUC1 在花和根中高表达,白菜经历三倍化扩
张后 的 同 线 性 区 段 同 源 基 因 中 Bra016103、
Bra016103 与 AtSUC1 表达基本一致,而另一个
Bra003906 则在茎叶中也有高表达。甘蓝中 AtSUC1
基因扩张后产生的同源基因也有类似的表达特性。
但是白菜中独立进化来的同源基因 Bra017654 及在
甘白杂交后形成的甘蓝型油菜中保留的直系同源基
因 Bna0541420 则是在角果中的 RPKM 值最高,可
能与种子发育密切相关,说明它们在进化中由于环
境或选择压力获得了新的功能,这两个基因也是后
续研究的重点。同样的分化也出现在其他 SUC 基
因上,因而这也从侧面说明导致甘蓝与白菜符合
SUC结构特征的基因数目差异的潜在原因:可能在
基因进化过程中,一些基因获得新的功能或者是功
能逐渐丧失,表现为跨膜结构的改变,从而形成现有
的基因数目。
本研究通过拟南芥和已经完成基因组测序的芸
薹属物种的比较基因组学分析,深入探讨了 SUC 基
因家族在拟南芥和芸薹属祖先物种分化之后,以及
白菜和甘蓝杂交形成油菜以后基因家族成员的丢失
和保留情况,并从基因家族成员的表达特性,进化关
系进行了详细地比较分析,为 SUC 基因家族的功能
验证,为十字花科作物的重要经济性状的基因克隆
和 QTL定位提供了重要的参考意见,同时为油菜、
白菜、甘蓝的进化关系分析做了有益的补充。
参考文献:
[1] Ayre B G. Membrane - transport systems for sucrose in
relation to whole - plant carbon partitioning[J]. Molecu-
lar Plant,2011,4(3):377 - 394.
[2] Kuhn C,Hajirezaei M R,Fernie A R,et al. The sucrose
transporter StSUT1 localizes to sieve elements in potato
tuber phloem and influences tuber physiology and devel-
opment[J]. Plant Physiol,2003,131(1) :102 - 113.
[3] Reinders A,Schulze W,Kuhn C,et al. Protein - protein
792袁午舟等: 芸薹属 AC基因组中 SUC基因家族的鉴定与进化分析
interactions between sucrose transporters of different affin-
ities colocalized in the same enucleate sieve element[J].
Plant Cell,2002,14(1):1 567 - 1 577.
[4] Chang A B,Lin R,Studley W K,et al. Phylogeny as a
guide to structure and function of membrane transport pro-
teins[J]. Mol Membr Biol,2004,21(3) :171 – 181.
[5] Berthier A,Desclos M,Amiard V,et al. Activation of
sucrose transport in defoliated Lolium perenne L.:An ex-
ample of apoplastic phloem loading plasticity[J]. Plant
Cell Physiol,2009,50(7) :1 329 - 1 344.
[6] Liesche J,Schulz A,Krugel U,et al. Dimerization and
endocytosis of the sucrose transporter StSUT1 in mature
sieve elements[J]. Plant Signal Behav,2008,3(12) :
1 136 - 1 137.
[7] Chincinska I A,Liesche J,Krügel U,et al. Sucrose
transporter StSUT4 from potato affects flowering,tuber-
ization,and shade avoidance response[J]. Plant Physiol-
ogy,2008,146(2) :515 - 528.
[8] Sauer N,Ludwig A,Knoblauch A,et al. AtSUC8 and
AtSUC9 encode functional sucrose transporters,but the
closely related AtSUC6 and AtSUC7 genes encode aber-
rant proteins in different Arabidopsis ecotypes[J]. The
Plant Journal,2004,40(1) :120 - 130.
[9] WippelK,Sauer N. Arabidopsis SUC1 loads the phloem in
suc2 mutants when expressed from the SUC2 promoter
[J]. J Exp Bot,2011,63:669 - 679.
[10] Hoth S,Niedermeier M,Feuerstein A,et al. An ABA
- responsive element in the AtSUC1 promoter is in-
volved in the regulation of AtSUC1 expression[J]. Plan-
ta,2010,232:911 - 923.
[11] Gottwald J R,Krysan P J,Young J C,et al. Genetic
evidence for the in planta role of phloem - specific plas-
ma membrane sucrose transporters[J]. PNAS,2000,
97(25) :13 979 - 13 984.
[12] Meyer S,Melzer M,Truernit E,et al. AtSUC3,a gene
encoding a new Arabidopsis sucrose transporter,is ex-
pressed in cells adjacent to the vascular tissue and in a
carpel cell layer[J]. The Plant Journal,2000,24(6) :
869 - 882.
[13] Meyer S,Lauterbach C,Niedermeier M,et al. Woun-
ding enhances expression of AtSUC3,a sucrose trans-
porter from Arabidopsis sieve elements and sink tissues
[J]. Plant Physiol,2004,134:684 - 693.
[14] Schulz A,Beyhl D,Marten I,et al. Proton - driven su-
crose symport and antiport are provided by the vacuolar
transporters SUC4 and TMT1 /2[J]. The Plant Journal,
2011,68(1) :129 - 136.
[15] Baud S,Wuillème S,Lemoine R,et al. The AtSUC5
sucrose transporter specifically expressed in the endo-
sperm is involved in early seed development in Arabidop-
sis[J]. The Plant Journal,2005,43(6) :824 - 836.
[16] Sivitz A B,Reinders A,Johnson M E,et al. Arabidop-
sis sucrose transporter AtSUC9. High - affinity transport
activity,intragenic control of expression,and early flow-
ering mutant phenotype[J]. Plant physiology,2007,143
(1) :188 - 198.
[17] Aoki N,Hirose T,Scofield G. N,et al. The sucrose
transporter gene family in rice[J]. Plant Cell Physiol,
2003,44(3) :223 - 232.
[18] Sivitz A B,Reinders A,Ward J M. Arabidopsis sucrose
transporter AtSUC1 is important for pollen germination
and sucrose - induced anthocyanin accumulation[J].
Plant Physiol,2008,147:92 - 100.
[19] Reinders A,Sivitz A B,Ward J M. Evolution of plant
sucrose uptake transporters (SUTs) [J]. Frontiers in
Plant Science,2012,3:22.
[20] Li F,Ma C,Wang X,et al. Characterization of sucrose
transporter alleles and their association with seed yield -
related traits in Brassica napus L[J]. BMC Plant Biolo-
gy,2011,11(1) :168.
[21] Blanc G,Hokamp K,Wolfe K H. A recent polyploidy
superimposed on older large - scale duplications in the
Arabidopsis genome[J]. Genome Res,2003,13:137 -
144.
[22] Vision T J,Brown D G,Tanksley S D. The origins of
genomic duplications in Arabidopsis[J]. Science,2000,
290:2 114 - 2 117.
[23] Schranz M E,Lysak M A,Mitchell - Olds T. The
ABCs of comparative genomics in the Brassicaceae:
building blocks of crucifer genomes[J]. Trends in Plant
Science,2006,11:535 - 542.
[24] Lagercrantz U. Comparative mapping between Arabidop-
sis thaliana and Brassica nigra indicates that Brassica
genomes have evolved through extensive genome replica-
tion accompanied by chromosome fusions and frequent
rearrangements[J]. Genetics,1998,150:1 217 - 1 228.
[25] Cheng F,Liu S,Wu J,et al. BRAD,the genetics and
genomics database for Brassica plants[J]. BMC Plant
Biol,2011,11:136.
[26] Yu J,Zhao M,Wang X,et al. Bolbase:a comprehen-
sive genomics database for Brassica oleracea[J]. BMC
Genomics,2013,14(1) :664.
[27] Thompson J D,Higgins D G,Gibson T J. CLUSTAL
W:improving the sensitivity of progressive multiple se-
quence alignment through sequence weighting,position
- specific gap penalties and weight matrix choice[J].
Nucleic Acids Res,1994,22(22) :4 673 - 4 680.
[28] Eddy S R. Profile hidden Markov models[J]. Bioinfor-
892 中国油料作物学报 2014,36(3)
matics,1998,14(9):755 - 763.
[29] Tamura K,Peterson D,Peterson N,et al. MEGA5:
Molecular evolutionary genetics analysis using maximum
likelihood,evolutionary distance,and maximum parsi-
mony methods[J]. Molecular Biology and Evolution,
2011,28:2 731 - 2 739.
[30] Altschul S F,Madden T L,Schaffer A A,et al.
Gapped BLAST and PSI - BLAST:a new generation of
protein database search programs[J]. Nucleic Acids
Res,1997,25(17) :3 389 - 3 402.
[31] Wang Y,Tang H,Debarry J D,et al. MCScanX:a
toolkit for detection and evolutionary analysis of gene
synteny and collinearity[J]. Nucleic Acids Res,2012,
40(7) :e49.
[32] Tamura K,Dudley J,Nei M,et al. MEGA4:molecular
evolutionary genetics analysis (MEGA)software version
4. 0[J]. Molecular biology and evolution,2007,24(8) :
1 596 - 1 599.
[33] Shirasuka K. Genetics of sucrose transporters in plants
[J]. Genes Genomes Genomics,2007,1:73 - 80.
[34] Bailey T L,Boden M,Buske F A,et al. MEME
SUITE:tools for motif discovery and searching[J]. Nu-
cleic Acids Research,2009,37(suppl 2) :202 - 208.
[35] Sun Y,Ward J M. Arg188 in rice sucrose transporter
OsSUT1 is crucial for substrate transport[J]. BMC Bio-
chemistry,2012,13(1) :26.
[36] Lu J M Y,Bush D R. His - 65 in the proton - sucrose
symporter is an essential amino acid whose modification
with site - directed mutagenesis increases transport ac-
tivity[J]. Proceedings of the National Academy of Sci-
ences,1998,95(15) :9 025 - 9 030.
[37] Henderson P J F,Maiden M C J. Homologous sugar
transport proteins in Escherichia coli and their relatives
in both prokaryotes and eukaryotes[J]. Philos Trans R
Soc London,1990,326(1 236) :391 - 410.
[38] Hirai T,Heymann J A W,Maloney P C,et al. Struc-
tural model for 12 - helix transporters belonging to the
major facilitator superfamily[J]. J Bacteri,2003,185
(5) :1 712 - 1 718.
(责任编辑:郭学兰)
992袁午舟等: 芸薹属 AC基因组中 SUC基因家族的鉴定与进化分析