免费文献传递   相关文献

Genome-wide screening and characterization of the U-box gene family in Medicago truncatula

蒺藜苜蓿全基因组中U-box基因家族的筛选与特征分析



全 文 :书犇犗犐:10.11686/犮狔狓犫2015102 犺狋狋狆://犮狔狓犫.犾狕狌.犲犱狌.犮狀
郑兴卫,邵麟惠,李聪.蒺藜苜蓿全基因组中Ubox基因家族的筛选与特征分析.草业学报,2015,24(8):130141.
ZhengXW,ShaoLH,LiC.GenomewidescreeningandcharacterizationoftheUboxgenefamilyin犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪.ActaPrataculturaeSini
ca,2015,24(8):130141.
蒺藜苜蓿全基因组中犝犫狅狓基因
家族的筛选与特征分析
郑兴卫,邵麟惠,李聪
(中国农业科学院北京畜牧兽医研究所,北京100193)
摘要:植物基因组中广泛存在Ubox基因,其编码蛋白大部分作为泛素系统中决定底物特异性识别的E3 泛素连接
酶,广泛地调控植物生长生殖发育以及响应逆境胁迫等过程。本文利用蒺藜苜蓿基因组数据库,通过生物信息学
手段,鉴定蒺藜苜蓿Ubox家族基因;采用 MEGA6软件进行系统进化树分析;通过GSDS在线工具和 Mapinspect
软件进行基因结构及染色体定位分析;利用已有的蒺藜苜蓿芯片数据进行组织表达和胁迫响应表达分析。结果表
明,蒺藜苜蓿基因组中含有41个Ubox基因,不均匀地分布于蒺藜苜蓿的8条染色体上。根据结构域组成和系统
进化分析将这些Ubox蛋白分成6类。基因表达模式分析发现,该家族成员的表达具有一定的组织特异性,并能
响应盐、干旱和氮素胁迫。这些研究结果为蒺藜苜蓿Ubox基因家族的功能分析奠定了基础。
关键词:蒺藜苜蓿;Ubox基因家族;进化;表达模式  
犌犲狀狅犿犲狑犻犱犲狊犮狉犲犲狀犻狀犵犪狀犱犮犺犪狉犪犮狋犲狉犻狕犪狋犻狅狀狅犳狋犺犲犝犫狅狓犵犲狀犲犳犪犿犻犾狔犻狀犕犲犱犻犮犪犵狅
狋狉狌狀犮犪狋狌犾犪
ZHENGXingWei,SHAOLinHui,LICong
犐狀狊狋犻狋狌狋犲狅犳犃狀犻犿犪犾犛犮犻犲狀犮犲狊,犆犺犻狀犲狊犲犃犮犪犱犲犿狔狅犳犃犵狉犻犮狌犾狋狌狉犪犾犛犮犻犲狀犮犲狊,犅犲犻犼犻狀犵100193,犆犺犻狀犪
犃犫狊狋狉犪犮狋:TheUboxdomaingenestypicalyexistinmultiplevariantswithinplantgenomes,andmostofthem
belongtotheubiquitin/proteasomesystemasE3ubiquitinligase.Theyplaykeyrolesintheregulationof
growth,indevelopment,inreproductionaswelasinresponsetoenvironmentalstress.Inthisstudy,bioin
formaticsmethodswereappliedtoidentifyUboxfamilygenesof犕.狋狉狌狀犮犪狋狌犾犪throughwholegenomescreen
ing.AphylogenetictreewascreatedusingtheMEGA6program.Genestructureandchromosomelocation
weredefinedbyGSDSandMapinspect.Atotalof41Uboxgenesdistributedunevenlyon8chromosomeswere
identifiedfrom犕.狋狉狌狀犮犪狋狌犾犪.TheUboxproteinswereclassifiedintosixmajorclassesbasedontheirmotif
compositionsandphylogenyrelationships.Theexpressionprofilesof犕.狋狉狌狀犮犪狋狌犾犪Uboxgenesshowedchar
acteristicsoftissuespecificityandresponsetosalt,droughtandnitrogenstress.Theseresultswilbeuseful
forfuturefunctionalanalysesoftheUboxfamilygenesin犕.狋狉狌狀犮犪狋狌犾犪.
犓犲狔狑狅狉犱狊:犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪;Uboxgenefamily;phylogeneticanalysis;expressionpatterns
第24卷 第8期
Vol.24,No.8
草 业 学 报
ACTAPRATACULTURAESINICA
2015年8月
Aug,2015
收稿日期:20150225;改回日期:20150409
基金项目:国家自然科学基金(31372362)项目和“十二五”国家科技支撑计划(2011BAD17B01)资助。
作者简介:郑兴卫(1987),女,河北定州人,在读博士。Email:smilezxw@126.com
通讯作者Correspondingauthor.Email:licong0520@sina.com
Ubox基因家族是一类具有Ubox结构域的基因家族,其编码蛋白大部分是泛素系统中决定底物识别特性
的泛素连接酶E3[1],也有部分Ubox蛋白质属于泛素链聚集因子E4[2]。作为E3 的Ubox蛋白在真核生物,特
别是植物中广泛存在,在与细胞周期、信号转导、逆境反应、转录调节、DNA修复、细胞凋亡、形态发生、分泌途径
等过程有关的蛋白质降解途径中发挥着重要作用[36]。
Ubox基序最初是从具有泛素链聚集酶E4活性的酵母蛋白质 UFD2中鉴定出来的[7]。第一个被鉴定出具
体结构的植物Ubox蛋白为拟南芥(犃狉犪犫犻犱狅狆狊犻狊狋犺犪犾犻犪狀犪)AtPUB14蛋白质[8]。近年来,随着越来越多的 U
box蛋白质被鉴定出来,其结构与功能也逐渐引起了人们的关注。研究表明,Ubox结构域由大约70个氨基酸
组成,该结构域在真菌、植物和动物等真核生物中高度保守。在目前已鉴定出的真核生物Ubox蛋白中,植物U
box(plantUboxprotein,PUB)蛋白的数目远远多于其他生物[3]。如酵母中有2个Ubox基因,在人中有21个
Ubox基因[4,7,9],而经基因组序列分析预测,拟南芥基因组中存在64个Ubox基因[1011],水稻(犗狉狔狕犪狊犪狋犻狏犪)中
已鉴定出77个带有Ubox结构的基因[12]。到目前为止,多种植物的PUB蛋白基因功能已经被验证:1)PUB蛋
白参与植物的防御反应。编码拟南芥AtPUB17和与其同源的烟草(犖犻犮狅狋犻犪狀犪犫犲狀狋犺犪犿犻犪狀犪)ACRE276蛋白的
基因能正调控细胞凋亡和植物防御的过程[13]。AtPUB19通过负调节 ABA信号调控植物的干旱胁迫响应过
程[14]。超表达拟南芥的PUB22和PUB23能够增加其对干旱胁迫的敏感性[15]。辣椒(犆犪狆狊犻犮狌犿犪狀狀狌狌犿)中的
UBox蛋白质CaPUB1,在拟南芥中超表达后植株的耐盐性增加[16]。CMPG1在烟草与番茄(犛狅犾犪狀狌犿犾狔犮狅狆犲狉
狊犻犮狌犿)中参与多个抗病基因介导的抗性反应[17]。2)一些植物Ubox蛋白调控植株生长和生殖发育过程。水稻
犗狊犘犝犅15突变后,导致种子不能长出初生根,幼苗生长缓慢甚至死亡[18]。拟南芥AtPUB4基因突变后,影响绒
毡层细胞降解途径,使花粉粒粘连导致雄性不育[19]。ACR1在芸薹属植物雌蕊中作用于其下游的S受体激酶,
促进了雌蕊中兼容性因子的泛素化降解,最终导致花粉自交不亲和[20]。并且拟南芥PUB13和同源基因水稻
SPL11同时能够调控植物的细胞死亡、抗病和开花时间[21],证明植物在发育和先天免疫反应方面具有信号交叉。
蒺藜苜蓿是豆科苜蓿属一年生植物,由于其具有生育期短(80~100d)、基因组较小(454~526Mb)、二倍体
(2狀=16)、自花授粉、易于转化、再生时间较短等特点被作为豆科模式植物进行研究[2223]。蒺藜苜蓿与大部分豆
科植物具有相似的遗传性,从蒺藜苜蓿获得的信息对其他豆科植物具有重要的参考价值。因此,蒺藜苜蓿成为继
拟南芥和水稻进行基因组序列测定之后第3个基因组完整测序的模式植物[2425]。蒺藜苜蓿全基因组序列公布后
仍在不断完善,目前,利用生物信息学方法分析基因家族的特征、进化关系成为热点。本研究利用生物信息学方
法对蒺藜苜蓿全基因组中的Ubox基因家族的种类、数目、基因结构、染色体定位、系统发生和基因表达模式等
进行分析,旨在为豆科植物育种提供重要的理论依据。
1 材料与方法
1.1 数据来源
试验于2014年8月至2015年1月进行。最新的蒺藜苜蓿(犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪)全基因组数据和蛋白质数
据(Mt4.0)下载于JVCI蒺藜苜蓿测序网站(http://medicago.jcvi.org/medicago/)[26];拟南芥 Ubox基因家族
蛋白序列和基因序列下载于拟南芥 Ubox基因家族网站(http://www.arabidopsis.org/browse/genefamily/
pub.jsp)[10];水稻 Ubox基因家族蛋白序列下载于水稻全基因组数据库(http://rice.plantbiology.msu.
edu/)[27];蒺藜苜蓿基因芯片表达数据下载自蒺藜苜蓿基因表达图谱数据库(MtGEAv3,http://mtgea.noble.
org/v3/)[28]。
1.2 蒺藜苜蓿Ubox基因家族成员鉴定
首先利用蒺藜苜蓿全基因组序列构建本地BLAST数据库[29],以目前拟南芥已经鉴定出的所有Ubox基因
家族成员,共64个蛋白的基因序列对蒺藜苜蓿基因组数据库执行本地BLAST搜索,Evalue设为0.001;同时将
Pfam数据库[30]中Ubox保守结构域序列下载并提取出来(PF04565),利用 Hmmerv3.1b1[31](http://hmmer.
janelia.org/)构建隐马尔科夫模型(HMM),在 Mt4.0v1蛋白数据库中搜索含有Ubox结构域的候选序列。合
并上述两部分结果,手工剔除无完整读码框的序列。所得结果利用Pfam 和SMART[32](http://smart.embl
131第8期 郑兴卫 等:蒺藜苜蓿全基因组中Ubox基因家族的筛选与特征分析
heidelberg.de/)在线工具进一步分析结构域,去除无典型Ubox结构域的序列,最终得到蒺藜苜蓿的 Ubox基
因。利用ExPASyProteomicsServer(http://www.expasy.org/proteomics)对所有蒺藜苜蓿 Ubox蛋白氨基
酸序列进行分子量、等电点预测。
1.3 Ubox家族系统发育树的构建及蛋白结构域分析
通过ClustalW[33]程序对蒺藜苜蓿 Ubox蛋白进行多序列联配比对分析,序列联配比对结果使用
MEGA6[34]程序采用邻接法(NeighborJoining,NJ)生成基因的系统进化树,替换模式为“Poissonmodel”,缺口
设置为“Pairwisedeletion”,校验参数Bootstrap重复1000次。利用在线工具SMART分析 Ubox基因家族蛋
白的结构域组成。
1.4 蒺藜苜蓿Ubox家族基因结构及染色体定位分析
在得到每个基因信息的同时得到了基因的DNA序列,包括基因的cDNA序列,再用在线工具GSDS[35](ht
tp://gsds.cbi.pku.edu.cn/)得到基因结构图。同时获得了这些基因的染色体位置信息,利用 Mapinspect工具
标出每个Ubox结构域基因在染色体组上的位置,从而得到每个Ubox结构域基因在基因组中的分布情况。
1.5 蒺藜苜蓿Ubox家族基因表达模式分析
根据41个蒺藜苜蓿Ubox基因对应的CDS序列,在蒺藜苜蓿基因芯片平台BLAST搜索其对应的探针,获
得探针的表达量信息。将39个不同组织器官、不同处理下的基因芯片数据通过CIMminer在线分析软件鉴定蒺
藜苜蓿Ubox家族表达差异基因,并作出热图(heatmap),最后对蒺藜苜蓿 Ubox基因的表达情况进行聚类分
析。
2 结果与分析
2.1 蒺藜苜蓿Ubox基因家族信息
通过本地BLAST比对以及Hmmer搜索,去除不含Ubox典型结构域的序列,最终从已发表的蒺藜苜蓿全
基因组中鉴定出41个Ubox基因家族成员,如表1所示。通过Pfam和SMART工具进行蛋白质结构分析,41
个蒺藜苜蓿Ubox蛋白均含有约60~70个氨基酸的Ubox保守结构域。通过ExPASy工具分析,蒺藜苜蓿中
最长的Ubox蛋白(登录号:Medtr1g090320.1)包含1490个氨基酸残基,分子量大小为41个蛋白中的最大值
167.08kD,最短的Ubox蛋白(登录号:Medtr2g007630.1)包含259个氨基酸残基,分子量最小,为28.73kD。
等电点范围为5.28(Medtr7g078330.1)~9.24(Medtr2g007630.1)。
2.2 蒺藜苜蓿Ubox家族系统进化及蛋白结构域分析
为研究蒺藜苜蓿Ubox基因家族系统进化关系,对最终筛选出的41个蒺藜苜蓿Ubox蛋白进行了系统进
化树的构建。经过SMART蛋白结构域分析发现,除Ubox结构域外,蒺藜苜蓿Ubox蛋白还含有其他结构域。
根据进化树及蛋白结构域(图1),并参考拟南芥和水稻的Ubox基因家族分类结果(表2),本文将蒺藜苜蓿中41
个Ubox蛋白分为6种类型,分别包含18,12,5,3,2和1个蒺藜苜蓿Ubox蛋白家族成员。ARM 亚家族在植
物中研究最多,并且在拟南芥和水稻中都被鉴定为最大的亚类,在蒺藜苜蓿中为第2大亚类。在拟南芥和水稻中
根据N端保守位点甘氨酸、赖氨酸/精氨酸和亮氨酸定义的GKL+Ubox亚家族,因为其结构域分析与 Ubox
only亚类没有区别,因此在本文中归为Uboxonly亚类,Uboxonly结构的PUB蛋白在蒺藜苜蓿中的数量最
多,共18个。Kinase亚家族有5个成员,其中3个成员含丝/苏氨酸蛋白激酶结构域(S_TKcdomain),另外两个
为丝/苏/酪氨酸蛋白激酶结构域(STYKcdomain)。含有 WD40重复结构和TPR结构的 Ubox基因在蒺藜苜
蓿中分别有3和2个。MtPUB28是蒺藜苜蓿中唯一含有UFD2结构的Ubox蛋白。
为了深入分析与其他物种同源基因的进化关系,对蒺藜苜蓿与拟南芥和水稻的Ubox/ARM亚类进行了系
统进化树的构建(图2)。结果显示,与拟南芥或水稻中的同源基因相比,大部分蒺藜苜蓿Ubox/ARM基因与蒺
藜苜蓿家族内部的同源基因的遗传距离更加接近。然而,MtPUB25、MtPUB32和 MtPUB34在拟南芥中都存在
与其遗传距离最近的直系同源蛋白。
231 草 业 学 报 第24卷
表1 蒺藜苜蓿基因组中的犝犫狅狓基因
犜犪犫犾犲1 犜犺犲犝犫狅狓犵犲狀犲狊犻犱犲狀狋犻犳犻犲犱犻狀犕.狋狉狌狀犮犪狋狌犾犪
基因名称
Genename
基因组登录号
Geneaccession
No.
染色体定位
Chromosomelocation
蛋白质大小
Proteinlength
(aa)
分子量
Molecularmass
(kD)
等电点
Isoelectricpoint
(pI)
Ubox位置
Uboxdomain
location
MtPUB1 Medtr1g017770.1 Mt1:5155762~5157066 434 48.39 6.48 48111
MtPUB2 Medtr1g044720.1 Mt1:13219653~13229161 519 56.31 6.19 464
MtPUB3 Medtr1g079450.1 Mt1:19801680~19803846 446 49.65 8.05 66129
MtPUB4 Medtr1g090320.1 Mt1:24918857~24926483 1490 167.08 5.76 518582
MtPUB5 Medtr1g100820.1 Mt1:29454831~29460239 658 74.91 5.91 592655
MtPUB6 Medtr2g011140.1 Mt2:2770619~2771770 383 42.16 6.34 1881
MtPUB7 Medtr2g018010.1 Mt2:5480342~5485275 737 80.66 6.67 295358
MtPUB8 Medtr2g087350.1 Mt2:27010470~27011681 403 45.33 8.78 976
MtPUB9 Medtr3g008270.1 Mt3:1431271~1437474 797 88.60 6.07 733795
MtPUB10 Medtr3g008280.1 Mt3:1439374~1444747 809 90.01 6.76 742804
MtPUB11 Medtr3g065080.1 Mt3:20692515~20694675 439 49.13 8.35 39102
MtPUB12 Medtr3g085610.1 Mt3:27983174~27986817 766 84.92 5.87 283346
MtPUB13 Medtr3g095730.1 Mt3:32953972~32955422 419 46.77 8.98 1679
MtPUB14 Medtr3g096370.1 Mt3:33262313~33264012 404 45.02 5.98 1376
MtPUB15 Medtr4g085720.1 Mt4:29354320~29355973 451 49.99 6.79 1780
MtPUB16 Medtr4g107010.1 Mt4:36718387~36721372 747 83.52 8.27 283346
MtPUB17 Medtr5g015210.1 Mt5:4977159~4982044 471 51.87 6.05 70133
MtPUB18 Medtr5g015500.1 Mt5:5114610~5120878 603 65.76 8.16 39101
MtPUB19 Medtr5g020570.1 Mt5:7616428~7619709 739 83.35 6.01 276339
MtPUB20 Medtr5g020570.2 Mt5:7616428~7619709 767 86.52 5.98 248311
MtPUB21 Medtr5g032010.1 Mt5:13295960~13300750 808 92.93 8.04 735798
MtPUB22 Medtr5g034440.1 Mt5:14515606~14517933 689 76.82 6.78 283346
MtPUB23 Medtr5g048050.1 Mt5:20620611~20622418 438 50.05 6.52 2891
MtPUB24 Medtr5g077510.1 Mt5:32089598~32091146 442 49.45 8.72 38101
MtPUB25 Medtr5g083030.1 Mt5:34808238~34811295 736 81.48 6.25 296359
MtPUB26 Medtr5g090510.1 Mt5:39416745~39418357 694 76.93 6.36 296359
MtPUB27 Medtr6g008170.1 Mt6:1635686~1637470 554 61.52 8.39 54117
MtPUB28 Medtr6g013690.1 Mt6:3521237~3530545 746 84.95 5.68 677740
MtPUB29 Medtr6g071340.1 Mt6:14676044~14677640 418 47.61 5.61 871
MtPUB30 Medtr7g005940.1 Mt7:603565~608500 1073 121.79 6.81 598662
MtPUB31 Medtr7g077780.1 Mt7:21604335~21610498 896 100.38 5.76 829892
MtPUB32 Medtr7g078330.1 Mt7:21864536~21867868 646 72.78 5.28 277340
MtPUB33 Medtr7g116600.1 Mt7:37900392~37905354 552 61.69 7.87 81144
MtPUB34 Medtr7g117890.1 Mt7:38450474~38455685 1001 111.25 5.47 258321
MtPUB35 Medtr8g011720.1 Mt8:2007859~2011647 277 31.95 5.97 214277
MtPUB36 Medtr8g011720.2 Mt8:2007859~2011647 288 33.34 6.07 203266
MtPUB37 Medtr8g027140.1 Mt8:6694347~6698223 1006 112.03 5.59 262325
MtPUB38 Medtr8g077480.1 Mt8:21449790~21452175 490 55.03 8.39 278341
MtPUB39 Medtr8g092870.1 Mt8:26471964~26473220 418 46.35 7.41 1376
MtPUB40 Medtr8g093310.1 Mt8:26690378~26691706 418 46.35 7.41 1376
MtPUB41 Medtr8g103190.1 Mt8:30203366~30213196 1068 118.82 5.56 153217
331第8期 郑兴卫 等:蒺藜苜蓿全基因组中Ubox基因家族的筛选与特征分析
图1 蒺藜苜蓿犝犫狅狓家族进化树及蛋白结构
犉犻犵.1 犜犺犲狀犲犻犵犺犫狅狉犼狅犻狀犻狀犵狆犺狔犾狅犵犲狀犲狋犻犮狋狉犲犲犪狀犱狊狋狉狌犮狋狌狉犲狅犳犝犫狅狓狆狉狅狋犲犻狀狊犻狀犕.狋狉狌狀犮犪狋狌犾犪
 使用Ubox蛋白的氨基酸序列构建进化树,分支上数字代表校验参数Bootstrap重复1000次时该节点可信度 Thephylogenetictreewascon
structedbyusingtheaminoacidsequencesoftheUboxproteins.ThenumbersonthebranchesmeanthereliabilitypercentofBootstrapsvalue
basedon1000replication.
2.3 蒺藜苜蓿Ubox家族基因结构及染色体定位分析
对家族成员的基因结构分析显示(图3),蒺藜苜蓿Ubox家族基因结构差异较大,内含子数目从0个到16
个数目不等。进一步分析发现,蒺藜苜蓿Ubox蛋白分类中的I类,即 Uboxonly亚类,其基因结构较为简单,
431 草 业 学 报 第24卷
大多数不含内含子或仅含有1个内含子,仅有3个基因含有3个以上的内含子。II类(Ubox/ARM 亚类)中每
个基因的内含子数目不超过4个。III类(Kinase/Ubox亚类)中基因的内含子数目在6~9个之间,IV类(U
box/WD40亚类)的3个基因所含内含子数目最多,分别为16个、15个和13个。V类(TPR/Ubox亚类)的2
个基因均含有7个内含子。仅包含1个基因的VI类(UFD2/Ubox亚类),Medtr6g013690.1基因含有15个内
含子。
表2 蒺藜苜蓿、拟南芥和水稻犝犫狅狓蛋白的结构域组成
犜犪犫犾犲2 犇狅犿犪犻狀狅狉犵犪狀犻狕犪狋犻狅狀狅犳犕.狋狉狌狀犮犪狋狌犾犪,犃狉犪犫犻犱狅狆犻狊犪狀犱犗.狊犪狋犻狏犪犝犫狅狓狆狉狅狋犲犻狀狊
分类
Group
结构域组成(N端→C端)Domainorganization
(Nterminus→Cterminus)
蛋白数量 Numberofproteinincluded
蒺藜苜蓿犕.狋狉狌狀犮犪狋狌犾犪 拟南芥[12]犃狉犪犫犻犱狅狆狊犻狊 水稻[36]犗.狊犪狋犻狏犪
I Uboxonly 18 8 20
II Ubox+ARMrepeats 12 28 31
III Kinase+Ubox 5 16 15
IV Ubox+WD40 3 2 2
V TPR+Ubox 2 6 6
VI UFD2speciesmotif+Ubox 1 1 1
VII Ubox+GKLbox 0 16 0
VIII TPR+Kinase+Ubox 0 1 1
IX MIF4G+Ubox 0 0 2
通过提取蒺藜苜蓿Ubox基因的染色体定位信息,得到41个 Ubox基因在蒺藜苜蓿8条染色体上的定位
图(图4)。由图4可知,蒺藜苜蓿Ubox基因在染色体上呈不均等分布。其中5号染色体分布最多,共含有10
个Ubox基因,而4号染色体上分布的Ubox基因最少,仅有2个Ubox成员。另外,Ubox基因在染色体上的
分布呈现区域性,从3号、5号、7号和8号染色体中可以看到,在染色体上的某一区域家族成员个数比较密集。
2.4 蒺藜苜蓿Ubox家族基因表达模式分析
利用蒺藜苜蓿 MtGEA数据库进行的组织表达分析结果(图5)表明,共有37个Ubox基因在数据库中有表
达数据。聚类图中用绿-黑-红三色代表基因表达的强度,红色越亮代表信号越强,绿色越亮代表信号越弱,黑
色代表中间水平。结果显示,Medtr5g020570.1、Medtr5g020570.2在叶片中特异性表达,Medtr5g077510.1和
Medtr3g008082.1 主要在根中表达,Medtr1g017770.1 与 Medtr3g065080.1 在 营 养 器 官 中 表 达 量 高,
Medtr1g079450.1和 Medtr7g116600.1在种皮中特异性表达。Medtr1g044720.1普遍存在于蒺藜苜蓿叶、茎、花
和种子等组织中,表达量较为丰富,而 Medtr5g048050.1、Medtr5g083030.1、Medtr5g090510.1、Medtr6g071340.1
和 Medtr7g005940.1在各组织中表达量都很低。
同时,根据不同处理下的芯片数据,还分析了不同胁迫处理下蒺藜苜蓿Ubox基因的表达模式,包括盐(200
mmol/LNaCl)、干旱、低氮(N2、NO3、NH4+)处理。结果显示,盐胁迫下9个基因(Medtr1g017770.1、
Medtr2g018010.1、Medtr3g095730.1、Medtr4g107010.1、Medtr5g034440.1、Medtr5g048050.1、Medtr5g077510.1、
Medtr6g071340.1和 Medtr7g117890.1)在根中表达量上调,表明这些基因可能会参与植株幼苗期对盐胁迫的响
应。水分胁迫下,在幼苗和根中检测到的Ubox基因表达量变化并不一致。干旱处理后在幼苗中表达量上调的
基因有 Medtr4g107010.1和 Medtr6g013690.1两个,Medtr4g085720.1、Medtr5g020570.1、Medtr5g020570.2和
Medtr7g116600.1四个基因则表现为干旱时表达量降低,胁迫解除后又恢复甚至超过正常值。而在干旱胁迫后
的根中,Medtr1g044720.1基因表达量上调,表达量下降的有10个基因(Medtr3g008270.1、Medtr3g008280.1、
Medtr3g095730.1、Medtr4g085720.1、Medtr5g020570.1、Medtr5g020570.2、Medtr7g005940.1、Medtr7g077780.1、
Medtr8g092870.1和Medtr8g093310.1)。N素(N2、NO3、NH4+)胁迫下,Medtr4g085720.1和 Medtr4g107010.1在
531第8期 郑兴卫 等:蒺藜苜蓿全基因组中Ubox基因家族的筛选与特征分析
图2 蒺藜苜蓿与拟南芥、水稻犝犫狅狓/犃犚犕蛋白的系统发生关系
犉犻犵.2 犘犺狔犾狅犵犲狀犲狋犻犮狉犲犾犪狋犻狅狀狊犺犻狆狅犳犕.狋狉狌狀犮犪狋狌犾犪,犃狉犪犫犻犱狅狆狊犻狊犪狀犱犗.狊犪狋犻狏犪犝犫狅狓/犃犚犕狆狉狅狋犲犻狀狊
 红色表示蒺藜苜蓿 Ubox/ARM 蛋白,蓝色表示拟南芥 Ubox/ARM 蛋白,绿色表示水稻 Ubox/ARM 蛋白。TheredlabelsindicateUbox/
ARMproteinin犕.狋狉狌狀犮犪狋狌犾犪,whileblueandgreenonesindicateUbox/ARMin犃狉犪犫犻犱狅狆狊犻狊and犗.狊犪狋犻狏犪,respectively.
幼苗中响应胁迫,表达量都上调,而根中这两个基因表达量基本不受 N 素(NO3、NH4+)胁迫的影响。
Medtr7g005940.1在幼苗和根中对NH4+胁迫响应都比NO3敏感。
3 讨论
随着多种植物基因组测序的完成,利用全基因组数据对基因家族进行系统分析和预测基因功能已成为植物
基因功能研究所关注的重要问题[3739]。蒺藜苜蓿作为豆科的模式植物,其基因组测序完成后,WRKY[4041]、
LBD[42]、MADSbox[43]及NBS[44]等家族都进行了广泛的生物信息学分析。Ubox蛋白在植物生殖发育及抗逆
机制中发挥着至关重要的作用,是当前生物学研究的热点。本研究在蒺藜苜蓿基因组中鉴定出41个 Ubox基
631 草 业 学 报 第24卷
图3 41个蒺藜苜蓿犝犫狅狓基因的结构分析
犉犻犵.3 犌犲狀犲狊狋狉狌犮狋狌狉犲狅犳41犝犫狅狓犵犲狀犲犻狀犕.狋狉狌狀犮犪狋犾犪
图4 蒺藜苜蓿犝犫狅狓基因在染色体上的定位
犉犻犵.4 犆犺狉狅犿狅狊狅犿犪犾犾狅犮犪狋犻狅狀狊狅犳犝犫狅狓犵犲狀犲狊犻狀犕.狋狉狌狀犮犪狋狌犾犪
731第8期 郑兴卫 等:蒺藜苜蓿全基因组中Ubox基因家族的筛选与特征分析
图5 蒺藜苜蓿犝犫狅狓基因表达模式
犉犻犵.5 犜犺犲犲狓狆狉犲狊狊犻狅狀狆狉狅犳犻犾犲狅犳狋犺犲犕.狋狉狌狀犮犪狋狌犾犪犝犫狅狓犵犲狀犲狊
 
因,这与之前拟南芥(64个)[39]和水稻(77个)[36]等植物的报导存在一定差异,这说明 Ubox基因家族并不与基
因组大小有直接的关系,这与Zeng等[12]在水稻Ubox基因家族研究中的结论一致。
Ubox功能域是一种被修饰的RINGfinger结构,它不具有RINGfingertype蛋白质中由半胱氨酸和组氨
酸及两个锌离子构成的金属离子螯合残基,而是用盐键和氢键来稳定其结构[45]。除了N端的Ubox结构域外,
Ubox蛋白中通常还存在一些与蛋白相互作用密切相关的二级结构域,主要用来介导 Ubox蛋白与底物蛋白的
特异性识别。本研究中根据除Ubox结构域外的其他结构域的种类,将蒺藜苜蓿中的41个Ubox蛋白家族成
员分为6个亚家族。Ubox/ARM亚家族成员是目前植物Ubox家族基因中功能研究最多的亚类。拟南芥和水
稻均为研究最为深入的模式植物,突变体类型较蒺藜苜蓿更为丰富,芯片数据更加全面完整,Ubox基因功能也
得到了更加广泛的验证。研究表明,Ubox/ARM 蛋白通过多个ARM 基序相互衔接形成独特的结构以提供蛋
白-蛋白相互作用的场所,参与植物的自交不亲和、抗病、相应非生物胁迫、激素信号转导等多个过程。本文对蒺
藜苜蓿与拟南芥、水稻的Ubox/ARM亚家族进行了联合系统进化分析,发现与单子叶的水稻相比,蒺藜苜蓿U
box基因与同是双子叶的拟南芥更容易聚为一类,并且Ubox基因家族在物种间进化上是较为保守的(图2),所
以可以认为与拟南芥聚类在一起的蒺藜苜蓿 Ubox基因也能具有类似的功能。基于拟南芥中基因功能已报导
或基因组中已注释的Ubox/ARM基因的分析结果[4647],可以对蒺藜苜蓿的 Ubox基因家族进行功能预测分
831 草 业 学 报 第24卷
析。在磷酸盐缺失条件下,拟南芥AtPUB9与其上游信号AtARK2共同调控植株侧根发育[48],与其对应的蒺藜
苜蓿同源蛋白 MtPUB32可能也具有类似功能。拟南芥AtPUB18和AtPUB19是同源基因,参与ABA介导的
干旱胁迫响应过程,并且与AtPUB22和 AtPUB23响应干旱胁迫的过程相互独立[4952],蒺藜苜蓿中 MtPUB26
与AtPUB18和AtPUB19同源,可能也参与到类似的干旱响应过程。
本文通过对蒺藜苜蓿基因芯片信息分析发现,根据蒺藜苜蓿 Ubox家族基因在8个不同组织的表达显示,
不同的Ubox家族成员在表达上具有一定的组织特异性,暗示 Ubox家族成员间存在功能特异性。而陈浩
等[53]通过选取水稻中4个Ubox蛋白质进行 Westernblotting检测和EST数据比较分析,得出4个 Ubox蛋
白质在水稻生长发育的不同时期或部位为组成型表达,且表达量接近。这可能与物种间存在差异有关,或者与不
同研究中所涉及的转录谱数据和EST数据存在差异有关。多个 Ubox蛋白基因在盐、干旱和氮素胁迫条件下,
表达量出现上调或下调的变化,暗示这些基因在调控逆境胁迫过程中能够发挥作用。
目前国内外对Ubox基因功能的研究主要采用酵母双杂交筛选与其相互作用的下游蛋白[54],以及基于
RNA沉默或基因敲除的反向遗传学办法[19]。通过研究蒺藜苜蓿Ubox蛋白的结构与功能,寻找与其相互作用
的靶蛋白,将有助于了解植物体内蛋白与蛋白的互作机制,从而揭示Ubox基因如何调控蒺藜苜蓿的生长发育,
以及如何参与对逆境胁迫的信号转导过程。
犚犲犳犲狉犲狀犮犲狊:
[1] ShigetsuguH,KeiichiIN.Uboxproteinsasanewfamilyofubiquitinligases.BiochemicalandBiophysicalResearchCom
munications,2003,302(4):635645.
[2] AravindL,EugeneVK.TheUboxisamodifiedRINGfingeracommondomaininubiquitination.CurrentBiology,2000,
10(4):132134.
[3] PattersonC.Anewgunintown:theUboxisaubiquitinligasedomain.Science’sSTKE,2002,2002(116):pe4.
[4] HatakeyamaS,YadaM,MatsumotoM,犲狋犪犾.Uboxproteinsasanewfamilyofubiquitinproteinligases.TheJournalofBi
ologicalChemistry,2001,276(35):3311133120.
[5] HatakeyamaS,NakayamaKI.Uboxproteinsasanewfamilyofubiquitinligases.BiochemicalandBiophysicalResearch
Communications,2003,302(4):635645.
[6] AndersenP,KragelundBB,OlsenAN,犲狋犪犾.Structureandbiochemicalfunctionofaprototypical犃狉犪犫犻犱狅狆狊犻狊Uboxdo
main.TheJournalofBiologicalChemistry,2004,279(38):4005340061.
[7] VanDemarkAP,HilCP.Structuralbasisofubiquitylation.CurrentOpinionStructuralBiology,2002,12(6):822830.
[8] KoeglM,HoppeT,SchlenkerS,犲狋犪犾.Anovelubiquitinationfactor,E4,isinvolvedinmultiubiquitinchainassembly.Cel,
1999,96(5):635644.
[9] OhiMD,VanderKooiCW,RosenbergJA,犲狋犪犾.StructuralinsightsintotheUbox,adomainassociatedwithmultiubiq
uitination.NatureStructuralBiology,2003,10(4):250255.
[10] AzevedoC,SantosRosaMJ,ShirasuK.TheUboxproteinfamilyinplants.TrendsinPlantScience,2001,6(8):354
358.
[11] WiborgJ,O’SheaC,SkriverK.Biochemicalfunctionoftypicalandvariant犃狉犪犫犻犱狅狆狊犻狊狋犺犪犾犻犪狀犪UboxE3ubiquitinprotein
ligases.BiochemistryJournal,2008,413(3):447457.
[12] ZengLR,ParkCH,VenuRC,犲狋犪犾.Classification,expressionpattern,andE3ligaseactivityassayofriceUboxcontai
ningproteins.MolecularPlant,2008,1(5):800815.
[13] YangC W,GonzAilezLamothe,Rocio,犲狋犪犾.TheE3ubiquitinligaseactivityof犃狉犪犫犻犱狅狆狊犻狊PLANTUBOX17andits
functionaltobaccohomologACRE276arerequiredforceldeathanddefense.ThePlantCel,2006,18(4):10841098.
[14] SamuelMA,MudgilY,SaltJN,犲狋犪犾.InteractionsbetweentheSdomainreceptorkinasesandAtPUBARME3ubiquitin
ligasessuggestaconservedsignalingpathwayin犃狉犪犫犻犱狅狆狊犻狊.PlantPhysiology,2008,147(4):20842095.
[15] ChoSK,RyuM Y,SongC,犲狋犪犾.犃狉犪犫犻犱狅狆狊犻狊PUB22andPUB23arehomologousUBoxE3ubiquitinligasesthatplay
combinatoryrolesinresponsetodroughtstress.PlantCel,2008,20(7):18991914.
[16] ChoSK,ChungHS,RyuMY,犲狋犪犾.HeterologousexpressionandmolecularandcelularcharacterizationofCaPUB1enco
dingahotpepperUBoxE3ubiquitinligasehomolog.PlantPhysiology,2006,142(4):16641682.
[17] GonzalezLamotheR,TsitsigiannisDI,LudwigAA,犲狋犪犾.TheUboxproteinCMPG1isrequiredforefficientactivationof
defensemechanismstriggeredbymultipleresistancegenesintobaccoandtomato.PlantCel,2006,18(4):10671083.
931第8期 郑兴卫 等:蒺藜苜蓿全基因组中Ubox基因家族的筛选与特征分析
[18] ParkJJ,YiJ,YoonJ,犲狋犪犾.OsPUB15,anE3ubiquitinligase,functionstoreducecelularoxidativestressduringseedling
establishment.ThePlantJournal,2011,65(2):194205.
[19] WangH,LuY,JiangT,犲狋犪犾.The犃狉犪犫犻犱狅狆狊犻狊Ubox/ARM1repeatE3ligaseAtPUB4influencesgrowthanddegenera
tionoftapetalcels,anditsmutationleadstoconditionalmalesterility.ThePlantJournal,2013,74(3):511523.
[20] StoneSL,AndersonEM,MulenRT,犲狋犪犾.ARC1isanE3ubiquitinligaseandpromotestheubiquitinationofproteins
duringtherejectionofselfincompatible犅狉犪狊狊犻犮犪polen.PlantCel,2003,15(4):885898.
[21] LiuJ,LiW,NingY,犲狋犪犾.TheUboxE3ligaseSPL11/PUB13isaconvergencepointofdefenseandfloweringsignalingin
plants.PlantPhysiology,2012,160(1):2837.
[22] WangY,LiuWX,MaLC,犲狋犪犾.Researchprogressesin犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪genetictransformation.PrataculturalSci
ence,2014,31(3):504511.
[23] WeiZW,GaiJY.Modellegume:犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪.ActaPrataculturaeSinica,2008,17(1):114120.
[24] GaryS,MarcL,LaurentB,犲狋犪犾.Geneticsandfunctionalgenomicsoflegumenodulation.CurrentOpinioninPlantBiology,
2006,9(2):110121.
[25] EndreG,KeresztA,KeveiZ,犲狋犪犾.Areceptorkinasegeneregulatingsymbioticnoduledevelopment.Nature,2002,417:
962966.
[26] TangH,KrishnakumarV,BidwelS,犲狋犪犾.Animprovedgenomerelease(versionMt4.0)forthemodellegume犕犲犱犻犮犪犵狅
狋狉狌狀犮犪狋狌犾犪.BMCGenomics,2014,15:312.
[27] KawaharaY,delaBastideM,HamiltonJP,犲狋犪犾.Improvementofthe犗狉狔狕犪狊犪狋犻狏犪Nipponbarereferencegenomeusing
nextgenerationsequenceandopticalmapdata.Rice,2013,6:4.
[28] HeJ,BeneditoVA,WangM,犲狋犪犾.The犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪geneexpressionatlaswebserver.BMCBioinformatics,
2009,10:441.
[29] BraunRC,PedrettiKT,CasavantTL,犲狋犪犾.ParalelizationoflocalBLASTserviceonworkstationcluster.FutureGenera
tionComputerSystem,2001,17(6):745754.
[30] FinnRD,MistryJ,SchusterBocklerB,犲狋犪犾.Pfam:clans,webtoolsandservices.NucleicAcidResearch,2006,34(S1):
247251.
[31] FinnRD,ClementsJ,EddySR.HMMERwebserver:interactivesequencesimilaritysearching.NucleicAcidResearch,
2011,39(S2):2937.
[32] LetunicI,DoerksT,BorkP.SMART6:recentupdatesandnewdevelopments.NucleicAcidResearch,2009,37(S1):
229232.
[33] LarkinMA,BlackshieldsG,BrownNP,犲狋犪犾.ClustalWandClustalXversion2.0.Bioinformatics,2007,23(21):2947
2948.
[34] TamuraK,StecherG,PetersonD,犲狋犪犾.MEGA6:Molecularevolutionarygeneticsanalysisversion6.0.MolecularBiology
andEvolution,2013,30:27252729.
[35] HuB,JinJ,GuoA,犲狋犪犾.GSDS2.0:anupgradedgenefeaturevisualizationserver.Bioinformatics,2014,doi:10.1093/
bioinformatics/btu817.
[36] CaoYH.TheCharacteristicsofRiceUBoxGeneFamilywithitsTranscriptionandExpressionPatternAnalysis[D].Baod
ing:AgriculturalUniversityofHebeiProvince,2012.
[37] JiangGG,SongLL,GuoDL,犲狋犪犾.Genomewideassociationmappingofaluminumtolerancein犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪.Ac
taPrataculturaeSinica,2013,22(4):170178.
[38] KangJM,ZhangTJ,YangQC,犲狋犪犾.Researchprogressinthequantitativetraitloci(QTL)andgenomicselectionofalfal
fa.ActaPrataculturaeSinica,2014,23(6):304312.
[39] LuYQ,GuanN,LiC.AdvancedinthestudyonUboxproteinsof犃狉犪犫犻犱狅狆狊犻狊狋犺犪犾犻犪狀犪.MolecularPlantBreeding,2008,
6(5):941948.
[40] JiangT,LinYX,LinX,犲狋犪犾.GenomewideanalysisoftheWRKYtranscriptionfactorfamilyin犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪.Ac
taPrataculturaeSinica,2011,20(3):211218.
[41] SongH,NanZB.GenomewideidentificationandanalysisofWRKYtranscriptionfactorsin犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪.Heredi
tas,2014,36(2):152168.
[42] JiaXT,LiuWX,XieW G,犲狋犪犾.GenomewideanalysisoftheLBDtranscriptionfactorfamilyin犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪.
ActaBotanicaBorealiOccidentaliaSinica,2014,34(10):21762187.
[43] ZhangJ,SongLL,GuoDL,犲狋犪犾.GenomewideidentificationandinvestigationoftheMADSboxfamilyin犕犲犱犻犮犪犵狅狋狉狌狀
犮犪狋狌犾犪.ActaPrataculturaeSinica,2014,23(6):233241.
[44] ZhaoY,JiangHY,WangJM,犲狋犪犾.Analysisofgenomewidediseaseresistancegenesandtheirexpansionin犕犲犱犻犮犪犵狅
041 草 业 学 报 第24卷
狋狉狌狀犮犪狋狌犾犪.JournalofAgriculturalBiotechnology,2009,17(6):10621069.
[45] DonnaY,DaphneRG.ThediversityofplantUboxE3ubiquitinligases:fromupstreamactivatorstodownstreamtarget
substrates.JournalofExperimentalBotany,2009,60(4):11091121.
[46] YangJ,LanXG,LiYH.Ubox/ARMproteinsinplants.PlantPhysiologyCommunications,2008,44(6):12161222.
[47] VogelmannK,SubertC,DanzbergerN,犲狋犪犾.PlasmamembraneassociationofSAUL1typeplantUboxarmadilorepeat
proteinsisconservedinlandplants.FrontiersinPlantScience,2014,5:37.
[48] DrechselG,BerglerJ,WippelK,犲狋犪犾.Cterminalarmadilorepeatsareessentialandsufficientforassociationoftheplant
UboxarmadiloE3ubiquitinligaseSAUL1withtheplasmamembrane.JournalofExperimentalBotany,2011,62(2):775
785.
[49] SrijaniD,SubramanianS,GayathriW,犲狋犪犾.TheSdomainreceptorkinaseAtARK2andtheUbox/ARMrepeatcontai
ningE3ubiquitinligase9modulemediateslateralrootdevelopmentunderphosphatestarvationin犃狉犪犫犻犱狅狆狊犻狊.PlantPhysi
ology,2014,165(4):16471656.
[50] YashwantiM,ShiuSH,SophiaLS,犲狋犪犾.Alargecomplementofthepredicted犃狉犪犫犻犱狅狆狊犻狊ARMrepeatproteinaremem
bersoftheUboxE3ubiquitinligasefamily.PlantPhysiology,2004,134(1):5966.
[51] JakobW,CharlotteOS,KarenS.Biochemicalfunctionoftypicalandvariant犃狉犪犫犻犱狅狆狊犻狊狋犺犪犾犻犪狀犪UboxE3ubiquitinpro
teinligase.BiochemicalJournal,2008,413:447457.
[52] SeoDH,RyuMY,JammesF,犲狋犪犾.Rolesoffour犃狉犪犫犻犱狅狆狊犻狊UBoxE3ubiquitinligasesinnegativeregulationofabscisic
acidmediateddroughtstressresponses.PlantPhysiology,2012,160(1):556568.
[53] ChenH,LiLY,BaiH,犲狋犪犾.ExpressionanalysisofriceUBoxproteinsatdifferentdevelopmentalstages.ProgressinBio
chemistryandBiophysics,2009,36(9):12081214.
[54] MbengueM,CamutS,deCarvalhoNiebelF,犲狋犪犾.The犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪E3ubiquitinligasePUB1interactswiththe
LYK3symbioticreceptorandnegativelyregulatesinfectionandnodulation.ThePlantCel,2010,22(10):34743488.doi:
10.1105/tpc.110.075861.
参考文献:
[22] 王宇,刘文献,马利超,等.蒺藜苜蓿遗传转化体系研究进展.草业科学,2014,31(3):504511.
[23] 魏臻武,盖钧镒.豆科模式植物———蒺藜苜蓿.草业学报,2008,17(1):114120.
[36] 曹英豪.水稻Ubox基因家族的特征及转录表达模式分析[D].保定:河北农业大学,2010.
[37] 姜格格,宋丽莉,郭东林,等.蒺藜苜蓿耐酸铝性状的全基因组关联分析.草业学报,2013,22(4):170178.
[38] 康俊梅,张铁军,杨青川,等.紫花苜蓿QTL与全基因组选择研究进展及其应用.草业学报,2014,23(6):304312.
[39] 鲁玉清,关宁,李聪.拟南芥Ubox蛋白的研究进展.分子植物育种,2008,6(5):941948.
[40] 江腾,林勇祥,林雪,等.苜蓿全基因组 WRKY转录因子基因的分析.草业学报,2011,20(3):211218.
[41] 宋辉,南志标.蒺藜苜蓿全基因组中 WRKY转录因子的鉴定与分析.遗传,2014,36(2):152168.
[42] 贾喜涛,刘文献,谢文刚,等.蒺藜苜蓿LBD转录因子家族全基因组分析.西北植物学报,2014,34(10):21762187.
[43] 张军,宋丽莉,郭东林,等.MADSbox基因家族在蒺藜苜蓿的全基因组分析.草业学报,2014,23(6):233241.
[44] 赵阳,江海洋,汪结明,等.蒺藜苜蓿全基因组抗病基因和基因扩张分析.农业生物技术学报,2009,17(6):10621069.
[46] 杨佳,蓝兴国,李玉花.植物Ubox/ARM蛋白.植物生理学通讯,2008,44(6):12161222.
[53] 陈浩,李莉云,白辉,等.水稻UBox蛋白质在不同发育时期的表达分析.生物化学与生物物理进展,2009,36(9):1208
1214.
141第8期 郑兴卫 等:蒺藜苜蓿全基因组中Ubox基因家族的筛选与特征分析