免费文献传递   相关文献

Genome-wide identification and investigation of the MADS-box gene family in Medicago truncatula

MADS-box基因家族在蒺藜苜蓿的全基因组分析



全 文 :书犕犃犇犛犫狅狓基因家族在蒺藜苜蓿的全基因组分析
张军,宋丽莉,郭东林,郭长虹,束永俊
(黑龙江省分子细胞遗传与遗传育种重点实验室 哈尔滨师范大学生命科学与技术学院,黑龙江 哈尔滨150025)
摘要:MADSbox基因家族是植物体内的重要转录因子,它们广泛地调控着植物生长、发育和生殖等过程。本研究
以蒺藜苜蓿基因组数据为材料,采用结构域搜索方法,鉴定了138个 MADSbox基因。通过序列比对系统进化分
析,将它们分成两大类:Ⅰ型(92个)和Ⅱ型(46个)。同时,通过染色体定位分析发现,134个 MADSbox基因定位
在染色体上,还有4个 MADSbox基因定位在尚未完成最终拼接的超长片段上。蒺藜苜蓿的 MADSbox基因家族
成员之间存在大量的基因重复,特别是Ⅰ型 MADSbox基因,通过基因复制,MADSbox基因家族在染色体上形成
多个密集的 MADSbox基因簇。对蒺藜苜蓿的RNAseq表达谱数据分析,发现 MADSbox基因在心皮组织、花器
官等组织中表达量较高,这表明蒺藜苜蓿的 MADSbox基因家族广泛地参与苜蓿组织分化、发育以及生殖等过程
的调控,这将为进一步揭示 MADSbox类转录因子在蒺藜苜蓿中作用机制提供了重要的参考。
关键词:蒺藜苜蓿;MADSbox;系统进化分析;基因复制;表达模式
中图分类号:S816;S551+.903;Q943.2  文献标识码:A  文章编号:10045759(2014)06023309
犇犗犐:10.11686/cyxb20140628  
  MADSbox基因家族是一类转录因子,广泛地存在于动物、植物和真菌等真核生物,它们在N端含有一个由
58~60个氨基酸组成的保守结构域,称为 MADSbox结构域[12]。MADSbox是一个可以结合DNA序列的结
构域,它可以识别结合CArG基序(CC[A/T]6GG),并激活下游基因的表达[3]。根据分子系统进化分析,MADS
box基因家族可以分为两大类:I型和Ⅱ型,其中:Ⅰ型主要是指含有SRF结构域,Ⅱ型主要含有 MEF2类似结构
域和植物中特异的 MIKC类 MADSbox基因。结合 MADSbox基因的结构特征,可以将 MADSbox家族分成
5个小类:Ⅰ型的 Mα、Mβ和 Mγ;Ⅱ型的 MIKC和 MIKC
[12]。
在植物基因组中,MIKC类 MADSbox转录因子的结构和功能研究比较清楚,它们通常含有4个结构域,分
别为:MADSbox(M)、Interveningdomain(I)、Kertainlikedomain(K)和Cterminaldomain(C)[3]。这些转录
因子在植物基因组特有的,在各种植物基因组之间是非常保守的,在植物生长、发育等过程起到重要的调控作用,
比如:SOC1(SUPPRESSOROFOVERESPRESSIONOFCONSTANS1)、FLC1(FLOWERINGLOCUSc),
AGL24(AGAMOUSLIKEGENE24)、MAF1/FLM (MADSAFFECTINGFLOWERING)和SVP(SHORT
VEGETATIVEPHASE)等 MADSbox基因调控植物的开花时间[49];AP1(APETALA1)、FUL(FRUIT
FUL)和CAL(CAULIFLOWER)等 MADSbox基因调控花芽组织的形成[1012];AP1、SEP13(SEPALLATA1
3)、AP3(APETALA3)、PI(PISTILLATA)和AG(AGAMOUS)等 MADSbox基因控制植物花器官的形成和
种子的发育[1315]。
根据分类学定义:苜蓿属含有4个亚属,56个种,其中最受科研人员关注的有:紫花苜蓿(犕犲犱犻犮犪犵狅狊犪狋犻狏犪)
和蒺藜苜蓿(犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪)两个种。紫花苜蓿是四倍体植物,具有优良的农艺性状,是全世界种植范围最
广的牧草作物;蒺藜苜蓿是二倍体植物,其基因组较小(约470Mb),已经完成基因组测序,成为研究豆科,特别是
苜蓿属(如紫花苜蓿)的模式植物[1618]。在紫花苜蓿长期种植生产过程中,科研人员多重视苜蓿营养体性状,如产
量、品质、抗性等,对苜蓿生殖过程性状关注较少,导致紫花苜蓿的种子生产水平一直低下,严重制约了紫花苜蓿
第23卷 第6期
Vol.23,No.6
草 业 学 报
ACTAPRATACULTURAESINICA   
233-241
2014年12月
收稿日期:20131212;改回日期:20140107
基金项目:国家自然科学基金(31302019),国家高技术研究发展计划项目(2013AA102607),高等学校博士学科点专项科研基金
(20122329120001)和国家科技支撑计划项目(2011BAD17B0421)资助。
作者简介:张军(1989),女,黑龙江双鸭山人,在读硕士。Email:zy646898171@163.com
通讯作者。Email:syjun2003@126.com;kaku_2008@163.com
的种植推广[17],同时,其他草类植物也存在类似的问题[1920]。
本研究将对蒺藜苜蓿的基因组测序数据进行结构域搜索,鉴定 MADSbox基因家族成员。通过序列比对和
系统进化分析,完成 MADSbox基因家族成员的分类,同时,根据 MADSbox基因家族的染色体定位信息,明确
其在基因组的分布特征。最后,结合蒺藜苜蓿的RNAseq数据,分析 MADSbox家族在蒺藜苜蓿心皮和花等生
殖器官发育过程的表达谱,为解析蒺藜苜蓿中 MADSbox基因家族的重要作用提供参考。
1 材料与方法
1.1 数据来源
蒺藜苜蓿基因组测序数据、基因转录序列、CDS序列、蛋白质序列及其注释信息[18](版本为:Mt4.0v1)均下
载自JCVI(http://www.jcvi.org/medicago/)。
1.2 蒺藜苜蓿 MADSbox基因家族的鉴定和分类
MADSbox基因的结构域信息(PF00319)下载自Pfam数据库[21],利用软件 HMMER[22](V3.0)搜索蒺藜
苜蓿的蛋白质序列,运行参数为:-E0.01。将挖掘的 MADSbox基因比对拟南芥的 MADSbox基因,根据拟
南芥的 MADSbox基因分类信息对蒺藜苜蓿 MADSbox基因家族进行分类。同时,提取蒺藜苜蓿 MADSbox
基因的注释信息,确定其内含子分布信息。
1.3 蒺藜苜蓿 MADSbox基因家族的系统进化分析
提取蒺藜苜蓿 MADSbox基因家族的蛋白质序列,利用ClustalW2[23]进行多重序列比较,比对结果采用
MEGA4[24]进行系统进化分析,系统进化分析参数如下:1)建树方法为邻近法(neighborjoining,NJ);2)遗传距离
为泊松距离(Poissoncorrection);3)抽样次数为1000(bootstrap:1000replications)。
1.4 蒺藜苜蓿 MADSbox基因家族的染色体定位分析
从蒺藜苜蓿基因组中提取 MADSbox基因的基因组序列和CDS序列,利用BLAST[25]进行两两比对。当2
个 MADSbox基因的一致性超过85%时,则将这2个 MADSbox基因之间存在基因复制(geneduplication)。
提取所有 MADSbox基因在蒺藜苜蓿基因中的位置信息,结合 MADSbox基因间的基因复制情况,利用软件
CIRCOS[26]绘制 MADSbox基因家族在蒺藜苜蓿基因组中的分布情况。
1.5 蒺藜苜蓿 MADSbox基因家族的表达分析
蒺藜苜蓿的转录组测序(RNAseq)数据[18]下载自NCBI的SRA数据库(http://www.ncbi.nlm.nih.gov,
登录号为:SRR350517SRR350521,SRR350538和SRR349692)。转录组数据包含蒺藜苜蓿的根部(root),根部
结瘤(nodule),叶片(blade),芽(bud),心皮(seedpod)和花(flower)6个组织和部位。转录组数据采用TopHat[27]
和Cufflink[28]进行分析,获得蒺藜苜蓿基因的表达量(fragmentsperkilobaseofexonpermilionfragments
mapped,FPKM值)。利用 MATLAB(R2008B)提取 MADSbox基因的表达量,去除表达量较低的 MADSbox
基因(FPKM 值小于1),然后,对剩下的 MADSbox基因表达量进行对数转换和标准化,最后,对蒺藜苜蓿
MADSbox基因的表达情况进行聚类分析。
2 结果与分析
2.1 蒺藜苜蓿 MADSbox基因家族的鉴定和分类
通过HMMER搜索,蒺藜苜蓿基因组总共鉴定出138个 MADSbox基因家族成员,如表1所示。这些
MADSbox基因主要分成两大类,即Ⅰ型和Ⅱ型 MADSbox基因,其中:Ⅱ型 MADSbox基因有46个,包含有
MIKC(41个)和MIKC(5个)两类;Ⅰ型 MADSbox基因有92个,包含有 Mα(49个)、Mβ(7个)和Mγ(36个)3
类。两类 MADSbox基因中,Ⅱ型 MADSbox基因大多数都含有多个内含子,多数为6~8个,甚至超过10个,
如 MtMADS044,45和46都含有10~11个内含子;而Ⅰ型 MADSbox基因大多数不含有内含子或者含有1个
内含子。与其他植物相比,蒺藜苜蓿基因组中 MADSbox基因家族成员总数差别不大,如拟南芥为107,水稻为
75,大豆为106,但是,成员组成差异较大,蒺藜苜蓿Ⅱ型与Ⅰ型分别为46和92个,Ⅱ型占总 MADSbox基因家
族的33%,拟南芥为42%,水稻为57%[29],大豆为68%[30],蒺藜苜蓿的Ⅱ型 MADSbox基因比例明显偏低。
432 ACTAPRATACULTURAESINICA(2014) Vol.23,No.6
表1 蒺藜苜蓿基因组中鉴定的 犕犃犇犛犫狅狓基因
犜犪犫犾犲1 犜犺犲犕犃犇犛犫狅狓犵犲狀犲狊犻犱犲狀狋犻犳犻犲犱犻狀犕.狋狉狌狀犮犪狋狌犾犪
基因Gene 基因座位号Genelocus 类别Group 内含子Introns 基因Gene 基因座位号Genelocus 类别Group 内含子Introns
MtMADS001 Medtr0003s0590 MIKC 7 MtMADS070 Medtr3g030780 Mα 0
MtMADS002 Medtr1g029670 MIKC 6 MtMADS071 Medtr3g052870 Mα 1
MtMADS003 Medtr1g038300 MIKC 6 MtMADS072 Medtr3g052920 Mα 0
MtMADS004 Medtr1g041615 MIKC 3 MtMADS073 Medtr3g067870 Mα 3
MtMADS005 Medtr1g053070 MIKC 7 MtMADS074 Medtr3g067875 Mα 0
MtMADS006 Medtr1g101970 MIKC 6 MtMADS075 Medtr3g067910 Mα 0
MtMADS007 Medtr2g009890 MIKC 8 MtMADS076 Medtr3g080940 Mα 0
MtMADS008 Medtr2g017865 MIKC 7 MtMADS077 Medtr3g109930 Mα 1
MtMADS009 Medtr2g461710 MIKC 1 MtMADS078 Medtr3g437790 Mα 0
MtMADS010 Medtr3g005530 MIKC 8 MtMADS079 Medtr4g036915 Mα 0
MtMADS011 Medtr3g014350 MIKC 1 MtMADS080 Medtr4g051538 Mα 2
MtMADS012 Medtr3g084980 MIKC 7 MtMADS081 Medtr4g094632 Mα 0
MtMADS013 Medtr3g088615 MIKC 6 MtMADS082 Medtr4g094638 Mα 0
MtMADS014 Medtr3g113030 MIKC 6 MtMADS083 Medtr4g127140 Mα 0
MtMADS015 Medtr3g452380 MIKC 8 MtMADS084 Medtr4g131030 Mα 1
MtMADS016 Medtr4g036050 MIKC 6 MtMADS085 Medtr5g045560 Mα 0
MtMADS017 Medtr4g093030 MIKC 3 MtMADS086 Medtr5g053390 Mα 0
MtMADS018 Medtr4g093970 MIKC 8 MtMADS087 Medtr5g055100 Mα 0
MtMADS019 Medtr4g102530 MIKC 7 MtMADS088 Medtr7g028448 Mα 0
MtMADS020 Medtr4g109810 MIKC 7 MtMADS089 Medtr7g062350 Mα 0
MtMADS021 Medtr4g109830 MIKC 7 MtMADS090 Medtr8g022970 Mα 0
MtMADS022 Medtr5g021270 MIKC 6 MtMADS091 Medtr8g043650 Mα 0
MtMADS023 Medtr5g031000 MIKC 7 MtMADS092 Medtr8g046350 Mα 0
MtMADS024 Medtr5g032150 MIKC 7 MtMADS093 Medtr8g051580 Mα 0
MtMADS025 Medtr5g032520 MIKC 7 MtMADS094 Medtr8g079502 Mα 0
MtMADS026 Medtr5g046790 MIKC 6 MtMADS095 Medtr8g086290 Mα 0
MtMADS027 Medtr5g046870 MIKC 2 MtMADS096 Medtr0061s0010 Mβ 2
MtMADS028 Medtr5g066180 MIKC 7 MtMADS097 Medtr1g114730 Mβ 0
MtMADS029 Medtr5g066960 MIKC 0 MtMADS098 Medtr2g049610 Mβ 0
MtMADS030 Medtr6g015975 MIKC 7 MtMADS099 Medtr4g107170 Mβ 0
MtMADS031 Medtr6g464720 MIKC 7 MtMADS100 Medtr6g005440 Mβ 0
MtMADS032 Medtr7g016600 MIKC 7 MtMADS101 Medtr6g005450 Mβ 0
MtMADS033 Medtr7g016630 MIKC 7 MtMADS102 Medtr6g018920 Mβ 0
MtMADS034 Medtr7g075850 MIKC 7 MtMADS103 Medtr1g077300 Mγ 0
MtMADS035 Medtr7g075870 MIKC 7 MtMADS104 Medtr1g077320 Mγ 0
MtMADS036 Medtr8g033220 MIKC 8 MtMADS105 Medtr1g077390 Mγ 0
MtMADS037 Medtr8g033250 MIKC 6 MtMADS106 Medtr1g084950 Mγ 0
MtMADS038 Medtr8g033270 MIKC 7 MtMADS107 Medtr1g090697 Mγ 0
MtMADS039 Medtr8g066260 MIKC 7 MtMADS108 Medtr1g090710 Mγ 0
MtMADS040 Medtr8g087860 MIKC 6 MtMADS109 Medtr1g090783 Mγ 0
MtMADS041 Medtr8g097090 MIKC 7 MtMADS110 Medtr2g016210 Mγ 1
532第23卷第6期 草业学报2014年
 续表1 Continued
基因Gene 基因座位号Genelocus 类别Group 内含子Introns 基因Gene 基因座位号Genelocus 类别Group 内含子Introns
MtMADS042 Medtr3g102570 MIKC 9 MtMADS111 Medtr2g035580 Mγ 1
MtMADS043 Medtr4g084740 MIKC 9 MtMADS112 Medtr2g035610 Mγ 0
MtMADS044 Medtr4g108720 MIKC 11 MtMADS113 Medtr3g031100 Mγ 1
MtMADS045 Medtr5g041650 MIKC 10 MtMADS114 Medtr3g031240 Mγ 1
MtMADS046 Medtr5g061740 MIKC 11 MtMADS115 Medtr3g065100 Mγ 0
MtMADS047 Medtr0121s0080 Mα 0 MtMADS116 Medtr3g093900 Mγ 0
MtMADS048 Medtr0121s0100 Mα 0 MtMADS117 Medtr3g465410 Mγ 0
MtMADS049 Medtr1g012570 Mα 0 MtMΑDS118 Medtr3g466830 Mγ 0
MtMΑDS050 Medtr1g047550 Mα 0 MtMΑDS119 Medtr3g466890 Mγ 0
MtMΑDS051 Medtr1g054265 Mα 0 MtMΑDS120 Medtr3g466980 Mγ 1
MtMΑDS052 Medtr1g063160 Mα 0 MtMΑDS121 Medtr3g467080 Mγ 1
MtMΑDS053 Medtr1g075570 Mα 1 MtMΑDS122 Medtr4g019670 Mγ 0
MtMΑDS054 Medtr1g075600 Mα 0 MtMΑDS123 Medtr4g028720 Mγ 0
MtMΑDS055 Medtr1g077360 Mα 0 MtMΑDS124 Medtr4g028800 Mγ 0
MtMΑDS056 Medtr1g105905 Mα 0 MtMΑDS125 Medtr4g031910 Mγ 0
MtMΑDS057 Medtr1g105910 Mα 0 MtMΑDS126 Medtr4g032260 Mγ 0
MtMΑDS058 Medtr1g105920 Mα 0 MtMΑDS127 Medtr4g032290 Mγ 0
MtMΑDS059 Medtr1g106070 Mα 0 MtMΑDS128 Medtr4g032620 Mγ 0
MtMΑDS060 Medtr1g108500 Mα 8 MtMΑDS129 Medtr4g063790 Mγ 1
MtMΑDS061 Medtr1g108510 Mα 0 MtMΑDS130 Medtr5g024430 Mγ 1
MtMΑDS062 Medtr1g108580 Mα 0 MtMΑDS131 Medtr5g047580 Mγ 0
MtMΑDS063 Medtr2g030740 Mα 0 MtMΑDS132 Medtr5g075380 Mγ 0
MtMΑDS064 Medtr2g045020 Mα 0 MtMΑDS133 Medtr7g011950 Mγ 0
MtMΑDS065 Medtr2g085250 Mα 0 MtMΑDS134 Medtr7g055790 Mγ 3
MtMΑDS066 Medtr2g085280 Mα 0 MtMΑDS135 Medtr7g055800 Mγ 2
MtMΑDS067 Medtr2g093190 Mα 0 MtMΑDS136 Medtr7g055940 Mγ 2
MtMΑDS068 Medtr2g105290 Mα 0 MtMΑDS137 Medtr7g106510 Mγ 0
MtMΑDS069 Medtr3g030770 Mα 0 MtMΑDS138 Medtr8g036130 Mγ 0
2.2 蒺藜苜蓿 MADSbox基因家族的系统进化分析
利用ClustalW2和 MEGA进行系统进化分析,如图1所示。结果显示,在系统进化上,Ⅱ型和Ⅰ型 MADS
box基因是各自独立系统演化,两种之间没有交叉。其中:Ⅱ型中的 MIKC类保守性较好,独自分成一支;
MIKC类保守性稍微弱一些,分成两邻近的两支;Ⅰ型的3个类:Mα、Mβ和Mγ,总体上系统分类良好,大多数成
员都可以正确的分类,只有 MtMADS073、130和134这3个成员进化关系出现不一致。这也说明通过 MADS
box基因在植物中保守性较强,可以通过拟南芥的分类信息鉴定蒺藜苜蓿 MADSbox基因家族的分类情况。
2.3 蒺藜苜蓿 MADSbox基因家族的染色体定位分析
通过提取蒺藜苜蓿 MADSbox基因的染色体定位信息,发现4个(MtMADS001、47、48和96)定位在尚未完
全组装的长片段上,剩下的134个成员定位在8条染色体上,如图2所示。每条染色体分布有5~27个 MADS
box基因,其中:1号染色体最多为27个,其次为3号和4号染色体,分别为26和23个;6号染色体最少,只有5
个。此外,MADSbox基因家族在蒺藜苜蓿染色体组上不是均匀分布,它们呈聚集形式分布,如1,3,4和5号染
色体上都有多个 MADSbox的基因簇。通过两两比对分析发现:多数蒺藜苜蓿 MADSbox基因都拥有2个或
632 ACTAPRATACULTURAESINICA(2014) Vol.23,No.6
以上的拷贝,即存在基因复制情况,其中:Ⅱ型 MADSbox基因成员复制较少,如图2中红色(MIKC)和浅红色
(MIKC)线条所示,Ⅰ型的基因复制较多,如图2中蓝色(Mα)、浅蓝色(Mβ)和紫色(Mγ)线条所示。
2.4 蒺藜苜蓿 MADSbox基因家族的表达分析
通过下载NCBI数据库中蒺藜苜蓿的RNAseq数据,分析得到蒺藜苜蓿MADSbox基因家族在6种组织的
表达谱。蒺藜苜蓿的表达谱显示,多数MADSbox基因(91/138,66%)FPKM都小于1,说明这些MADSbox基
因在6种组织中的表达量极低或者不表达,其中:Ⅰ型 MADSbox基因有75个,Ⅱ型 MADSbox基因有26个。
剩下47个 MADSbox基因的表达谱进行聚类分析,如图3所示。根据表达谱信息,47个基因主要可以分成3
组:A组含有13个基因,其中Ⅰ型8个,Ⅱ型5个,主要在蒺藜苜蓿的心皮和花等生殖器官中表达;B组含有16
个基因,其中Ⅰ型9个,Ⅱ型7个,这些 MADSbox基因虽然表达,但是在各种组织中表达量都不高;C组含有12
个基因,其中Ⅰ型4个,Ⅱ型8个,主要在蒺藜苜蓿的根部、结瘤、叶片和芽中表达,在心皮和花组织中表达量较
低。
图1 蒺藜苜蓿 犕犃犇犛犫狅狓基因家族的系统进化分析
犉犻犵.1 犘犺狔犾狅犵犲狀犲狋犻犮狋狉犲犲狅犳犕犃犇犛犫狅狓犵犲狀犲犳犪犿犻犾狔犻狀犕.狋狉狌狀犮犪狋狌犾犪
 
3 讨论
通过全基因组分析,从蒺藜苜蓿中鉴定了138个 MADSbox基因,其中Ⅱ型 MADSbox基因46个,这与拟
南芥(犃狉犪犫犻犱狅狆狊犻狊狋犺犪犾犻犪狀犪,45个)和水稻(犗狉狔狕犪狊犪狋犻狏犪,43个)等植物的报导一致,但是比大豆(犌犾狔犮犻狀犲犿犪狓)
中Ⅱ型 MADSbox基因(72个)要少,这可能是由于大豆基因组发生加倍,是古四倍体造成。同时,Ⅱ型 MADS
box基因一般含有多个内含子,Ⅰ型一般不含有或者只含有1个内含子,通常含有多个内含子的基因一般比较保
732第23卷第6期 草业学报2014年
图2 蒺藜苜蓿 犕犃犇犛犫狅狓基因在染色体定位
犉犻犵.2 犆犺狉狅犿狅狊狅犿犪犾犾狅犮犪狋犻狅狀狊狅犳犕犃犇犛犫狅狓犵犲狀犲狊犻狀犕.狋狉狌狀犮犪狋狌犾犪
 
图3 蒺藜苜蓿 犕犃犇犛犫狅狓基因表达的聚类分析
犉犻犵.3 犎犲犪狋犿犪狆狅犳犕犃犇犛犫狅狓犵犲狀犲犲狓狆狉犲狊狊犻狅狀狅犫狋犪犻狀犲犱犳狉狅犿犚犖犃狊犲狇犻狀犕.狋狉狌狀犮犪狋狌犾犪 
832 ACTAPRATACULTURAESINICA(2014) Vol.23,No.6
守,而不含有内含子的基因保守性较差[1,9]。此外,蒺藜苜蓿的Ⅰ型和Ⅱ型 MADSbox基因在基因组分布模式也
有差异,Ⅱ型基本上遍布基因组各条染色体上(2~10个),比较均匀;Ⅰ型只是集中在少数染色体上,如:1号染色
体(22个)和3号染色体(19个),其他染色体(6号染色体,3个)上极少,呈基因簇状分布。最后,比较基因组学和
表达谱分析结果显示,蒺藜苜蓿的Ⅰ型 MADSbox基因含有大量的复制基因,大多基因都不表达或者表达量极
低;而Ⅰ型 MADSbox基因的复制较少,且表达模式较为稳定。综合上面可以发现,在蒺藜苜蓿基因组中,Ⅰ型
MADSbox基因处于积极复制的“扩张期”,虽然基因数量较多,但是参与调控的过程较少;而Ⅱ型 MADSbox基
因基本进入“稳定期”,基因复制较少,家族成员数量也较少,但是,这些基因保守性好,积极参与蒺藜苜蓿器官形
成和发育等过程的调控。
通过蒺藜苜蓿的RNAseq数据分析发现,大多数Ⅰ型 MADSbox基因成员不表达或者表达量极低,而Ⅱ型
MADSbox的表达量相对较高,这也为Ⅱ型 MADSbox基因在蒺藜苜蓿的器官发育和形态建成过程中的重要调
控作用奠定了基础。在蒺藜苜蓿 MADSbox基因家族的表达谱中,A组基因(图3)主要是调控蒺藜苜蓿生殖器
官花和心皮的发育和形成,其中Ⅱ型 MADSbox基因有5个。通过同源搜索和系统进化分析发现,它们分别属
于SEP(MtMADS012和 MtMADS020)、AP3/PI(MtMADS014和 MtMADS044)和AP1(MtMADS039)等亚家
族,在拟南芥、水稻等植物中,这3个亚家族也参与花等生殖器官的发生和形成,说明这些 MADSbox基因的功
能高度保守,在蒺藜苜蓿中也通过这些 MADSbox基因的表达调控控制花等生殖器官的形态发生。此外,C组
基因主要调控蒺藜苜蓿根部、叶片和芽等组织的分化和形态形成,其中Ⅱ型 MADSbox基因有8个,分别属于
SOC1(MtMADS017、MtMADS035和 MtMADS036)、ANR1(MtMADS019、MtMADS023和 MtMADS029)以及
SVP(MtMADS018和 MtMADS028),它们在各个组织中表达量都较高,参与植物各个器官的发育,这与其他植
物中的报道类似,这就意味着蒺藜苜蓿的Ⅱ型 MADSbox基因无论从结构上,还是表达模式上,甚至是生物学功
能上都非常保守[1,3,2930]。
4 结论
本研究采用结构域搜索的方法,在蒺藜苜蓿基因组中鉴定了 MADSbox基因家族的全部基因成员,并通过
序列比对和系统进化方法,确定了 MADSbox基因家族的分类和进化关系。通过染色体定位分析,研究了蒺藜
苜蓿中MADSbox基因家族的演化特点。同时,结合RNAseq的表达谱,阐述了MADSbox基因家族在植物器
官发育,特别是生殖器官发育过程中的重要调控作用,这将为揭示蒺藜苜蓿种子形成机制提供参考,也为解析紫
花苜蓿种子生长过程提供重要的借鉴作用。
参考文献:
[1] TheiβenG,BeckerA,DiRosaA,犲狋犪犾.AshorthistoryofMADSboxgenesinplants[J].PlantMolecularBiology,2000,
42(1):115149.
[2] BeckerA,WinterKU,MeyerB,犲狋犪犾.MADSboxgenediversityinseedplants300milionyearsago[J].MolecularBiology
andEvolution,2000,17(10):14251434.
[3] DeBodtS,RaesJ,VandePeerY,犲狋犪犾.Andthenthereweremany:MADSgoesgenomic[J].TrendsinPlantScience,
2003,8(10):475483.
[4] MichaelsSD,AmasinoRM.FLOWERINGLOCUSCencodesanovelMADSdomainproteinthatactsasarepressorofflow
ering[J].ThePlantCel,1999,11(5):949956.
[5] HartmannU,HhmannS,NettesheimK,犲狋犪犾.MolecularcloningofSVP:anegativeregulatorofthefloraltransitionin犃狉
犪犫犻犱狅狆狊犻狊[J].ThePlantJournal,2000,21(4):351360.
[6] SamachA,OnouchiH,GoldSE,犲狋犪犾.Distinctrolesof犆犗犖犛犜犃犖犛targetgenesinreproductivedevelopmentof犃狉犪犫犻犱狅狆
狊犻狊[J].Science,2000,288:16131616.
[7] ScortecciKC,MichaelsSD,AmasinoRM.IdentificationofaMADSboxgene,FLOWERINGLOCUSM,thatrepresses
flowering[J].ThePlantJournal,2001,26(2):229236.
932第23卷第6期 草业学报2014年
[8] MichaelsSD,DittaG,GustafsonBrownC,犲狋犪犾.犃犌犔24actsasapromoteroffloweringin犃狉犪犫犻犱狅狆狊犻狊andispositivelyreg
ulatedbyvernalization[J].ThePlantJournal,2003,33(5):867874.
[9] KaufmannK,MelzerR,TheiβenG.MIKCtypeMADSdomainproteins:structuralmodularity,proteininteractionsandnet
workevolutioninlandplants[J].Gene,2005,347(2):183198.
[10] AlejandraMandelM,GustafsonBrownC,SavidgeB,犲狋犪犾.Molecularcharacterizationofthe犃狉犪犫犻犱狅狆狊犻狊floralhomeotic
gene犃犘犈犜犃犔犃1[J].Nature,1992,360:273277.
[11] BowmanJL,AlvarezJ,WeigelD,犲狋犪犾.Controlofflowerdevelopmentin犃狉犪犫犻犱狅狆狊犻狊狋犺犪犾犻犪狀犪by犃犘犈犜犃犔犃1andinter
actinggenes[J].Development,1993,119(3):721743.
[12] GuQ,FerrandizC,YanofskyMF,犲狋犪犾.TheFRUITFULLMADSboxgenemediatesceldifferentiationduring犃狉犪犫犻犱狅狆
狊犻狊fruitdevelopment[J].Development,1998,125(8):15091517.
[13] PelazS,DittaGS,BaumannE,犲狋犪犾.BandCfloralorganidentityfunctionsrequireSEPALLATA MADSboxgenes[J].
Nature,2000,405:200203.
[14] LiljegrenSJ,DittaGS,EshedY,犲狋犪犾.SHATTERPROOFMADSboxgenescontrolseeddispersalin犃狉犪犫犻犱狅狆狊犻狊[J].
Nature,2000,404:766770.
[15] NesiN,DebeaujonI,JondC,犲狋犪犾.TheTRANSPARENT犜犈犛犜犃16locusencodestheARABIDOPSISBSISTERMADS
domainproteinandisrequiredforproperdevelopmentandpigmentationoftheseedcoat[J].ThePlantCel,2002,14(10):
24632479.
[16] 江腾,林勇祥,刘雪,等.苜蓿全基因组 WRKY转录因子基因的分析[J].草业学报,2011,20(3):211218.
[17] 刘志鹏,张吉宇,王彦荣.紫花苜蓿配子体发育遗传调控的研究进展[J].草业学报,2011,20(4):270278.
[18] YoungND,DebeleF,OldroydGE,犲狋犪犾.The犕犲犱犻犮犪犵狅genomeprovidesinsightintotheevolutionofrhizobialsymbioses[J].
Nature,2011,480:520524.
[19] 吕奉菊,崔美辰,陈明林.蚕茧草的繁殖生物学研究[J].草业学报,2013,22(3):196203.
[20] 黄利春,金睴,张树振,等.蝶形花亚科植物花粉释放机制[J].草业学报,2013,22(6):305314.
[21] FinnRD,MistryJ,SchusterBcklerB,犲狋犪犾.Pfam:clans,webtoolsandservices[J].NucleicAcidsResearch,2006,34
(S1):247251.
[22] FinnRD,ClementsJ,EddySR.HMMERwebserver:interactivesequencesimilaritysearching[J].NucleicAcidsRe
search,2011,39(S2):2937.
[23] ThompsonJD,HigginsDG,GibsonTJ.CLUSTALW:improvingthesensitivityofprogressivemultiplesequencealign
mentthroughsequenceweighting,positionspecificgappenaltiesandweightmatrixchoice[J].NucleicAcidsResearch,
1994,22(22):46734680.
[24] TamuraK,DudleyJ,NeiM,犲狋犪犾.MEGA4:molecularevolutionarygeneticsanalysis(MEGA)softwarewersion4.0[J].
MolecularBiologyandEvolution,2007,24(8):15961599.
[25] AltschulSF,MaddenTL,SchafferAA,犲狋犪犾.GappedBLASTandPSIBLAST:anewgenerationofproteindatabase
searchprograms[J].NucleicAcidsRes,1997,25(17):33893402.
[26] KrzywinskiMI,ScheinJE,BirolI,犲狋犪犾.Circos:Aninformationaestheticforcomparativegenomics[J].GenomeRe
search,2009,19(9):16391645.
[27] TrapnelC,PachterL,SalzbergSL.TopHat:discoveringsplicejunctionswithRNASeq[J].Bioinformatics,2009,25(9):
11051111.
[28] TrapnelC,WiliamsBA,PerteaG,犲狋犪犾.TranscriptassemblyandquantificationbyRNASeqrevealsunannotatedtran
scriptsandisoformswitchingduringceldifferentiation[J].NatBiotech,2010,28(5):511515.
[29] ZhaoY,LiX,ChenW,犲狋犪犾.WholegenomesurveyandcharacterizationofMADSboxgenefamilyinmaizeandsorghum[J].Plant
Cel,TissueandOrganCulture,2011,105(2):159173.
[30] ShuY,YuD,WangD,犲狋犪犾.GenomewidesurveyandexpressionanalysisoftheMADSboxgenefamilyinsoybean[J].
MolecularBiologyReports,2013,40(6):39013911.
042 ACTAPRATACULTURAESINICA(2014) Vol.23,No.6
犌犲狀狅犿犲狑犻犱犲犻犱犲狀狋犻犳犻犮犪狋犻狅狀犪狀犱犻狀狏犲狊狋犻犵犪狋犻狅狀狅犳狋犺犲犕犃犇犛犫狅狓犵犲狀犲犳犪犿犻犾狔犻狀犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪
ZHANGJun,SONGLili,GUODonglin,GUOChanghong,SHUYongjun
(KeyLaboratoryofMolecularCytogeneticsandGeneticBreedingofHeilongjiangProvince,Colege
ofLifeScienceandTechnology,HarbinNormalUniversity,Harbin150025,China)
犃犫狊狋狉犪犮狋:MADSboxgenesencodeimportanttranscriptionfactorsinplantsthatareinvolvedinmanyprocesses
duringgrowth,developmentandreproduction.APfamdomainsearchofthe犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪genomere
vealed138putativeMADSboxgenes.Thesegeneswereclassifiedintotwoclasses,typeI(92members)and
typeII(46members),basedonmultiplealignmentandphylogeneticanalysis.Therewere134MADSbox
genespresentonalchromosomesin犕.狋狉狌狀犮犪狋狌犾犪,whilefourwerelocatedonthesupercontigs.Like犃狉犪犫犻
犱狅狆狊犻狊andriceMADSboxgenes,thoseMADSboxgenesexpandedthroughgeneduplicationeventsin犕.
狋狉狌狀犮犪狋狌犾犪,especialythetypeIgenes.Thereweremanyduplicategeneclusters,whereMADSboxgeneswith
highdegreesofsimilaritywereclusteredacrossthe犕.狋狉狌狀犮犪狋狌犾犪genome.AnalysisofRNAseqdatafromdif
ferenttissuesin犕.狋狉狌狀犮犪狋狌犾犪revealedthatMADSboxgenesareexpressedinseedpod,flowerandothertis
sues.ThisexpressionpatternsuggeststhattheMADSboxgenesplayanimportantroleintissuedifferentia
tion,developmentandreproductionprocessin犕.狋狉狌狀犮犪狋狌犾犪.
犓犲狔狑狅狉犱狊:犕犲犱犻犮犪犵狅狋狉狌狀犮犪狋狌犾犪;MADSbox;phylogeneticanalysis;geneduplication;expressionpatterns
142第23卷第6期 草业学报2014年