免费文献传递   相关文献

小立碗藓MADS-box基因家族的系统进化分析



全 文 :植物生理学报 Plant Physiology Journal 2015, 51 (2): 197~206  doi: 10.13592/j.cnki.ppj.2014.0539 197
收稿 2014-11-26  修定 2015-02-05
资助 湖南省教育厅青年项目(13B045)和湖南省科技厅青年基
金项目(2015JJ3075)。
* 通讯作者(E-mail: chendh212@163.com; Tel: 0731-84673684)。
小立碗藓MADS-box基因家族的系统进化分析
易吉明1, 黄婷1, 黄勇1,2, 陈东红1,2,*
湖南农业大学1生物科学技术学院, 2湖南省作物种植资源创新和利用重点实验室, 长沙410128
摘要: 苔藓植物作为最早出现的陆生植物的代表, 生活周期仍以配子体为主, 在植物进化史上占据着重要的地位。另外, 同
源异型基因MADS-box家族广泛参与植物的生长发育和形态构建。因此, 对苔藓植物MADS-box家族的分析有助于了解苔
藓植物出现过程中发生的重要分子事件和关键器官革新。我们基于最新公布的小立碗藓基因组数据库确定了20个带有典
型MADS结构域的MADS-box基因, 其中11个MIKC*型、5个MIKCC型、4个I型, 并对它们进行了染色体定位、外显子-内
含子基因结构、蛋白结构域组成、系统进化构建等分析, 为进一步阐明小立碗藓MADS-box基因的功能提供了准确的信
息资源。
关键词: 小立碗藓; MADS-box; MIKC; 结构域组成; 系统进化分析
Phylogenetic Analysis of MADS-box Gene Family in Physcomitrella patens
YI Ji-Ming1, HUANG Ting1, HUANG Yong1,2, CHEN Dong-Hong1,2,*
1School of Bioscience and Biotechnology, 2Hunan Provincial Key Laboratory of Crop Germplasm Innovation and Utilization, Hu-
nan Agricultural University, Changsha 410128, China
Abstract: On behalf of the earliest land plant with the predominant gametophyte generation in the life cycle,
bryophyte takes up the important position during plant evolution. Additionally, MADS-box homoetic gene fam-
ily is widely involved in plant growth and development or morphological architecture. Therefore, it is informa-
tive to understand the important molecular events and key organ innovations during the emergence of bryophyte
by analyzing moss MADS-box family. Here, we identified 20 MADS-box genes with typical MADS domain in
Physcomitrella patens, including 11 members of MIKC*-type, 5 of MIKCC-type, and 4 of type-I based on the
latest genomic database. Then we investigated the chromosome location, exon-intron gene structure, domain ar-
chitecture, and phylogenetic relationship on moss MADS-box members. These results provide an accurate in-
formation platform for further unveiling the function of moss MADS-box genes.
Key words: Physcomitrella patens; MADS-box; MIKC; domain architecture; phylogenetic analysis
苔藓植物(Bryophyta)独特的结构特征和生活
方式使其在植物的进化研究方面具有重要价值。
苔藓植物正式出现了胚的构造, 但其生活史仍以
单倍体的配子体阶段为主, 缺乏维管系统, 是一种
由水生到陆生的过渡类型。实际上, 目前关于苔
藓植物的确切进化地位仍然存在较大争议, 因此
需要更多的化石证据的支持或更加全面系统的生
物信息学分析来进一步提供佐证。
MADS-box基因是真核生物中一类重要的转
录因子, 在生长发育调控和信号转导中发挥着重
要作用, 普遍存在于动物、植物和真菌中(Alvarez-
Buylla等2000; Becker和Theissen 2003)。MADS-box
基因在动物中与心肌发育有关, 在酵母中起信息
素应答作用, 在植物中几乎参与生长发育的各个
时相。MADS-box基因均含有一段约60个氨基酸
组成的高度保守的MADS-box结构域, 可划分为I
型(SRF型)和II型(MEF2型)。
至今, MADS-box基因家族在被子植物, 尤其
是模式植物拟南芥(Arabidopsis thaliana)中研究得
最为详尽。被子植物I型MADS-box蛋白仅拥有一个
保守的MADS结构域和一个长的C末端(Smaczniak等
2012), 其编码基因通常包含1~2个外显子, 根据系
统进化分析可归为3类: Mα、Mβ、Mγ (Parenicova
等2003)。有限的报道表明, 它们主要参与雌配子
体、胚乳或种子的发育(Kohler等2003; Portereiko
等2006; Bemer等2008; Colombo等2008; Kang等
植物生理学报198
2008; Steffen等2008)。II型MADS-box蛋白在植物
中可划分为MIKCC型和MIKC*型, 前者比后者拥有
保守性更强的K区和一个更短的I区(Theissen等
2000; Henschel等2002)。被子植物MIKCC型可进
一步分为13个亚类: StMADS11、DEF/GLO、
GGM13 (B sister)、AGL15、AGL6、AGL2、FLC、
SQUA、AGL17、AGL12、AG、TM3和TM8 (拟
南芥中没有) (Becker和Theissen 2003; Heijmans等
2012); MIKC*型则进一步分为P组和S组(Nam等
2004)。MIKCC型基因在植物孢子体发育的多个时
相和部位都有表达, 参与成花转变、花时决定、花
序分生组织和花分生组织决定、花器官特性决定、
花的衰老和脱落、胚的发育(Fernandez等2000)、
果实的发育和开裂(Rijpkema等2007)以及营养器
官叶和根的形态建成(Tapia-Lopez等2008)等。拟
南芥MIKC*型基因共有6个成员, 其中5个在花粉中
有表达且部分得到功能验证 (Ve re l s t等2007 ;
Adamczyk和Fernandez 2009), 表明MIKC*型基因主
要调控雄配子体的发育。关于苔藓类MADS-box
基因的功能报道相对比较缺乏, 对此家族进行生
物信息学分析有助于了解绿色植物进化中的关键
事件和进化路径。
我们依据最新公布的小立碗藓基因组数据库
信息, 重新订正了小立碗藓MADS-box家族的成
员, 并对它们进行染色体定位、基因外显子-内含
子结构、蛋白结构域组成和系统进化分析, 更加
准确地反映小立碗藓MADS-box家族在基因、氨
基酸和系统进化水平上的真实状态, 为正确利用
和进一步分析小立碗藓MADS-box基因的功能提
供了一个准确可靠的信息平台。
材料与方法
1 小立碗藓MADS-box基因数据来源
小立碗藓(Physcomitrella patens L.) MADS-box
家族的基因组DNA、CDS和蛋白数据来源于Phy-
tozome 10.0数据库(http://phytozome.jgi.doe.gov/pz/
portal.html#); 拟南芥的MADS-box基因和蛋白数
据来源于拟南芥官方网站TAIR数据库(www.arabi-
dopsis.org); 苔藓MADS-box蛋白氨基酸序列基本性
质, 如氨基酸数目、分子量和等电点通过ExPASy网
站(http://www.expasy.org/ compute_pi/)在线分析。
2 苔藓MADS-box基因染色体定位和基因组结构
分析
以Phytozome 10.0提供的相关基因信息, 确定
其染色体定位。然后通过MapInspect软件作图。
将小立碗藓MADS-box的基因序列和cDNA序列,
通过在线软件Gene Structure Display Server (http://
gsds.cbi.pku.edu.cn/)分析内含子和外显子构成。
3 MADS-box蛋白的结构域组成分析
运用SMART在线工具(http://smart.embl-hei-
delberg.de/)和NCBI保守结构域搜索(http://www.
ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)对苔藓
MADS-box家族蛋白的结构域组成进行分析, 并通
过DOG 2.0软件绘制。
4 序列比对和系统进化分析
将苔藓MADS-box蛋白和拟南芥MADS-box
蛋白一起采用MEGA 5.1构建系统进化树。参数设
置: 使用Neighbor-Joining法的No. of differences模
型构建, 选择部分删除(partial deletion)空位(gap)的
选项, Bootstrap method取值1 000。蛋白多重比对
采用在线工具MULTALIN (https://npsa-prabi.ibcp.
fr/cgi-bin/align_multalin.pl), 蛋白比对后一致序列
的分析用在线工具WebLogo (http://weblogo.berke-
ley.edu/logo.cgi)。
实验结果
1 小立碗藓MADS-box家族成员的最新订正
伴随着全基因组测序技术的飞跃发展和分析
方法的深入开发, 所测物种基因库中的数据仍在
不断进行补充、确认和修正。其中 , 小立碗藓
MADS-box家族就是典型例子之一。Barker和Ashton
(2013)报道, 小立碗藓中共有26个MADS-box家族,
包括6个MIKCC型、11个MIKC*型、7个I型以及2
个假基因。然而, 我们在最新公布的Phytozome 10.0
数据库收集到的数据表明, 小立碗藓MADS-box家
族的序列已普遍得到更新和修正: 共发现21条编
码基因, 比之前的报道少了3条; 除了6条完全相同
外, 新鉴定出2条, 并修正了13条(表1)。为了方便
后续分析, 我们统一重新命名了这21条序列, 即
PpMADS101~PpMADS121。其中, PpMADS108、
PpMADS109、PpMADS112、PpMADS115、
PpMADS117和PpMADS118分别与之前报道的
易吉明等: 小立碗藓MADS-box基因家族的系统进化分析 199
PpMADS3、PPMA9、PPM6、PPM7、PPTIM7、
PPTIM1序列完全相同(Barker和Ashton 2013);
PpMADS101、PpMADS102、PpMADS103、
PpMADS105分别与之前报道的序列基本相同, 仅仅
在翻译的起始位置有出入 ; P p M A D S 11 9和
PpMADS120为新鉴定出的成员。而之前报道的5个
成员(包括PpMADS-S、PPTIM2~4和8)在最新的数
据库中没有找到对应的基因, 表明它们可能属于后
期数据处理中错误拼接的产物。其余13条经修正
的成员序列出错的位置多集中在N端或C端, 少数在
序列中间(表1), 表明经人为测序和组装拼接的基因
组序列在反映原物种实际序列的忠诚度方面仍需
进一步改进和完善。这些小立碗藓MADS-box基因
编码的蛋白包含134~465个氨基酸, 分子量介于
15~50 kDa, 等电点在5~10之间。需要说明的是, 由
于PpMADS121蛋白在其N端缺少代表性的MADS-
box结构域, 很有可能是一个假基因, 因此本文部分
后续分析中不把其包括在内。
2 小立碗藓MADS-box家族基因的染色体定位
小立碗藓共有27条染色体, 然而PpMADS的
20条成员和1条假基因仅分布在其中10条染色体
上, 且分布并不均匀(图1)。在第9、13、25号染
色体上仅有1个成员存在, 分别为PpMADS121、
117、120; 在第4、8、12号上有2个成员, 分别为
PpMADS102/110、PpMADS111/112、PpMADS103/113;
在第14、17号染色体上有3个成员, 分别为PpMADS-
104/114/119、PpMADS105/115/118; 在第3号染色
体上则有4个成员PpMADS108/109/101/116。MIKCC
或I型基因分别单独定位于特定的染色体上, 而
MIKC*型基因除了有4个成员单独位于一条染色体
外, 另外8个成员成对存在于4条染色体上(图1), 如
PpMADS106/107、PpMADS108/109、PpMADS111/112、
PpMADS114/119, 这表明它们可能分别来源于一次
基因复制事件。
3 小立碗藓MADS-box家族的基因结构
拟南芥中I型和II型MADS-box家族基因结构
有显著的区别, I型几乎没有内含子或仅1个内含
子; MIKCC型基因一般含有6~7个内含子; MIKC*型
基因内含子数目波动比较大, 含1~9个不等, 但9个
居多(Parenicova等2003)。因此, 我们同样调查了
表1 小立碗藓中包含的MADS-box基因特性
Table 1 The properties of MADS-box genes in P. patens
基因名称 基因座位号 类型 蛋白长度/aa 分子量/kDa 等电点 外显子数量 本文修正序列与之前报道的差异
PpMADS101 Phpat.003G125000 MIKCC 348 38.3 7.71 9 N端起始位点早于PPM2
PpMADS102 Phpat.004G002000 MIKCC 348 38.5 6.81 9 N端起始位点早于PpMADS1
PpMADS103 Phpat.012G078200 MIKCC 354 38.7 9.00 9 N端起始位点早于PPM1
PpMADS104 Phpat.014G056100 MIKCC 333 36.9 7.80 8 与PPMC6的N端、C端均不一致
PpMADS105 Phpat.017G019900 MIKCC 271 36.5 7.71 9 N端起始位点早于PPMC5
PpMADS106 Phpat.001G158500 MIKC* 425 47.8 9.08 11 与PPM4的C端不一致
PpMADS107 Phpat.001G158400 MIKC* 396 44.5 8.35 11 PPMA11的中部多了一小段插入
PpMADS108 Phpat.003G124300 MIKC* 416 47.1 7.01 12 与PpMADS3相同*
PpMADS109 Phpat.003G124400 MIKC* 411 46.8 7.29 10 与PPMA9相同*
PpMADS110 Phpat.004G013900 MIKC* 418 47.3 9.06 11 与PPMA12中部和C端不一致
PpMADS111 Phpat.008G025900 MIKC* 410 46.7 7.81 12 与PPMA8中部不一致
PpMADS112 Phpat.008G025800 MIKC* 410 46.3 6.98 11 与PPM6相同*
PpMADS113 Phpat.012G080000 MIKC* 417 46.7 6.91 11 与PpMADS2的C端不一致
PpMADS114 Phpat.014G086000 MIKC* 372 44.9 8.22 10 与PPM3的C端不一致
PpMADS115 Phpat.017G043700 MIKC* 438 49.8 8.81 11 与PPM7相同*
PpMADS116 Phpat.003G132700 I型 296 26.6 9.84 1 与PPTIM5的C端不一致
PpMADS117 Phpat.013G084000 I型 391 42.6 5.48 1 与PPTIM7相同*
PpMADS118 Phpat.017G094300 I型 244 26.8 6.86 1 与PPTIM1相同*
PpMADS119 Phpat.014G086100 MIKC* 134 15.5 9.37 3 无对应序列
PpMADS120 Phpat.025G025800 I型 465 51.3 5.07 5 无对应序列
PpMADS121 Phpat.009G005300 无M区 199 21.6 5.95 2 缺失PPMA10的N端(含MADS域)
  *更新前后没有差异的序列。
植物生理学报200
小立碗藓MADS-box家族基因结构组成, 结果显示,
I型基因结构和拟南芥中相似, 基本没有内含子(除
了PpMADS120有4个内含子); II型基因结构与拟南
芥稍有不同, 但整体变化趋势一致, PpMIKCC型基
因包括7~8个内含子, 而PpMIKC*型基因由9~11个
内含子构成(除了PpMADS119有2个内含子) (图
2)。因此, 从整体上看, MADS-box家族基因结构
的保守性同样在小立碗藓中存在。
4 小立碗藓MADS-box蛋白的结构域组成分析
为了揭示小立碗藓MADS-box蛋白序列的保
守性与分歧, 我们利用NCBI网站的CD-Search功能
和SMART网站的在线工具分析了PpMADS蛋白的
图1 小立碗藓MADS-box家族基因染色体定位
Fig.1 Chromosome location of MADS-box genes in P. patens
C: MIKCC基因; *: MIKC*基因; I: I型基因。
图2 小立碗藓MADS-box家族基因结构
Fig.2 Gene structure of MADS-box genes in P. patens
实心矩形: 外显子; 直线: 内含子。
易吉明等: 小立碗藓MADS-box基因家族的系统进化分析 201
结构域组成。结果表明, II型PpMADS蛋白基本都
含有保守的M A D S和K结构域 (图 3 ) ; 虽然
PpMADS107和119蛋白缺少K区, 但系统进化分析
显示它们仍属于II型(图4、5)。另外, PpMADS119
蛋白非常短, 仅由134个氨基酸构成, 可能是因为
在进化过程中序列发生突变从而导致蛋白的提前
终止, 进而干扰了K区的正常形成。I型PpMADS
仅含有一个保守的MADS结构域, 符合此类基因的
特征构成。大多PpMADS蛋白的MADS结构域直
接定位在N端的起始位置 ; 但也有例外 , I I型
PpMADS101~104的MADS结构域分布在序列近N
端处, I型PpMADS120的MADS域分布在近中部
处。这些在MADS结构域前面多出一段序列的也
被称为NMIKC型MADS-box蛋白。
型MADS-box蛋白共有11个成员, 它们聚为一支,
与拟南芥MIKC*型分支并列成为姐妹支 ; 其中
PpMADS119又独立于其他PpMIKC*型蛋白之外
(图4), 可能朝着基因结构和功能歧化的方向演化,
与之对应的是PpMADS119编码蛋白很小, 已失去
了K区及C端的大部分序列 , 仅保留了基本的
MADS结构域。小立碗藓MIKCC型的5个成员也聚
在一起, 相较拟南芥MIKCC型有着更近的亲缘关
系, 说明苔藓MIKCC型基因还没有出现类似被子
植物的13个亚类的分化。但是小立碗藓的MIKC*型
和MIKCC型分别与拟南芥中同类型的MIKC型蛋
白构成聚类, 表明MIKC*型和MIKCC型基因的分
歧时间在苔藓植物出现之前就已发生。小立碗藓
的I型MADS-box蛋白有4个成员, 构成2个分支,
PpMADS117和PpMAD120组成分支I-2, 与拟南芥
(Mβ+Mγ)分支平行; PpMADS116和PpMAD118组
成分支I-1, 位于其他的I型+II型的基部(图4)。因
此, 我们认为I型基因在苔藓中可能代表着古老的
起源, 经基因复制后, 一部分基因继续维持古老的I
型基因角色, 另一部分基因序列产生了变异并积
累产生了新的II型基因和新的功能。与I型基因古
老角色相对应的是, 它一般仅有1个外显子组成,
缺乏内含子序列(图2), 这可能是一种比较原始的
性状。另外, 我们也基于高度保守的MADS结构域
对小立碗藓MADS-box家族蛋白进行了系统进化
分析, 发现与用全长蛋白构建的进化树有基本相
似的拓扑结构, 同样分为I型和II型, I型有2个亚类,
II型包括MIKCC型和MIKC*型。
多重序列比对结果显示, 小立碗藓II型MADS
结构域氨基酸序列比I型更加保守(图6), 说明II型
基因在进化中受到的选择压力更大, 在功能上对
有机体的环境适应性和生活力更加重要。但I型和
II型MADS结构域在中部近C端的区域显示最高的
相似性。小立碗藓II型(即MIKC型) MADS结构域
共享4个完全保守的基序 : EIKKIE、RQVT、
SKRR和VLCD, 多集中在N端 ; 而MIKCC型与
MIKC*型MADS结构域中分别完全保守的残基之
间存在11个位置的差异, 且多集中在C端(图6-D)。
这表明MADS结构域N端残基的差异决定了I型和
II型的区别, 而C端残基的差异决定了MIKCC型与
MIKC*型的分歧。
图3 小立碗藓MADS-box编码蛋白的结构域分布
Fig.3 Domain architecture of MADS-box proteins in P. patens
5 小立碗藓MADS-box家族的系统进化分析
拟南芥MADS-box家族成员在系统进化方面
已经得到较为充分的研究, 主要划分为I型和II型,
其中I型又分为Mα (25个成员)、Mβ (20个)、Mγ
(20个)三种亚型, II型分为MIKCC型(39个)和MIKC*
型(6个) (Parenicova等2003)。为了阐明小立碗藓
MADS-box家族蛋白之间的系统进化关系, 我们另
外选取了拟南芥MADS-box家族的代表性成员作
为参照, 并以2种绿藻植物MADS成员作为根进行
系统进化树的构建。结果显示, 小立碗藓的MIKC*
植物生理学报202
讨  论
Barker和Ashton (2013)报道, 小立碗藓MADS-
box基因家族除了2个假基因外, 还有24个编码蛋
白(6条MIKCC型, 11条MIKC*型, 7条I型)。然而, 我
们基于Phytozome 10.0网站最新公布的数据, 发现
新版小立碗藓MADS-box基因家族较之前的数据
有了较大幅度的更新和修正, 包含1条假基因和20
条特征MADS-box基因(5条MIKCC型, 11条MIKC*
型, 4条I型), 其中仅6条与之前的序列完全相同, 13
条进行了不同程度的修正, 2条属于全新的序列(1条
MIKC*型和1条I型); 之前版本中有5条序列(MIKCC
型的PpMADS -S , I型的PPTIM2、PPTIM3、
PPTIM4、PPTIM8)在新版本中没有发现对应的相
似序列。因此, 对小立碗藓MADS-box基因家族数
据进行重新修正和分析是非常有必要的, 可为后
续的功能鉴定提供更加准确的信息资源。基于最
新首次发布的小立碗藓基因座位信息, 我们系统
分析了小立碗藓MADS-box基因的染色体定位, 较
之前版本的脚手架(Scaffold)信息(Barker和Ashton
2013)更加准确和全面。所有新版PpMADS序列的
基因结构分析表明, 个别序列的外显子-内含子结
构分布出现明显变动, 例如PpMADS109 (9个内含
子)、PpMADS107 (10个内含子)、PpMADS114 (9
个内含子)分别比之前对应的PPMA9、PPMA11、
图4 小立碗藓MADS-box家族蛋白全长的系统进化分析
Fig.4 Phylogenetic analysis of PpMADS-box family based on the full-length sequences
◆: 拟南芥; ●: 小立碗藓; ■: 绿藻类。CrMADS1: 衣藻(Chlamydomonas reinhardtii) MADS-box蛋白; VcMADS1: 团藻(Volvox carteri)
MADS-box蛋白。
易吉明等: 小立碗藓MADS-box基因家族的系统进化分析 203
PPM3少了1个内含子。我们也首次全面分析了小
立碗藓MADS-box基因编码蛋白的结构域组成, 发
现MIKC型一般都含有保守的MADS-box结构域和
K区, 然而PpMADS107和PpMADS109缺少K区, 说
明在进化过程中发生了结构域的丢失。系统进化
分析表明, 苔藓的MIKCC型和MIKC*型分别与拟南
芥的对应序列聚在一起; I型有2个分支, 一支与拟
南芥的I型聚为一类, 另一支处于上述序列和绿藻
MADS-box蛋白之间。这表明MIKCC型和MIKC*
型基因的分歧在苔藓植物出现之前, I型基因的出
现可能早于II型基因。
MADS-box基因在进化中数量和序列的多样
性变化紧密联系着真核生物结构和功能的革新。
生物信息学分析发现MADS结构域很可能起源于
古老原核生物的拓扑异构酶IIA的A亚基(TOPI-
IA-A) (Gramzow等2010)。而且通过基因复制和分
歧产生了I型和II型(Gramzow等2010)。在真核生
物中, MADS-box基因在动物和真菌中的成员很少,
但在植物中却得到爆发性的发展, 并产生了独特
的MIKC型(Alvarez-Buylla等2000)。目前普遍认为
陆生植物起源于单相世代型的轮藻(Graham等
2000; Lewis和McCourt 2004); 随后演化出双相的
世代交替型生活史, 包括配子体世代占主导的苔
藓植物和孢子体世代占主导的维管植物(Kenrick
和Crane 1997; Graham等2000)。为了研究陆生植物
MADS-box基因的起源, 3种轮藻类MADS-box基因
图5 基于MADS结构域的小立碗藓MADS-box家族成员的系统进化分析
Fig.5 Phylogenetic analysis of PpMADS-box family based on the MADS domain
被克隆了出来, 即球状轮藻(Chara globularis) Cg-
MADS1、鞘毛藻(Coleochaete scutata) CsMADS1和
带藻(Closterium peracerosum-strigosum-littorale)
CpMADS1, 经分析发现它们均属于MIKCC型(Ta-
nabe等2005)。可见, 轮藻和陆地植物的共同祖先
中已经拥有了MIKCC型基因。CgMADS1和Cp-
MADS1的表达模式表明陆地植物MIKCC型基因的
祖先功能可能是参与单倍体生殖细胞的分化, 随
后在进化中被重征到二倍体世代发挥作用。苔藓
植物作为水生到陆生的过渡类型, 配子体为主要
生活阶段。Zobell等(2010)从3种苔藓植物中分离
出一些MIKC*型基因: 葫芦藓(Funaria hygrometrica)
FhMADS1~11、偏叶泥炭藓(Sphagnum subsecundum)
SsMADS1~4、地钱(Marchantia polymorpha) Mp-
MADS1。MIKC*基因家族在葫芦藓、偏叶泥炭藓
和小立碗藓中得到快速扩增, 然而在较低级的苔
类植物地钱中似乎仅能分离出1个成员(Zobell等
2010)。而且, 地钱MpMADS1的异源表达能部分替
代拟南芥MIKC*型在花粉发育方面的功能(Zobell
等2010)。另外, 葫芦藓11个MIKC*型基因在配子
体均有特异性高表达(Zobell等2010)。小立碗藓
MIKCC型基因PPM1和PpMADS1在配子体和孢子
体中普遍表达(Singer等2007)。这可能反映了苔藓
MIKCC型基因处在从古老的配子体世代被重新招
募到后来居上并占主导地位的孢子体世代的一种
进化转变的状态(Quod等2007)。本研究结果表明,
植物生理学报204
图6 小立碗藓MADS-box家族成员的MADS结构域比对分析
Fig.6 Multiply alignments of MADS domains of PpMADS-box proteins
A: 选取小立碗藓和2个绿藻MADS-box蛋白的MADS结构域进行比对分析; B: 小立碗藓MIKCC型MADS结构域的一致序列; C: 小立碗
藓MIKC*型MADS结构域的一致序列(PpMADS119除外); D: 小立碗藓II型蛋白(包括所有MIKC型) MADS结构域的一致序列。短线代表缺
失的残基; 箭头标示小立碗藓MADS结构域中的可变残基; @标示在小立碗藓MIKCC和MIKC*蛋白内保持一致, 但在两类之间不同的氨基
酸残基。
小立碗藓共有20条MADS-box基因(5条MIKCC型,
11条MIKC*型, 4条I型), 其中数量占显著优势的
MIKC*型基因可能与苔藓植物中占主导的配子体
发育密切相关。石松门代表了最早维管植物的进
化分支, 与真叶植物是姊妹类群。江南卷柏(Selag-
inella moellendorffii)共有19个MADS-box基因, 其
中, I型13个, MIKCC型3个, MIKC*型3个(Gramzow等
2012)。卷柏MIKC*型基因的数量远少于小立碗藓,
可能与维管植物中配子体发育开始退化有关。卷
柏属MIKC*型基因(SmMADS2/4/10和SpMADS1/2/3)
均在包含有雄配子体的小孢子囊有特异高表达
(Kwantes等2012)。多穗石松(Lycopodium annotinum)
MIKC*型基因LAMB1在生殖球果中有特异表达
(Svensson等2000)。因此, 石松类MIKC*型基因在雄
配子体发育方面仍然有着保守的功能。由于蕨类
植物和裸子植物缺乏代表性植物的全基因组序列
信息, 因此对它们的研究相对薄弱。水蕨MIKC*型
基因已经出现类似被子植物的分组, 即P组(CRM13
易吉明等: 小立碗藓MADS-box基因家族的系统进化分析 205
和CRM16)和S组(CRM14和CRM15), 在配子体和孢
子体世代均有表达(Kwantes等2012), 与其他门类植物
存在较大区别。据估计在约3亿年前, MIKCC型基因
中的AG、AGL2、AGL6、DEF/GLO、GGM13、
STMADS11和TM3亚类就已经存在于被子植物和裸
子植物的最近共同祖先中(Bowman等1991; Coen和
Meyerowitz 1991; Colombo等2008), 这可能与生殖
器官的复杂性增加有关。被子植物真花的出现进
一步导致MIKCC型基因的数量攀升到一个新的高
峰, 例如拟南芥的110个MADS-box基因中有39个
MIKCC 型基因(Parenicova等2003)。总之, MADS-box
基因数量和类型的分化可能决定着植物关键器官的
出现和基本进化方向。
参考文献
Adamczyk BJ, Fernandez DE (2009). MIKC* MADS domain het-
erodimers are required for pollen maturation and tube growth in
Arabidopsis. Plant Physiol, 149 (4): 1713~1723
Alvarez-Buylla ER, Pelaz S, Liljegren SJ, Gold SE, Burgeff C, Ditta
GS, Ribas de Pouplana L, Martinez-Castilla L, Yanofsky MF
(2000). An ancestral MADS-box gene duplication occurred
before the divergence of plants and animals. Proc Natl Acad Sci
USA, 97 (10): 5328~5333
Barker EI, Ashton NW (2013). A parsimonious model of lineage-spe-
cific expansion of MADS-box genes in Physcomitrella patens.
Plant Cell Rep, 32 (8): 1161~1177
Becker A, Theissen G (2003). The major clades of MADS-box genes
and their role in the development and evolution of flowering
plants. Mol Phylogenet Evol, 29 (3): 464~489
Bemer M, Wolter-Arts M, Grossniklaus U, Angenent GC (2008). The
MADS domain protein DIANA acts together with AGAMOUS-
LIKE80 to specify the central cell in Arabidopsis ovules. Plant
Cell, 20 (8): 2088~2101
Bowman JL, Smyth DR, Meyerowitz EM (1991). Genetic interactions
among floral homeotic genes of Arabidopsis. Development, 112
(1): 1~10
Coen ES, Meyerowitz EM (1991). The war of the whorls: genetic
interactions controlling flower development. Nature, 353 (6339):
31~37
Colombo M, Masiero S, Vanzulli S, Lardelli P, Kater MM, Colombo
L (2008). AGL23, a type I MADS-box gene that controls female
gametophyte and embryo development in Arabidopsis. Plant J,
54 (6): 1037~1010
Fernandez DE, Heck GR, Perry SE, Patterson SE, Bleecker AB, Fang
SC (2000). The embryo MADS domain factor AGL15 acts
postembryonically: inhibition of perianth senescence and abscis-
sion via constitutive expression. Plant Cell, 12 (2): 183~197
Graham LE, Cook ME, Busse JS (2000). The origin of plants: body
plan changes contributing to a major evolutionary radiation. Proc
Natl Acad Sci USA, 97 (9): 4535~4540
Gramzow L, Barker E, Schulz C, Ambrose B, Ashton N, Theißen G,
Litt A (2012). Selaginella genome analysis—entering the “ho-
moplasy heaven” of the MADS world. Front Plant Sci, 3: 214
Gramzow L, Ritz MS, Theissen G (2010). On the origin of MADS-do-
main transcription factors. Trends Genet, 26 (4): 149~153
Heijmans K, Morel P, Vandenbussche M (2012). MADS-box genes
and floral development: the dark side. J Exp Bot, 63 (15):
5397~5404
Henschel K, Kofuji R, Hasebe M, Saedler H, Munster T, Theissen G
(2002). Two ancient classes of MIKC-type MADS box genes are
present in the moss Physcomitrella patens. Mol Biol Evol, 19 (6):
801~814
Kang I-H, Steffen JG, Portereiko MF, Lloyd A, Drews GN (2008).
The AGL62 MADS domain protein regulates cellularisation
during endosperm development in Arabidopsis. Plant Cell, 20 (3):
635~647
Kenrick P, Crane PR (1997). The origin and early evolution of plants
on land. Nature, 389: 33~39
Kohler C, Hennig L, Spillane C, Pien S, Gruissem W, Grossniklaus
U (2003). The Polycomb-group protein MEDEA regulates seed
development by controlling expression of the MADS-box gene
PHERES1. Genes Dev, 17 (12): 1540~1553
Kwantes M, Liebsch D, Verelst W (2012). How MIKC* MADS-
box genes originated and evidence for their conserved function
throughout the evolution of vascular plant gametophytes. Mol
Biol Evol, 29 (1): 293~302
Lewis LA, McCourt RM (2004). Green algae and the origin of land
plants. Am J Bot, 91 (10): 1535~1556
Nam J, Kim J, Lee S, An G, Ma H, Nei M (2004). Type I MADS-box
genes have experienced faster birth-and-death evolution than
type II MADS-box genes in angiosperms. Proc Natl Acad Sci
USA, 101 (7): 1910~1915
Parenicova L, de Folter S, Kieffer M, Horner DS, Favalli C, Busscher
J, Cook HE, Ingram RM, Kater MM, Davies B et al (2003). Mo-
lecular and phylogenetic analyses of the complete MADS-box
transcription factor family in Arabidopsis: new openings to the
MADS world. Plant Cell, 15 (7): 1538~1551
Portereiko MF, Lloyd A, Steffen JG, Punwani JA, Otsuga D, Drews
GN (2006). AGL80 is required for central cell and endosperm
development in Arabidopsis. Plant Cell, 18 (8): 1862~1872
Quodt V, Faigl W, Saedler H, Münster T (2007). The MADS-domain
protein PPM2 preferentially occurs in gametangia and sporophytes
of the moss Physcomitrella patens. Gene, 400 (1~2): 25~34
Rijpkema AS, Gerats T, Vandenbussche M (2007). Evolutionary
complexity of MADS complexes. Curr Opin Plant Biol, 10 (1):
32~38
Singer SD, Krogan NT, Ashton NW (2007). Clues about the ancestral
roles of plant MADS-box genes from a functional analysis of
moss homologues. Plant Cell Rep, 26 (8): 1155~1169
植物生理学报206
Smaczniak C, Immink RG, Angenent GC, Kaufmann K (2012). De-
velopmental and evolutionary diversity of plant MADS-domain
factors: insights from recent studies. Development, 139 (17):
3081~3198
Steffen JG, Kang IH, Portereiko MF, Lloyd A, Drews GN (2008).
AGL61 interacts with AGL80 and is required for central cell de-
velopment in Arabidopsis. Plant Physiol, 148 (1): 259~268
Svensson ME, Johannesson H, Engstrom P (2000). The LAMB1
gene from the clubmoss, Lycopodium annotinum, is a divergent
MADS-box gene, expressed specifically in sporogenic struc-
tures. Gene, 253 (1): 31~43
Tanabe Y, Hasebe M, Sekimoto H, Nishiyama T, Kitani M, Henschel
K, Münster T, Theissen G, Nozaki H, Ito M (2005). Character-
ization of MADS-box genes in charophycean green algae and
its implication for the evolution of MADS-box genes. Proc Natl
Acad Sci USA, 102 (7): 2436~2441
Tapia-Lopez R, Garcia-Ponce B, Dubrovsky JG, Garay-Arroyo A, Pe-
rez-Ruiz RV, Kim S-H, Acevedo F, Pelaz S, Alvarez-Buylla ER
(2008). An AGAMOUS-related MADS-box gene, XAL1 (AGL12),
regulates root meristem cell proliferation and flowering transi-
tion in Arabidopsis. Plant Physiol, 146 (3): 1182~1192
Theissen G, Becker A, di Rosa A, Kanno A, Kim JT, Munster T, Win-
ter KU, Saedler H (2000). A short history of MADS box genes in
plants. Plant Mol Biol, 42 (1): 115~149
Verelst W, Twell D, de Folter S, Immink R, Saedler H, Munster T
(2007). MADS-complexes regulate transcriptome dynamics
during pollen maturation. Genome Biol, 8 (11): R249
Zobell O, Faigl W, Saedler H, Munster T (2010). MIKC* MADS-box
proteins: conserved regulators of the gametophytic generation of
land plants. Mol Biol Evol, 27 (5): 1201~1211