免费文献传递   相关文献

Structure and Expression Analysis of KNOX Gene Family in Soybean

大豆KNOX基因家族的结构和表达分析



全 文 :植物学报 Chinese Bulletin of Botany 2012, 47 (3): 236–247, www.chinbullbotany.com
doi: 10.3724/SP.J.1259.2012.00236
——————————————————
收稿日期: 2012-01-19; 接受日期: 2012-04-01
基金项目: 国家自然科学基金重大研究计划(No.91131008)和山东省自然科学杰出青年基金(No.JQ200909)
* 通讯作者。E-mail: suxinyang@yahoo.com.cn
大豆KNOX基因家族的结构和表达分析
李方正, 杨素欣*, 吴春霞, 魏海超, 曲瑞莲, 冯献忠
山东师范大学生命科学学院, 山东省高校系统生物学重点实验室, 济南 250014
摘要 KNOX基因家族编码同源异型盒蛋白, 在植物生长发育过程中起重要调控作用。利用生物信息学手段在全基因组水
平上对大豆(Glycine max)KNOX家族基因进行鉴定和分类, 并分析其基因结构、蛋白同源结构域特征以及基因表达方式。
研究结果表明: 大豆中的27个GmKNOX基因可以分为GmKNOX I和GmKNOX II两个亚类, 其中GmKNOX I类可分为3个主
要的进化支, GmKNOX II类分为2个主要的进化支; 26个GmKNOX基因不均匀地分布在16条染色体上, GmKNOX27尚无法
定位。不同组织表达谱的分析表明: GmKNOX I类基因表达部位比较集中, 以茎顶端分生组织中表达量最高; 而GmKNOX II
类基因的表达特异性较GmKNOX I类低, 表达部位更广泛。
关键词 表达谱分析, 基因结构, KNOX基因家族, 大豆
李方正, 杨素欣, 吴春霞, 魏海超, 曲瑞莲, 冯献忠 (2012). 大豆KNOX基因家族的结构和表达分析. 植物学报 47, 236–247.
同源异型盒基因家族(homeobox gene family)编
码一类含有同源异型盒结构域的转录调控因子, 在生
物体的形态建成、模式形成和细胞命运的决定中起着
重要的作用(Gehring et al., 1994; Williams, 1998;
Mukherjee et al., 2009; Mallo et al., 2010)。典型的
同源异型盒结构域是一个在进化上高度保守的长度
为180 bp的DNA序列, 其编码的60个氨基酸残基在
三维空间形成一个具有3个螺旋区的结构域, 其中第
1个螺旋与第2个螺旋形成环(loop)结构, 第2个螺旋
和第3个螺旋区形成一个螺旋 -转角 -螺旋 (helix-
turn-helix)的DNA结合基序(Billeter et al., 1993; Ge-
hring et al., 1994)。同源异型盒基因最初是通过对果
蝇(Drosophila melanogaster)的同源异型突变和体节
突变体的杂交分析发现的, 其参与调控动物体节的位
置及其形态和数量(McGinnis et al., 1984a, 1984b;
Gehring et al., 1994), 随后被证实在动植物和真菌
中广泛存在(Astell et al., 1981; Williams, 1998; Bür-
glin, 2003; Mukherjee et al., 2009; Mallo et al.,
2010)。
植物同源异型盒基因在进化过程中形成了多样
性的结构。根据系统发育关系和结构特征, 目前将其
分为HD-ZIP I、HD-ZIP II、HD-ZIP III、HD-ZIP IV、
PLINC、WOX、DDT、PHD、NDX、LD、PINTOX、
SAWADEE、KNOX和BEL共14类。其中前4类属于
HD-ZIP超家族, 均在同源异型盒C-端含有一个亮氨
酸拉链特征性结构, 其余各类除具有同源异型盒外,
各自还有其特征性的保守结构域(Mukherjee et al.,
2009)。 KNOX和 BEL基因家族属于 TALE(three
amino-acid loop extension)同源异型盒蛋白超家族,
其编码的蛋白质是非典型的同源异型盒蛋白, 它们的
同源异型盒区包括63个氨基酸, 在第1个螺旋与第2
个螺旋之间存在3个额外的氨基酸(P-Y-P)(Chen et
al., 2003; Hamant and Pautot, 2010)。
KNOX(Knotted1-like homeobox)基因家族几乎
存在于所有的植物中(Mukherjee et al., 2009)。玉米
(Zea mays)Knotted1(Kn1)基因是第1个从植物中发
现的同源异型盒基因(Vollbrecht et al., 1991)。KNOX
蛋白具有4个结构域, 依次为KNOX1、KNOX2、ELK
和Homeobox KN(Finn et al., 2010)。Kerstetter等
(1994)根据KNOX基因的结构特征、表达方式以及系
统发育关系, 将KNOX基因家族分为I类KNOX亚家族
和II类KNOX亚家族。
I类KNOX亚家族基因与Kn1最为相似, 主要在植
物的分生组织中表达, 是分生组织发生与维持所必需
的关键基因, 通过调控与器官发生相关的细胞分化,
最终影响侧生器官的形态建成。II类KNOX亚家族基
·研究报告·
李方正等: 大豆 KNOX基因家族的结构和表达分析 237
因的表达部位相对不如I类集中, 由于已知的突变体
缺乏表型, 目前对其研究相对较少, 仅KNAT7被证实
参与次级细胞壁的生物合成(Li et al., 2011, 2012)。
在模式植物拟南芥(Arabidopsis thaliana)基因组中含
I类和II类KNOX基因各4个: KN1-like in Arabidopsis
thaliana 1 (KNAT1)、 KNAT2、 KNAT6和 Shoot
Meristemless (STM)为I类; KNAT3、KNAT4、KNAT5
和KNAT7为II类。
KNOX基因参与植物生长发育和器官分化过程
的多个方面, 其作用对分生组织的形成和功能的维持
至关重要; 参与侧生器官的形态建成; 影响细胞命
运, 抑制细胞分化; 参与植物激素的调节等(李春苑等,
2009; Hay and Tsiantis, 2010)。大豆(Glycine max)
是人类和动物摄取所需的蛋白质和植物油的主要来源
之一, 也是一种可持续利用的重要生物能源。大豆全
基因组测序的完成(Schmutz et al., 2010)和全基因组
分析方法的使用(王慧等, 2011)正在改变大豆分子生
物学研究相对滞后的局面。现代生物信息学手段提供
了在全基因组水平认知基因的生物学功能和基因调
控网络的方法, 使解析复杂生物学现象的能力发生了
根本性的改观。本研究在全基因组水平上对大豆
KNOX基因家族进行系统的注释、分子进化分析和表
达分析, 以期为进一步认识它们在大豆株型结构、叶
形态发育等重要生物学过程中的功能提供理论指导。
1 材料与方法
1.1 材料
本研究所用的拟南芥(Arabidopsis thaliana L.)KNOX
蛋白序列来源于TAIR (The Arabidopsis Information
Resource)网站(http://www.arabidopsis.org/)。相关
基因名称见表1。
大豆(Glycine max (L.) Merr)KNOX基因家族的
基因信息从Phytozome网站的大豆相关数据库
(http://www.phytozome.org/soybean.php)和NCBI数
据库(http://www.ncbi.nlm.nih.gov/)中进行查找。
1.2 大豆KNOX基因的查找
在Phytozome网站(Version 7.0)使用BLAST工具, 分
别输入在TAIR网站检索到的拟南芥KNOX蛋白序列,
进行BLASTp查找大豆KNOX基因, 并检索NCBI数据
表1 拟南芥KNOX基因名称
Table 1 List of KNOX genes in Arabidopsis thaliana
Group Gene
KNOX Class I STM (AT1G62360) KNAT1 (AT4G08150)
KNAT2 (AT1G70510) KNAT6 (AT1G23380)
KNOX Class II KNAT3 (AT5G25220) KNAT4 (AT5G11060)
KNAT5 (AT4G32040) KNAT7 (AT1G62990)


库进行补充校正。在检索到的蛋白序列中, 选择含有
KNOX结构域的序列进行后续分析。
由于在数据库中查询到的部分基因序列为预测
结果, 并未得到实验证实, 首先检测序列是否完整。
如果基因序列不完整, 查询NCBI和Phytozome数据
库中相关的EST序列, 拼接成具有完整CDS的序列。
对于含有多个转录本的基因, 选取Phytozome数据库
中注释的主要转录产物进行后续的分析研究。
根据在 Phytozome数据库中所获取的大豆
KNOX基因序列信息 , 以及Phytozome网站的大豆
Gbrowse工具 (http://www.phytozome.org/cgi-bin/g-
browse/soybean/)所显示的基因组信息, 手工标注每
个基因在大豆染色体上的位置。
1.3 大豆KNOX蛋白的系统发育分析
将检索到的拟南芥和大豆KNOX蛋白的氨基酸序列
用FASTA格式保存。另选拟南芥中与KNOX相似性最
高的BEL1作为外类群, 使用MEGA软件(Version 5.05)
(Tamura et al., 2011)对其进行多重序列比对(使用蛋
白序列比对默认值), 并用邻接法(Poisson模型, Boot-
strap检验1 000次)重建系统发育树, 去除Bootstrap
支持率低于50%的节点, 并显示各分支长度。
1.4 大豆KNOX基因结构分析
将大豆GmKNOX相应基因序列使用FASTA格式保存
(未包含UTR区), 分别导入基因结构显示系统(GS-
DS, http://gsds.cbi.pku.edu.cn/)(郭安源等, 2007)绘
制基因结构图, 并对个别显示错误的结构图进行手工
修正。
1.5 大豆KNOX蛋白结构域分析
使用Clustal X软件对大豆KNOX蛋白的多重序列进行
比对(Version 2.1)(Larkin et al., 2007)。将27个大豆
KNOX蛋白的氨基酸序列以FASTA格式保存在纯文
238 植物学报 47(3) 2012
本文档中, 加载到Clustal X软件中, 采用默认设置进
行完全序列比对, 比对后手工排序。
对大豆KNOX蛋白结构域的分析采用Pfam在线
工具(http://pfam.sanger.ac.uk/)。使用Clustal X软件
(Version 2.1)对大豆KNOX蛋白序列进行多重序列比
对, 得到的比对结果(生成的.aln文件)由HMMER2软
件包(Version 2.4i)中的hmmbuild程序读取, 并创建
一个HMM文件 , 最后使用LogoMat-M(http://www.
sanger.ac.uk/resources/software/logomat-m/)来显示
结构域HMM logo (Schuster-Böckler et al., 2004)。
1.6 大豆KNOX基因表达分析
根据已发表的大豆全转录组的测序结果(Libault et
al., 2010), 在其公布的51 529个大豆基因的表达数
据中筛选大豆KNOX基因的相关数据 , 检测大豆
KNOX基因在不同组织中的表达情况。将得到的数据
使用R软件(Version 2.14.0)环境下的heatmap.2程序
进行处理, 制作成热图(heatmap)。
2 结果与讨论
2.1 大豆中KNOX同源基因的鉴定和基因组定位
根据拟南芥KNOX蛋白的氨基酸序列在大豆数据库
中进行BLAST检索、筛选和拼接, 共得到27个大豆
KNOX基因(表2)。通过大豆基因组注释的分析, 检测
到GmKNOX15、GmKNOX16、GmKNOX17、Gm-
KNOX18和GmKNOX20均含有2个转录本, GmKN-
OX11和GmKNOX21均含有3个转录本。本文选择这
几个基因在数据库中注释为主要转录产物的转录本
进行后续分析。


表2 大豆KNOX家族基因
Table 2 KNOX family genes in soybean
Gene Primary transcript Protein length (AA) Molecular weight (Da) pI
GmKNOX1 Glyma09g01000.1 325 36 500.5 6.66
GmKNOX2 Glyma15g11850.1 350 39 464.1 6.55
GmKNOX3 Glyma07g39350.1 357 40 291.5 6.86
GmKNOX4 Glyma17g01370.1 343 38 841.3 7.42
GmKNOX5 Glyma14g05150.1 262 30 272.6 7.42
GmKNOX6 Glyma14g10430.1 385 44 092.4 6.90
GmKNOX7 Glyma04g05210.1 361 42 052.1 7.05
GmKNOX8 Glyma08g39170.1 321 36 278.5 4.75
GmKNOX9 Glyma02g04190.1 308 34 897.3 5.28
GmKNOX10 Glyma01g03450.1 316 35 858.2 5.30
GmKNOX11 Glyma19g41610.1 311 35 497.0 5.69
GmKNOX12 Glyma10g28820.1 322 36 577.8 4.60
GmKNOX13 Glyma03g39040.1 333 38 255.7 5.03
GmKNOX14 Glyma04g35850.1 290 33 458.5 6.76
GmKNOX15 Glyma06g06890.1 410 45 821.6 6.26
GmKNOX16 Glyma04g06810.1 399 44 699.6 6.29
GmKNOX17 Glyma17g32980.1 411 46 075.3 6.38
GmKNOX18 Glyma14g13750.1 412 45 918.7 6.02
GmKNOX19 Glyma09g12820.1 369 41 603.9 5.60
GmKNOX20 Glyma13g22530.1 346 39 790.4 5.75
GmKNOX21 Glyma17g11330.1 345 39 676.3 5.75
GmKNOX22 Glyma15g24350.1 340 38 426.2 5.58
GmKNOX23 Glyma05g03650.1 293 33 235.6 6.83
GmKNOX24 Glyma17g14180.1 292 33 074.5 6.72
GmKNOX25 Glyma01g42410.1 281 32 139.8 6.94
GmKNOX26 Glyma11g02960.1 279 31 892.6 6.85
GmKNOX27 Glyma0041s00360.1 291 33 620.1 6.80
李方正等: 大豆 KNOX基因家族的结构和表达分析 239
为了明确各基因在不同染色体上的分布, 根据
Phytozome大豆基因组数据库中的基因位置信息, 制
作了26个大豆KNOX基因(GmKNOX27在公布的大
豆测序结果中未能定位到具体的染色体上, 位于尚未
定位的片段重叠群上)在染色体上的分布图(图1)。从
图1可以看出, 这26个基因分别定位在16条染色体
上, 并且大多分布在染色体的两端: 在第12、16、18
和20号染色体上不含KNOX基因; 在第17号染色体
上KNOX基因数目最多, 为4个; 在第4号染色体和14
号染色体上KNOX基因有3个; 在第1、9和15号染色
体上为2个, 其余10条染色体各有1个KNOX基因。
2.2 大豆中KNOX同源基因的分子进化
根据拟南芥和大豆中KNOX蛋白的氨基酸序列, 使用
MEGA软件采用邻接法重建拟南芥和大豆KNOX蛋白
的系统发育树(图2)。从系统发育树中可以看到, 大豆


图1 大豆KNOX基因在染色体上的分布

Figure 1 Distribution of KNOX genes in soybean chromosomes
240 植物学报 47(3) 2012


图2 拟南芥和大豆中KNOX蛋白系统发育树
在MEGA5中采用邻接法(自举检验1 000次)构建, 显示自举检验支持率(节点旁的数字)≥50%的分支, 分支下方数字为长度。粗体为
拟南芥KNOX和BEL1蛋白。

Figure 2 The phylogenetic tree of KNOX proteins in Arabidopsis and soybean
Constructed with Neighbor-joining method (1 000 replications of bootstrap test) in MEGA5, clades supported by bootstrap values
(the numbers beside the nodes) ≥50% are shown, the numbers below the clades are their lengths. Tags with bold font are
Arabidopsis KNOX and BEL1 proteins.

李方正等: 大豆 KNOX基因家族的结构和表达分析 241
KNOX基因家族可以很清晰地分成两大支: GmKNOX
I类和GmKNOX II类。GmKNOX I类又可以分成3个小
类: GmKNOX I A、GmKNOX I B和GmKNOX I C。
GmKNOX II类可分成2个小类 : GmKNOX II A和
GmKNOX II B。GmKNOX I A类基因与拟南芥的STM
和KNAT1基因有较高的相似性 , 其中STM与Gm-
KNOX1–5处于相同分支, KNAT1与GmKNOX6、7和
27处于相同分支, 说明大豆中两者经历了不同的进
化历程。GmKNOX I B类基因与拟南芥的KNAT2和
KNAT6基因有较大的相似性。GmKNOX I C类基因则
为I类基因在进化过程中形成的大豆特异的I类KNOX
基因。而GmKNOX II A和GmKNOX II B则分别对应
于拟南芥的KNAT3/4/5和KNAT7基因。
图2显示, 对应于拟南芥中的KNOX基因, 在大
豆中存在数量不等和相似性不同的同源基因。说明不
同成员的KNOX基因在2个物种中经历了不同的进化
历程。对于GmKNOX II类家族成员, 利用系统树可以
清晰地区分大豆中拟南芥的KNAT7和KNAT3/4/5对
应基因。 但对于GmKNOX I类家族成员, 除了发现与
拟南芥STM和KNAT1/2/6基因有较高亲缘关系的成
员之外, 部分成员(如GmKNOX11–13等)形成了一个
特有的进化支。这说明大豆GmKNOX I类家族成员经
历了不同的进化途径。
2.3 大豆KNOX基因结构
对大豆KNOX基因的结构分析(图3)显示, 所有大豆
KNOX基因都存在3个以上的内含子, 大多数基因长
度在3 kb以上, 但外显子序列较短, 序列中包含大段



图3 大豆KNOX基因的结构
方框代表外显子, 黑色横线代表内含子。

Figure 3 The gene structure of KNOX genes in soybean
The boxes and black lines represent exons and introns, respectively.
242 植物学报 47(3) 2012
的内含子。内含子的数目为3–7个, 数目最多的是
GmKNOX22, 内含子长度介于41–7 684 bp之间; 外
显子数目为4–8个, 长度为3–612 bp。这种内含子-外
显子结构严重异化的现象, 可能对于其基因功能的分
化具有重要贡献。
2.4 大豆KNOX蛋白结构域
通过对大豆KNOX蛋白的多重序列比对(图4), 证实
大豆中的KNOX蛋白依次呈现该类蛋白质共有的4个
结构域: KNOX1、KNOX2、ELK和Homeobox KN结
构域。其中的Homeobox KN结构域具有最高的保守



图4 大豆KNOX蛋白的多重序列比对
以横线表示KNOX1、KNOX2、ELK和Homeobox KN结构域。

Figure 4 The multiple sequence alignment of soybean KNOX proteins
The black lines show the KNOX1, KNOX2, ELK and Homeobox KN domain.
李方正等: 大豆 KNOX基因家族的结构和表达分析 243




图5 大豆KNOX蛋白结构域的隐马模型图
隐马模型图显示蛋白保守区各位点的氨基酸保守性, 使用单字母符号代表氨基酸, 字母高度代表保守水平。(A) KNOX1结构域; (B)
KNOX2结构域; (C) ELK结构域; (D) Homeobox KN结构域(黑色方框中是该结构域相对典型Homeobox结构域所特有的3个氨基酸)

Figure 5 HMM logos of conserved domains in soybean KNOX proteins
The HMM logos reveal the conservation of amino acids in the conserved domains, single letters stand for the amino acids, the
height of the letters show the conservation level. (A) KNOX1 domain; (B) KNOX2 domain; (C) ELK domain; (D) Homeobox KN
domain (The letters in the black square show the additional amino acids compared to the classic Homeobox domain)



性, 呈现TALE同源异型盒蛋白超家族的特征结构,
其编码63个氨基酸, 在第1个螺旋与第2个螺旋之间
存在3个额外的氨基酸(P-Y-P)。作为基因家族特征保
守结构域的KNOX1、KNOX2和ELK也呈现出较好的
保守性, 但是GmKNOX I类和GmKNOX II类蛋白亚
类内部蛋白质的相似性更为显著。
通过对KNOX蛋白结构域的进一步分析, 确定了
KNOX1、KNOX2、ELK和Homeobox KN结构域在每
个位置上最大可能氨基酸的频率(图5)。通过对氨基酸
频率的计算, 确定出这4个结构域可能的氨基酸序列
和各氨基酸的保守程度。从中我们可以清楚地看到,
Homeobox KN的结构最为保守, 其余则保守性较差。
2.5 大豆KNOX基因表达
为了研究大豆KNOX基因在不同组织中的表达情况,
利用大豆全转录组的测序结果(Libault et al., 2010),
从中筛选到27个大豆KNOX基因在各个组织中的表
达量, 其中所检测的表达部位依次为: 播种84小时后
244 植物学报 47(3) 2012


图6 大豆KNOX基因表达图谱
方块内颜色显示大豆KNOX基因表达水平: 红色最低, 黑色居中, 绿色最高。

Figure 6 Expression profile of soybean KNOX genes
Colors in square represent the expression level of soybean KNOX genes: red is the lowest, black is the middle, green is the
highest.


植株的根毛、播种120小时后植株的根毛、根瘤、茎
顶端分生组织、花、绿色果荚、叶片、根和根尖(图
6)。如图6所示, 大豆KNOX基因的表达模式与其系统
发生呈现出一定的关联性。GmKNOX I类基因较为集
中在茎顶端分生组织中表达, 其中GmKNOX I B类基
因还在根尖中有较高的表达。GmKNOX II类基因表达
比较广泛 , 在除根尖外的其它部位均有表达 ;
GmKNOX II A类基因在播种84小时后植株的根毛、
播种120小时后植株的根毛、根瘤、花、叶片和根中
均有不同程度的表达, 而在根尖、茎顶端分生组织和
绿色果荚中表达较弱; GmKNOX II B类基因在茎顶端
分生组织、花和叶中均有较高的表达。
2.6 讨论
目前有关大豆KNOX基因的研究较少 , 仅有Liu等
(2008)研究了大豆KNOX基因GmKNT1 (GmKNOX3)
的功能, 证明GmKNT1主要在根、茎、花和未成熟的
种子中表达, 且其表达受IAA、ABA和JA诱导, 受GA
抑制, 过量表达GmKNT1可以影响植物的生长和发
育。近期研究发现, KNOX基因在豆科模式植物蒺藜
苜蓿(Medicago truncatula)中参与复叶的发育(Peng
et al., 2011)。本研究在大豆相关数据库中鉴定了27
个大豆KNOX基因, 数目多于拟南芥(8个)、玉米(13
个)、水稻(12个)和杨树(15个), 这反映出大豆作为古
四倍体的特征 (Mukherjee et al., 2009; Hay and
Tsiantis, 2010)。目前推测大豆基因组的复制至少发
生了2次, 一次大约是在5 900万年前, 另一次则可能
发生在1 300万年前, 由此引起了整个基因组的高度
重复。2次复制发生后紧接着出现了基因多样化和基
因丢失, 大量的染色体发生重排, 大豆的全基因测序
结果显示 , 约 75%的基因以多拷贝形式出现
(Schmutz et al., 2010; Severin et al., 2011)。与拟南
芥中的KNOX基因相比, GmKNOX II类家族成员的进
化途径可以比较清晰地分为2个分支, 而GmKNOX I
李方正等: 大豆 KNOX基因家族的结构和表达分析 245
类家族成员的进化历程则比较复杂, 经历了更多的基
因结构分化, 可能导致基因功能分化和新功能的产生
(Xu et al., 2012)。已有证据表明, KNOX基因的表达
方式与基因结构之间有较好的对应关系(Kerstetter et
al., 1994)。我们的研究结果也证实了这一现象。大豆
KNOX基因中I类基因和II类基因的表达方式不同: I类
KNOX基因主要在茎顶端分生组织(SAM)、根和花中
表达, 且表达量不高; 而II类KNOX基因则有更广泛
的时空表达。这与其它物种中的KNOX基因表达方式
相一致, 表明KNOX基因在功能上可能具有高度的保
守性(Hay et al., 2010; Woody et al., 2011)。对大豆
KNOX基因表达水平的分析表明, 两类大豆KNOX基
因的表达水平和表达范围与各自基因结构上的分化
程度相对应, 表达量低且表达范围小的I类KNOX基
因, 较表达量高且表达范围广的II类KNOX基因表现
出更显著的变异。这些都与系统发育分析的结果相一
致(图2, 图6)。
目前, 随着对KNOX基因研究的不断深入, 越来
越多的与其相互作用的基因被鉴定, 新型缺失同源异
型盒结构域的KNATM基因被发现 (Magnani and
Hake, 2008), KNOX I与多种激素间调控关系的研究
也越来越多(李春苑等, 2009; Hay et al., 2010)。相信
对大豆KNOX基因家族的结构和表达分析, 将有助于
揭示不同物种中KNOX基因的起源和进化关系。
KNOX I类基因在植物中主要在分生组织中表达, 而
分生组织是所有器官发生进程的源泉, 决定植物的最
终形态。细胞命运的改变使植物的构型、器官形态、
维管发育以及发育进程发生强烈的变化, 因此深入了
解大豆中KNOX基因的功能, 将为研究大豆株型和叶
型发育相关的重要农艺性状奠定重要基础。
参考文献
郭安源, 朱其慧, 陈新, 罗静初 (2007). GSDS: 基因结构显
示系统. 遗传 8, 1023–1026.
李春苑, 阮美煜, 贾海燕, 王崇英 (2009). 同源异型盒基因I
类KNOX的表达调控及在植物形态建成中的作用. 细胞生
物学杂志 (5), 635–640.
王慧, 高中杰, 张丹, 程浩, 喻德跃 (2011). 应用关联分析鉴
定大豆对斜纹夜蛾的抗性基因. 植物学报 46, 514–524.
Astell CR, Ahlstrom-Jonasson L, Smith M, Tatchell K,
Nasmyth KA, Hall BD (1981). The sequence of the DNAs
coding for the mating-type loci of Saccharomyces cere-
visiae. Cell 27, 15–23.
Billeter M, Qian YQ, Otting G, Muller M, Gehring W,
Wüthrich K (1993). Determination of the nuclear mag-
netic resonance solution structure of an Antennapedia
homeodomain-DNA complex. J Mol Biol 234, 1084–1097.
Bürglin TR (2003). The homeobox genes of Encephalito-
zoon cuniculi (Microsporidia) reveal a putative mat-
ing-type locus. Dev Genes Evol 213, 50–52.
Chen H, Rosin FM, Prat S, Hannapel DJ (2003). Interacting
transcription factors from the three-amino acid loop ex-
tension superclass regulate tuber formation. Plant Physiol
132, 1391–1404.
Finn RD, Mistry J, Tate J, Coggill P, Heger A, Pollington
JE, Gavin OL, Gunasekaran P, Ceric G, Forslund K,
Holm L, Sonnhammer EL, Eddy SR, Bateman A (2010).
The Pfam protein families database. Nucleic Acids Res
38, D211–D222.
Gehring WJ, Affolter M, Burglin T (1994). Homeodomain
proteins. Annu Rev Biochem 63, 487–526.
Hamant O, Pautot V (2010). Plant development: a TALE
story. C R Biol 333, 371–381.
Hay A, Tsiantis M (2010). KNOX genes: versatile regulators
of plant development and diversity. Development 137,
3153–3165.
Kerstetter R, Vollbrecht E, Lowe B, Veit B, Yamaguchi J,
Hake S (1994). Sequence analysis and expression pat-
terns divide the maize knotted1-like homeobox genes into
two classes. Plant Cell 6, 1877–1887.
Larkin MA, Blackshields G, Brown NP, Chenna R,
McGettigan PA, McWilliam H, Valentin F, Wallace IM,
Wilm A, Lopez R, Thompson JD, Gibson TJ, Higgins
DG (2007). Clustal W and Clustal X version 2.0. Bioin-
formatics 23, 2947–2948.
Li EY, Bhargava A, Qiang WY, Friedmann MC, Forneris
N, Savidge RA, Johnson LA, Mansfield SD, Ellis BE,
Douglas CJ (2012). The Class II KNOX gene KNAT7
negatively regulates secondary wall formation in Arabi-
dopsis and is functionally conserved in Populus. New
Phytol 194, 102–115.
Li EY, Wang SC, Liu Y, Chen JG, Douglas CJ (2011).
OVATE FAMILY PROTEIN4 (OFP4) interaction with
KNAT7 regulates secondary cell wall formation in Arabi-
dopsis thaliana. Plant J 67, 328–341.
Libault M, Farmer A, Joshi T, Takahashi K, Langley RJ,
Franklin LD, He J, Xu D, May G, Stacey G (2010). An
246 植物学报 47(3) 2012
integrated transcriptome atlas of the crop model Glycine
max, and its use in comparative analyses in plants. Plant
J 63, 86–99.
Liu J, Ha D, Xie ZM, Wang CM, Wang HW, Zhang WK,
Zhang JS, Chen SY (2008). Ectopic expression of soy-
bean GmKNT1 in Arabidopsis results in altered leaf
morphology and flower identity. J Genet Genomics 35,
441–449.
Magnani E, Hake S (2008). KNOX lost the OX: the Arabi-
dopsis KNATM gene defines a novel class of KNOX trans-
criptional regulators missing the homeodomain. Plant Cell
20, 875–887.
Mallo M, Wellik DM, Deschamps J (2010). Hox genes and
regional patterning of the vertebrate body plan. Dev Biol
344, 7–15.
McGinnis W, Garber RL, Wirz J, Kuroiwa A, Gehring WJ
(1984a). A homologous protein-coding sequence in Dro-
sophila homeotic genes and its conservation in other
metazoans. Cell 37, 403–408.
McGinnis W, Levine MS, Hafen E, Kuroiwa A, Gehring
WJ (1984b). A conserved DNA sequence in homoeotic
genes of the Drosophila Antennapedia and bithorax com-
plexes. Nature 308, 428–433.
Mukherjee K, Brocchieri L, Bürglin TR (2009). A com-
prehensive classification and evolutionary analysis of
plant homeobox genes. Mol Biol Evol 26, 2775–2794.
Peng JL, Yu JB, Wang HL, Guo YQ, Li GM, Bai GH, Chen
RJ (2011). Regulation of compound leaf development in
Medicago truncatula by fused compound leaf1, a class M
KNOX gene. Plant Cell 23, 3929–3943.
Schmutz J, Cannon SB, Schlueter J, Ma JX, Mitros T,
Nelson W, Hyten DL, Song QJ, Thelen JJ, Cheng JL,
Xu D, Hellsten U, May GD, Yu Y, Sakurai T, Umezawa
T, Bhattacharyya MK, Sandhu D, Valliyodan B,
Lindquist E, Peto M, Grant D, Shu SQ, Goodstein D,
Barry K, Futrell-Griggs M, Abernathy B, Du JC, Tian Z,
Zhu LC, Gill N, Joshi T, Libault M, Sethuraman A,
Zhang XC, Shinozaki K, Nguyen HT, Wing RA, Cregan
P, Specht J, Grimwood J, Rokhsar D, Stacey G,
Shoemaker RC, Jackson SA (2010). Genome sequence
of the palaeopolyploid soybean. Nature 463, 178–183.
Schuster-Böckler B, Schultz J, Rahmann S (2004). HMM
Logos for visualization of protein families. BMC Bioinfor-
matics 5, 7.
Severin AJ, Cannon SB, Graham MM, Grant D, Shoe-
maker RC (2011). Changes in twelve homoeologous
genomic regions in soybean following three rounds of
polyploidy. Plant Cell 23, 3129–3136.
Tamura K, Peterson D, Peterson N, Stecher G, Nei M,
Kumar S (2011). MEGA5: molecular evolutionary gene-
tics analysis using maximum likelihood, evolutionary dis-
tance, and maximum parsimony methods. Mol Biol Evol
28, 2731–2739.
Vollbrecht E, Veit B, Sinha N, Hake S (1991). The devel-
opmental gene Knotted-1 is a member of a maize ho-
meobox gene family. Nature 350, 241–243.
Williams RW (1998). Plant homeobox genes: many
functions stem from a common motif. Bioessays 20, 280–
282.
Woody JL, Shoemaker RC (2011). Gene expression: sizing
it all up. Front Genet 2, 70–70.
Xu GX, Guo CC, Shan HY, Kong HZ (2012). Divergence of
duplicate genes in exon-intron structure. Proc Natl Acad
Sci USA 109, 1187–1192.

李方正等: 大豆 KNOX基因家族的结构和表达分析 247
Structure and Expression Analysis of KNOX Gene
Family in Soybean
Fangzheng Li, Suxin Yang*, Chunxia Wu, Haichao Wei, Ruilian Qu, Xianzhong Feng
Key Laboratory of Systems Biology in Universities of Shandong, College of Life Sciences, Shandong Normal University,
Jinan 250014, China
Abstract KNOX family genes, coding homeobox proteins, play an important role in plant development. We investigated
soybean KNOX family genes with genome database analysis and bioinformatics. Phylogenetic analysis characterized 2
classes of GmKNOX genes: GmKNOX I with 3 sub-classes and GmKNOX II with 2. In total, 26 GmKNOX genes distribute
in 16 chromosomes of soybean, and GmKNOX27 could not be located in any chromosome. Whole-genome expression
analysis revealed class I GmKNOX genes mainly expressed in meristematic tissues and class II GmKNOX genes broadly
expressed in different tissues.
Key words expression profiles, gene structure, KNOX gene family, soybean
Li FZ, Yang SX, Wu CX, Wei HC, Qu RL, Feng XZ (2012). Structure and expression analysis of KNOX gene family in
soybean. Chin Bull Bot 47, 236–247.
———————————————
* Author for correspondence. E-mail: suxinyang@yahoo.com.cn
(责任编辑: 白羽红)