全 文 :分子植物育种,2015年,第 13卷,第 7期,第 1623-1630页
Molecular Plant Breeding, 2015, Vol.13, No.7, 1623-1630
研究报告
Research Report
十字花科植物 SOM基因的鉴定及分析
陶鹏 钟新民 * 李必元 王五宏 岳智臣 雷娟利
浙江省农业科学院蔬菜研究所,杭州, 310021
*通讯作者, zhongxm@mail.zaas.ac.cn
摘 要 SOMNUS (SOM)基因编码一个 CCCH型锌指蛋白,是 PHYTOCHROME INTERACTING FACTO-
R3-LIKE5 (PIL5)下游的关键负调控因子,参与调控种子的萌发。本研究从十字花科 12个物种的全基因组
数据库中鉴定了 17个 SOM基因,其中芸薹属物种白菜、甘蓝和甘蓝型油菜中均包含 2个及以上的 SOM
基因。预测这 17个 SOM蛋白的等电点和分子量,结果显示 LaSOM蛋白明显不同于其他的 SOM蛋白。氨
基酸序列比对显示 LaSOM蛋白缺失了部分氨基酸序列,但所有的 SOM蛋白均包含保守的 3个锌指基
序,其中 2个 CCCH型的锌指基序。对这些 SOM基因的组织结构进行分析,结果显示:只有 LaSOM基因
存在一个内含子,其他 SOM基因均没有内含子,暗示 LaSOM基因在进化过程中获得了内含子,并导致
LaSOM蛋白缺失部分序列。启动子分析显示每个 SOM基因起始密码子上游 1 000 bp的启动子中至少有
2个 E-box元件。白菜 RNA-seq数据显示 BrSOM1在根、茎、叶、花和角果中均不表达,仅在胚胎发育阶段
的早期子叶胚和成熟胚中有表达。而 BrSOM2在根、茎、叶和花中均有表达,BrSOM2在胚胎发育阶段中的
表达类似于 BrSOM1,只是在表达水平上比 BrSOM1低。研究结果可为深入研究 SOM基因奠定基础。
关键词 十字花科, SOM,启动子,进化,基因表达
Identification and Analysis of SOM Gene of Brassicaceae
Tao Peng Zhong Xinmin * Li Biyuan Wang Wuhong Yue Zhichen Lei Juanli
Institute of Vegetables, Zhejiang Academy of Agricultural Sciences, Hangzhou, 310021
* Corresponding author, zhongxm@mail.zaas.ac.cn
DOI: 10.13271/j.mpb.013.001623
Abstract SOMNUS (SOM) gene encodes a CCCH-type zinc finger protein, which is a key downstream negative
regulator of PHYTOCHROMEINTERACTING FACTOR3-LIKE5 (PIL5) and involves in the regulation of seed
germination. This study identified 17 SOM genes from the genomes of 12 Brassicaceae species. Each of Brassica
rapa, B. oleracea and B. napus from Brassica had at least 2 SOM genes. Molecular weight (MW) and isoelectric point
(pI) of the 17 SOM proteins were predicted by bioinformatics, showing that LaSOM protein was significantly
different from the other SOM proteins both in molecular weight and isoelectric point. Amino acid sequence
alignment showed that LaSOM protein missed a part of amino acid sequence. However, all of the 17 SOM proteins
had three conserved zinc finger motifs, including 2 CCCH-type zinc finger motifs. Gene structure analysis of 17
SOM genes indicated that one intron existed in LaSOM gene, while, no intron was present in the rest SOM genes.
The result suggested that the LaSOM gene could gain one intron during the evolutionary process, causing lack of
partial amino acid sequence in LaSOM protein. Promoter sequence analysis demonstrated that each SOM gene had
at least 2 E-box elements in promoter of 1 000 bp upstream of initiation codon. Based on RNA-seq data of B. rapa,
BrSOM1 was not expressed in roots, stems, leaves, flowers and siliques, but in early cotyledon embryo and mature
收稿日期:2015-02-04 接受日期:2015-03-06 网络出版日期:2015-05-20
URL: http://www.biopublisher.cn/index.php/mpbopa/article/view/3006
基金项目:本研究由国家自然科学基金项目(31301788; 31372058)、浙江省农业新品种选育重大科技专项(2012C12903-3-8;
2012C12903-6-2)和浙江省农业科学院重点实验室项目共同资助
分子植物育种
Molecular Plant Breeding
锌指结构是由半胱氨酸以及组氨酸构成,并通
过锌离子形成四面体的空间结构。具有锌指结构的
蛋白称为锌指蛋白。锌指蛋白能通过与蛋白质、DNA
或 RNA结合参与基因表达调控,是真核生物中普遍
存在的重要转录因子。在动物、植物和酵母中均发现
有锌指蛋白的存在(Wang et al., 2008)。根据结合锌离
子的氨基酸的种类及排列,锌指蛋白可分成多种。
CCCH类型锌指蛋白是锌指蛋白中的大家族,由 1~6
个 CCCH类型(CX6-14-C-X4-5-C-X3-H)的蛋白基序构
成(Berg and Shi, 1996)。全基因组范围内研究显示:
拟南芥和水稻中分别有 68和 67个 CCCH型的锌指
结构(Wang et al., 2008)。基于系统树,拟南芥可分为
11个亚家族,而水稻可分为 8个亚家族(Wang et al.,
2008)。对于 CCCH类型的锌指蛋白的研究主要集中
在动物这一方面,对植物 CCCH类型的锌指蛋白的
研究较少。近年来,随着多种植物全基因组测序工作
的完成以及分子生物学水平的发展,研究人员发现
CCCH类型锌指蛋白广泛参与植物生长发育的调控
以及植物对生物和非生物胁迫响应。在拟南芥中,
HUA1基因被证实是一个 RNA结合蛋白,参与了开
花调控(Li et al., 2001)。PEI1是一个胚胎特异表达
CCCH锌指蛋白,在拟南芥胚胎的顶端分生区中有
着重要的作用(Li and Thomas, 1998)。SOM基因是
CCCH类型锌指蛋白家族中的成员,包含了一个典
型的 CCCH型锌指基序(CX8CX5CX3H),参与了依赖
光照的种子萌发。SOM基因敲除后会导致 ABA和
GA代谢基因的转录表达发生变化,从而引起 ABA
水平的下降和 GA水平的上升。在拟南芥中,SOM
基因特异表达在种子中,随 ABA升高而上调,随 GA
升高而下调。研究结果显示 SOM 基因参与了由
ABA和 GA介导的种子发育、休眠和萌发的调控
(Kim et al., 2008)。
十字花科(Brassicaceae)植物广泛分布于世界各
地,约有 338个属和 3700个种(Al-Shehbazet al., 2006)。
十字花科植物与人类的生活密切相关,其中的白菜
类、甘蓝类、芥菜类等蔬菜作物具有重要的经济价
值。此外,十字花科植物也是重要的研究材料,比如
拟南芥作为模式植物被深入研究;荠菜是研究适应
性分子机制的好材料;芸薹属植物是研究植物多倍
化的模式材料;对于进化过程中发生多倍化的白菜
embryo of the embryonic stage. However, BrSOM2 was expressed in roots, stems, leaves and flowers. In
embryonic development, the expression profile of BrSOM2 was similar to that of BrSOM1, while, BrSOM2 showed
lower expression level than BrSOM1. The results can lay the foundation for further research on SOM genes.
Keywords Brassicaceae, SOM, Promoter, Evolution, Gene expression
和甘蓝来说,其家族基因的成员的扩大和丢失也是
最近研究的热点(黄小云等, 2014)。最近越来越多的
十字花科植物全基因组测序工作已经完成,比如早
期测序的拟南芥(Arabidopsis Genome Initiative, 2000)
以及近几年测序的白菜(Wang et al., 2011)和甘蓝(Liu
et al., 2014)等。目前十字花科有 12个物种的基因组
数据能从公共数据库 Brassica Database (http://bras-
sicadb.org/brad/index.php)中获得。全基因组数据为我
们提供了研究十字花科物种 SOM基因的机会。尽管
对拟南芥 SOM基因的研究已经开始,但对其他十字
花科植物中的 SOM基因的分布和进化并不清楚。此
外,许多有关 SOM基因的问题还没有解决,比如,每
个物种中有多少 SOM基因?芸薹属植物 SOM基因
数量上有没有扩大?这些 SOM 基因的启动子如何
呢?SOM基因在进化过程有没有发生一些变化?这
些问题都是亟待解决的。本研究正是基于上述研究
现状,开展了十字花科植物 SOM基因的研究。
本研究首先对十字花科 12个物种的 SOM基因
进行了鉴定,并通过对 SOM基因的定位、蛋白特性、
进化关系、基因组织结构、启动子基序以及基因表达
进行比较研究,旨在对 SOM蛋白的进化特点以及生
物学功能进行剖析,为后续的深入研究提供基础数据。
1结果与分析
1.1十字花科植物 SOM基因的识别及定位
利用拟南芥的 SOM 基因序列在公共数据库
Brassica Database 上进行检索,结合共线性基因分
析,找到了 12十字花科个物种的 17个 SOM基因
(表 1)。分析这些 SOM蛋白的氨基酸数量和蛋白质
特性,结果显示:大多数 SOM蛋白的氨基酸数量在
370~400 之间,等电点在 7.5~9.0 之间,分子量在
40~45 kD之间(图 1)。其中 LaSOM蛋白在氨基酸数
量、等电点和分子量上均明显偏离上述值,暗示 La-
SOM蛋白可能在进化过程中发生明显变化。除了
LaSOM基因存在一个内含子外,其余十字花科植物
的 SOM基因均不存在内含子(表 1)。芸薹属植物在
进化过程中发生了 3倍化,因此芸薹属植物存在 3个
亚基因组(LF, MF1和MF2)。分析芸薹属 SOM基因
在亚基因组中的分布,结果显示:芸薹属 SOM1基因
均定位在 LF上,SOM2基因定位在MF1上(表 1)。
1624
表 1来自 12个十字花科物种的 17个 SOM基因的名称、基因编号、基因定位以及内含子情况
Table 1 Name, ID, location and intron of the 17 SOM genes from 12 Brassicaceae species
基因名称
Gene name
AtSOM
BrSOM1 a
BrSOM2 b
BoSOM1 a
BoSOM2 b
SpSOM
AlSOM
LaSOM
CrSOM
SiSOM
AaSOM
ThSOM
BnASOM1 a
BnASOM2 b
BnCSOM1 a
BnCSOM2 b
CsSOM
物种
Species
拟南芥
Arabidopsis thaliana
白菜
Brassica rapa
白菜
Brassica rapa
甘蓝
Brassica oleracea
甘蓝
Brassica oleracea
条叶蓝芥
Schrenkiella parvula
琴叶拟南芥
Arabidopsis lyrata
Leavenworthia alabamica
荠菜
Capsella rubella
水蒜芥
Sisymbrium irio
Aethionema arabicum
盐芥
Thellungiella halophila
甘蓝型油菜
Brassica napus
甘蓝型油菜
Brassica napus
甘蓝型油菜
Brassica napus
甘蓝型油菜
Brassica napus
亚麻荠
Camelina sativa
基因编号
Gene ID
AT1G03790
Bra015264
Bra030542
Bol040844
Bol011623
c0001_00230
fgenesh2_kg.1_307_AT1G03790
LA_scaffold64_5
Carubv10011207m
SI_scaffold2411_43
AA_scaffold3097_27
Thhalv10007884m
GSBRNA2T00150332001
GSBRNA2T00089642001
GSBRNA2T00002710001
GSBRNA2T00145340001
Csa03g004920
基因定位
Gene location
Chr1(+): 954525...956097
Chr10(-): 2332308...2333480
Chr8(-): 20629078...20630277
Chr5(+): 941042...942220
Chr8(-): 2948945...2950111
Chr1(+): 877852...879030
Chr1(+): 1157234...1158821
LA_scaffold64(-): 12738...13807
Sca1(+): 1001227...1002411
SI_scaffold2411(+): 143759...144928
AA_scaffold3097(-): 117062...118174
scaffold_5(-): 14670094...14671260
ChrA10(+): 1138164...1139336
ChrA08(+): 18336484...18337683
chrC05(+): 1001720...1002904
chrC08(+): 288204...289679
Chr3(+): 1294455...1296326
内含子
Intron
No
No
No
No
No
No
No
Yes
No
No
No
No
No
No
No
No
No
注: a:定位在 LF亚基因组; b:定位在MF1亚基因组; Yes:存在内含子; No:不存在内含子
Note: a: The location in LF subgenome; b: The location in MF1 subgenome; Yes: The gene has an intron; No: The gene has no intron
1.2十字花科植物 SOM蛋白锌指结构分析
在分析 17个 SOM蛋白的等电点和分子量时,
发现 LaSOM蛋白明显不同于其他 SOM蛋白。因此,
本研究使用 ClustalX对 17个 SOM的氨基酸序列进
行比对,结果显示相比于其他 SOM蛋白,LaSOM蛋
白的氨基酸序列上有部分缺失(图 2),并发现 LaSOM
基因的内含子正好位于氨基酸序列的缺失部位。为
了显示这些植物 SOM蛋白有没有缺失重要的锌指
结构,本研究比对了这些 SOM蛋白的锌指结构的氨
基酸序列,发现所有的 17个 SOM蛋白均包含 3个锌
指结构(ZF1, ZF2和 ZF3)。ZF1锌指基序为 CX5HX4-
CX3H,ZF2锌指基序为 CX8CX5CX3H,ZF3锌指基序
为 CX5CX4CX3H。十字花科植物 17个 SOM蛋白的 3
个锌指结构完全一致(图 3)。
1.3十字花科 SOM蛋白的系统发育进化分析
为研究这些SOM蛋白系统发育进化关系,本研
十字花科植物 SOM基因的鉴定及分析
Identification and Analysis of SOM Gene of Brassicaceae 1625
分子植物育种
Molecular Plant Breeding
图 1十字花科 12个物种 17个 SOM蛋白的等电点以及分子量
Figure 1 Putative pI and MW of 17 SOM proteins from 12 Bras-
sicaceae species
图 2十字花科 12个物种的 17个 SOM蛋白的氨基酸序列比对
注:星号表示一致的氨基酸;一个或两个点表示类似的氨基
酸;灰色背景表示 LaSOM蛋白的氨基酸序列的缺失部分;黑
色三角表示内含子的插入位置
Figure 2 Multiple sequence alignment of the 17 SOM proteins
from 12 Brassicaceae species
Note: Asterisks indicate identical amino acid residues; One or
two dots indicate similar amino acid residues; Gray background
represents fragment loss in LaSOM protein; The intron of LaSOM
gene is represented by black rectangle
究采用 MEGA5.2 (Tamura et al., 2011)软件,通过邻
接法构建了 SOM系统发育进化树。结果显示:芸薹
属中的白菜和甘蓝中分别包含 2个 SOM蛋白,而甘
蓝型油菜中包含 4个 SOM蛋白;而在其他物种中,
每个物种中均只有一个 SOM蛋白。所有来自芸薹属
的 SOM蛋白聚在一支,而来自于芸薹属 LF亚基因
组的 SOM1基因和来自于芸薹属 MF1亚基因组的
SOM2基因分别聚成一小支;ThSOM、SpSOM和 Si-
SOM与芸薹属的 SOM蛋白的亲缘关系更近;而 At-
SOM、AlSOM、LaSOM、CrSOM 和 CsSOM 聚在一
起;AaSOM单独成支(图 4)。
1.4十字花科植物 SOM基因结构启动子分析
本研究从公共数据库中下载了十字花科 12个
物种 17 个 SOM 基因起始密码子上游 1 000 bp 的
DNA 序列。识别并分析这些 SOM 基因的 E-box
(5-CCNNTG-3)的数量以及分布,结果显示所有这
些 SOM 基因的起始密码子上游 1 000 bp 的启动子
区域至少存在 2个 E-box元件。绝大部分 E-box定
位在-200 bp上游区域,其中在-300~-400 bp区域
有着最高密度的 E-box元件(图 5)。
1.5白菜 SOM基因的基因表达
本研究从 NCBI数据库和已发表的 SCI论文中
获得白菜 SOM基因的转录组测序数据,分析白菜两
个 SOM基因的表达情况。结果显示:在器官表达中,
两个旁系同源基因 BrSOM1和 BrSOM2在转录表达
上差异明显(图 6)。BrSOM1在根、茎、叶、花和角果中
均不表达,而 BrSOM2则在根、茎、叶和花中均有表
达,其中在根中的表达最高,而在角果中没有表达。
在白菜的胚胎发育过程中,BrSOM1和 BrSOM2表达
谱上比较类似,只是两者在表达水平上有显著差异。
BrSOM1和 BrSOM2均在白菜的胚胎发育过程中显
示了明显的上升调控,在早期子叶胚中显示了最高
表达,然后开始下降(图 7)。
2讨论
在本研究中,我们从十字花科 12个物种中鉴定
了 17个 SOM基因。芸薹属的白菜和甘蓝分别包含
了 2个 SOM基因,而甘蓝型油菜则有 4个 SOM基
因。在其他物种中,均只有 1个 SOM基因(表 1)。芸
薹属的白菜、甘蓝和甘蓝型油菜的 SOM基因的数量
多于其他物种,可能与芸薹属祖先进化过程中经历
的基因组三倍化有关(Cheng et al., 2013)。而白菜和
甘蓝各有 2个 SOM基因,数量上少于 3个,说明芸
薹属 SOM基因在基因组三倍化过程中伴随着 SOM
基因的丢失(Wang et al., 2011; Cheng et al., 2012)。在
分析亚基因组的定位时,发现白菜和甘蓝的 BoSOM1
和 BoSOM1定位在 LF亚基因组上,BrSOM2和 BoS-
OM2定位在MF1亚基因组上,MF2亚基因组上不存
在 SOM基因,说明其在进化过程中丢失了。
分析 SOM蛋白的分子量和等电点时,发现 La-
SOM蛋白的等电点和分子量与其他的 SOM蛋白明
显不同(图 1)。在分析 SOM基因结构中发现 LaSOM
基因存在一个内含子,而且内含子正好定位于氨基
酸序列缺失部位(图 2),暗示 LaSOM 基因内含子的
获得导致了氨基酸序列的缺失。以前的研究结果显
示植物在进化过程中更倾向于丢失内含子,获得内
1626
图 3十字花科 12个物种的 17个 SOM蛋白的氨基酸序列比对显示锌指基序(ZF1, ZF2, ZF3)
注:星号表示相同的氨基酸;一个或两个点表示类似的氨基酸;锌指基序中保守一致的氨基酸用黑色背景标记
Figure 3 Multiple alignment of the 17 SOM proteins from 12 Brassicaceae species for three zinc finger motifs (ZF1, ZF2, and ZF3)
Note: Asterisks indicate identical amino acid residues; One or two dots indicate similar amino acid residues; Conserved Cys and His
residues of zinc finger motifs are marked by black background
图 4基于十字花科 12个物种的 17个 SOM蛋白的氨基酸序
列构建系统进化树
注:重复抽样 1 000次以获取自展值,自展值标记在分支上;
Br:白菜; Bo:甘蓝; Bn:甘蓝型油菜; At:拟南芥; Al:琴叶拟南
芥; Cr:荠菜; Cs:亚麻荠; Aa: Aethionema arabicum; Si:水蒜芥;
La: Leavenworthia alabamica; Th:盐芥; Sp:条叶蓝芥
Figure 4 Phylogenetic tree based on amino acid sequence of 17
SOM proteins from 12 Brassicaceae species
Note: Bootstrap value by repeating the sampling 1 000 times to
obtain, and numbers above the branches indicate bootstrap value;
Br: B. rapa; Bo: B. oleracea; Bn: B. napus; At: A. thaliana; Al: A.
lyrata; Cr: Capsella rubella; Cs: Camelina sativa; Aa: Aethionema
arabicum; Si: Sisymbrium irio; La: Leavenworthia alabamica; Th:
Thellungiella halophila; Sp: Schrenkiella parvula
含子的概率明显低于丢失内含子的概率(Roy and Pen-
ny, 2007)。随着植物的进化,SOM蛋白在序列上或多
或少的发生了变化,但这些 SOM蛋白均包含 3个高
度保守的锌指结构基序。
随着白菜基因组的测序,白菜的转录组测序数
据也越来越多。因此我们能够从 NCBI数据库和已
发表的文献中下载获得转录组测序原始数据,从而
分析白菜 SOM基因的转录本水平的表达(Tong et al.,
2013; Zhang et al., 2014)。结果显示 BrSOM1表达在
根、茎、叶和花器官中,并且在根中显示了最高的表
达。然而 BrSOM2则在根、茎、叶、花和角果中均没有
表达(图 6)。BrSOM1和 BrSOM2两个旁系同源基因
在转录表达水平上差异明显,这可能与进化过程中
启动子发生变化相关。在分析甘蓝旁系同源基因
BoKIN1和 BoKIN2的表达时,这两个旁系同源基因
在表达上也出现明显变化(Tao et al., 2014)。在拟南
芥中,AtSOM基因特异表达在种子,而在其他器官中
几乎没有表达(Kim et al., 2008)。而在白菜胚胎发育
表达中,BrSOM1和 BrSOM2在球形胚和心形胚中均
没有表达,在早期子叶胚中有最高表达。BrSOM1和
BrSOM2表达类似,只是在表达水平上有差异(图 7)。
在荠菜中,SOM基因也在后期胚胎中显示较高表达
(Tao and Wang, 2012)。在拟南芥中,SOM基因突变
后会导致 ABA水平的降低和 GA水平的上升。后来
研究发现 SOM基因是 PIL5基因的下游基因,参与
了调控 ABA和 GA代谢基因以及 GA的响应。为了
十字花科植物 SOM基因的鉴定及分析
Identification and Analysis of SOM Gene of Brassicaceae 1627
分子植物育种
Molecular Plant Breeding
图 5十字花科 12个物种的 17个 SOM基因结构启动子
注:菱形表示 E-box
Figure 5 Promoter analysis of 17 SOM gene structure from 12 species of Brassicaceae
Note: The rhombus represents E-box
显示 SOM基因表达与其启动子基序的关系,我们也
分析了这些 SOM基因起始密码子 ATG上游 1 000 bp
的启动子基序,显示所有的 SOM基因至少存在 2个
E-box启动子。在拟南芥种子萌发吸水期间,ABI3和
PIL5蛋白能够共同协作直接结合到 E-box基序上,
从而能够激活下游基因的表达,比如 RGA、GAI和
SOM (Park et al., 2011)。SOM基因参与了植物种子
的休眠与萌发的调控信号通路。
3材料与方法
3.1 SOM基因序列的获得
首先从 NCBI数据库中下载获得拟南芥的 SOM
基因(AT1G03790)序列,然后使用拟南芥的 SOM基
因序列在公共数据库 Brassica Database (http://brassi-
cadb.org/brad/index.php)中进行检索。获得白菜(Bra-
ssica rapa)、甘蓝(B. oleracea)、甘蓝型油菜(B. napus)、琴
叶拟南芥(Arabidopsis lyrata)、荠菜(Capsella rubella)、水
蒜芥(Sisymbrium irio)、Aethionema arabicum、Leaven-
worthia alabamica、盐芥(Thellungiella halophila)、条叶
蓝芥(Schrenkiella parvula)和亚麻荠(Camelina sativa)
的 SOM基因序列,同时记录每个 SOM基因的登录
号以及 SOM基因的定位,收集在表 1中。使用 syn-
tenic genes分析十字花科这些 SOM基因的共线性关
系,记录芸薹属物种每个 SOM基因在亚基因组中的
分布(LF, MF1和MF2)。
3.2 SOM蛋白质特性分析及锌指结构分析
首先我们使用 Primer 5软件将所有 SOM基因
的核苷酸序列转化成氨基酸序列,然后使用 Prot-
1628
图 6白菜 BrSOM1和 BrSOM2基因在不同器官中的表达情况
注 : 白菜五个器官的表达数据从 NCBI 的 Gene Expression
Omnibus数据库中下载获得,收录号为 GSE43245
Figure 6 Gene expression of BrSOM1 and BrSOM2 in different
organs
Note: The expression values of BrSOM1 and BrSOM2 are down-
loaded from NCBI Gene Expression Omnibus (http://www.ncbi.
nlm.nih.gov/geo/) under accession no.GSE43245 from five Chi-
nese cabbage organs
图 7白菜 BrSOM1和 BrSOM2在胚胎发育过程中的四个阶段
的表达情况
注: BrSOM1和 BrSOM2基因在球形胚,心形胚,早期子叶型胚
和成熟胚中的表达数据来源于参考文献(Zhang et al., 2014)
Figure 7 Gene expression of BrSOM1 and BrSOM2 at the four
stages of embryo development
Note: The expression values of BrSOM1 and BrSOM2 in globular,
heart, early cotyledon embryo stages and mature embryo stage
are downloaded from recent publications (Zhang et al., 2014)
Param (http://web.expasy.org/protparam/)计算每个 SOM
蛋白的氨基酸数量、等电点和分子量。将 SOM蛋白
的等电点和分子量数据输入 Excel中,制作散点图。
使用 ClustalX (Thompson et al., 1997)将 SOM蛋白进
行比对,然后将锌指结构标记出来。
3.3序列比对和系统树分析
使用 ClustalX (Thompson et al., 1997)将获得白
菜、甘蓝、甘蓝型油菜和拟南芥等 SOM蛋白的氨基
酸序列进行比对,结果保存为 FASTA格式。然后使
用MEGA5.2 (Tamura et al., 2011),基于 Jones-Taylor-
Thornton substitution matrix 算法采用邻接法构建了
系统发育进化树。为了获得高质量的系统树,每颗系
统树都运行了 1 000次重复。
3.4 SOM基因启动子分析
首先我们从数据库中下载了每个 SOM基因起
始密码子上游 1 000 bp 的核苷酸序列,然后使用
Softberry软件(http://linux1.softberry.com/berry.phtml)
预测转录起始位点,然后用(5-CANNTG-3)序列作
为标准,找出 E-box基序。基于 Softberry预测的转录
起始位点,排除那些位于 SOM基因转录起始位点下
游的 E-box,然后记录每个 SOM基因中 E-box的定
位信息,然后使用 excel进行作图。
3.5白菜 SOM基因的表达
白菜全基因组已经测序,随后白菜器官表达
(Tong et al., 2013) 和胚胎发育的转录组测序工作
(Zhang et al., 2014)也已完成。我们从 NCBI数据库中
下载获得了白菜器官表达的转录组测序的原始数据
(登录号: GSE43245)。从最近的文献(Zhang et al., 2014)
的附件中下载获得了白菜胚胎发育过程的转录组测
序数据。从中找到 BrSOM1和 BrSOM2基因的转录组
测序数据,然后使用 Excel进行作图,其中横坐标为
生物样品,纵坐标为表达量。
作者贡献
陶鹏是本研究的实验设计和实验研究的执行
人,完成数据分析,论文初稿的写作;李必元、王五
宏、岳智臣和雷娟利参与实验设计,试验结果分析;
钟新民是项目的构思者及负责人,指导实验设计,数
据分析,论文写作与修改。全体作者都阅读并同意最
终的文本。
致谢
本研究受到国家自然科学基金项目(31301788,
31372058)、浙江省农业新品种选育重大科技专项
(2012C12903-3-8, 2012C12903-6-2)和浙江省农业
科学院重点实验室项目共同资助。
参考文献
Al-Shehbaz I .A., Beilstein M.A., and Kellogg E.A., 2006, Sys-
tematics and phylogeny of the Brassicaceae (Cruciferae): an
overview, Plant Syst. Evol., 259(2-4): 89-120
Arabidopsis Genome Initiative, 2000, Analysis of the genome se-
quence of the flowering plant Arabidopsis thaliana, Nature,
408(6814): 796-815
Berg J.M., and Shi Y., 1996, The galvanization of biology: a
growing appreciation for the role s of zinc, Science, 271
十字花科植物 SOM基因的鉴定及分析
Identification and Analysis of SOM Gene of Brassicaceae 1629
分子植物育种
Molecular Plant Breeding
(5252): 1081-1085
Cheng F., Mandáková T., Wu J., Xie Q., Lysak MA., and Wang
X., 2013, Deciphering the diploid ancestral genome of the
mesohexaploid Brassica rapa, Plant Cell, 25(5): 1541-1554
Cheng F., Wu J., Fang L., and Wang X., 2012, Syntenic gene
analysis between Brassica rapa and other Brassicaceae
species, Front. Plant Sci., 3: 198
Huang X.Y., Tao P., Wang W., Li B.Y., Yue Z.H., Lei J.L., and
Zhong X.M., 2014, Genome-wide analysis of heat shock
transcription factor families in Chinese cabbage and cab-
bage, Fenzi Zhiwu Yuzhong (Molecular Plant Breeding), 12
(2): 296-305 (黄小云,陶鹏,王五宏,李必元,岳智臣,雷娟
利,钟新民, 2014,大白菜和甘蓝热激转录因子基因家族
鉴定及比较分析,分子植物育种, 12(2): 296-305)
Kim D.H., Yamaguchi S., Lim S., Oh E., Park J., Hanada A.,
Kamiya Y., and Choi G., 2008, SOMNUS, a CCCH-Type
zinc finger protein in Arabidopsis, negatively regulates
light-dependent seed germination downstream of PIL5,
Plant Cell, 20(5): 1260-1277
Li J., Jia D., and Chen X., 2001, HUA1, a regulator of stamen
and carpel identities in Arabidopsis, codes for a nuclear
RNA binding protein, Plant Cell, 13(10): 2269-2281
Li Z., and Thomas T.L., 1998, PEI1, an embryo-specific zinc fin-
ger protein gene required for heart-stage embryo formation
in Arabidopsis, Plant Cell, 10(3): 383-398
Liu S., Liu Y., Yang X., Tong C., Edwards D., Parkin I.A.P.,
Zhao M., Ma J., Yu J., Huang S., Wang X., Wang J., Lu K.,
Fang Z., Bancroft I., Yang T.J., Hu Q., Wang X., Yue Z., Li
H., Yang L., Wu J., Zhou Q., Wang W., King G.J., Chris
Pires J., Lu C., Wu Z., Sampath P., Wang Z., Guo H., Pan S.,
Yang L., Min J., Zhang D., Jin D., Li W., Belcram H., Tu J.,
Guan M., Qi C., Du D., Li J., Jiang L., Batley J., Sharpe A.
G., Park B.S., Ruperao P., Cheng F., Espinosa Waminal N.,
Huang Y., Dong C., Wang L., Li J., Hu Z., Zhuang M.,
Huang Y., Huang J., Shi J., Mei D., Liu J., Lee T., Wang J.,
Jin H., Li Z., Li X., Zhang J., Xiao L., Zhou Y., Liu Z., Liu
X., Qin R., Tang X., Liu W., Wang Y., Zhang Y., Lee J.,
Kim H.H., Denoeud F., Xu X., Liang X., Hua W., Wang X.,
Wang J., Chalhoub B., and Paterson A.H., 2014, The Brassica
oleracea genome reveals the asymmetrical evolution of poly-
ploid genomes, Nat. Commun., 5: 3930
Park J., Lee N., Kim W., Lim S., and Choi G., 2011, ABI3 and
PIL5 collaboratively activate the expression of SOMNUS by
directly binding to its promoter in imbibed Arabidopsis
seeds, Plant Cell, 23(4): 1404-1415
Roy S.W., and Penny D., 2007, Patterns of intron loss and gain in
plants: intron-loss-dominated evolution and genome-wide
comparison of O. Sativa and A. thaliana, Mol. Biol. Evol.,
24(1): 171-181
Tamura K., Peterson D., Peterson N., Stecher G., Nei M., and
Kumar S., 2011, MEGA5: molecular evolutionary genetics
analysis using maximum likelihood, evolutionary distance,
and maximum parsimony methods, Mol. Biol. Evol., 28(10):
2731-2739
Tao P., and Wang J.B, 2012, Identification and characterization
of transcripts differentially expressed during embryogenesis
in Capsella bursapastoris, Biol. Plantarum, 56(3): 415-421
Tao P., Huang X., Li B., Wang W., Yue Z., Lei J., and Zhong X.,
2014, Comparative analysis of alternative splicing, alterna-
tive polyadenylation and the expression of the two KIN
genes from cytoplasmic male sterility cabbage (Brassica ole-
racea L. var. capitata L.), Mol. Genet. Genomics, 289 (3):
361-372
Thompson J.D., Gibson T.J., Plewniak F., Jeanmougin F., and
Higgins D.G., 1997, The Clustal_Xwindows interface: flexi-
ble strategies for multiple sequence alignment aided by qual-
ity analysis tools, Nucleic Acids Res., 25(24): 4876-4882
Tong C., Wang X., Yu J., Wu J., Li W., Huang J., Dong C., Hua
W., and Liu S., 2013, Comprehensive analysis of RNA-seq
data reveals the complexity of the transcriptome in Brassica
rapa, BMC Genomics, 14: 689
Wang D., Guo Y., Wu C., Yang G., Li Y., and Zheng C., 2008,
Genome-wide analysis of CCCH zinc finger family in Ara-
bidopsis and rice, BMC Genomics, 9: 44
Wang X., Wang H., Wang J., Sun R., Wu J., Liu S., Bai Y., Mun
J., Bancroft I., Cheng F., Huang S., Li X., Hua W., Wang J.,
Wang X., Freeling M., Pires J.C., Paterson A.H., Chalhoub
B., Wang B., Hayward A., Sharpe A.G., Park B., Weisshaar
B., Liu B., Li B., Liu B., Tong C., Song C., Duran C., Peng
C., Geng C., Koh C., Lin C., Edwards D., Mu D., Shen D.,
Eleni S., Li F., Fraser F., Conant G., Lassalle G., King G.J.,
Bonnema G., Tang H., Wang H., Belcram H., Zhou H., Hi-
rakawa H., Abe H., Guo H., Wang H., Jin H., Parkin I.A.P.,
Batley J., Kim J., Just J., Li J., Xu J., Deng J., Kim J.A., Li
J., Yu J., Meng J., Wang J., Min J., Poulain J., Wang J.,
Hatakeyama K., Wu K., Wang L., Fang L., Trick M., Links
M.G., Zhao M., Jin M., Ramchiary N., Drou N., Berkman P.
J., Cai Q., Huang Q., Li R., Tabata S., Cheng S., Zhang S.,
Zhang S., Huang S., Sato S., Sun S., Kwon S., Choi S., Lee
T., Fan W., Zhao X., Tan X., Xu X., Wang Y., Qiu Y., Yin
Y., Li Y., Du Y., Liao Y., Lim Y., Narusaka Y., Wang Y.,
Wang Z., Li Z., Wang Z., Xiong Z., and Zhang Z, 2011, The
genome of the mesopolyploid crop species Brassica rapa,
Nat. Genet., 43(10): 1035-1039
Zhang Y., Peng L., Wu Y., Shen Y., Wu X., and Wang J., 2014,
Analysis of global gene expression profiles to identify differ-
entially expressed genes critical for embryo development in
Brassica rapa, Plant Mol. Biol., 86(4-5): 425-442
1630