全 文 :作物学报 ACTA AGRONOMICA SINICA 2016, 42(6): 832843 http://zwxb.chinacrops.org/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn
本研究由教育部新世纪优秀人才支持计划项目(NCET-12-1072), 国家自然科学基金项目(31360366)和新疆生产建设兵团博士基金项目
(2012BB007)资助。
This study was supported by the Program for New Century Excellent Talents in University of Ministry of Education of China
(NCET-12-1072), the National Natural Science Foundation of China (31360366), and Program for Doctor Foundation in XinJiang Production
and Construction Corps (2012BB007).
* 通讯作者(Corresponding author): 黄先忠, E-mail: xianzhongh106@163.com, Tel: 0993-2057262
第一作者联系方式: E-mail: zhangyn0513@163.com, Tel: 0993-2057262
Received(收稿日期): 2015-11-13; Accepted(接受日期): 2016-01-11; Published online(网络出版日期): 2016-03-14.
URL: http://www.cnki.net/kcms/detail/11.1809.S.20160314.1444.002.html
DOI: 10.3724/SP.J.1006.2016.00832
亚洲棉 bZIP蛋白家族的鉴定及 GaFD基因的组织表达分析
张彦楠 蔡大润 黄先忠*
石河子大学生命科学学院/植物基因组学实验室, 新疆石河子 832003
摘 要: 碱性亮氨酸拉链(basic leucine zipper, bZIP)是真核生物中数量最多并且最具多样性的转录因子之一, 参与植
物生长发育及响应生物和非生物胁迫。本研究利用亚洲棉(Gossypium arboreum)全基因组数据库, 通过生物信息学分
析分布在 13 条染色体上的 159 个 bZIP 家族基因的全序列。系统进化、基因结构和保守基序分析表明这些基因分成
13个亚家族。其中, A亚家族有 3个 GaFD基因 GaFD1、GaFD2和 GaFD3, 通过实时荧光定量 PCR分析 3个 GaFD
基因在不同组织中的表达, 结果表明 GaFD1和 GaFD2在 SAM中的表达量最高, GaFD3在茎中表达量最高。研究表
明棉花基因组中具有数量众多的 bZIP家族成员, 不同基因结构及 FD基因不同的表达特征表明 bZIP基因在棉花生长
发育中可能具有不同的功能, 这些结果为进一步解析棉花 bZIP家族基因的功能和作用机理积累了有价值的资料。
关键词: 碱性亮氨酸拉链; 亚洲棉; FD; 进化分析; 基因表达
Identification of bZIP Protein Family in Gossypium arboreum and Tissue Ex-
pression Analysis of GaFDs Genes
ZHANG Yan-Nan, CAI Da-Run, and HUANG Xian-Zhong*
Plant Genomics Laboratory / College of Life Sciences, Shihezi University, Shihezi 832003, China
Abstract: The basic leucine zipper (bZIP) is one of the largest and most diverse transcription factors in eukaryotes, and is in-
volved in various processes of plant growth and development and in response to biotic and abiotic stresses. In this study, 159 bZIP
family genes were identified and their complete gene sequences were obtained by using bioinformatics analysis method, based on
Gossypium arboreum whole genome database, and 159 bZIP genes were loaded on 13 chromosomes. The 159 bZIP genes were
categorized into 13 groups based on their phylogenetic relationships, gene structures and conserved motifs. In addition, three
GaFD homologous genes GaFD1, GaFD2, and GaFD3 were identified, which belongs to A subfamily in G. arboretum. The ex-
pression patterns of GaFD genes in different tissues were determined by using quantitative Real-time reverse transcription PCR
(qRT-PCR) method. The results showed that GaFD1 and GhFD2 were preferentially expressed in the shoot apical meristem
(SAM), whereas GaFD3 was preferentially expressed in stem. The results revealed that a number of bZIP family members exist in
cotton genome, and FD genes with different structures and expression patterns play different roles in the development of cotton,
which provides valuable information for dissecting the function and mechanism of bZIPs in cotton.
Keywords: Basic leucine zipper; Gossypium arboreum; FD; Phylogenetic analysis; Gene expression
在生物体中, 转录因子(TF)负责调控基因的表
达 , 碱性亮氨酸拉链(bZIP)转录因子是最大并且最
具多样性的转录因子家族之一。bZIP转录因子根据
它们共有的 bZIP 保守结构域而被命名。bZIP 结构
域由一个碱性区域和一个亮氨酸拉链区域组成, 包
含 60~80个氨基酸, 其中碱性区域具有一个含 18个
氨基酸残基的保守基序 N-x7-R/K-x9, 这个区域的
作用是参与细胞核定位和DNA结合; 亮氨酸拉链结
第 6期 张彦楠等: 亚洲棉 bZIP蛋白家族的鉴定及 GaFD基因的组织表达分析 833
构域的特征是每 7 个氨基酸的第 7 位含有一个亮氨
酸(Leu), 或者还含有其他疏水性氨基酸, 比如异亮
氨酸(Ile)、缬氨酸(Val)、苯丙氨酸(Phe)和甲硫氨酸
(Met), 该结构域参与 bZIP蛋白与 DNA结合之前的
二聚体化[1]。植物 bZIP蛋白能与含有 AGCT核心区
域的 DNA序列元件特异性结合, 并且优先与 G-box
(CACGTG)、C-box (GACGTC)和 A-box (TACGTA)
结合[2]。当 bZIP蛋白与 DNA序列相互作用时, 其碱
性结构域的 N 端插入 DNA 双链的大沟, 同时亮氨酸
拉链的 C端二聚体化而形成一个叠加的卷曲螺旋[3-4]。
随着更多真核生物基因组测序的完成, 越来越多物
种的 bZIP 转录因子家族已被鉴定或者预测[5-12]。但
在植物中只有很少一部分 bZIP 转录因子的功能被
确定。已有的研究表明植物 bZIP蛋白参与许多器官
和组织的分化、种子萌发[13]、花序及叶片的发育[14];
另一方面, bZIP 蛋白还参与信号传递和响应生物、
非生物刺激, 比如脱落酸(ABA)信号、渗透作用、组
织缺氧、干旱、高盐和冷胁迫[15], 以及病原体防御
等[16]; bZIP 蛋白也响应光效应, 并且参与光形态建
成[17]。
根据碱性结构域和其它保守基序的特征, 将拟
南芥的 75个 bZIPs基因划分为 A、B、C、D、E、F、
G、H、I和 S类 10个亚家族[9]。其中 A亚族中有少
部分 bZIPs 基因已被克隆, 如 ABF 和 AREB 主要在
ABA 和胁迫信号调控网络中发挥重要作用 [15,18];
ABI5 主要参与种子萌发和早期幼苗的发育[13,19]。A
亚家族中的 FD 基因对植物侧枝发育、花序形成和
开花起到重要作用[14,20]。拟南芥开花位点 T 控制基
因 FT 编码成花素(Florigen)蛋白, 成花素在叶片中
合成, 经过韧皮部到达顶端分生组织(SAM), 与在
SAM 产生的 FD 蛋白结合, 促进下游开花身份相关
基因如 AP1 等表达, 进而促进开花[20]; 水稻 Hd3a
编码的蛋白是水稻中的成花激素, 在水稻 SAM 中,
Hd3a、成花素受体蛋白 14-3-3 与 OsFD1 相互作用,
形成一个成花素激活复合物 FAC来促进水稻开花[21],
而 Hd3a、14-3-3 和 OsFD2 蛋白形成一个 FAC 来调
节叶片的发育[14]。在玉米 C亚家族中, O2通过和 PBF
蛋白相互作用调控胚乳发育[22]。D 亚族参与防御病
害和生理生长两种不同进程[23-27]。G 亚家族的成员
参与光应答启动子的调节[28]和种子的成熟[29]。H 亚
家族 HY5 参与光形态发生和光信号转导, 进而影响
下胚轴和根的发育[18]。I 亚家族中, 烟草 RSG 和番
茄 VSF-1 基因调节植物的生长发育[30-31]。S 亚家族
是拟南芥 bZIP 家族中成员最多的, 但是只有 ATB2
基因功能研究的报道, 表明ATB2与平衡碳水化合物
的供需有关[32], 此外, 一些 S 亚家族的同源基因在胁
迫后能激活转录和在花的特定部位特异性表达[33-34]。
异源四倍体陆地棉(Gossypium hirsutum)占全世
界栽培种棉花的 90%以上, 是可再生的纺织用纤维
的主要来源, 还能产生油料种子[35]。陆地棉的 2 个
现存的祖亲属亚洲棉(Gossypium arboreum)和雷蒙德
氏棉(Gossypium raimondii)的基因组测序的完成[36-37],
为二倍体棉花 bZIP 转录因子家族的分析提供了数
据支持, 并且随着异源四倍体陆地棉[38-39]、海岛棉
基因组的测序[40], 进一步加快了棉花生物技术的进
步。bZIP蛋白在棉花整个发育过程中起重要的作用,
尤其是 bZIP 家族的 FD 基因, 与棉花花器官的发育
和开花有关。本研究利用二倍体棉花基因组数据库
鉴定亚洲棉 bZIP家族成员, 并查找 bZIP家族 FD基
因序列, 分析 FD 基因在亚洲棉不同组织中的表达
特征, 为进一步研究棉花 bZIP家族基因的功能奠定
了基础。
1 材料与方法
1.1 试验材料
亚洲棉(G. arboreum)中亚 1 号 A 由国家种质三
亚野生苗圃提供。2015 年 4 月 26 日将其种植于石
河子大学试验农场。播种后 40 d采集根、茎、真叶,
在解剖镜下剥去叶片将 SAM分离出来; 采集开花当
天的花、雌蕊和雄蕊以及 20 d的棉铃, 将胚珠从棉
桃中剥离。所有棉花组织立即浸没于液氮中, –80℃
保存备用。
1.2 亚洲棉 bZIP家族基因的查找
通过 NCBI 的全基因组鸟枪 (whole-genome
shotgun contigs, WGS)数据库 (http://www.ncbi.nlm.
nih.gov/)获得亚洲棉(G. arboreum)全基因组序列, 分
别从拟南芥转录因子数据库(DATF) (http://datf.cbi.
pku.edu.cn/)和植物转录因子数据库 v2.0 (Plant
TFDB) (http://planttfdb.cbi.edu.cn/)获得拟南芥和雷
蒙德氏棉 bZIP转录因子序列。分别以拟南芥和雷蒙
德氏棉的 bZIP 基因的开放阅读框序列(ORF)为查询
序列(query), 运行 TBLASTX, 选择数据库 wgs、物
种 G. arboreum, 其他为缺省值, 搜索亚洲棉基因组
上的 bZIP基因序列, 选择比对结果中 E值小于 E–10
的序列。通过 MegAlign在线软件比对分析雷蒙德氏
棉和获得的亚洲棉的 bZIP 基因序列, 获得亚洲棉
834 作 物 学 报 第 42卷
bZIP 基因的 ORF 序列。用 SMART (http://smart.
emblheidelberg.de/)和 Pfam (http://pfam.sanger.ac.uk/)
软件鉴定亚洲棉 bZIP 基因编码的蛋白序列是否存
在 bZIP 结构, 参数设置为缺省值, 去除非全长的短
片段以及相同基因的冗余序列, 保存完整且具有表
达信息的基因序列用于下一步分析, 最终确定亚洲
棉基因组中 bZIP基因的序列。
1.3 亚洲棉 bZIP家族进化树的构建
利用 ClustalX2 程序比对 159 个亚洲棉、13 个
拟南芥[9](https://www.arabidopsis.org/)和 11个水稻[10]
(http://rice.plantbiology.msu.edu/)的 bZIPs 蛋白的序
列, 通过 MEGA5.1 软件分析系统发育和分子进化,
以邻位相连法(Neighbor-Joining, NJ)构建进化树[41],
运用 p-distance模型, BootStrap参数设置为 1000次
重复, 使分支结果更为可靠。
1.4 亚洲棉 bZIP家族保守结构的鉴定
利用在线MEME分析工具(MEME version 4.8.1)
(http://meme.sdsc.edu/meme/cgi-bin/meme.cgi) 鉴 定
亚洲棉 bZIP转录因子除 bZIP结构以外的保守基序,
设置基序的最小宽度、最大宽度和最大数量, 分别
限制为 6、200和 25。由最低 E-value < E–48值确定
基序的最终数量, 根据这些基序在 MEME中的位置
顺序和出现的频率确定亚洲棉 bZIP 家族序列所属
的亚家族。
1.5 亚洲棉 bZIP 家族基因结构和保守内含子剪
接位点分析
利用在线软件 Gene Structure Display Server
(GSDS) (http://gsds.cbi.pku.edu.cn/)分析亚洲棉 bZIP
基因外显子/内含子(intron–exon)的分布和内含子的
剪接位点。
1.6 亚洲棉 GaFD基因的查找
以拟南芥的 1个 bZIP A亚家族基因 AtFD (Gen-
Bank登录号为AT4G35900)的ORF序列为 query, 运行
TBLASTX, 选择数据库 wgs、物种 G. arboreum, 搜索
亚洲棉 FD基因, 选择比对结果中 E值小于 E–10的序
列。利用 NCBI 的 BlastN 工具(参数设置为缺省值)比
对分析 GaFD基因与 GenBank数据库中其他物种 FD
基因的相似性, 同时运用Clustal X2程序比对GaFD和
其他物种 FD 蛋白的氨基酸序列, 并且通过进化分析
和氨基酸序列的相似性将 GaFD基因命名。
1.7 总 RNA的提取和 cDNA第 1链的合成
采用杭州博日科技有限公司(BIOER) Biospin多
糖多酚植物总 RNA 提取试剂盒, 参照其说明书, 提
取亚洲棉不同组织的总 RNA; 利用北京百泰克公司
的 Supermo III M-MLV反转录酶, 参照试剂盒说明
书, 合成 cDNA第 1链。
1.8 GaFD基因的组织表达分析
根据上述分析得到 GaFD 基因的序列, 设计实
时荧光定量 qRT-PCR分析的引物(表 1), 内参基因为
棉花的 Ubiquitin7。以亚洲棉不同组织的 cDNA为模
板, 采用北京康为世纪有限公司 FASTSYBR Mix-
ture (With ROX)试剂盒, 利用 7500 Fast实时荧光定
量 PCR仪(Life Technologies, Foster City, CA, USA)
检测基因表达量。检测每份样品目的基因和内参基
因的 CT值(循环阈值), 每份样品 3 次重复, 并且进
行 3次独立的实验。
qRT-PCR总体系含 cDNA 30 ng、2 × FASTSYBR
混合物 5.0 μL、基因特异正向引物(10 μmol L–1) 0.2
μL、反向引物(10 μmol L–1) 0.2 μL, 用 RNase-Free
H2O补足到 10.0 μL。采用二步法 PCR, 反应程序为
95℃预热 10 min, 95℃ 15 s, 60℃ 1 min, 共 40个循
环, 熔解曲线阶段为仪器默认程序。采用 2–ΔCT法分
析试验数据, 先分别计算出每组的 ΔCT = CT 目的基因–
CT 内参基因, 再根据 ΔCT 值求出 2–ΔCT 及标准误, 使用
Microsoft Excel 2010软件处理数据。
2 结果与分析
2.1 亚洲棉 bZIP家族的鉴定
通过比对分析亚洲棉基因组数据库 , 共获得
159 个 GabZIPs基因, 它们分布于 94 个基因组鸟枪
序列 (shotgun contigs)上 , 被命名为 GabZIP1~
GabZIP94, 由相同 shotgun contigs 编码的不同的
bZIP 蛋白共享一个基因名(用额外的小数部分区分),
比如 GabZIP1.1~GabZIP1.3。159个 GabZIPs基因分
布于 13条染色体上, 其中第 1染色体上有 6条序列,
第 2染色体上有 6条序列, 第 3染色体上有 12条序
列, 第 4染色体上有 11条序列, 第 5染色体上有 19
条序列, 第 6 染色体上有 13 条序列, 第 7 染色体上
有 9 条序列, 第 8 染色体上有 18 条序列, 第 9 染色
体上有 11 条序列, 第 10 染色体上有 23 条序列, 第
11 染色体上有 13 条序列, 第 12 染色体上有 6 条序
列 , 第 13 染色体上有 8 条序列 ; Gabzip28、
Gabzip49.1、Gabzip49.2 和 Gabzip75 这 4 条序列的
染色体定位情况未知。
第 6期 张彦楠等: 亚洲棉 bZIP蛋白家族的鉴定及 GaFD基因的组织表达分析 835
表 1 本研究所用的引物
Table 1 PCR primers used in this study
引物名称
Primer name
上游引物序列
Forward primer sequence (5–3)
下游引物序列
Reverse primer sequence (5–3)
用途
Function
GaFD1 CGACCACCTTAGCCACCTTT CTCTTGATCGAGCAGCGGAT GaFD1 tissue expression
GaFD2 ACTCGTGTCCTCTCAGGTCT GGCGAAGCTAGAGCGTCAAA GaFD2 tissue expression
GaFD3 ATCGCTTGGTGCTGCTCATA CCGGCGATCATCGGGATTTT GaFD3 tissue expression
UBQ7 AGAGGTCGAGTCTTCGGACA GCTTGATCTTCTTGGGCTTG Reference gene
2.2 亚洲棉 bZIP家族的进化分析
由进化分析可以看出(图 1), 除 GabZIP64 外,
其余 182条 bZIP序列分为 A、B、C、D、E、F、G、
H、I、S、U、V、W 13个亚家族, 其中 A~S 10个
亚家族同拟南芥和水稻 bZIP 家族分类一致。
AtbZIP62、AtbZIP72和 AtbZIP60在拟南芥 bZIP家
族不属于任何亚家族, GabZIP74.1和 GabZIP74.2与
AtbZIP62 和 OsbZIP80 蛋白划分为同一个进化分支,
把它们归为一个新的亚家族 , 命名为 U 亚家族 ;
GabZIP12和 GabZIP66与 AtbZIP72蛋白划分为同一
个进化分支, 归为一个新的亚家族, 命名为 V 亚家
族 ; GabZIP19.1 、 GabZIP19.2 、 GabZIP19.3 和
GabZIP83 与 AtbZIP60 蛋白划分为同一个进化分支,
归为一个新的亚家族, 命名为 W亚家族。
亚洲棉 bZIP A 亚家族是最大的一个进化分支,
包括 38条 GabZIPs蛋白序列。B亚家族和 H亚家族
的成员最少, 分别只有 1条 GabZIP蛋白序列。C亚
家族有 11个成员, D亚家族有 29个成员, E亚家族
有 8个成员, F亚家族有 5个成员, G亚家族有 14个
成员, I亚家族有 17个成员, S亚家族有 26个成员, U
亚家族有 2个成员, V亚家族有 2个成员, W亚家族
有 4个成员。
2.3 亚洲棉 bZIP家族保守结构的分析
亚洲棉 bZIPs 蛋白一共有 25 个保守基序
(E-value < 1E–1.0), 包括保守的 bZIP基序(motif 6),
不同亚家族 bZIP 蛋白的保守基序具有一定的分布
规律(图 2)。motif 8 存在于除了 D 亚家族外的所有
亚家族中, 但有些基序仅共存于个别亚家族中, 比
如 motif 1只存在于 A、S亚族中, motif 4存在于 D
和 E亚族中, motif 5存在于 A和 D亚族中, motif 7
存在于 A、C和 S亚族中, motif 14存在于 A和 G亚
族中, motif 17存在于 E和 I亚族中, motif 18存在于
D、S 和 W 亚族中, motif 22 存在于 D 和 I 亚族中,
motif 24存在于 E、I和 V亚家族中。此外, 还有一
些保守基序只存在于特殊的亚家族中, 比如, motif
2、3、9和 27只存在于 A亚族中, motif 10、11、12、
13、15和 16只存在于 D亚族中, motif 23只存在于
F亚族中, motif 19只存在于 G亚族中, motif 20和 25
只存在于 I 亚族中。这一现象表明每个亚家族中存
在的特殊基序决定了该亚家族中成员的功能。
2.4 亚洲棉 bZIP家族基因结构分析
Intron 和 exon 的数量和分布情况暗示了亚洲棉
bZIP 家族基因的进化印记, 同一个亚家族中的成员
具有相似的基因结构 , 不同亚家族和成员之间
intron–exon 的数量和位置是不同的(图 2)。其中有
19 条基因序列没有内含子, 占整个 GabZIP 基因的
11.95%, 这种现象出现在 A、F 和 S 亚族, 分别占
7.69%、20.00%和 57.69%。剩余的 140 个 GabZIP
基因有内含子, 内含子的数量在 1~12 之间变化, D
和 G 亚家族中的成员内含子数目变化程度最大, 分
别在 5~12 和 6~11 之间变动, 其余亚家族内含子的
数量存在小范围的变化, 一般在 1~4之间变动。
bZIP 区域的碱性区 (Basic region)和铰链区
(Hinge region)是最保守的(图 3), 根据 Basic region
和 Hinge region中内含子的数目、位置和拼接位点,
将 GabZIP基因划分为 7 种模式: a、b、c、d、e、f
和 g (图 4)。其中模式 a (包含 31个基因)和 b (包含
39个基因)是最普遍的, 模式 a在 Hinge region 的–5
位置有一个内含子(P0), 只有A亚家族的 31个基因。
模式 b在 Basic region的–22位置有一个内含子(P2),
它出现在 C、E、I和 W亚家族中。模式 c有 2个内
含子(都在 P0), 1个在 Basic region的–22位置, 另一
个在 Hinge region的–6位置, 只出现在 D亚家族。
模式 d 在 Hinge region 的–6 位置有一个内含子(P0),
只存在于 G亚家族。模式 e在 Basic region的–19位
置有 1个内含子(P2), 只包含 I亚家族的 1个基因。
模式 f在 Basic region的–20位置有一个内含子(P0),
只出现在 V亚家族。模式 g在 Basic region和 Hinge
region 都没有内含子, 有 42 个基因属于这个模式,
这 42个基因分别包含在 A、B、F、H、S和 U亚家
836 作 物 学 报 第 42卷
图 1 亚洲棉 bZIP家族蛋白进化分析
Fig. 1 Phylogenetic analysis of the GabZIP family proteins in G. arboreum
利用 MEGA5.1软件及邻位相连法 NJ构建进化树, BootStrap参数设置为 1000次重复, 有 13个进化分支被命名为 A~I和 S~W, 13种
不同的颜色代表 13个亚家族, 数字代表每个分支的成员。
The phylogenetic tree was generated using the neighbor-joining criteria in MEGA 5.1 with 1000 Bootstrap Replicates. The 13 distinct clades
were named as A–I and S–W. The 13 different color boxes represent 13 clades. Number represents members in each clade.
族中。由图 4 可以看出在 Hinge region 内含子只出
现在 P0处, 在 Basic region内含子出现在 P0/P2处。
由于 bZIP基因结构中 Basic region 和 Hinge region
中的重要性和保守性 , 使 GabZIP 与 OsbZIP 和
ZmbZIP蛋白的功能可能相一致。
2.5 亚洲棉 GaFD基因的鉴定
通过对比对分析亚洲棉 bZIP基因的序列, 共得
到 3 个 GaFD 基因, 它们分别位于第 1、第 4 和第
10染色体上(表 2)。根据与拟南芥 AtFD基因的进化
关系和蛋白氨基酸序列的比对分析 , 将亚洲棉
第 6期 张彦楠等: 亚洲棉 bZIP蛋白家族的鉴定及 GaFD基因的组织表达分析 837
GabZIP13 命名为 GaFD1, 将 GabZIP47 命名为
GaFD2, 将 GabZIP70命名为 GaFD3。Blast比对分
析这 3 个 GaFDs 基因的 CDS 序列, 其中亚洲棉
GaFD1 与雷蒙德氏棉预测 GrFD (GenBank 登录号
为 XM_012613834.1)基因的相似性为 97.1%, GaFD2
与预测 GrFD (GenBank登录号为 XM_012632374.1)
基因的相似性为 97.4%, GaFD3与预测 GrFD (Gen-
Bank 登录号为 XM_012586433.1)基因的相似性为
97.3%。比较亚洲棉 3个 GaFD基因的 ORF及 ORF
ORF 相对应基因组区域的序列, 分析这 3 个基因的
外显子和内含子结构, 结果显示和拟南芥 AtFD 基
因结构相似, 均由 3个外显子和 2个内含子组成(图
5)。将 3个GaFD蛋白与其他 6种物种的 FD蛋白, 即
拟南芥 AtFD (GenBank登录号为 BN000021)、葡萄
(Vit is v in i fera) VvFD (GenBank 登录号 XP_
0 0 36 35 25 9 .1 )、欧洲山杨和河北杨的杂交品种
(Populus tremula × Populusalba) PtFD (GenBank登
录号 AGM48561.1)、马铃薯(Solanum tuberosum)
图 2 亚洲棉 bZIP家族结构分析
Fig. 2 Structural characterization of GabZIP family in G. arboreum
25种不同的颜色代表 25个不同的保守基序, 外显子和内含子分别由黄色方块和黑色线表示。
Twenty-five different color boxes represent 25 different motifs. Orange box represents exon, and black line represents intron.
838 作 物 学 报 第 42卷
图 3 亚洲棉 bZIP蛋白碱性区域和铰链区的比对
Fig. 3 Alignment of basic and hinge regions of GabZIP protein in G. arboreum
第 6期 张彦楠等: 亚洲棉 bZIP蛋白家族的鉴定及 GaFD基因的组织表达分析 839
图 4 亚洲棉 bZIP基因碱性区域和铰链区内含子的分布模式
Fig. 4 Intron distribution patterns within the basic and hinge
regions of the GabZIP genes in G. arboreum
+1是第 1个亮氨酸(每 7个氨基酸的第 7个是亮氨酸), 碱性区域
和铰链区用水平线表示, 内含子处用垂直线分隔。P0代表内含子
拼接位点发生在 2个密码子之间, P2代表内含子拼接位点发生在
1个密码子的第 2个和第 3个核苷酸之间。
The first leucine in the amino acid heptad repeats is numbered +1,
the basic and hinge regions are depicted by horizontal solid lines,
Intron interrupted by vertical bars. P0 represent the intron splicing
site between two codons, P2 means the intron splicing site located
between the second nucleotide and the third nucleotide in one
codon.
StFD (GenBank登录号为 AGM48561.1)、大豆 GmFD
(GenBank 登录号为 XP_006573542.1)和野草莓
( F r a g a r i a v e s c a ) ( G e n B a n k 登录号为 X P _
004289074.1)的氨基酸序列比对分析, 发现亚洲棉
GaFD 蛋白中都存在 A、LSL 和 SAP 这 3 个保守基
序(图 6), 表明这 3个序列是 GaFD基因。
2.6 亚洲棉 GaFD基因的组织表达分析
qRT-PCR分析表明, 3个 GaFD基因在中亚 1号
A 的根、茎、叶、SAM、开花当天的花、雌蕊、雄
蕊和 20 d的胚珠这 8个组织中的表达模式存在差异
(图 7)。GaFD1 在 SAM 中的表达量最高, 其次在茎
中表达, 在叶片和根中的表达量很弱, 在雌蕊和胚
珠中几乎不表达(图 7-A); GaFD2在 SAM中的表达
量最高, 在叶片、花和雌蕊中表达很弱, 在根中几乎
不表达(图 7-B); GaFTD3 在茎中表达量最高 , 在
SAM 中也有较高的表达, 在花和雄蕊中表达量很弱,
在叶片和雌蕊中几乎不表达(图 7-C)。
3 讨论
本研究通过信息学手段分析亚洲棉全基因组序
列, 获得了 159 个亚洲棉 bZIP 基因, 它们分别位于
第 1~第 13染色体上。通过与拟南芥和水稻 bZIP基
因家族聚类分析[9-10], 将亚洲棉 bZIP基因分为 13个
亚家族(图 1), 其中 A~S 10 个亚家族同拟南芥分类
表 2 亚洲棉 GaFD基因信息
Table 2 Information for GaFD in G. arboreum
GenBank中全基因组鸟枪重叠群登录号
GenBank assession No. of the
whole-genome shotgun contig.
E值
E-value
染色体定位
Chromosome location
bZIP家族基因
bZIP family gene
雷蒙德氏棉中同源基因 a
Homologous gene of
G. raimondii a
AYOE01003689.1 6E–48 1 GaFD1 GrFD (XM_012613834.1)
AYOE01012049.1 7E–41 4 GaFD2 GrFD (XM_012632374.1)
AYOE01027287.1 2E–19 10 GaFD3 GrFD (XM_012586433.1)
a 括号内为 GenBank登录号。a The GenBank accession number showed in parentheses.
图 5 亚洲棉 GaFD基因外显子及内含子分析
Fig. 5 Exons and introns analysis of GaFD genes in G. arboreum
ATG和 TGA/TAA分别代表起始密码子和终止密码子, 黑色方框和直线分别代表外显子和内含子,
数字表示外显子和内含子的长度(bp)。
ATG and TGA/TAA represent initiation codon and termination codon, respectively. Black box and lines represent exonic and intronic regions,
respectively. Numbers indicate the length of exons and introns (base pairs).
840 作 物 学 报 第 42卷
图 6 亚洲棉与其他物种 FD蛋白氨基酸序列比对
Fig. 6 Amino acid sequences alignment of FD proteins from G. arboreum and other plant species
A、LSL和 SAP代表不同植物 FD蛋白氨基酸序列中的 3个保守基序。
A, LSL, and SAP represent three conserved motifs in FD protein amino acid sequences of different plant species.
图 7 亚洲棉 GaFD基因在不同组织中的表达特征
Fig. 7 Expression patterns of GaFD genes in different tissues of G. arboreum
R: 根; S: 茎; L: 叶; SA: 幼苗顶端分生组织; Fl: 花; Pi: 雌蕊; St: 雄蕊; O: 花后 20 d的胚珠。
R: root; S: stem; L: leaf; SA: SAM; Fl: flower; Pi: pistil; St: stamen; O: the ovule at the 20 day after flowering.
一致 [9], U 亚家族与大麦(Hordeum vulgare)和玉米
(Zea mays)分类一致[42-43], V和 W属于新的亚家族。
在拟南芥、水稻和玉米中, bZIP 亚家族成员最多的
分别是 S (17个 AtbZIP), A (17个 OsbZIP)和 D (40
个 ZmbZIP), 成员最少的分别是 H、E、U (每个亚家
族有 2 个 AtbZIP), U (1 个 OsbZIP)和 U (2 个
ZmbZIP)[9,10,43]; 在亚洲棉中, A 亚家族是最大的一
个进化分支, 包括 38条 GabZIP蛋白序列, B亚家族
第 6期 张彦楠等: 亚洲棉 bZIP蛋白家族的鉴定及 GaFD基因的组织表达分析 841
和 H亚家族的成员是最少的, 分别只有 1条 GabZIP
蛋白序列。与拟南芥 bZIP 基因比对发现与 AtbZIP
基因同源的 GabZIP 基因, 在进化上可能与 AtbZIP
基因功能相近, 如, A 亚家族有 38 个 GabZIP, 其中
GabZIP31.3、GabZIP68.3 和 GabZIP90.1 是拟南芥
AtABF的同源基因, 主要参与 ABA和逆境胁迫的调
控表达[18]; B亚家族只有一个基因, GabZIP86; C亚
家族有 11 个 GabZIP 基因, 其中 GabZIP46.1 和
GabZIP18分别是 AtbZIP10和 AtbZIP25的同源基因,
AtbZIP10和 AtbZIP25的功能是调控特定种子基因的
表达[44], 而 GabZIP46.1 和 GabZIP18 是否同样具有
此功能还有待于验证; D亚家族有 29个 GabZIP基因,
该家族通过与 TGACG (TGA)蛋白序列结合发挥它
的作用 [23, 25], 其中 GabZIP53.3、 GabZIP82 和
GabZIP87是 AtTGA的同源基因; E和 F亚家族分别
有 8 个和 5 个 GabZIPs 基因; G 亚家族有 14 个
GabZIPs 成员, 由于该家族成员与 G-box 序列结合
而命名 , GabZIP29、GabZIP44.3、GabZIP49.1 是
AtGBF 的同源基因, 参与响应光启动子的调控[28,45];
H 亚家族只有一个成员 , GabZIP59, 它是拟南芥
AtHY5的同源基因, AtHY5基因调控在刺激诱导下下
胚轴和根的发育[17]; I亚家族有 17个 GabZIP成员; S
亚家族有 26 个 GabZIP 成员, 由于 S 亚家族成员的
蛋白序列长度较短, 它可能需要与其它因子相互作
用来完成转录激活[33]。
保守结构分析表明, 亚洲棉 GabZIPs 家族成员
共有 25个保守基序(图 2), 这些保守基序可能与蛋白
的功能有关, 也可能参与 bZIP蛋白功能的激活。拟
南芥、水稻和玉米的 bZIP家族蛋白保守基序的鉴定
都已经完成[9-10, 43]。拟南芥 A 亚家族的保守基序中
有酪蛋白激酶(CKII)磷酸化位点(S/TxxD/E), ABA能
引起AtAREB1/2蛋白在此位点磷酸化进而诱导下游
基因的表达, 在亚洲棉 A 亚家族的保守基序中也包
含这个序列。拟南芥 G亚族中有 3个保守基序是富
含脯氨酸激活结构域的一部分, 在亚洲棉 G 亚族中
同样包含这一保守基序。说明不同物种 bZIP家族之
间具有一定的结构保守性, 这也是基因功能相似的
原因。此外, 不同物种 bZIP亚家族保守基序之间也
存在着差异, 这也是物种之间保持特异性的原因。
基因结构分析表明(图 2), 亚洲棉有 19 条 GabZIPs
基因序列没有内含子, 这个现象出现在 A、F、S 和
U亚族中, D和 G亚族中内含子变化的数目最大, 在
玉米[43]中, 没有内含子的序列出现在 F和 S亚族中,
内含子变化数目最大的也是 D和 G亚族, 说明在单
双子叶植物中 bZIP家族的基因结构具有相似性。在
亚洲棉中, bZIP的 Basic region和 Hinge region是最
保守的, 一般认为在这个区域中内含子的位置和拼
接位点相对于其它区域对探索 bZIP 基因的同源进
化更有意义[10,46], 根据这个区域中内含子的数目、位
置和拼接位点将 bZIP 基因划分为 7 种模式(图 4), 其
中内含子的数量与水稻[10]、玉米[43]、大麦[42] bZIP家
族的分类基本一致, 拼接位点有所差异, 但和蓖麻[47]
内含子拼接位点比较相似, 可能是单双子叶物种的
差异所致。
bZIP A亚家族中的 FD蛋白通过与 FT基因编码
的 Florigen 蛋白相互作用, 促进下游开花身份相关
基因表达, 进而促进植物开花。亚洲棉 GabZIP A亚
家族有 3 个 GaFDs 基因, 分别位于第 1、第 4 和第
10染色体(表 2)。结构分析表明, 亚洲棉 3个 FD基
因与拟南芥 FD 基因的结构相同(图 5), 并且蛋白序
列中含有 FD蛋白的 3个保守基序(图 6)。研究表明,
拟南芥 fd-1 突变体是明显晚花的, 在 fd-1 突变体中
过量表达 FD可以恢复它的正常表型[20], 说明 FD基
因具有促进开花的作用。但是亚洲棉 3 个 FD 基因
是否也具有促进开花的功能, 或者各自起着不同的
作用还需要进一步的验证。对拟南芥[10]和水稻[14] FD
基因的研究表明, 成花素 FT基因在子叶的维管组织
和叶片中转录为 mRNA并合成 FT蛋白, FT蛋白再
由韧皮部经过长距离运输到顶端分生组织 , 与在
SAM 合成的 FD 蛋白相互作用激活下游信号, 促进
植物开花, 在本研究中, 3个GaFD基因均在 SAM中
的表达量很高, 在叶片中只有微弱的表达, 或者不
表达(图 7), 这符合 FD蛋白与 FT蛋白的作用模式。
但是, GaFD1和GaFD2在 SAM中的表达量最高, 而
GaFD3 在茎中的表达量最高, 其次在 SAM 中表达,
这个现象说明 GaFD3与 GaFD1和 GaFD2可能存在
功能上的差异, 推测除具促进开花的作用外, 还有
其他重要的功能。
总之 , 在二倍体棉花 G. arboreum (A2)和 G.
raimondii (D5)基因组中均存在 bZIP家族基因, 四倍
体陆地棉由 A与 D基因组进化而来, 四倍体棉花也
可能具有A与D两套 bZIP家族基因, 同时也不排除
四倍体棉花 bZIP 基因家族在进化过程中由于重复
基因间的相互作用只有一组二倍体基因组(A 或 D)
来源的 bZIP基因表达。随着陆地棉[38-39]和海岛棉[40]
基因组测序的完成, 为我们对四倍体棉花中究竟存
842 作 物 学 报 第 42卷
在多少个 bZIP基因, 相应的基因序列与二倍体有什
么不同提供了数据支持, 对它们在棉花发育过程中
的具体功能还需要进一步的深入研究。本研究获得
的有关亚洲棉 bZIP家族基因的信息, 为进一步分析
棉花 bZIP转录因子特别是棉花 FD同源基因的功能
和作用机制积累了有价值的资料。
4 结论
基于亚洲棉(G. arboreum)全基因组数据库, 发
掘出 159个 bZIP家族基因, 属于 13个亚家族, 分布
在 13条染色体上。bZIP A亚家族存在 3个 GaFD基
因, GaFD1 和 GaFD2 在 SAM 中表达最高, GaFD3
在茎中表达最高, 不同的表达特征表明它们可能具
有不同的功能。
References
[1] Hurst H C. Transcription factors: 1. bZIP proteins. Protein Profile,
1994, 1: 123–168
[2] Izaw T, Foster R, Chua N H. Plant bZIP protein DNA binding
specificity. J Mol Biol, 1993, 230: 1131–1144
[3] Landschulz W H, Johnson P F, McKnight S L. The leucine zipper:
a hypothetical structure common to a new class of DNA binding
proteins. Science, 1988, 240: 1759–1764
[4] Ellenberger T E, Brandl C J, Struhl K, Harrison S C. The GCN4
basic region leucine zipper binds DNA as a dimer of uninter-
rupted alpha helices: crystal structure of the protein-DNA com-
plex. Cell, 1992, 71: 1223–1237
[5] Fernandes L, Rodrigues-Pousada C, Struhl K. Yap, a novel family
of eight bZIP proteins in Saccharomyces cerevisiae with distinct
biological functions. Mol Cell Biol, 1997, 17: 6982–6993
[6] Estes K A, Dunbar T L, Powell J R, Ausubel F M, Troemel E R.
bZIP transcription factor zip-2 mediates an early response to
Pseudomonas aeruginosa infection in Caenorhabditis elegans.
Proc Natl Acad Sci USA, 2010, 107: 2153–2158
[7] Fassler J, Landsman D, Acharya A, Moll J R, Bonovich M, Vin-
son C. B-ZIP proteins encoded by the Drosophila genome:
evaluation of potential dimerization partners. Genome Res, 2002,
12: 1190–1200
[8] Vinson C, Myakishev M, Acharya A, Mir A A, Moll J R, Bono-
vich M. Classification of human B-ZIP proteins based on dimeri-
zation properties. Mol Cell Biol, 2002, 22: 6321–6335
[9] Jakoby M, Weisshaar B, Dröge-Laser W, Vicente-Carbajosa J,
Tiedemann J, Kroj T. bZIP transcription factors in Arabidopsis.
Trends Plant Sci, 2002, 7: 106–111
[10] Nijhawan A, Jain M, Tyagi A K, Khurana J P. Genomic survey
and gene expression analysis of the basic leucine zipper tran-
scription factor family in rice. Plant Physiol, 2008, 146: 333–350
[11] Wang J, Zhou J, Zhang B, Vanitha J, Ramachandran S, Jiang S Y.
Genome-wide expansion and expression divergence of the basic
leucine zipper transcription factors in higher plants with an em-
phasis on sorghum. J Integr Plant Biol, 2011, 53: 212–231
[12] Liao Y, Zou H F, Wei W, Hao Y J, Tian A G, Huang J, Liu Y F,
Zhang J S, Chen S Y. Soybean GmbZIP44, GmbZIP62 and
GmbZIP78 genes function as negative regulator of ABA signaling
and confer salt and freezing tolerance in transgenic Arabidopsis.
Planta, 2008, 228: 225–240
[13] Lopez-Molina L, Mongrand S, Chua N H. Postgermination de-
velopmental arrest checkpoint is mediated by abscisic acid and
requires the ABI5 transcription factor in Arabidopsis. Proc Natl
Acad Sci USA, 2001, 98: 4782–4787
[14] Tsuji H, Nakamura H, Taoka K, Shimamoto K. Functional diver-
sification of FD transcription factors in rice, components of
florigen activation complexes. Plant Cell Physiol, 2013, 54:
385–397
[15] Uno Y, Furihata T, Abe H, Yoshida R, Shinozaki K, Yamagu-
chi-Shinozaki K. Arabidopsis basic leucine zipper transcription
factors involved in an abscisic acid-dependent signal Transduc-
tion pathway under drought and high-salinity conditions. Proc
Natl Acad Sci USA, 2000, 97: 11632–11637
[16] Dröge-Laser W, Kaiser A, Lindsay W P, Halkier B A, Loake G J,
Doerner P, Dixon R A, Lamb C. Rapid stimulation of a soybean
protein-serine kinase that phosphorylates a novel bZIP
DNA-binding protein, G/HBF-1, during the induction of early
transcription-dependent defenses. EMBO J, 1997, 16: 726–738
[17] Ang L H, Chattopadhyay S, Wei N, Oyama T, Okada K,
Batschauer A, Deng X W. Molecular interaction between COP1
and HY5 defines a regulatory switch for light control of
Arabidopsis development. Mol Cell, 1998, 1: 213–222
[18] Choi H, Hong J, Ha J, Kang J, Kim S Y. ABFs, a family of
ABA-responsive element binding factors. J Biol Chem, 2000, 275:
1723–1730
[19] Finkelstein R R, Lynch T J. The Arabidopsis abscisic acid re-
sponse gene ABI5 encodes a basic leucine zipper transcription
factor. Plant Cell, 2000, 12: 599–609
[20] Abe M, Kobayashi Y, Yamamoto S, Daimon Y, Yamaguchi A,
Ikeda Y, Ichinoki H, Notaguchi M, Goto K, Araki T. FD, a bZIP
protein mediating signals from the floral pathway the shoot apex.
Science, 2005, 309: 1052–1056
[21] Taoka K, Ohki I, Tsuji H, Furuita K, Hayashi K, Yanase T, Ya-
maguchi M, Nakashima C, Purwestri Y A, Tamaki S, Ogaki Y,
Shimada C, Nakagawa A, Kojima C, Shimamoto K. 14-3-3 pro-
teins act as intracellular receptors for rice Hd3a florigen. Nature,
2011, 476: 332–335
[22] Vicente-Carbajosa J, Moose S P, Parsons R L, Schmidt R J. A
maize zinc-finger protein binds the prolamin box in zein gene
promoters and interacts with the basic leucine zipper transcrip-
tional activator Opaque2. Proc Natl Acad Sci USA, 1997, 94:
7685–7690
[23] Després C, DeLong C, Glaze S, Liu E, Fobert P R. The Arabi-
dopsis NPR1/NIM1 protein enhances the DNA binding activity
of a subgroup of the TGA family of bZIP transcription factors.
Plant Cell, 2000, 12: 279–290
[24] Katagiri F, Lam E, Chua N H. Two tobacco DNA-binding pro-
teins with homology to the nuclear factor CREB. Nature, 1989,
340: 727–730
[25] Singh K, Foley R C, Oñate-Sánchez L. Transcription factors in
plant defense and stress responses. Curr Opin Plant Biol, 2002, 5:
430–436
第 6期 张彦楠等: 亚洲棉 bZIP蛋白家族的鉴定及 GaFD基因的组织表达分析 843
[26] Chuang C F, Running M P, Williams R W, Meyerowitz E M. The
PERIANTHIA gene encodes a bZIP protein involved in the de-
termination of floral organ number in Arabidopsis thaliana.
Genes Dev, 1999, 13: 334–344
[27] Walsh J, Freeling M. The liguleless2 gene of maize functions
during the transition from the vegetative to the reproductive shoot
apex. Plant J, 1999, 19: 489–495
[28] Schindler U, Menkens A E, Beckmann H, Ecker J R, Cashmore A
R. Heterodimerization between light-regulated and ubiquitously
expressed Arabidopsis GBF bZIP proteins. EMBO J, 1992, 11:
1261–1273
[29] Chern M S, Bobb A J, Bustos M M. The regulator of MAT2
(ROM2) protein binds to early maturation promoters and re-
presses PvALF-activated transcription. Plant Cell, 1996, 8:
305–321
[30] Fukazawa J, Sakai T, Ishida S, Yamaguchi I, Kamiya Y, Takaha-
shi Y. REPRESSION OF SHOOT GROWTH, a bZIP transcrip-
tional activator, regulates cell elongation by controlling the level
of gibberellins. Plant Cell, 2000, 12: 901–915
[31] Ringli C, Keller B. Specific interaction of the tomato bZIP tran-
scription factor VSF-1 with a non-palindromic DNA sequence
that controls vascular gene expression. Plant Mol Biol, 1998, 37:
977–988
[32] Rook F, Gerrits N, Kortstee A, van Kampen M, Borrias M, Weis-
beek P, Smeekens S. Sucrose-specific signaling represses transla-
tion of the Arabidopsis ATB2 bZIP transcription factor gene.
Plant J, 1998, 15: 253–263
[33] Martínez-García J F, Moyano E, Alcocer M J, Martin C. Two
bZIP proteins from Antirrhinum flowers preferentially bind a hy-
brid C-box/G-box motif and help to define a new sub-family of
bZIP transcription factors. Plant J, 1998, 13: 489–505
[34] Strathmann A, Kuhlmann M, Heinekamp T, Dröge-Laser W.
BZI-1 specifically heterodimerises with the tobacco bZIP tran-
scription factors BZI-2, BZI-3/TBZF and BZI-4, and is function-
ally involved in flower development. Plant J, 2001, 28: 397–408
[35] Chen Z J, Scheffler B E, Dennis E, Triplett B A, Zhang T, Guo W,
Chen X, Stelly D M, Rabinowicz P D, Town C D, Arioli T,
Brubaker C, Cantrell R G, Lacape J M, Ulloa M, Chee P, Gingle
A R, Haigler C H, Percy R, Saha S, Wilkins T, Wright R J, Van
Deynze A, Zhu Y, Yu S, Abdurakhmonov I, Katageri I, Kumar P
A, Mehboob-Ur-Rahman, Zafar Y, Yu J Z, Kohel R J, Wendel J F,
Paterson A H. Toward sequencing cotton (Gossypium) genomes.
Plant Physiol, 2007, 145: 1303–1310
[36] Li F, Fan G, Wang K, Sun F, Yuan Y, Song G, Li Q , Ma Z, Lu C,
Zou C, Chen W, Liang X, Shang H, Liu W, Shi C, Xiao G, Gou C,
Ye W, Xu X, Zhang X, Wei H, Li Z, Zhang G, Wang J, Liu K,
Kohel R J, Percy R G, Yu J Z, Zhu Y X, Wang J, Yu S. Genome
sequence of the cultivated cotton Gossypium arboreum. Nat
Genet, 2014, 46: 567–572
[37] Wang K, Wang Z, Li F, Ye W, Wang J, Song G, Yue Z, Cong L,
Shang H, Zhu S, Zou C, Li Q, Yuan Y, Lu C, Wei H, Gou C,
Zheng Z, Yin Y, Zhang X, Liu K, Wang B, Song C, Shi N, Kohel
R J, Percy R G, Yu J Z, Zhu Y X, Wang J, Yu S. The draft genome
of a diploid cotton Gossypium raimondii. Nat Genet, 2012, 44:
1098–1103
[38] Li F, Fan G, Lu C, Xiao G, Zou C, Kohel R J, Ma Z, Shang H, Ma
X, Wu J, Liang X, Huang G, Percy R G, Liu K, Yang W, Chen W,
Du X, Shi C, Yuan Y, Ye W, Liu X, Zhang X, Liu W, Wei H, Wei
S, Huang G , Zhang X, Zhu S , Zhang H, Sun F, Wang X, Liang J,
Wang J, He Q, Huang L, Wang J, Cui J, Song G, Wang K, Xu X,
Yu J Z, Zhu Y, Yu S. Genome sequence of cultivated Upland cot-
ton (Gossypium hirsutum TM-1) provides insights into genome
evolution. Nat Biotechnol, 2015, 33: 524–530
[39] Zhang T, Hu Y, Jiang W, Fang L, Guan X, Chen J, Zhang J, Saski
C A, Scheffler B E, Stelly D M, Hulse-Kemp A M, Wan Q, Liu B,
Liu C, Wang S, Pan M, Wang Y, Wang D, Ye W, Chang L, Zhang
W, Song Q, Kirkbride R C, Chen X, Dennis E, Llewellyn D J,
Peterson D G, Thaxton P, Jones D C, Wang Q, Xu X, Zhang H,
Wu H, Zhou L, Mei G, Chen S, Tian Y, Xiang D, Li X, Ding J,
Zuo Q, Tao L, Liu Y, Li J, Lin Y, Hui Y, Cao Z, Cai C, Zhu X,
Jiang Z, Zhou B, Guo W, Li R, Chen Z J. Sequencing of
allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a
resource for fiber improvement. Nat Biotechnol, 2015, 33:
531–537
[40] Liu X, Zhao B, Zheng H J, Hu Y, Lu G, Yang C Q, Chen J D,
Chen J J, Chen D Y, Zhang L, Zhou Y, Wang L J, Guo W Z, Bai Y
L, Ruan J X, Shangguan X X, Mao Y B, Shan C M, Jiang J P,
Zhu Y Q, Jin L, Kang H, Chen S T, He X L, Wang R, Wang Y Z,
Chen J, Wang L J, Yu S T, Wang B Y, Wei J, Song S C, Lu X Y,
Gao Z C, Gu W Y, Deng X, Ma D, Wang S, Liang W H, Fang L,
Cai C P, Zhu X F, Zhou B L, Jeffrey Chen Z, Xu S H, Zhang G,
Wang S Y, Zhang T Z, Zhao G P, Chen X Y. Gossypium bar-
badense genome sequence provides insight into the evolution of
extra-long staple fiber and specialized metabolites. Sci Rep, 2015,
5: 14139
[41] Tamura K, Peterson D, Peterson N, Stecher G, Nei M, Kumar S.
MEGA5: molecular evolutionary genetics analysis using maxi-
mum likelihood, evolutionary distance, and maximum parsimony
methods. Mol Biol Evol, 2011, 28: 2731–2739
[42] Pourabed E, Ghane Golmohamadi F, Soleymani Monfared P,
Razavi S M, Shobbar Z S. Basic leucine zipper family in barley:
genome-wide characterization of members and expression analy-
sis. Mol Biotechnol, 2015, 57: 12–26
[43] Wei K, Chen J, Wang Y, Chen Y, Chen S, Lin Y, Pan S, Zhong X,
Xie D. Genome-wide analysis of bZIP-encoding genes in maize.
DNA Res, 2012, 19: 463–476
[44] Lara P, Oñate-Sánchez L, Abraham Z, Ferrándiz C, Díaz I, Car-
bonero P, Vicente-Carbajosa J. Synergistic activation of seed
storage protein gene expression in Arabidopsis by ABI3 and two
bZIPs related to OPAQUE2. J Biol Chem, 2003, 278: 21003–21011
[45] Weisshaar B, Armstrong G A, Block A, da Costa e Silva O,
Hahlbrock K. Light-inducible and constitutively expressed
DNA-binding proteins recognizing a plant promoter element with
functional relevance in light responsiveness. EMBO J, 1991, 10:
1777–1786
[46] Suckow M, von Wilcken-Bergmann B, Müller-Hill B. Identifica-
tion of three residues in the basic regions of the bZIP proteins
GCN4, C/EBP and TAF-1 that are involved in specific DNA
binding. EMBO J, 1993, 12: 1193–1200
[47] Jin Z, Xu W, Liu A. Genomic surveys and expression analysis of
bZIP gene family in castor bean (Ricinus communis L.). Planta,
2014, 239: 299–312