免费文献传递   相关文献

拟南芥bZIP基因家族系统发育树比较分析



全 文 :收稿日期:2007-11-08基金项目:四川省教育厅自筹项目(06zd1018);四川省应用基础研究基金资助项目(05JY029-101);四川省教育厅资助项目(2003031022);西南科技大学重点项目(2006031030)作者简介:蒋 瑶(1982-),女 ,四川罗江人 ,硕士 ,主要从事植物分子生物学研究工作。通讯作者:胡尚连(1966-),女 ,河北秦皇岛人 ,教授 ,博士 ,主要从事植物生理与生物技术研究工作。
拟南芥 bZIP 基因家族系统发育树比较分析
蒋 瑶 ,胡尚连 ,孙 霞 ,黄胜雄
(西南科技大学 生命学院 ,四川 绵阳 621010)
  摘要:bZIP蛋白是植物中特有的一类转录因子 , 包含亮氨酸拉链结构域和碱性结构域两部分。在种子贮藏基因
表达 、光形态发生及器官建成以及植物对 ABA、光 、厌氧生活和发育信号的反应中 , bZIP 蛋白家族对调节基因的表达
都起到重要的作用。对已鉴定出的 78个拟南芥 bZIP 基因(包括-like)中 72 个 bZIP 基因(不包括-like和假设蛋白),利
用系统发育树分为 8个组 , 以期进一步探讨进化组中的生物特征和功能。
关键词:bZ IP 基因;转录因子;进化;拟南芥
中图分类号:Q75  文献标识码:A  文章编号:1000-7091(2008)01-0022-06
Comparative Phylogenetic Analysis of the bZIP Gene Family in Arabidopsis thaliana
JIANG Yao ,HU Shang-lian ,SUN Xia ,HUANG Sheng-xiong
(College of Life Science and Engineering ,Southwest University of Science and Technology ,Mianyang 621010 ,China)
Abstract:The basic leucine zipper(bZIP)protein that containing leucine zipper domain and basic domain are one u-
nique kind of transcription factors/ repressors in plants.The family of bZIP genes plays an important role in the gene ex-
pression which regulating the seed storage , light morphogenesis , organogenesis , and in regulating the response of plants on
the signals of ABA , light , anaerobic life and development.The 78 bZIP genes(including bZIP like)in Arabidopsis
thaliana were identified.Of them , putative AtbZIP proteins translated by the 72 bZIP genes(excluding bZIP like and hy-
pothetical proteins)were clustered into 8 groups by PHYLIP according to sequence similarities of their basic region.It is
very important to study on the functional characteristics of bZIP transcription factors in plant in future.
Key words:bZIP gene;Transcription factor;Evolution;Arabidopsis thaliana
  随着基因工程与分子生物学的快速发展 ,人们
对基因调控的研究越来越深入 ,主要集中在转录因
子 、信号转导和 RNA 剪辑等方面 ,而转录因子已成
为分子生物学领域的研究热点 。
做为模式植物的拟南芥(Arabidopsis thaliana),
其全基因组的测序工作已经完成 ,据推断 ,至少有
1 553个编码转录因子的基因 ,约占估计基因总数的
5.9%[ 1] 。因此 ,对拟南芥相关转录因子的研究工作
也得到了迅速的拓展和深入。根据 DNA 结合的特
异性 ,可将拟南芥转录因子分为不同的亚组 ,各亚组
所起的作用也各异 , bZIP(碱性亮氨酸拉链 , Basic
leucine zipper)家族则为其中之一 ,是真核生物的转
录因子和阻抑蛋白中最大而且最保守的类型[ 2] 。
bZIP结构为亮氨酸拉链结构域(每 7个氨基酸的第
7位含有一个亮氨酸以及其他疏水残基位第 3和第
4位 ,亮氨酸拉链形成一个两亲性的α螺旋)和碱性
结构域(大约有 20个氨基蛋白的 C 端是 bZIP 的
DNA识别结构域 ,用于识别并结合 G-box ,N端通常
都含有脯氨酸丰富的转录激活结构域),通过它激活
所调控基因的表达[ 3] 。bZIP 因子结合到带有一个
ACGT 核心的DNA序列元件上 ,其功能受二聚化作
用和翻译后修饰调控 ,通过亮氨酸重复区域 ,使这些
因子形成同源或异源二聚体 。
迄今为止 ,分子克隆研究证明 , bZIP 蛋白分布
在从高等植物至哺乳动物等不同的真核生物物种之
中 ,说明其分布广泛 ,种类繁多 ,且在植物发育和代
谢过程中起着关键性的调控作用 ,其主要功能是调
节基因表达的强度 ,或应答外源激素和环境的胁迫
(如:参与植物对 ABA 、光 、厌氧生活和发育中各种
信号的反应[ 4])。在胁迫条件下 ,bZIP 转录因子可
以与 ABA诱导基因的启动子区域的结合来调节下
游靶基因的表达。ABA信号在植物对非生物胁迫
的应答反应中起着非常重要的作用[ 5] ,或防御病原
体 ,或控制靶基因的时空特异性表达。拟南芥 bZIP
华北农学报·2008 , 23(1):22-27
蛋白可分为 3类:TGA 家族 、GBF 家族和其他类家
族。其中 TGA/GBF与胁迫应答密切相关 ,对胁迫诱
导基因起调控作用[ 6] 。TGA/GBF 蛋白各成员的
DNA结合特异性 ,蛋白互作特性和表达模式都有差
异 ,分别参与不同胁迫反应[ 7] 。这些 bZIP转录因子
包括水稻(Oryza sativa)TREB 蛋白和拟南芥 AREB 、
ABF 、ABI5蛋白[ 8-13] ,它们需要磷酸化修饰才可被
激活。OsABI5-1 与 OsABI5-2(均是 OsABI5 的变体)
有完全相同的功能域 ,但只有 OsABI5-2能特异地结
合G-Box[ 14] 。Fan等[ 15]的研究表明该家族的转录因
子与水杨酸信号转导途径的重要元件 NPR1(No-ex-
pressor of PR1)相互作用 。但经水杨酸处理后 ,其作
用明显增强 ,同时特异的 TGA/GBF 的 DNA结合活
性也会大大提高 ,如:热胡椒经水杨酸和乙烯利处理
后 ,会增加 CabZIP1转录因子的表达 ,且 CabZIP1的
瞬时表达在PR-1转录水平上会增强[ 16] 。
本研究收集拟南芥 bZIP 基因的氨基酸序列进
行相关的生物信息学分析 ,目前在国内未见相关报
道 ,试图通过PHYLIP构建系统发生树 ,为今后进一
步研究该家族的功能和调控机制提供了一定的理论
依据和分子进化关系 。
1 材料和方法
1.1 序列收集和基因结构
通过TATF(http:∥datf.cbi.pku.edu.cn/),Nation-
al Center for Biologica Information(NCBI:http:∥www.
ncbi.nlm.nih.gov/), TAIR(http:∥www.arabidopsis.
org/)和 MIPS(http:∥mips.gsf.de/proj/plant/ jsf/athal/
searchjsp/ index.jsp)4种不同的网络来源获得拟南芥
bZIP 蛋白(包括 bZIP-like),再利用不同 bZIP 因子的
氨基酸序列在NCBI的BLAST 和TAIR的wublast进行
比对 ,其E-value 小于 4×10-4。通过拟南芥 TIGR db
获得 bZIP 的基因结构(表 1)。从 TIGR(http:∥tigr-
blast.tigr.org/ tgi/)和 TAIR Blast2.0(http:∥www.ara-
bidopsis.org/Blast)这两个网址并利用 bZIP 基因推断
所得的核苷酸序列收集了拟南芥 EST 序列。
1.2 序列比对和系统树构建
利用 ClustalW(含 BOXSHADE)(http:∥bioweb.
pasteur.fr)对其氨基酸序列进行多重比对并进行人工
校对。对比所用的参数为:protein weigh matrix:Gonnet
series;negative matrix:no;gap open penalty:10.00;gap
extension penalty:0.20;delay devergent sequence:30;
residue-specific gap penalties:on;hydrophilic residues:
GPSNDQEKR;gap separation distance L:0;end gap sepa-
ration penalty:on;transition weight:0.50。
使用 PHYLIP(版本 3.5c)(http:∥bioweb.pasteur.
fr)构建系统发育树 。利用生物信息资源分析蛋白质
卷曲螺旋(http:∥www.ch.embnet.org/ software/COILS-
form.html),可预测α-螺旋的卷曲螺旋排列方式。
利用 MEME(http:∥meme.sdsc.edu./meme/web-
site/ intro.html)和 BLOCKS(http:∥blocks.fhcrc.org/
blocks)程序分析拟南芥 bZIP蛋白的保守基元进一步
来确定其分组。
2 结果与分析
2.1 拟南芥bZIP蛋白结构域分析
已从4种不同的网络数据库(TATF ,NCBI , TAIF
和MIPS)收集到拟南芥 bZIP 基因 ,通过 BLAST 比对
搜索到 78个不同的编码含 bZIP-like蛋白拟南芥位点
(表2),这与Marc Jakoby 等[ 17]所鉴定的 75个 bZIP 基
因以及 Jose Luis Riechmann等[ 1]所鉴定的 81个 bZIP
基因的数目有差异 ,所以不排除还有其他 AtbZIP 基
因的存在 。所得到的这些蛋白只有一个 bZIP 结构
域 ,但存在的位置有很大的差异性 ,而对大部分 bZIP
因子基因蛋白质结构域进行预测的结果表明 ,所有的
序列都含有一个或多个外显子 ,基本结构域大多数位
于C端 ,少数位于N端;大约有一半序列都有内含子 ,
且位于 bZIP结构域的左端 ,有少部分只含有 1个或
不含内含子。
2.2 系统树分析和识别拟南芥 bZIP家族
为了估计拟南芥 bZIP蛋白的进化关系 ,进行的
系统发育树分析是基于 DNA 结合域序列 ,并利用
DNAMAN 软件进行同源性比对 ,结果表明 ,氨基酸
序列的相似性明显高于其基因家族中的基因序列 ,
且高达 50%。
利用PHYLP(版本3.5c)获得的无根树可分为8个
组(图 1),这与Marc Jakoby[ 17]的分组存在一定的差异 ,
但它们都能确定其基因编码 bZIP 蛋白与bZIP 家族之
间的关系 ,以及通过系统发育树进一步预测其基因的
功能。同一基因不同的亚种却分在不同的小组 ,说明
进化上亲缘关系相对较远 ,可推测其功能也不相同 ,
如:At1g08320 ,At3g12250等。再根据分析拟南芥 bZIP
蛋白的同一标准将其中一些组还分为一些亚组。为检
测拟南芥基因组中假定复制基因 ,采用其相关bZIP蛋
白的碱基对来检测序列的冗长性。
调控因子的 DNA结合域 ,对其生物功能是极其
重要的。bZIP结构域的系统发育树表明 ,相对保守
序列的进化选择以及结构域的起始。事实上 ,基于
系统发育树对 bZIP 基因家族的分类可能影响其基
因结构域的作用。
1期 蒋 瑶等:拟南芥 bZIP 基因家族系统发育树比较分析 23 
表 1 拟南芥大部分 bZIP因子蛋白质结构
Tab.1 Most protein structure of the bZIP transcrciption factors in Arabidopsis thaliana
24  华 北 农 学 报 23卷
图 1 拟南芥 bZIP 蛋白系统发育树
Fig.1 Phylogenetic tree of bZIP proteins in Arabidopsis thaliana
1期 蒋 瑶等:拟南芥 bZIP 基因家族系统发育树比较分析 25 
表 2 拟南芥 bZIP转录因子
Tab.2 The bZIP transcription factors in Arabidopsis thaliana
AGI名
AGI
name
氨基酸
数目
Number of
amino
acid
染色体
位置
Position of
chromosome
EST
数目
Number
of
EST
cDNA
数目
Number
of
cDNA
基因名或
蛋白名
Gene name
or protein
name
AGI名
AGI
name
氨基酸
数目
Number of
amino
acid
染色体
位置
Position of
chromosome
EST
数目
Number
of
EST
cDNA
数目
Number
of
cDNA
基因名或
蛋白名
Gene name
or protein
name
At1g49720 392 1 25 5 ABF1 At1g45249 416 1 8 3 ABF2
At5g49450 145 5 28 5 AtbZIP1 At4g02640 411 4 33 5 AtbZIP10
At4g34590 159 4 57 7 AtbZIP11 At2g41070 262 2 21 7 AtbZIP12
At5g44080 315 5 36 3 AtbZIP13 At4g35900 285 4 3 7 AtbZIP14
At5g42910 370 5 2 1 AtbZIP15 At2g35530 409 2 7 3 AtbZIP16
At2g40950 721 2 6 2 AtbZIP17 At2g40620 367 2 15 6 AtbZIP18
At4g35040 261 4 41 4 AtbZIP19 At2g18160 171 2 76 6 AtbZIP2
At5g06950 330 5 10 5 AtbZIP20 At1g08320 481 1 14 4 AtbZIP21
At1g22070 384 1 24 3 AtbZIP22 At2g16770 249 2 7 3 AtbZIP23
At3g51960 227 3 5 2 AtbZIP24 At3g54620 403 3 57 9 AtbZIP25
At5g06960 330 5 14 5 AtbZIP26 At2g17770 156 2 0 3 AtbZIP27
At3g10800 675 3 17 3 AtbZIP28 At4g38900 553 4 31 4 AtbZIP29
At5g15830 186 5 7 2 AtbZIP3 At2g21230 519 2 25 4 AtbZIP30
At2g13150 262 2 1 1 AtbZIP31 At2g12940 220 2 1 1 AtbZIP32
At2g12900 264 2 0 0 AtbZIP33 At2g42380 310 2 4 2 AtbZIP34
At4g34000 449 2 36 9 AtbZIP37 At3g19290 431 3 21 5 AtbZIP38
At2g36270 442 2 21 2 AtbZIP39 At1g59530 148 1 0 2 AtbZIP4
At1g03970 270 1 32 2 AtbZIP40 At4g36730 315 4 39 7 AtbZIP41
At3g30530 173 3 2 0 AtbZIP42 At5g38800 165 5 5 1 AtbZIP43
At1g75390 173 1 47 4 AtbZIP44 At3g12250 330 3 69 10 AtbZIP45
At1g68640 452 1 6 3 AtbZIP46 At5g65210 268 5 50 4 AtbZIP47
At2g04038 166 2 2 0 AtbZIP48 At3g56660 620 3 0 1 AtbZIP49
At3g49760 156 3 7 1 AtbZIP5 At1g77920 368 1 20 5 AtbZIP50
At1g43700 341 1 43 9 AtbZIP51 At1g06850 337 1 12 6 AtbZIP52
At3g62420 146 3 48 5 AtbZIP53 At4g01120 360 4 28 7 AtbZIP54
At2g46270 382 2 26 6 AtbZIP55 At5g11260 168 5 24 3 AtbZIP56
At5g10030 364 5 10 4 AtbZIP57 At1g13600 196 1 3 1 AtbZIP58
At2g31370 398 2 34 3 AtbZIP59 At2g22850 227 2 7 2 AtbZIP6
At1g42990 295 1 35 2 AtbZIP60 At3g58120 329 3 29 6 AtbZIP61
At1g19490 471 1 5 2 AtbZIP62 At5g28770 308 5 23 6 AtbZIP63
At3g17609 135 3 14 5 AtbZIP64 At5g06839 417 5 1 1 AtbZIP65
At3g56850 297 3 32 6 AtbZIP66 At3g44460 331 3 8 4 AtbZIP67
At1g32150 389 1 5 2 AtbZIP68 At1g06070 423 1 30 8 AtbZIP69
At4g37730 305 4 11 0 AtbZIP7 At5g60830 206 5 2 0 AtbZIP70
At2g24340 322 2 0 0 AtbZIP71 At5g07160 26 5 0 0 AtbZIP72
At2g13130 324 2 0 4 AtbZIP73 At2g21235 550 2 0 0 AtbZIP74
At5g08141 137 5 0 1 AtbZIP75 At1g68880 138 1 3 2 AtbZIP8
At5g24800 277 5 31 1 AtbZIP9 At3g17610 149 3 0 0 HYH
At1g35490 300 1 7 1 bZIP-like At1g58110 374 1 14 2 bZIP-like
2.3 利用 MEME和 BLOCKS分析
由MEME 和 BLOCKS 程序分析 bZIP 蛋白的保
守基元大致可分为三类 ,但各类中也有小部分氨基
酸的差异 ,具体情况如下:
        Ⅰ :EKRQKRMLSNRESARRSRLRKQAYVQELE
PRKLRRLAQNREAAAKSRERKKRYTQQLE
PRKLRR I I QNREAAAKSRERKKRYTQQLE
Ⅱ:LR I I VDGVMAHYEELFR I KSNAAKADVFHLLSGMWKTPAERCFLWLGGFR
LRSLVENA I KHYFELFRMKASAAKNDVFFVMSGMWRTSAERFFL I LGGFR
LRI I VDGVMAHYFELFRIKSNAAKADVFHL I SGMWKTPAERCFLWLGGFR
Ⅲ:FIRQADNLRLQTLQQMYR I LTTRQAARALLA I GEYFSRLRALSSLWLARP
FVNQADHLRHETLQQLYRVLTTRQSARGLLALHDYFQRLRALSSSWATRH
FIRQADNLRLQTLQQMYR I LTTRQAARALLA I GEYFSRLRALSSLWLARP
  由 MEME 和 BLOCKS 软件分析可得 , 拟南芥 bZIP家族的氨基酸序列是高度保守的 ,它们至少存
26  华 北 农 学 报 23卷
在1个 BLOCKS ,甚至存在 2 ~ 4个 BLOCKS ,说明在
进化上的复杂性和多样性 ,以及相同组之间存在进
化上的一致性 ,有利于鉴定它们之间的功能。
3 结论
随着转基因技术和遗传分析手段的有力结合 ,将
会鉴定出更多的对植物改良有重大意义的转录因子。
尤其是利用生物信息学可以预料转录因子在植物生
物技术领域具有巨大的潜在价值和应用前景 ,同时也
将为植物性状的改良提供重要的生物技术手段。
本研究已鉴定出拟南芥 bZIP 蛋白 ,它们在被子
植物进化过程中起了很重要的作用 ,根据系统发育
分析的结果表明 ,拟南芥 bZIP 基因分为 8个组 ,它
们之间存在一定的亲缘关系 ,且具有一定的生物学
功能 ,能促进拟南芥 bZIP 蛋白其他特性和功能的研
究 ,通过系统发育树可推断进化过程中基因的多样
性和保守性 ,以便加快研究拟南芥 bZIP 基因在基
因工程中的应用提供理论依据 ,可进一步分析其功
能与相应的进化组的生理特征是有关的 。
参考文献:
[ 1]  Riechman.Arabidopsis transcription factor:Genome wide
comparative analysis among eukaryotes[ J] .Science , 2000 ,
290:2105-2110.
[ 2]  路子显 , 常团结 , 刘 翔 , 等.植物碱性亮氨酸拉链
(bZIP)蛋白研究进展(一)[ J] .遗传 , 2001 , 23(6):564-
570.
[ 3]  萨其拉 , 李文彬 , 孙勇如.G-box 和 G-box结合蛋白在植
物基因诱导表达中的转录调控作用[ J] .植物生理与分
子生物学 , 2003 , 39(1):89-92.
[ 4]  路子显 ,常团结 , 刘 翔 ,等.植物碱性亮氨酸拉链(bZIP)
蛋白研究进展(二)[ J] .遗传 , 2002 , 24(2):182-189.
[ 5]  李书粉 ,孙富丛 , 肖理慧 ,等.植物对非生物胁迫应答的
转录因子及调控机制[ J] .西北植物学报 , 2006 , 26(6):
1295-1300.
[ 6]  Singh K , Foley R C , Onate-Sanchez L.Transcription factors in
plant defense and stress responses[ J] .Curr Opin Plant Biol ,
2002 , 5(5):430-436.
[ 7]  王计平 ,史华平 ,毛 雪 , 等.转录因子网络与植物对环
境胁迫的响应[ J] .应用生态学 , 2006 , 17(9):1740-
1746.
[ 8]  向 旭 ,傅家瑞.脱落酸应答基因的表达调控及其与逆
境协迫的关系[ J] .植物学通报 , 1998 , 15(3):11-16.
[ 9]  Hobo T , Kowyama Y ,Hattori T.A bZIP factor , TRAB1 , inter-
acts with VP1 and mediates abscisic acid-induced transcrip-
tion[ J] .Proc Natl Acad Sci USA , 1999 , 96:15348-15353.
[ 10]  Finkelstein R R, Lynch T J.The Arabidopsis abscisic acid
response gene ABI5 encodes abasic leucine zipper transcrip-
tion factor[ J] .Plant Cell , 2000 , 12:599-609.
[ 11]  Lopez-molina L , Chua N H.A null mutation in a bZIP factor
confers ABA-insensitivity in Arabidopsis thaliana[ J] .Plant
Cell Physiol , 2000 , 41:541-547.
[ 12]  Unoy , Furihatat , Abeh , et al.Novel Arabidopsis bZIP tran-
scription factors involve dinan abscisic-acid-dependent signal
transduction pathway under drought and high salinity condi-
tions[ J] .Proc Natl Acad Sci USA , 2000 , 97:11632 -
11637.
[ 13]  Kang J Y , Choi H I , Im M Y , et al.Arabidopsis basic
leucine zipper proteins that mediate stress-responsive ab-
scisic acid signaling[ J] .Plant Cell , 2002 , 14:343-357.
[ 14]  Zou Meijuan.Characterization of alternative splicing prod-
ucts of bZIP transcription factor OsABI5[ J] .Biochemical
and Biophysical Research Communications , 2007 , 360:307
-313.
[ 15]  Fan W , Dong X.In vivo interaction between NPR1 and tran-
scription factor TGA2 leads to salicylic acid-mediated gene
activation in Arabidopsis[ J] .Plant Cell , 2002 , 14(6):1377
-1389.
[ 16]  Boo Ja Lee.In vivo binding of hot pepper bZIP transcription
factor CabZIP1 to the G-box region of pathogenesis-related
protein 1 promter[ J] .Biochemical and Biophysical Research
Communications , 2006 , 344:55-62.
[ 17]  Marc Jackoby.bZIP transcription factors in Arabidopsis[ J] .
Trends Plant Science , 2002 , 7(3):106-111.
1期 蒋 瑶等:拟南芥 bZIP 基因家族系统发育树比较分析 27