免费文献传递   相关文献

拟南芥基因组NBS-LRR类基因家族的生物信息学分析



全 文 :第一作者简介:王岩,女,1979年出生,吉林辽源人,硕士,助教,主要从事植物保护学方面研究。通信地址:130062吉林省长春市西安大路 5333
号,吉林大学和平校区植物科学学院,Tel:0431-87835707,E-mail:wang197911@163.com。
通信作者:席景会,男,1965年出生,黑龙江人,硕导,教授,主要从事植物保护学方面研究。Email:jhxi1965@jlu.edu.cn。
收稿日期:2009-03-20,修回日期:2009-04-21。
拟南芥基因组 NBS-LRR类基因家族的
生物信息学分析
王 岩,李兆阳,唐心龙,卢 姗,许 鹏,张 静,方 奎,席景会
(吉林大学植物科学学院,长春 130062)
摘 要:【研究目的】对拟南芥(Arabidopsis thaliana)中含有核苷酸结合位点(Nucleotide binding site,NBS)
和富含亮氨酸的重复序列(Leucine-rich repeat,LRR)类基因进行了分析。【方法】利用TAIR、Pfam网站,
数据库和Chromosome Map Tool、MEGA 3.0、ClustalX软件,分析确定NBS-LRR基因及其类型、染色体
物理分布、系统发育学关系。【结果】在拟南芥全基因组中共有204个NBS-LRR类基因,大多位于1号和5
号染色体上,其中71.6%的NBS-LRR类基因分布在基因簇内。对NBS-LRR类基因家族进行了氨基酸
多序列比对和系统进化树分析,NBS-LRR类基因家族可分为四个亚家族。另外,NBS-LRR基因在进化
过程中存在较多的复制现象。
关键词:拟南芥;生物信息学;基因家族;NBS-LRR
中图分类号:S432.2+3 文献标识码:A 论文编号:2009-0564
Bioinformatic Analysis of the NBS-LRR Gene Family in Arabidopsis thaliana
Wang Yan, Li Zhaoyang, Tang Xinlong, Lu Shan, Xu Peng, Zhang Jing, Fang Kui, Xi Jinghui
(College of Plant Science, Jilin University, Changchun 130062)
Abstract:【OBJECTIVE】A full set of disease resistance candidate genes encoding NBS-LRR in a complete ge⁃
nome of Arabidopsis thaliana were analyzed.【METHOD】Structural diversities, physical positions, and phylo⁃
genetic relationship were studied by TAIR and Pfam web, database, Chromosome Map Tool, MEGA 3.0 and
ClustalX software.【RESULTS】204 genes containing NBS domain were found in genome and most of those
were located in 1 and 5 chromosome. The NBS-LRR family genes on different chromosomes exist in the form of
monogenic gene or gene clusters, and 71.6% of the NBS-LRR genes were located in gene clusters. That showed
there are much copy phenomenons in the evolution of disease resistance genes of Arabidopsis thaliana.
Key words: Arabidopsis thaliana, bioinformatics, gene-family, NBS-LRR
0 引言
核苷酸结合位点(Nucleotide binding site,NBS)和
富含亮氨酸的重复序列(Leucine-rich repeat,LRR)类基
因是植物抗病基因家族中分布比较广泛的家族之一[1-2]。
NBS这个区域经常广泛的被用于植物抗病基因的识
别和分类,在这个区域里面包含有一些非常保守的基
序[3]。根据系统发生学分析,在植物中以NBS-LRR结
构编码的这一类基因(以下简称NBS-LRR类基因)主
要被分成两大类,一类是在编码蛋白N端包含一个
TIR(Tolland inter leukin-1 receptor)结 构 ,称 作
TIR-NBS-LRR类型基因;其他类型的NBS-LRR类基
因并不编码 TIR 结构区域,称之为非 TIR-NBS-LRR
类型基因,而这一类基因往往在它的N-端带有一个卷
曲螺旋结构(Coiled-coil,CC),也称做CC-NBS-LRR类
型基因。
随着功能基因组的研究的迅速发展以及拟南芥全
中国农学通报 2009,25(15):40-45
Chinese Agricultural Science Bulletin
基因组测序的完成[4],人们可以在基因组水平上对植
物重要基因家族进行挖掘、比较分析和功能预测。特
别是生物信息学相关技术的开发,在植物大规模的基
因分离、基因功能注释及功能基因组学等各项研究中
发挥越来越重要的作用。
笔者通过生物信息学方法研究拟南芥全基因组中
的NBS-LRR 类基因的分类和系统发生学,以期发现
新的与植物抗性相关的基因,进而加快拟南芥中抗病
基因的克隆以及抗病机制的研究,并为植物抗病育种
提供理论依据。
1 材料与方法
1.1 试验材料
此研究以模式植物拟南芥为研究对象,拟南芥全
基因组数据下载于拟南芥生物资源中心(The
Arabidopsis Information Resource Center),即 TAIR网
站(http://arabidopsis.org)中的最新数据。
1.2 试验方法
1.2.1 NBS-LRR类型基因的确定 利用TAIR网站和
数据库,输入关键词“NBS-LRR”、“NBS”、“LRR”和
“TIR”等进行查询,获得所有可能的NBS-LRR基因及
相应蛋白。
1.2.2 NBS 类型基因的分类 确定NBS 类型基因的
结构类型,通过 Pfam 网站(The protein families
database,http://www.sanger.ac.uk/Software/Pfam/),根
据NBS类型基因的N-端结构和LRR结构的不同,将
NBS-LRR类基因进行分类。
通过Pfam数据库进行系统分析得到的NBS-LRR
蛋白质结构域表现形式,进一步分析NBS-LRR 类蛋
白上所存在的其他结构域。
1.2.3 NBS-LRR 类基因染色体物理定位 NBS-LRR
类型基因通过NCBI数据库提供的染色体定位工具进
行拟南芥染色体物理定位。使用“Chromosome Map
Tool”工具,确认NBS-LRR类基因的染色体位置。
1.2.4 拟南芥 NBS-LRR 类基因系统发生学分析
应用多序列比对工具ClustalX构建系统进化树,以氨
基酸全序列联配的结果为基础,用MEGA 3.0程序生
成。采用程序中的Neighbor-joining法,运行是采用如
下参数:模式采用“Poisson correction”,缺口设置为
“Pairwise Deletion”,校验参数为 Bootstrap=1000,随机
种子。
2 结果与分析
2.1 拟南芥中的NBS-LRR类基因
以“NBS”为关键词进行搜索 TAIR数据库得到
196个符合条件的NBS-LRR类基因;用“LRR”进行搜
索后得到 250个符合条件的基因;用TIR进行第三次
搜索后得到288个基因;而以“NBS-LRR”为关键词进
行检索R数据库得到173个符合条件的基因。综合分
析与归纳,共获得的NBS-LRR类基因204个。
结果表明,在拟南芥中存在大量NBS-LRR类基
因,NBS-LRR类基因占拟南芥基因组总基因数量的
0.73 %,与粳稻和籼稻的NBS-LRR类基因非常接近[5]。
2.2 NBS-LRR类基因的分类
在拟南芥中,NBS-LRR类基因可以根据蛋白结构
阈“LRR”的有无划分成两大类;按照N端和LRR区域
基序的差异对这些NBS-LRR 基因进行分类,共分为
16类基因(表1)。在已知结构域的基因中,含LRR结
构的基因呈现出种类多样性的特征,共 11类 147个基
因;而在拟南芥基因组中不含LRR结构的基因共5类
57个基因。
根据以上分类方法,并通过Pfam网站分析,对于
具有“LRR”结构阈的类型,与已有报道相比,又分为
“LRR” 、 “TIR-LRR” 、 “NBS-LRR-X” 和
“TIR-NBS-LRR-TIR-NBS-LRR”四种新的类型。在利
用软件分析基础上,再通过手动检索更能准确地对
NBS-LRR类基因进行归类。
表1 拟南芥基因组中NBS-LRR基因分类
基因类别
CC-NBS-LRR
NBSCC-LRR
TIR-NBS-LRR
NBSTIR-LRR
TIR-NBS-LRR-X
TIR-NBS-TIR-NBS-LRR
TIR-TIR-NBS-LRR
LRR
NBS-LRR-X
TIR-LRR
TIR-NBS-LRR-TIR-NBS-LRR
Total with LRRs
TIR-NBS
TIR-X
X-TIR-NBS-X
CC-NBS
TIR-TIR
Total without LRRs
简称
CNL
NL
TNL
NL
TNLX
TNTNL
TTNL
L
NLX
TL
TNLTNL
TN
TX
XTNX
CN
TT
基因数目 a
54
5
83
1
2
1
3
8
5
1
1
164
7
39
4
11
4
65
基因数目 b
48
3
76
1
2
1
3
7
4
1
1
147
7
37
1
8
4
57
注:a通过生物信息学分析和数据库检索得到的基因数量;b通过
手动检索得到基因数量。
王岩等:拟南芥基因组NBS-LRR类基因家族的生物信息学分析 ·· 41
中国农学通报 http://www.casb.org.cn
拟南芥NBS抗病基因中存在大量含TIR基序的
基因,而单子叶作物水稻几乎不具有此类基因,存在明
显差异[6]。这表明双子叶植物与单子叶植物在NBS抗
病基因存在着明显差异。
2.3 NBS类型基因的物理位置
通过TAIR数据库提供的拟南芥基因组中的染色
体定位工具,确定了各种NBS-LRR类基因在拟南芥5
条染色体中的分布情况(见图1)。
图1 拟南芥NBS-LRR家族基因在染色上的分布
图 1中显示了标准NBS-LRR 类基因在拟南芥 5
条染色体上的分布,多数基因是以基因簇的形式存在
(表 2)。NBS-LRR 类基因在染色体上分布是不均衡
的,尽管NBS-LRR家族基因广泛分布在各个染色体
上,但在数量上明显不同。拟南芥的NBS-LRR家族基
因在2号染色体上只有8个,而在1号和5号染色体上
分别多达71个和68个。在不同染色体上的基因以单
基因或基因簇的形式存在,其中在 5号染色体上的基
因簇最多达到16个。
根据Holub对基因簇的定义(在 200 kb的核苷酸
单位中含有的基因群),可以得出拟南芥NBS-LRR基
因家族204个基因中共有146个基因是以基因簇的形
·· 42
式存在[7]。204个基因分布在 146个基因簇中,占基因
总数的71.6%,平均每个基因簇含3.2个基因。在这些
簇中含有2~3个基因的居多,21个簇有2个基因,14个
簇有3个基因,3个簇有4个基因,2个簇有9个基因,2
个簇有 10个基因,含有 6个、7个和 8个基因的簇各 1
个,最大的簇分布在第5号染色体上,有11个基因。
由图 1和表 2可知:第五号染色体基因簇最多达
16个,所以推测第五号染色体可能发生NBS抗病基因
的大规模复制,导致此染色体有如此高的NBS-LRR类
基因密度。只有58个NBS-LRR类型基因单独分布于
拟南芥的染色体上,占NBS-LRR总基因数28.4%。
2.4 NBS-LRR蛋白质中其他的结构域
预测蛋白质功能的生物信息学主要方法是对蛋白
质的结构域进行分析。对拟南芥中所有NBS-LRR蛋
白质进行结构域分析发现,具有NBS、LRR和TIR结
构域是NBS-LRR基因家族特点。一般,LRR结构域
以分散或多个串联在一起的形式存在,而NBS和TIR
结构域多数是单个形式存在。
除了具有 NBS、LRR 和 TIR 结构域外,在
NBS-LRR基因家族中还存在其他的结构域,包括
DUF641、PAⅡ、Pkinase、RCC1、FYVE、Mbo1_phocein、
DZC、DUF640、LIM、NACHT、WRKY、RPW8等 12个
结构域。
拟南芥 AT5G66910 蛋白含有 RPW8 结构域,
RPW8基因是一种特殊类型的抗病基因,含有RPW8
功能结构域的基因对白粉病菌具有广谱抗性。含有
RPW8.1 和 RPW8.2的转基因 Nicotiana tabacum 提高
了对Erysiphe orontii和Oidium lycopersici的抗性[8]。
WRKY类蛋白结构域最显著的特征是具有一个
或两个约含 60个氨基酸的保守的WRKY域,保守域
的N端含WRKYGQK,C端有一个C2H2 或C2HC形
式的锌指基元。在植物中,WRKY基因参与许多防卫
反应,同时也参与一些生理发育过程。大多数拟南芥
WRKY基因被病原侵染或被植物防卫反应的信号分
子水杨酸诱导[9]。
2.5 系统树分析
对拟南芥NBS-LRR基因家族进行了氨基酸多序
列比对和系统树构建,分析表明,拟南芥的NBS-LRR
结构域系统进化树除了有两个非常明显的分枝外,还
有 3个零散的小分支,根据进化关系可以分为四个亚
家族(图2)。除此之外,拟南芥的NBS-LRR类型基因
中含TIR基序基因和CC-NBS-LRR 基序基因的NBS
区域在进化树中存在于不同的进化分枝中,不存在
TIR和CC-NBS-LRR单独的分枝,说明这两类基因存
在相同的进化方式。
拟南芥中可分辨出多个簇,其中约 1/4簇只有单
个基因,显示NBS-LRR基因的冗余度较高。另外,有
些分支很长,说明这些基因的“祖先”基因在很早的时
间就发生了分化,相应基因序列已经发生大的分化,但
仍然可以肯定它们之间具有一定的演化关系。由图2
也可以得出,有些NBS-LRR基因分支较近,说明这些
基因在相对较短的时间范围内发生了复制。
2.6 NBS-LRR基因的同源性分析
根据目前已发表的文献和数据库检索,研究比较
深入的拟南芥NBS-LRR基因有13个(表3)。
为了深入分析拟南芥NBS-LRR家族相关抗病基
因的结构与功能,笔者对已经报道的NBS-LRR家族相
关抗病基因的氨基酸序列进行了比对(图 3),尽管只
有13个基因,但明显分为3个亚家族,其中第一个亚家
表2 NBS-LRR基因家族基因簇统计表
染色体
1
2
3
4
5
Total
基因
71
8
17
40
68
204
基因簇/基因
13/49
1/2
6/12
9/30
16/53
45/146
最大基因簇
11
2
2
10
10
百分数/%
69.0
25.0
70.6
75.0
77.9
71.6
表3 拟南芥NBS-LRR基因家族抗病基因的结构与功能
登录号
AT1G12210 RFL1
AT1G12220 RPS5
AT1G33560 ADR1
AT3G07040 RPM1
AT3G44480 RPP1
AT3G46530 RPP13
AT4G16860 RPP4
AT4G16890 SNC1
AT4G16950 RPP5
AT4G26090 RPS2
AT5G43470 RPP8
AT5G45250 RPS4
AT5G45260 RRS1
抗病谱
Pseudomonas syringae
Peronospora parasitica
Pseudomonas syringae
Peronospora parasitica
Peronospora parasitica
Erysiphe cichoracearum
Pseudomonas syringae
Peronospora parasitica
Peronospora parasitica
Pseudomonas syringae
Pseudomonas syringae
maculicola
Peronospora parasitica
Peronospora parasitica
Pseudomonas syringae
Peronospora parasitica
turnip crinkle virus
Pseudomonas syringae
Ralstonia solanacearum
结构特征
CC-NBS-LRR
CC-NBS-LRR
CC-NBS-LRR
CC-NBS-LRR
TIR-NBS-LRR
CC-NBS-LRR
TIR-NBS-LRR
TIR-NBS-LRR
TIR-NBS-LRR
CC-NBS-LRR
CC-NBS-LRR
TIR-NBS-LRR
TIR-NBS-LRR
王岩等:拟南芥基因组NBS-LRR类基因家族的生物信息学分析 ·· 43
中国农学通报 http://www.casb.org.cn
图2 204个拟南芥LRR-NBS氨基酸的系统树
图3 拟南芥NBS-LRR家族抗病基因氨基酸序列系统发生学分析
·· 44
族包含6个基因,分枝的可信度高,说明进化过程中亲
缘关系相近。而外测的分支包含 4个基因,分枝的可
信度低,说明进化过程中亲缘关系较远。
3 讨论
Meyers等对50%拟南芥基因组的序列分析发现,
其中包含 100多个基因,它们编码的蛋白质类似于由
R基因编码的NBS区域[10]。在拟南芥基因组中可能包
含许多NBS-LRR类基因,它们在NBS-LRR区域具有
相似性,对不同的病原物或对同种病原物的不同小种
具有抗性[11]。NBS-LRR基因通过各种分子机制为其
家族的演化提供了条件,如基因间、基因内的重组、基
因转换、基因的缺失和插入等,从而产生多种不同的特
异抗性,以应对高速变异的病原菌和各种胁迫反应[12]。
在植物基因组进化的过程中,会发生染色体复制
事件。笔者发现第一号染色体和第五号染色体发生复
制的区域较多,推测在拟南芥基因组进化的过程中,可
能发生了两次复制事件,第一号染色体比第五号染色
体发生复制的年代更久,导致差异显著。已有报道在
拟南芥中发生过两次或更多的复制事件[13-14]。拟南芥
单独分布于染色体上的 NBS-LRR 类型基因占
NBS-LRR总基因数 28.4%,而在水稻基因组中,仅为
24.1%[15],表明拟南芥的NBS-LRR类型基因重复或重
组事件的频率更高。
在拟南芥NBS-LRR基因家族中,仅 13个基因被
克隆,且大部分基因的功能目前还不清楚。通过生物
信息学方法研究拟南芥全基因组中的NBS-LRR类基
因的分类和系统发生学,对于发现新的与植物抗性相
关的基因,加快拟南芥中抗病基因的克隆以及抗病机
制的研究具有有十分重要的意义。
参考文献
[1] Gassmann W, Hinsch ME, Staskawicz BJ. The Arabidopsis RPS4
bacterial resistance gene is a member of the TIR-NBS-LRR family
of disease resistance genes[J]. Plant J, 1999, 20(3): 265-277.
[2] Mondragon-Palomino M, Meyers BC, Michelmore RW, et al.
Patterns of positive selection in the complete NBS-LRR gene
family of arabidopsis thaliana[J]. Genome Res. 2002,(12):
1305-1315.
[3] Meyers BC, Kaushik S, Nandety RS. Evolving disease resistance
genes [J]. Curr Opin Plant Biol, 2005, 8(2): 129-134.
[4] Arabidopsis Genome Initiative. Analysis of the genome sequence of
the flowering plant Arabidopsis thaliana [J]. Nature, 2000, 408:
796-815.
[5] 孙学辉,路铁刚,贾士荣,等.水稻中富含亮氨酸的重复序列和核苷
酸結合位点基因家族的生物信息学分析[J].中国农业科学,2004,
37(1):1-7.
[6] Bai J, Pennill LA, Ning J,et al. Diversity in Nucleotide Binding
Site-Leucine-Rich Repeat Genes in Cereals[J]. Genome Res, 2002,
12: 1871-1884.
[7] Holub EB. Arms race is ancient history in Arabidopsis, the
wildflower[J]. Nat Rev Genet, 2001, 2(7): 516-527.
[8] Xiao S, Brown S, Patrick E,et al. Enhanced Transcription of the
Arabidopsis Disease Resistance Genes RPW8.1 and RPW8.2 via a
Salicylic Acid-Dependent Amplification Circuit Is Required for
Hypersensitive Cell Death[J]. Plant Cell, 2003, 15: 33-45.
[9] Dong JX, Chen CH, Chen ZX. Expression profiles of the
Arabidopsis WRKY gene superfamily during plant defense
response [J]. Plant Mol Biol, 2003, 51(1): 21-37.
[10] Meyers BC, Morgante M, Michelmore W. TIR-X and TIR-NBS
proteins: Two new families related to disease resistance
TIR-NBS-LRR proteins encoded in Arabidopsis and other plant
genomes [J]. Plant Journal, 2002, 32(1): 77-92.
[11] Meyers BC, Kozik A, Griego A, et al. Genome-wide analysis of
NBS-LRR encoding genes in Arabidopsis[J]. Plant Cell, 2003, 15
(4): 809-834.
[12] Meyers BC, Dickerman AW, Michelmore RW, et al. Plant disease
resistance genes encode members of an ancient and diverse protein
family within the nucleotide-binding superfamily[J]. Plant J, 1999,
20(3): 317-332.
[13] Simillion C, Vandepoele K, Van Montagu MC, et al. The hidden
duplication past of Arabidopsis thaliana [J]. Proc Natl Acad Sci
USA, 2002, 99(21):13627-13632.
[14] Bowers J E, Chapman B A, Rong J, et al. Unravelling angiosperm
genome evolution by phylogenetic analysis of chromosomal
duplication events[J]. Nature, 2003, 422: 433-438.
[15] Zhou T, Wang Y, Chen JQ, et al. Genome-wide identification of
NBS genes in japonica rice reveals significant expansion of
divergent non-TIR NBS-LRR genes [J]. Mol Genet Genomics,
2004, 271(4):1243-1250.
王岩等:拟南芥基因组NBS-LRR类基因家族的生物信息学分析 ·· 45