全 文 :分子植物育种,2015年,第 13卷,第 11期,第 2578-2583页
Molecular Plant Breeding, 2015, Vol.13, No.11, 2578-2583
研究报告
Research Report
禾本科植物 NBS-LRR型抗病基因的进化分析
金玲 1* 金殿川 2 王莉 3 王金鹏 3 张岚 3
1华北理工大学,唐山, 063000 ; 2华北理工大学理学院,唐山, 063000; 3华北理工大学生命科学学院,唐山, 063000
*通讯作者, jinlingrr@qq.com
摘 要 运用生物信息学方法分析了禾本科植物水稻、高粱、二穗短柄草、玉米中 NBS-LRR型抗病基因的进
化特征,发现 NBS-LRR型抗病基因在染色体上分布不均等,且大部分都位于基因簇中。NBS-LRR型抗病基
因产生新基因的方式主要是串联重复,并且串联重复发生的概率与抗病基因所在基因簇的大小有关。
NBS-LRR型抗病基因之间几乎不具有共线性,一方面,可能是由于抗病基因在进化的过程中发生了基因丢
失造成的;另一方面,可能是由于抗病基因的进化速率较快导致基因间差异较大造成的。系统发育分析表明
NBS-LRR型抗病基因在禾本科的祖先物种中就已经存在,4个物种分离之后抗病基因家族在每个物种中按
照物种特异性的方式进行了扩张,其中串联重复对 4个物种中抗病基因家族的扩张起到了重要的作用。
关键词 禾本科植物,抗病基因,串联重复,基因簇,进化分析
Evolutionary Analysis of NBS-LRR Resistance Gene in Grass
Jin Ling 1* Jin Dianchuan 2 Wang Li 3 Wang Jinpeng 3 Zhang Lan 3
1 North China University of Science and Technology, Tangshan, 063000; 2 North China University of Science and Technology, College of Science,
Tangshan, 063000; 3 North China University of Science and Technology, College of Life Sciences, Tangshan, 063000
* Corresponding author, jinlingrr@qq.com
DOI: 10.13271/j.mpb.013.002578
Abstract We analyze the evolutionary characteristics of NBS-LRR resistance genes (R genes) by using bioinfor-
matics method in grass species including rice, maize, Brachypodium distachyon and sorghum. We find that R genes
are distributed unevenly on chromosomes and the majority of them are present in gene clusters. We also find that
new R genes mainly generated by tandem duplication, and the occurrence of tandem duplication is related to gene
clusters. Poor collinearity among R genes in the grass indicates frequent gene loss during evolutionary process or
difference of R genes caused by the rapid evolutionary rate. The phylogenetic analysis suggests that many R genes
have been preserved in grass common ancestor. After the split of four species, R genes expands in a species-specific
manner. Tandem duplication events contribute mostly to the expansion of this family in four species.
Keywords Disease resistance genes, Tandem duplication, Gene cluster, Positive selection
基金项目:本研究由河北省自然科学基金(C2014209201)资助
植物要保护自己就必须持续的抵抗细菌、病毒、
真菌、无脊椎动物,甚至其它动物的侵袭。植物不能
运动,无法逃避,所以植物必须适应这种环境
(Buchanan et al., 2004)。植物抗病基因是植物与病原
体长期相互作用的产物,它在抵御病原体的过程中
发挥了重要作用。其中 NBS-LRR型抗病基因是数目
最多的一类抗病基因,其编码蛋白的典型特征是序
列中包含核苷酸结合位点(NBS)和下游富含亮氨酸
的重复序列(LRR),能够有效抵御包括病毒、细菌、真
菌、线虫和昆虫等多种病害(季军等, 2007)。在目前研
究抗病基因进化的相关文献中,提出 NBS-LRR型抗
病基因主要是通过协同进化(concerted evolution)和
出生-死亡过程(birth-death process)进化,这是抗病
基因在基因组水平进化的两种主要机制(Richard and
Blake, 1998)。
目前,在基因组水平上对抗病基因进化的研究
主要针对单一的物种,本研究分别对四个典型禾本
科物种水稻、高粱、二穗短柄草、玉米中的抗病基因
进行系统发育分析,进而推断得到禾本科物种抗病
基因的进化特征。因为几乎所有的粮食都是禾本科
分子植物育种
Molecular Plant Breeding
图 1水稻同源抗病基因的系统发育树(ks<0.1)
Figure 1 Phylogenetic tree of rice homologous resistance genes
(ks<0.1)
植物,所以研究禾本科物种抗病基因的进化,具有十
分重要的现实意义。
1结果与分析
1.1禾本科抗病基因的分布特征
下载得到的水稻、高粱、二穗短柄草、玉米中抗
病基因的数量分别为 321、280、151、97。其中,水稻中
的 11号染色体分布的抗病基因最多有 88个,大约
有 94.1%的抗病基因位于基因簇中,最大的一个基因
簇包含 56个抗病基因分布在 11号染色体上;高粱
中的 5号染色体分布的抗病基因最多有 85个,大约
有 92.9%的抗病基因位于基因簇中,最大的一个基因
簇包含 43个抗病基因分布在 5号染色体上;二穗短
柄草中的 4号染色体分布的抗病基因最多有 56个,
大约有 73.3%的抗病基因位于基因簇中,最大的一个
基因簇包含 15个抗病基因分布在 2号染色体上;玉
米中的 10号染色体分布的抗病基因最多有 18个,
大约有 70.1%的抗病基因位于基因簇中,最大的一个
基因簇包含 12个抗病基因分布在 4号染色体上。
这些抗病基因在染色体上的分布是不均等的,
而且四个物种中大部分抗病基因在染色体上成簇存
在。基因簇(gene cluster)指基因家族中各成员紧密衔
接排列成的重复单元,位于染色体的特殊区域(张玉
静, 2000)。基因簇中的成员属于同一个祖先基因的扩
增产物,少则可以是由重复产生的两个邻近相关基
因所组成,多则可以是由几百个相关基因串联排列
而成。由于基因簇中的基因很容易发生不等交换产
生大量的重复基因,而目前在物种中存在的抗病基
因数量并没有预想的那么多,这说明在抗病基因中
一定存在一个快速高效的移除机制,从而维持了现
有的抗病基因数量。
1.2禾本科抗病基因的共线性分析
共线性分析首先是用一个序列相似性搜索的程
序找到匹配的基因对,然后用动态规划的方法找到
相邻的一串相似基因对(Wang, 2012)。首先根据 Blast
序列比对的结果,得到两个基因对是否匹配以及匹
配期望值大小的信息,另外根据基因的 gff文件,得
到基因在染色体上物理位置的信息,然后计算每条
染色体上所有可能的共线基因片段,即所有可能具
有共线性关系的基因。
在运行Mcscan软件得到的 block文件中可以发
现,四个物种的抗病基因之间几乎不具有共线性,只
有高粱中的抗病基因 Sb04g007100.1和二穗短柄草
中的抗病基因 Bradi3g07580.1 具有共线性关系,并
且这两个基因都是单基因,而其它的抗病基因之间
都不具有共线性关系,一方面可能是由于抗病基因
在进化的过程中发生了基因丢失造成的,另一方面
可能是由于抗病基因的进化速率较快导致基因间差
异较大造成的。
1.3禾本科抗病基因的进化分析
当同义替换率 ks<0.1时,说明是最近发生重复
产生的新基因。分别对水稻、高粱、二穗短柄草、玉米
中 ks<0.1的抗病基因进行系统发育分析。根据系统
发育树可以确定具有进化关系的基因,基因树中两
个分支节点的基因离的越近说明它们的亲缘关系越
近(Monosi et al., 2004)。另外,根据抗病基因在染色
体上的物理位置,可以推断系统发育树中哪些节点
发生了串联重复事件,如果一对抗病基因在系统发
育树中的亲缘关系近,并且它们在染色体上的物理
位置也是邻近的,那么就可以推断它们可能是通过
串联重复产生的。
水稻中 ks<0.1的同源抗病基因一共有 16个,用
这 16个基因构建系统发育树(图 1)。
通过水稻同源抗病基因的系统发育树以及查找
包含抗病基因位置信息的 gff文件可以发现,水稻抗
病基因在最近一次发生基因重复产生的新基因中,
亲缘关系近的抗病基因只有 Os11g022770、Os11g02-
29200 和 Os11g0228600、Os11g0226933 这两对抗病
基因在染色体上的物理位置不是邻近的,而其它亲
缘关系近的抗病基因在染色体上的物理位置也是邻
近的,因此可以推断水稻中最近一次新出生的抗病
基因大约有 77.8%是通过串联重复产生的。而且水稻
2579
图 2高粱同源抗病基因的系统发育树(ks<0.1)
Figure 2 Phylogenetic tree of sorghum homologous resistance
genes (ks<0.1)
图 3二穗短柄草同源抗病基因的系统发育树(ks<0.1)
Figure 3 Phylogenetic tree of Brachypodium distachyon homolo-
gous resistance genes (ks<0.1)
中新出生的抗病基因都位于基因簇中,其中抗病基
因 Os12g0481400 和 Os12g0481700 位于水稻 12 号
染色体上包含 20个抗病基因的基因簇中;抗病基因
Os12g0272800 和 Os12g0273266 位于水稻 12 号染
色体上另一个包含 15个抗病基因的基因簇中;抗病
基因 Os11g0226933、Os11g0227700、Os11g0228600、
Os11g0229200位于水稻 11号染色体上包含 26个抗
病基因的基因簇中;Os11g0673600、Os11g0673900、
Os11g0676100、Os11g0676200、Os11g0676050、Os11-
g0676960、Os11g0676980、Os11g0677101位于水稻 11
号染色体上另一个包含 56个抗病基因的基因簇中。
高粱中 ks<0.1的同源抗病基因一共有 20个,用
它们构建系统发育树(图 2)。
通过高粱中同源抗病基因的系统发育树以及查
找包含抗病基因位置信息的 gff文件可以发现,高粱
抗病基因在最近一次发生基因重复产生的新基因
中,亲缘关系近的抗病基因 Sb08g002350.1、Sb08g0-
02390.1和 Sb07g004830.1、Sb07g004880.1这两对抗
病基因在染色体上的物理位置不是邻近的,而其它
的亲缘关系近的抗病基因在染色体上的物理位置也
都是邻近的,因此可以推断高粱中最近一次新出生
的抗病基因大约有 81.8%是通过串联重复产生的。
而且高粱中新出生的抗病基因都位于基因簇中,其
中抗病基因 Sb05g004300.1、Sb05g004320.1、Sb05g0-
04330.1、Sb05g004360.1、Sb05g004380.1、Sb05g0044-
10.1、Sb05g004430.1、Sb05g004460.1、Sb05g008250.1
位于高粱 5号染色体上包含 34个抗病基因的基因
簇中;抗病基因 Sb05g017145.1、Sb05g022785.1、Sb0-
5g022790.1、Sb05g026940.1、Sb05g026970.1 位于高
粱 5号染色体上另一个包含 43个抗病基因的基因簇
中;抗病基因 Sb07g004830.1和 Sb07g004880.1位于
高粱 7号染色体上包含 22个抗病基因的基因簇中;
抗病基因 Sb08g002350.1和 Sb08g002390.1位于高粱
8号染色体上包含 15个抗病基因的基因簇中;抗病基
因 Sb08g022170.1和 Sb08g022180.1位于高粱 8号染
色体上另一个包含 20个抗病基因的基因簇中。
用二穗短柄草中 ks<0.1的 18个同源抗病基因
构建系统发育树(图 3)。
通过二穗短柄草中同源抗病基因的系统发育树
以及查找包含抗病基因位置信息的 gff文件可以发
现,二穗短柄草中抗病基因在最近一次发生基因重
复产生的新基因中,亲缘关系近的抗病基因 Bra-
di2g03060.1、Bradi2g03020.1;Bradi2g36150.1、Bradi-
2g36180.1;Bradi2g36030.1、Bradi2g36040.1;Bradi2g-
38830.1、Bradi2g38840.1 这四对抗病基因在染色体
上位于邻近的位置,因此可以推断二穗短柄草中最
近一次新出生的抗病基因大约有 44.4%是通过串联
重复产生的。二穗短柄草新出生的抗病基因中有
88.9%位于基因簇中,只有 Bradi2g36030.1 和 Bra-
di2g36040.1不位于基因簇中,其它的抗病基因都位
于基因簇中,其中抗病基因 Bradi2g03020.1和 Bra-
di2g03060.1位于二穗短柄草的 2号染色体上包含 7
个抗病基因的基因簇中;抗病基因 Bradi4g10020.1、
Bradi4g10060.1、Bradi4g10150.1、Bradi4g10220.1 位
于二穗短柄草 4号染色体上包含 13个抗病基因的
禾本科植物 NBS-LRR型抗病基因的进化分析
Evolutionary Analysis of NBS-LRR Resistance Gene in Grass 2580
分子植物育种
Molecular Plant Breeding
图 4玉米同源抗病基因的系统发育树(ks<0.1)
Figure 4 Phylogenetic tree of maize homologous resistance genes
(ks<0.1)
基因簇中;抗病基因 Bradi2g36150.1、Bradi2g36180.1、
Bradi2g38830.1、Bradi2g38840.1 位于二穗短柄草 2
号染色体上包含 15 个抗病基因的基因簇中;Bra-
di5g22550.1和 Bradi5g22840.1在二穗短柄草 5号染
色体上包含 9个抗病基因的基因簇中;Bradi4g13550.1
和 Bradi4g13470.1位于二穗短柄草 4号染色体上包
含 4个抗病基因的基因簇中。
用玉米中 ks<0.1的 8个抗病基因构建系统发育
树(图 4)。
通过玉米中同源抗病基因的系统发育树以及查
找包含抗病基因位置信息的 gff文件可以发现,玉米
中抗病基因在最近一次发生基因重复产生的新基因
中,亲缘关系近的抗病基因只有 Zm2g003625、
Zm2g069382这对抗病基因在染色体上的物理位置
不是邻近的,而其它亲缘关系近的抗病基因在染色
体上的物理位置也是邻近的,因此可以推断玉米中
最近一次新出生的抗病基因大约有 75%是通过串联
重复产生的。玉米中新出生的抗病基因中大约有 75%
位于基因簇中,只有 Zm2g064015 和 Zm2g302279
这两个抗病基因不位于基因簇中,其它的抗病基
因都位于基因簇中,其中抗病基因 Zm2g180244、
Zm2g180254、Zm2g069382、Zm2g003625 位于玉米
10号染色体上包含 9个抗病基因的基因簇中;抗病
基因 Zm2g026083 和 Zm2g101527 位于玉米 7 号染
色体上另一个包含 5个抗病基因的基因簇中。
通过水稻、高粱、二穗短柄草、玉米中抗病基因
序列构建的系统发育树可以推断,四个物种中抗病
基因产生新基因的方式主要是串联重复,并且串联
重复发生的概率与抗病基因所在的基因簇大小有
关。串联重复在抗病基因进化的过程中,起到了维持
抗病基因功能以及平衡抗病基因数量的作用。
禾本科四个物种中共包含 849个抗病基因,其
中有 321个抗病基因来自水稻,280个抗病基因来自
高粱,151个抗病基因来自二穗短柄草,97个抗病基
因来自玉米。用这些基因构建禾本科四个物种抗病
基因的系统发育树(图 5)。
分别用四种不同的颜色表示禾本科四个物种中
的抗病基因,其中红色代表水稻中的抗病基因;蓝色
代表高粱中的抗病基因;绿色代表二穗短柄草中的
抗病基因;黄色代表玉米中的抗病基因。对禾本科抗
病基因的系统发育树进行分析结果显示:同一物种
中的抗病基因并没有完全聚类,而是将全部抗病基
因分成了相对独立的亚族,每一个亚族中都包含水
稻、高粱、二穗短柄草、玉米的抗病基因,这表明抗病
基因家族很可能在这四个物种分离之前就已经存在
了。在系统发育树的末端分支上旁系同源基因的数
量明显高于直系同源基因的数量,这表明祖先物种
中很可能具有少量的抗病基因,在物种分离之后每个
物种中的抗病基因可能按照物种特异性的方式进行
了扩张,从而形成了现有的抗病基因数量。通过查找
包含抗病基因物理位置信息的 gff文件可以发现,在
每个物种中亲缘关系近的抗病基因大部分都位于染
色体上邻近的位置,这表明在每个物种中抗病基因的
物种特异性扩张很可能是串联重复的结果,串联重复
对四个物种中抗病基因的扩张起到了重要的作用。
2讨论
本课题主要运用生物信息学方法分析了禾本科
物种中抗病基因的进化特征。禾本科物种中抗病基
因在染色体上分布不均等,而且大部分抗病基因在
染色体上成簇存在,其中水稻、高粱、二穗短柄草、玉
米中分别有 94.1%、92.9%、73.3%、70.1%的抗病基因
位于基因簇中。四个物种中抗病基因产生新基因的
方式主要是串联重复,在水稻、高粱、二穗短柄草、玉
米新出生的抗病基因中分别有 77.8%、81.8%、44.4%、
75%的抗病基因是通过串联重复产生的,串联重复发
生的概率与抗病基因所在基因簇的大小有关,串联
重复在抗病基因的进化过程中起到了维持抗病基因
功能以及平衡抗病基因数量的作用。四个物种中的
抗病基因之间几乎不具有共线性,只有高粱中的抗
病基因 Sb04g007100.1和二穗短柄草中的抗病基因
Bradi3g07580.1这一对抗病基因具有共线性关系,并
且这两个抗病基因都是单基因,而其它的抗病基因
之间都不具有共线性关系,一方面可能是由于抗病
基因在进化的过程中发生了基因丢失造成的,另一
方面可能是由于抗病基因的进化速率较快导致基因
间差异较大造成的。系统发育分析表明在禾本科的
2581
图 5禾本科抗病基因的系统发育树
Figure 5 Phylogenetic tree of resistance gene in grass
祖先物种中很可能具有少量的抗病基因,在四个物
种分离之后每个物种中的抗病基因可能按照物种特
异性的方式进行了扩张,从而形成了现有的抗病基
因数量,而且每个物种中抗病基因的物种特异性扩
张很可能是串联重复的结果,串联重复对四个物种
中抗病基因的扩张起到了重要的作用。
3材料与方法
3.1数据来源
从 NCBI (http://www.ncbi.nlm.nih.gov/)分别下载
禾本科植物水稻、高粱、二穗短柄草、玉米中 NBS-LRR
型抗病基因的 CDS序列保存为 Fasta格式的文件,并
在 Linux 操作系统上编写 perl 程序将抗病基因的
CDS序列翻译成对应的蛋白质序列,并提取包含抗病
基因在染色体上物理位置信息的 gff文件。
3.2生物信息学分析方法
运用 BLAST软件对四个物种中抗病基因的蛋白
质序列进行同源序列搜索,确定每个物种中抗病基因
的同源基因,将比对的参数 E值设为 1e-5,从而排除
蛋白质相似性匹配长度很短的基因对。再运用 Mc-
禾本科植物 NBS-LRR型抗病基因的进化分析
Evolutionary Analysis of NBS-LRR Resistance Gene in Grass 2582
分子植物育种
Molecular Plant Breeding
scan软件(http://chibba.agtec.uga.edu/duplication/mcscan/)
寻找水稻、高粱、二穗短柄草、玉米中与抗病基因
具有共线性关系的基因,分析抗病基因的共线性
情况。
运用 Perl语言编程分别计算水稻、高粱、二穗短
柄草、玉米中同源抗病基因之间同义替换率 ks的
值。然后,利用 MEGA软件分别对水稻、高粱、二穗
短柄草、玉米中 ks<0.1的抗病基因做 CLUSTAL多
序列比对,然后采用邻近连接法构建系统发育树并
对得到的系统发育树进行自举检验,将自举检验的
值设置为 1 000。最后,利用 Phyml软件采用默认的
参数值对禾本科四个物种的抗病基因构建系统发育
树,分析抗病基因的进化特征。
作者贡献
王莉、张岚是本研究的实验设计和实验研究的
执行人;王金鹏、金玲完成数据分析,论文初稿的写
作;金殿川参与实验设计,试验结果分析;金玲是项
目的构思者及负责人,指导实验设计,数据分析,论
文写作与修改。全体作者都阅读并同意最终的文本。
致谢
本研究由河北省自然科学基金(C2014209201)
资助。感谢华北理工大学基因组学与计算生物学实
验室王希胤老师对本研究的指导和支持。
参考文献
Buchanan B.B., Gruissem W., and Jones R.L., eds., Qu L.J., Gu
H.Y., Bai S.N., Zhao J.D., and Chen Z.L., trans., 2004, Bio-
chemistry and molecular biology of plants, Science press,
Beijing, China, pp.904 (布坎南 B.B.,格鲁伊森姆W.,琼斯
R.L.,主编,翟礼嘉,顾红雅,白书农,赵进东,陈章良,主
译, 2004, 植物生物化学与分子生物学, 科学出版社, 中
国,北京, pp.904)
Ji J., Yang S.H., and Tian D.C., 2007, Pattenrs of positive selec-
tion and gene conversion in the complete disease resistance
genes of rice, Zhongguo Nongye Kexue (Scientia Agricultura
Sinica), 40(9): 1856-1863 (季军,杨四海,田大成, 2007,水
稻基因组中抗病基因正选择方式及基因转换的研究,中
国农业科学, 40(9): 1856-1863)
Richard W.M., and Blake C.M., 1998, Clusters of resistance
genes in plants evolve by divergent selection and a birth-
and-death process, Genome Res., 8(11): 1113-1130
Zhang Y.J, eds., 2000, Molecular genetics, Science Press, Bei-
jing, China, pp.87 (张玉静,编著, 2000,分子遗传学,科学
出版社,中国,北京, pp.87)
Wang Y.P., Tang H.B., Jeremy D. D., Tan X., Li J.P., Wang X.Y.,
Tae-ho Lee, Jin H.Z., Barry M., Guo H., Jessica C.K., and
Andrew H.P., 2012, MCScanX: a toolkit for detection and
evolutionary analysis of gene synteny and collinearity, Nu-
cleic acids research, 40(7): 49
Monosi B., Wisser J., and PennillL., 2004, Full-genome analysis
of resistance gene homologues in rice, Theor. Appl. Genet.,
109(7): 1434-1447
2583