免费文献传递   相关文献

Identification of Expressed Resistance Gene Analogues (RGAs) and Development of RGA-SSR Markers in Nicotiana

烟草表达抗病基因同源物(RGAs)的鉴定及RGA-SSR标记的开发


烟草是研究植物与病原菌互作的理想材料。鉴定烟草抗病基因及其同源物对揭示抗病机制具有重要意义。近年来公共数据库不断增长的EST序列为烟草表达RGA的鉴定提供丰富的数据。本研究通过拼接GenBank收录的412 325条烟草EST序列,获得149 606Uni-EST序列。随后利用已克隆的112个植物R基因蛋白序列对其扫描,检测出1113NtRGA,其中有2735465310230个分别包含NBS-LRRLRR-PKLRRPKMlo结构域,另有109个未检测到结构域。通过序列比对将1071NtRGA定位于N. benthamiana基因组712个位点上。经搜索,从72NtRGA检测出78SSR,根据其侧翼序列设计64对引物。54对成功从烟草基因组DNA中扩增出清晰条带,9对在24个普通烟草品种间检测出多态性,检出等位基因数2~4个,平均2.56个;41对在6个烟草种间检测出多态性,检出等位基因数2~4个,平均2.61个。


全 文 :作物学报 ACTA AGRONOMICA SINICA 2014, 40(2): 240−252 http://zwxb.chinacrops.org/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn

本研究由 广东省烟草专卖局科技计划项目(201106), 广东省科技计划项目(2010B020302004)和广东省烟草专卖局(公司)科技项目
(200905)资助。
* 通讯作者(Corresponding author): 陈俊标, E-mail: jbchen2007@126.com, Tel: 86-20-87596595
第一作者联系方式: E-mail: qinghua654321@126.com
Received(收稿日期): 2013-06-02; Accepted(接受日期): 2013-07-25; Published online(网络出版日期): 2013-09-29.
URL: http://www.cnki.net/kcms/detail/11.1809.S.20130929.1537.009.html
DOI: 10.3724/SP.J.1006.2014.00240
烟草表达抗病基因同源物(RGA)的鉴定及 RGA-SSR标记的开发
袁清华 谢锐鸿 张振臣 马柱文 李集勤 李淑玲 陈俊标*
广东省农业科学院作物研究所, 广东广州 510640
摘 要: 烟草是研究植物与病原菌互作的理想材料。鉴定烟草抗病基因及其同源物对揭示抗病机制具有重要意义。
近年来公共数据库不断增长的 EST序列为烟草表达 RGA的鉴定提供丰富的数据。本研究通过拼接 GenBank收录的
412 325条烟草 EST序列, 获得 149 606条 Uni-EST序列。随后利用已克隆的 112个植物 R基因蛋白序列对其扫描, 检
测出 1113个 NtRGA, 其中有 273、546、53、102和 30个分别包含 NBS-LRR、LRR-PK、LRR、PK和 Mlo结构域, 另
有 109个未检测到结构域。通过序列比对将 1071个 NtRGA定位于 N. benthamiana基因组 712个位点上。经搜索, 从
72个 NtRGA中检测出 78个 SSR, 根据其侧翼序列设计 64对引物。54对成功从烟草基因组 DNA中扩增出清晰条带,
9对在 24个普通烟草品种间检测出多态性, 检出等位基因数 2~4个, 平均 2.56个; 41对在 6个烟草种间检测出多态
性, 检出等位基因数 2~4个, 平均 2.61个。
关键词: 烟草; 表达序列标签; 抗病基因同源物; SSR
Identification of Expressed Resistance Gene Analogues (RGAs) and Develop-
ment of RGA-SSR Markers in Nicotiana
YUAN Qing-Hua, XIE Rui-Hong, ZHANG Zhen-Chen, MA Zhu-Wen, LI Ji-Qin, LI Shu-Ling, and CHEN
Jun-Biao*
Crops Research Institute, Guangdong Academy of Agricultural Sciences, Guangzhou 510640, China
Abstract: Tobacco is an ideal experimental system for studing on plant-pathogen interaction. Identification of tobacco R gene and
resistance gene analogs is propitious to elucidating the underlying resistant mechanisms. In recent years, the growing public to-
bacco EST data provide rich source for identifying expressed RGA. In this study, 149 606 Uni-EST were assembled from 412 325
ESTs of tobacco in GenBank. By scanning the Uni-EST with 112 plant R gene protein sequences 1113 NtRGAs were identified.
These expressed RGAs comprised 273, 546, 53, 102, and 30 of NBS-LRR, LRR-PK, LRR, PK, and Mlo domains encoding R
genes, respectively. No domain was detected in the rest of 109 RGAs. By aligning sequence 1079 NtRGAs were allocated on 712
loci in N. benthamiana genome. A total of 78 simple sequence repeats (SSRs) were identified from 72 NtRGAs. Sixty-four primer
pairs were designed base on the flanking sequence of SSR. Among them, 54 primer pairs were amplified with clear bands from
tobacco genomic DNA. Nine primer pairs were detected to have polymorphism among 24 varieties of Nicotiana tabacum with
two to four alleles (on average 2.56 alleles). Forty-one primer pairs were detected to have polymorphism among six species in
Nicotiana with two to four alleles (on average 2.61 alleles).
Keywords: Nicotiana; Expressed sequence tags; Resistance gene analogs; SSR
烟草是我国乃至世界重要的经济作物。农业生
产中, 烟草青枯病、花叶病毒病和黑胫病等严重影
响烟叶产量和品质。据全国烟草病虫害预测预报及
综合防治网统计 , 2010年和2011年 , 全国16个烤烟
主产省烟草病虫害发生面积达80万公顷, 产量损失
6万吨, 产值损失7亿元。因此, 防治烟草病虫害对
烟叶生产具有重要作用, 而烟草抗病基因(R 基因)
和抗病基因同源物(RGA)的克隆则对揭示烟草抗病
第 2期 袁清华等: 烟草表达抗病基因同源物(RGA)的鉴定及 RGA-SSR标记的开发 241


机制以及制定正确的病虫害防治措施具有重要的
意义。
植物 R 基因对病原菌无毒基因编码蛋白的识别
起关键作用[1]。近年来, 通过图位克隆或转座子标签
法克隆的植物 R 基因超过100个 [2-5] (http://prgdb.
crg.eu/wiki/Species_with_R-genes)。尽管植物 R基因
克服的病原物种类不同, 其编码的氨基酸序列却存
在类似结构域, 如核苷酸结合位点(nucleotide binding
site, NBS)、富含亮氨酸重复序列(leucine-rich repeats,
LRR)、丝氨酸 /苏氨酸激酶(serine-threonine kinase,
STK)、亮氨酸拉链结构(leucine zippers, LZ)、跨膜结
构域(transmembrane domain, TM)、Toll白介素-1区域
(toll-interleukin-1 region, TIR)等[6-9]。这些保守结构域
为 R基因和 RGA的快速鉴定克隆提供捷径。
根据氨基酸序列保守结构域可将抗病基因分为
6 大类[2]。第 1 类含有 NBS 和 LRR 结构域(NBS-
LRR)。基于 N端是否缺失 TIR, 此类 R基因又可分
为 2个亚类, 即 TIR-NBS-LRR和 non-TIR-BS-LRR,
例如抗烟草花叶病毒的 N 基因含有 TIR-NBS-LRR
结构域 [7,10], 而抗丁香假单胞杆菌 (Pseudomonas
syringae)的拟南芥 Rps2 基因则含有 CC-NBS-LRR
结构域[11]。第 2类含有 LRR和 PK结构域(LRR-PK),
例如拟南芥 Fls2 和水稻 Xa21基因[12-13]。第 3类含
有一个胞外 LRR结构域, 例如拟南芥 RPP27基因[14]。
第 4 类只含有 PK 结构域, 例如番茄 Pto 和香瓜 At1
基因[15-16]。第 5 类包含具有不同抗性机制的其他 R
基因, 如玉米 Hm1和大麦 Mlo基因[3,17]。
早期 RGA 的分离主要通过 PCR 扩增 R 基因保
守结构域, 此法已成功从拟南芥[18-19]、大豆[20]、水
稻[21]、玉米[22]、小麦[23]、烟草[24-25]和其他植物[26-28]
中分离出 RGA。Bertioli等[29]根据 NBS设计简并引
物, 从花生栽培种和野生种中分离到 78 个 RGA。
Gao 等 [25]基于 NBS 和 PK 结构域从烟草品种
Nicotiana repanda分离出 100个 RGA。
与 PCR 扩增相比, 采用数据挖掘方法从基因组
中鉴定 RGA效率更高, 基于已公布的植物全基因组
序列, 迄今已成功从拟南芥[10]、水稻[30]、蒺藜苜蓿[31]
和百脉根[32]基因组中鉴定大量 RGA。Meyers 等[10]
从拟南芥基因组中鉴定出149个 NBS-LRR 编码基因
和58个其他相关基因。Ameline-Torregrosa等[31]从蒺
藜苜蓿全基因组草图中鉴定出333个非冗余 NBS-
LRR, 并预测全基因组含有400~500个 NBS-LRR 基
因。近期, Li等[32]从百脉根基因组中成功分离出158
个 NBS序列。
由于植物基因组中存在大量丧失生物学功能的
假基因, 而表达基因占植物基因组比例不到 1%, 根
据基因组 DNA序列开发的 RGA多为不表达的假基
因[32], 严重干扰 R 基因的克隆。因此, 鉴定具有表
达活性的 RGA对 R基因的克隆显得尤为重要。近期,
通过数据挖掘已从植物 EST 序列中鉴定出系列
RGAs。Liu 等[33]利用 454 技术测序获得 169 万条菜
豆 EST, 随后从中鉴定出 364个 RGA。Liu等[34]利用
54个植物 R基因氨基酸序列扫描 GenBank收录的花
生 EST序列, 成功鉴定出 385个表达花生 RGAs。
RGA 鉴定后常被用于开发 RGA 分子标记。基
于 RGA 开发的分子标记主要有 RFLP[35]、STS[36]、
SSCP[37]、CAPS[38]和 SSR[34]标记等。Sanz等[35]根据
燕麦 RGA 序列设计 31 个 RFLP 探针, 并成功将 53
个 RGA-RFLP 标记定位到燕麦六倍体遗传图谱上
(Avena byzantina cv. Kanota × Avena sativa cv.
Rollo)。近期, Liu等[34]从 25个花生 RGA中开发出
28个 SSR标记, 并将其中一个标记 RGA121定位到
连锁群 AhIV 上。由于 SSR 标记具有共显性、多态
性高、操作简单且重复性好等优点, 与其他标记相
比, 从RGA中开发 SSR更有利于抗病基因的定位与
克隆。
目前公共核酸数据库 GenBank收录的烟草 EST
序列已达 412 325条(截至 2012年 7月 20日), 几乎
涵盖不同时期, 不同组织表达的基因, 为烟草表达
RGA 鉴定提供丰富的资源。鉴于此, 本研究拟利用
数据挖掘方法从烟草 EST序列中鉴定表达 RGA, 继
而开发 RGA-SSR 标记。这将为烟草 R 基因的定位
与克隆奠定基础。
1 材料与方法
1.1 植物材料
普通烟草品种 24个(表 1), 其他烟草种 6个, 种
植于广东省农业科学院试验农场, 于生长期取叶片
提取基因组 DNA。
1.2 烟草 EST序列拼接
采用 TIGR基因指数聚类工具(TIGR gene indi-
ces clustering tools, 简称 TGICL, http://compbio.dfci.
harvard.edu/tgi/software/), 对 GenBank 收录的 EST
序列进行拼接。当 EST序列重叠超过50个核苷酸且
相似度达到90%, 同时序列不匹配长度不超过20个
核苷酸时被认为符合拼接要求。
242 作 物 学 报 第 40卷


表 1 供试烟草栽培品种
Table 1 Varieties and wild species of tobacco used in this study
编号
No.
材料
Material
类型
Type
1 ATNARELLO 白肋烟 Burley
2 KY26 白肋烟 Burley
3 大白筋 599 Big white burley 599 白肋烟 Burley
4 白肋 9号 White burley 9 白肋烟 Burley
5 阿波烟 Aboyan 白肋烟 Burley
6 Margland 609 白肋烟 Burley
7 广黄 5号 Guanghuang 5 烤烟 Flue-cured tobacco
8 丰字 1号 Fengzi 1 烤烟 Flue-cured tobacco
9 革新 6号 Gexin 6 烤烟 Flue-cured tobacco
10 革杂基 Gezaji 烤烟 Flue-cured tobacco
11 红花大金元 Honghuadajinyuan 烤烟 Flue-cured tobacco
12 金星 Jinxing 烤烟 Flue-cured tobacco
13 白骨牛利 Baiguniuli 晒烟 Sun-cured tobacco
14 大秋根 2 Daqiugen 2 晒烟 Sun-cured tobacco
15 大山沟 Dashangou 晒烟 Sun-cured tobacco
16 大同 Datong 晒烟 Sun-cured tobacco
17 大叶密合 Dayemihe 晒烟 Sun-cured tobacco
18 大种白毛 Dazhongbaimao 晒烟 Sun-cured tobacco
19 2040 雪茄烟 Cigar
20 74-16 雪茄烟 Cigar
21 夏湾娜 Xiawanna 雪茄烟 Cigar
22 Black sea samsun 香料烟 Oriental tobacco
23 Cuban Havana 雪茄烟 Cigar
24 Dark Virginia 烤烟 Flue-cured tobacco
25 克利夫兰氏烟草
Nicotiana clevelandii A. Gray
多室烟草组
Nicotiana sect. Polydicliae
26 残波烟草
Nicotiana repanda Willd
残波烟草组
Nicotiana sect. Repandae
27 迪勃纳氏烟草
Nicotiana debneyi Domin
香甜烟草组
Nicotiana sect. Suaveolentes
28 黄花烟草 Nicotiana rustica L. 黄花烟草组
Nicotiana sect. Rusticae
29 绒毛状烟草
Nicotiana tomentosiformis Good sp.
绒毛烟草组
Nicotiana sect. Tomentosae
30 林烟草 Nicotiana sylvestris Speg.
& Comes
林烟草组
Nicotiana sect. Sylvestres

1.3 数据挖掘烟草 RGA
利用 112个已克隆的植物 R基因(表 2)氨基酸序
列扫描 Uni-EST, 从中鉴定表达 RGAs。序列比对采
用 tBlastn 工具, 比对分值大于或等于 100, 且 E 值
小于或等于 1E–10 的 Uni-EST 被认为是候选烟草
RGAs (NtRGAs)。
1.4 NtRGA在 N. benthamiana基因组中的定位
利用 Blast工具将 NtRGA 通过序列比对定位在
本塞姆氏烟草(Nicotiana benthamiana)全基因组草图上
(http://solgenomics.net/organism/Nicotiana_benthamiana/
nome)。根据比对结果选择比对分值最高、E值最小,
且比对分值大于 50, E值小于 1E–10的基因组序列作
为 RGA定位区段。
1.5 烟草 RGA-SSR标记的开发
采用 Perl脚本MIcroSAtellite (MISA, http://pgrc.
ipk-gatersleben.de/misa/)从 RGA序列搜索 SSR位点。
设置以下 SSR搜索限制因子: 最短 15 bp, 二核苷酸
基序最少重复 8次, 三核苷酸基序至少重复 5次, 四
五六核苷酸基序至少重复 4 次, 不包含单核苷酸类
型。基于 SSR侧翼序列, 采用 Primer Premier 5软件
设计引物。新引物随后用于检测 24个烟草栽培种和
6个野生种的多态性。
2 结果与分析
2.1 烟草 EST序列拼接
截至 2012年 6月 7日, GenBank收录的烟草属
EST序列共 412 325条, 其中 N. tabacum 334 384条,
N. benthamiana 56 102条, N. langsdorffii × N. san-
derae 12 448条, N. sylvestris 8583条, N. attenuata
355条, 其他烟草种 453条。通过登陆 GenBank, 将
上述 EST 序列以 FASTA 格式下载保存, 作为烟草
RGAs 开发的原始数据。由于原始 EST 数据存在大
量冗余序列 , 为提高 EST 序列质量 , 获得比原始
EST 序列更长, 且来自同一位点的共有序列, 采用
TGICL工具拼接 GenBank收录的烟草 EST序列。结
果由 412 325条 EST序列拼接出 149 606条 Uni-EST
序列, 其中 contigs 45 137条, singletons 101 169条,
序列最长为 2312 bp, 最短为 431 bp, 平均长度为
874 bp。
2.2 NtRGAs鉴定
利用 tBlastn 软件将112个已知的 R 基因氨基酸
序列与烟草 Uni-EST 序列比对分析表明, 比对 E 值
小于或等于1E–10时有3个 R 基因(RPW8.1, RPW8.2,
xa27)无法检测到与之匹配的烟草 Uni-EST, 其余
109个 R基因共检测到6963条 Uni-EST。由于具有相
同结构域的 R 基因序列存在相似性, 序列比对时具
有相同结构域的 R基因常与同一 Uni-EST序列匹配,
导致 Uni-EST序列被重复计数。去除重复计数后, 共
有1113个 Uni-EST 与109个 R 基因序列匹配(数据未
发表)。其中273个含 NBS-LRR 结构域, 546个含
LRR-PK结构域, 53个含胞外 LRR结构域, 102个只
含 PK 结构域 , 30个含 Mlo 结构域 , 其余109个
第 2期 袁清华等: 烟草表达抗病基因同源物(RGA)的鉴定及 RGA-SSR标记的开发 243


表 2 112个用于本研究的植物 R基因
Table 2 One hundred and twelve known R genes from plants used in this study
物种
Species
R基因
R gene
蛋白质 ID
Protein ID
结构域
Structure
Aegilops tauschii Cre1 AAM94164 NBS, LRR, others
Arabidopsis thaliana EFR NP_197548 LRR, PK
Arabidopsis thaliana ER-Erecta NP_180201 LRR, PK
Arabidopsis thaliana FLS2 NP_199445 LRR, PK
Arabidopsis thaliana HRT AAF36987 NBS, LRR, PK, others
Arabidopsis thaliana PEPR1 NP_177451 LRR, PK
Arabidopsis thaliana RAC1 AAS01763 TIR, NBS, LRR, others
Arabidopsis thaliana RCY1 BAC67706 NBS, LRR, others
Arabidopsis thaliana RFO1 NP_178085 PK
Arabidopsis thaliana RLM3 NP_001031652 NBS, TIR, others
Arabidopsis thaliana RPM1 NP_187360 NBS, LRR, others
Arabidopsis thaliana RPP1 NP_190034 NBS, LRR, others
Arabidopsis thaliana RPP13 NP_190237 NBS, LRR, others
Arabidopsis thaliana RPP27 CAE51863 LRR
Arabidopsis thaliana RPP4 NP_193420 TIR, NBS, LRR, others
Arabidopsis thaliana RPP5 NP_193428 TIR, NBS, LRR, others
Arabidopsis thaliana RPP8 NP_199160 NBS, LRR, others
Arabidopsis thaliana Rps2 NP_194339 NBS, LRR, others
Arabidopsis thaliana Rps4 NP_199338 TIR, NBS, LRR, others
Arabidopsis thaliana RPS5 NP_17268 NBS, LRR, others
Arabidopsis thaliana RPW8.1 AAK09266 RPW8, others
Arabidopsis thaliana RPW8.2 AAK09267 RPW8, others
Arabidopsis thaliana RRS1 NP_001078715 NBS, LRR, others
Arabidopsis thaliana RTM1 NP_172067 —
Arabidopsis thaliana RTM2 NP_568144 —
Arabidopsis thaliana SSI4 AAN86124 TIR, NBS, LRR, others
Beta vulgaris Hs1 AAB48305 —
Capsicum annuum Bs3 ABW82012 NBS, LRR, others
Capsicum annuum Bs3-E ABW82011 NBS
Capsicum chacoense Bs2 AAF09256 NBS, LRR, others
Cucumis melo At1 AAL47679 PK
Cucumis melo At2 AAL62332 PK
Cucumis melo FOM-2 ABB91438 NBS, LRR, others
Cucumis melo VAT — NBS, LRR, others
Glycine max KR1 AAL56987 TIR, NBS, LRR, others
Glycine max Rps1-k-1 AAX89382 NBS, LRR, others
Glycine max Rps1-k-2 AAX89383 NBS, LRR, others
Helianthus annuus Pl8 AAT08955 NBS, LRR, others
Hordeum vulgare MLA1 ACZ65507 NBS, LRR, others
Hordeum vulgare MLA10 AAQ55541 NBS, LRR, others
Hordeum vulgare MLA13 AAO16014 NBS, LRR, others
Hordeum vulgare Mlo CAB06083 Mlo
Hordeum vulgare RPG1 ABK51311 PK
Hordeum vulgare Mla12 AAO43441 NBS, LRR, others
244 作 物 学 报 第 40卷


(续表 2)
物种
Species
R基因
R gene
蛋白质 ID
Protein ID
结构域
Structure
Hordeum vulgare Mla6 CAC29242 NBS, LRR, others
Hordeum vulgare Rdg2a ADK47521 NBS, LRR, others
Lactuca sativa Dm3 AAD03156 NBS, LRR, others
Linum usitatissimum L6 AAA91022 TIR, NBS, LRR, others
Linum usitatissimum M AAB47618 TIR, NBS, LRR, others
Linum usitatissimum P2 AAK28805 TIR, NBS, LRR, others
Nicotiana benthamiana Serk3A ADO86982 LRR, PK
Nicotiana benthamiana Serk3B ADO86983 LRR, PK
Nicotiana glutinosa N AAA50763 TIR, NBS, LRR, others
Nicotiana tabacum IVR CAA08776 —
Oryza sativa PIB BAA76282 NBS, LRR, others
Oryza sativa Pi-ta AAO45178 NBS, LRR, others
Oryza sativa XA1 BAA25068 NBS, LRR, others
Oryza sativa xa21 BAE93934 LRR, PK
Oryza sativa Pi2 ABC94598 NBS, LRR, others
Oryza sativa Pi36 ABI64281 NBS, LRR, others
Oryza sativa Pi9 ABC18336 NBS, LRR, others
Oryza sativa Pid2 ACR15163 PK
Oryza sativa Xa13 ABD78944 —
Oryza sativa Xa27 AAY54163 —
Oryza sativa Xa5 AAV53715 —
Oryza sativa Pi5-1 ACJ54697 NBS, LRR, others
Oryza sativa Pi5-2 ACJ54698 NBS, LRR, others
Oryza sativa Pid3 ACN79514 NBS, LRR, others
Oryza sativa Pikm1-TS BAG72135 NBS, LRR, others
Oryza sativa Pikm2-TS BAG72136 NBS, LRR, others
Oryza sativa Pikp-2 ADV58351 NBS, LRR, others
Oryza sativa Pit BAH20862 NBS, LRR, others
Oryza sativa Piz-t ABC73398 NBS, LRR, others
Oryza sativa Xa26 ABD84047 LRR, PK
Phaseolus vulgaris PGIP CAA46016 LRR, PK
Solanum acaule Rx2 CAB56299 NBS, LRR, others
Solanum bulbocastanum Rpi-blb1 AAP86601 NBS, LRR, others
Solanum bulbocastanum Rpi-blb2 AAZ95005 NBS, LRR, others
Solanum demissum R1 AAL39063 NBS, LRR, others
Solanum habrochaites Cf-4 CAA05270 LRR, PK
Solanum habrochaites Cf4A CAA05265 LRR, PK
Solanum lycopersicum I-2 AAD27815 NBS, LRR, others
Solanum lycopersicum Asc-1 AAF67518 —
Solanum lycopersicum Bs4 AAR21295 TIR, NBS, LRR, others
Solanum lycopersicum Hero CAD29729 NBS, LRR, others
Solanum lycopersicum LeEIX1 AAR28377 LRR, PK
Solanum lycopersicum LeEIX2 AAR28378 LRR, PK
Solanum lycopersicum Mi1.2 AAC67238 NBS, LRR, others

第 2期 袁清华等: 烟草表达抗病基因同源物(RGA)的鉴定及 RGA-SSR标记的开发 245


(续表 2)
物种
Species
R基因
R gene
蛋白质 ID
Protein ID
结构域
Structure
Solanum lycopersicum Sw-5 AAG31013 NBS, LRR, others
Solanum lycopersicum Tm-2 AAQ10735 NBS, LRR, others
Solanum lycopersicum Tm-2a AAQ10736 NBS, LRR, others
Solanum lycopersicum Ve1 AAK58682 LRR, PK
Solanum lycopersicum Ve2 AAK58011 LRR, PK
Solanum lycopersicum Cf-5 AAC78591 LRR, PK
Solanum pimpinellifolium Cf-2 AAC15779 LRR, PK
Solanum pimpinellifolium Prf AAF7630 NBS, LRR, others
Solanum pimpinellifolium Pto AAC48914 PK
Solanum pimpinellifolium Cf-9 CAA05277 LRR, PK
Solanum pimpinellifolium Cf9B CAA05273 LRR, PK
Solanum tuberosum Gpa2 AAF04603 NBS, LRR, others
Solanum tuberosum Gro1.4 AAP44390 TIR, NBS, LRR, others
Solanum tuberosum R3a AAW48299 NBS, LRR, others
Solanum tuberosum Rx CAB50786 NBS, LRR, others
Solanum tuberosum RY-1 CAC82811 TIR, NBS, LRR, others
Triticum aestivum Lr1 ABS29034 NBS, LRR, others
Triticum aestivum Lr10 AAQ01784 NBS, LRR, others
Triticum aestivum Lr21 ACO53397 NBS, LRR, others
Triticum aestivum Lr34 ADK62371 NBS, LRR, others
Triticum aestivum Pm3 AAQ96158 NBS, LRR, others
Zea mays Hm1 NP_001105920 —
Zea mays Hm2 ABY68564 —
Zea mays Rp1-D AAD47197 NBS, LRR, others

未发现结构域。将与 R基因序列匹配的 Uni-EST初
步确定为烟草 RGA, 并暂命名为 NtRGA。
2.3 NtRGA 在本塞姆氏烟草(Nicotiana bentha-
miana)基因组中的定位
将 NtRGA 定位到烟草基因组上对分离特定候
选抗病基因/QTL 具有重要意义。随着 N. bentha-
miana 全基因组草图的公布, 通过序列比对可直接
将NtRGA定位到N. benthamiana基因组上。用Blastn
工具在 N. benthamiana 全基因组草图中搜索与
NtRGAs 序列匹配的位点表明, 当分值大于 50 且 E
值小于 1E–10 时, 1113 个 NtRGA 有 1071 个在 N.
benthamiana基因组中找到相似的序列, 其中 965个
NtRGAs (90.7%)同时与基因组中多个片段匹配, 平
均每个NtRGA与 9.67个基因组片段匹配, 最多的一
个(CL7158Contig2)与 529 个基因组片段匹配。鉴于
植物基因在长期的进化过程中普遍存在多拷贝现象,
本研究取分值最高且 E 值最低的基因组序列作为
NtRGA的基因组位点。最终 1071个 NtRGA被定位
到 712 个基因组位点上, 共有 218 个基因组位点存
在一个位点与多个 NtRGAs配对(数据未发表)。进一
步分析发现, 与同一个基因组位点配对的 NtRGAs
存在两种类型: (1)序列高度同源, 与基因组同一区
段配对(图 1); (2)序列无同源性, 与基因组同一位点
不同区段配对(图 2)。由于真核生物的外显子存在选
择性剪切 , 同一段基因序列可能会转录成不同的
mRNA。属于类型 1的 NtRGA可能来自同一基因的
不同转录本, 同时也有可能是不同烟草种间的同源
基因。而类型 2的 NtRGA则可能来自同一基因的不
同部位。EST通常只是完整基因的一部分, 因此, 来
自相同基因的 EST序列可能由于缺乏重叠区而无法
被拼接在一起。
观察 NtRGA在 N. benthamiana基因组中的位置
表明, NtRGA在基因组中分布不均匀, 共有 17处基
因组区段存在多个 NtRGA串联。例如全长 63 kb的
基因组 scaffold (序列 ID: Niben.v0.3.Scf25265845)包
含 4个 NtRGA。
246 作 物 学 报 第 40卷



图 1 CL1421Contig1、CL1421Contig2与 N. benthamiana基因组序列比对结果
Fig. 1 Alignment of CL1421Contig1 and CL1421Contig2 to N. benthamiana genome
A: CL1421Contig1与基因组 scaffold (序列 ID: Niben.v0.3.Scf24878592)的 1078~1448 bp和 1547~2749 bp区段匹配;
B: CL1421Contig2与基因组支架 Scf24878592的 1276~1449 bp和 1549~2786 bp区段匹配。
A: CL1421Contig1 matches with 1078–1448 bp and 1547–2749 bp in genomic scaffold (sequence ID: Niben.v0.3.Scf24878592);
B: CL1421Contig2 matches with 1276–1449 bp and 1549–2786 bp in genomic scaffold (sequence ID: Niben.v0.3.Scf24878592).

2.4 SSR标记的开发
利用 Perl脚本MISA从1113条 NtRGA序列搜索
SSR, 共发现78个 SSR位点, 分布于72条序列, 其中
含有 SSR 一个以上的 NtRGA 序列6条 , 平均每
939 348 bp 含1个 SSR。根据 SSR 侧翼序列, 利用
Primer Premier 5软件设计 SSR引物, 共设计引物64
对, 8条 NtRGA序列由于 SSR侧翼序列太短或者结
构复杂而未能成功设计引物。新引物随后在24个烟
草栽培品种和6个野生种中扩增 , 并通过聚丙烯酰
胺凝胶电泳检测其多态性(表3)。结果发现, 供试引
物有54对在栽培种中能扩增出清晰条带, 其余10对
无扩增产物或产生类似 RAPD的非特异性条带。在
可扩增引物中, 46对扩增产物长度与预期相近, 7对
扩增产物长度大于预期 , 另有1对扩增片段比预期
短。可扩增的54对引物中有9对在烟草栽培品种间
检测出多态性 , 占可扩增引物的16.7%。检测等位
基因数2~4个, 总共23个, 平均2.56个。54对在烟草
栽培种中可扩增 SSR 引物在6个烟草野生种中均
第 2期 袁清华等: 烟草表达抗病基因同源物(RGA)的鉴定及 RGA-SSR标记的开发 247



图 2 FS423566和 CL17188Contig1与烟草基因组序列比对结果
Fig. 2 Alignment of FS423566 and CL17188Contig1 to N. benthamiana genome
A: FS423566与基因组 scaffold (序列 ID: Niben.v0.3.Scf24993858)的 4904~5308 bp区段匹配; B: CL17188Contig1与基因组 scaffold (序
列 ID: Niben.v0.3.Scf24993858)的 5494~6282 bp区段匹配。
A: FS423566 matches with 4904–5308 bp in genomic scaffold (sequence ID: Niben.v0.3.Scf24993858); B: CL17188Contig1 matches with
5494–6282 bp in genomic scaffold (sequence ID: Niben.v0.3.Scf24993858).

成功扩增。与栽培种相反, SSR引物在野生种中检测
出较高的多态性, 共有 41 对引物检测出多态性, 占
可扩增引物的 75.9%, 检测等位基因数为 2~4个, 总
共 92个, 平均 2.61个。图 3为引物 RGA-63在烟草
中的扩增带型, RGA-63 在 24 个普通烟草资源和 6
个其他烟草种中均检测出 4个等位基因。
3 讨论
作为“基因对基因”抗病机制的组成部分, 植物
R 基因在识别病原物特异无毒基因编码产物中起重
要作用[39]。本研究中从 GenBank收录的烟草 EST数
据中成功鉴定出 1113个RGA, 并通过序列比对将其
定位到 N. benthamiana基因组上, 说明利用 EST数
据能够高效鉴定 RGA。
过去几年, 通过数据挖掘已成功从甘蔗、小麦、
玉米等作物鉴定 RGA。Dilbirligi 等[40]采用4种不同
搜索策略在小麦中查找 RGA序列, 包括结构域搜索,
单个或多个基序搜索, 共有序列搜索以及单一全长
序列搜索。结果表明单一全长序列搜索效果最好。
当 E 值≤ E–10, 采用单一全长序列共检测到243个
含 NBS-LRRs 和101个其他类型的 RGA 序列。Xiao
等[41]利用改良 AFLP、RACE和数据挖掘方法鉴定玉
米 RGA和类 R基因 EST时, 发现数据挖掘方法最为
有效。Rossi 等[42]通过严格的比对条件(E 值最终从甘蔗 EST 序列中搜索到88 RGA, 代表3个主
要 R基因簇, 即 NBS-LRR, LRR-TM和 PK。上述研
究报告表明不同 E值对 RGA搜索结果影响很大。本
研究在 E 值≤E–10时, 共鉴定出1113个 RGA, 其数
量是小麦的3倍[40]。两者搜索结果差异大的原因有二,
首先是用于挖掘 NtRGA 的烟草 EST 数量多于小麦,
本研究共使用412 325条烟草 EST序列, 而 Dilbirligi
等[40]的研究仅使用78 221条小麦 EST 序列。其次是
用于比对分析的 R基因数量不同, 本研究采用112个
R 基因进行比对, 远超过用于小麦比对的 R 基因数
量(22个)。
通过 EST 挖掘 RGA 的一个优点是所检测到的
RGA 均为表达的基因, 相反, 通过基因组序列挖掘
的 RGA 存在不表达的假基因。Li 等[32]从百脉根基
248 作 物 学 报 第 40卷


第 2期 袁清华等: 烟草表达抗病基因同源物(RGA)的鉴定及 RGA-SSR标记的开发 249



250 作 物 学 报 第 40卷



图 3 引物 RGA-63在烟草中的扩增带型
Fig. 3 Amplification results of RGA-63 in Nicotiana
1: ATNARELLO; 2: KY26; 3: 大白筋 599; 4: 白肋 9号; 5: 阿波烟; 6: Margland 609; 7: 广黄 5号; 8: 丰字 1号; 9: 革新 6号; 10: 革杂
基; 11: 红花大金元; 12: 金星; 13: 白骨牛利; 14: 大秋根 2; 15: 大山沟; 16:大同; 17: 大叶密合; 18: 大种白毛; 19: 2040; 20:74-16; 21:
夏湾娜; 22: Black Sea Samsun; 23: Burley Hampton; 24: Dark Virginia; 25: N. clevelandii A. Gray; 26: N. repanda Willd; 27: N. debneyi
Domin; 28: N. rustica L.; 29: N. tomentosiformis; 30: N. sylvestris Speg. & Comes。
1: ATNARELLO; 2: KY26; 3: Big White Burley 599; 4: White Burley 9; 5: Aboyan; 6: Margland 609; 7: Guanghuang 5; 8: Fengzi 1; 9:
Gexin 6;10: Gezaji; 11: Honghuadajinyuan; 12: Jinxing; 13: Baiguniuli; 14: Daqiugen 2; 15: Dashangou; 16: Datong; 17: Dayemihe; 18:
Dazhongbaimao; 19: 2040; 20: 74-16; 21: Xiawangna; 22: Black Sea Samsun; 23: Burley Hampton; 24: Dark Virginia; 25: N. clevelandii A.
Gray; 26: N. repanda Willd; 27: N. debneyi Domin; 28: N. rustica L.; 29: N. tomentosiformis; 30: N. sylvestris Speg. & Comes.

因组鉴定的 RGA 中发现有 65 个编码不完整的蛋白
序列, 最终被确定为假基因。Meyers 等[10]从拟南芥
基因组中搜索含 NBS-LRR 结构域的 RGA, 发现至
少有 12个 NBS-LRR基因由于框架移动和无义突变
而演变为假基因。
由于目前多数植物 R 基因是通过图位克隆和转
座子标签法克隆得到[43], 因此, 将 RGA定位到基因
组上显得十分重要。本文通过序列比对将其中的
1071个 NtRGA定位到 N. benthamiana基因组中 712
个位点上, 为后续烟草 R 基因的克隆奠定了基础。
本研究尚有 42个NtRGA无法定位于N. benthamiana
基因组 , 推测有以下原因: (1)目前公布的 N. ben-
thamiana 全基因组序列仅为草图, 尚有部分基因组
区段未测序; (2)本研究鉴定的NtRGA仅部分来自 N.
benthamiana, 来自其他烟草种的 NtRGA 由于种间
基因组差异而无法定位。本研究通过分析 NtRGA在
基因组中的位置发现, RGA 在基因组中的分布并不
均匀, 部分 RGA成簇存在。这与前人在其他植物中
的研究结果相似[44-45]。R 基因的串联方便 R 基因的
遗传变异, 有利于新 R基因的进化。Bertioli等[46]通
过分析花生、百脉根和苜蓿发现反转座子与一些抗
病基因簇关联。其他几个假设例如复制、基因转换
和不等位交换已被用于解释 R基因成簇和进化[1]。
如何开发利用RGA0序列是RGA鉴定后需要解
决的问题。本文通过 SSR 搜索从 RGA 序列中开发
出 62 个 RGA-SSR 标记, 为后续抗病基因的定位克
隆提供了有利的帮助。近期的研究表明, SSR在普通
烟草具有较高的多态性, Bindler等[47]利用 SSR构建
普通烟草遗传图谱, 5119 对 SSR 引物中有 2415 对
(47%)在亲本间检测出多态性。本研究仅有 16.7%的
引物在普通烟草中检测到多态性, 且检测的等位基
因数仅有 2~4个。本研究开发的 SSR标记多态性低
的原因可能与标记来自表达基因序列有关。由于表
达基因维持其生物学功能, 在进化过程中承受的选
择压力远高于全基因的平均水平, 导致其序列高度
保守。
4 结论
利用植物 R基因蛋白质序列扫描 EST数据是鉴
定烟草表达 RGA的有效途径。烟草表达 RGA在基
因组中分布不均匀, 其结构域以 LRR-PK 和 NBS-
LRR为主。烟草 RGA-SSR在种内缺乏多态性, 但在
种间具有较高的多态性。
References
[1] Ellis J, Dodds P, Pryor T. The generation of plant disease resis-
tance gene specificities. Trends Plant Sci, 2000, 5: 373–379
[2] Sanseverino W, Roma G, Simone M D, Faino L, Melito S, Stupka
E, Frusciante L, Ercolano M R. PRGdb: a bioinformatics plat-
form for plant resistance gene analysis. Nucl Acids Res, 2009, 38:
D815
[3] Johal G S, Briggs S P. Reductase activity encoded by the Hm1
disease resistance gene in maize. Science, 1992, 258: 985–987
[4] Whitham S, McCormick S, Baker B. The N gene of tobacco con-
fers resistance to Tobacco mosaic virus in transgenic tomato.
Proc Natl Acad Sci USA, 1996, 93: 8776–8781
[5] Dixon M S, Jones D A, Keddie J S, Thomas C M, Harrison K,
Jones J D G, Lane C. The tomato Cf-2 disease resistance locus
comprises two functional genes encoding leucine-rich repeat
protein. Cell, 1996, 84: 451–459
[6] Bent A F. Plant disease resistance genes: function meets structure.
Plant Cell, 1996, 8: 1757–1771
[7] Meyers B C, Dickerman A W, Michelmore R W, Sivaramakrish-
nan S, Sobral B W, Young N D. Plant disease resistance genes
encode members of an ancient and diverse protein family within
the nucleotide-binding superfamily. Plant J, 1999, 20: 317–332
[8] Hulbert S H, Webb C A, Smith S M, Sun Q. Resistance gene
第 2期 袁清华等: 烟草表达抗病基因同源物(RGA)的鉴定及 RGA-SSR标记的开发 251


complexes: evolution and utilization. Annu Rev Phytopathol,
2001, 39: 285–312
[9] Dangl J L, Jones J D. Plant pathogens and integrated defence re-
sponses to infection. Nature, 2001, 411: 826–833
[10] Meyers B C, Kozik A, Griego A, Kuang H, Michelmore R W.
Genome-wide analysis of NBS-LRR-encoding genes in Arabi-
dopsis. Plant Cell, 2003, 15: 809–834
[11] Bent A F, Kunkel B N, Dahlbeck D, Brown K L, Schmidt R,
Giraudat J, Leung J, Staskawicz B J. RPS2 of Arabidopsis
thaliana: a leucine-rich repeat class of plant disease resistance
genes. Science, 1994, 265: 1856–1860
[12] Dunning F M, Sun W, Jansen K L, Helft L, Bent A F. Identifica-
tion and mutational analysis of Arabidopsis FLS2 leucine-rich
repeat domain residues that contribute to flagellin perception.
Plant Cell, 2007, 19: 3297–3313
[13] Song W Y, Wang G L, Chen L L, Kim H S, Pi L Y, Holsten T,
Gardner J, Wang B, Zhai W X, Zhu L H, Fauquet C, Ronald P. A
receptor kinase-like protein encoded by the rice disease resistance
gene, Xa21. Science, 1995, 270: 1804–1806
[14] Tor M, Brown D, Cooper A, Woods-Tor A, Sjolander K, Jones J
D, Holub E B. Arabidopsis downy mildew resistance gene RPP27
encodes a receptor-like protein similar to CLAVATA2 and tomato
Cf-9. Plant Physiol, 2004, 135: 1100–1112
[15] Martin G B, Brommonschenkel S H, Chunwongse J, Frary A,
Ganal M W, Spivey R, Wu T, Earle E D, Tanksley S D.
Map-based cloning of a protein kinase gene conferring disease
resistance in tomato. Science, 1993, 262: 1432–1436
[16] Taler D, Galperin M, Benjamin I, CohenY, Kenigsbuch D. Plant
eR genes that encode photorespiratory enzymes confer resistance
against disease. Plant Cell, 2004, 16: 172–184
[17] Buschges R, Hollricher K, Panstruga R, Simons G, Wolter M,
Frijters A, van Daelen R, van der Lee T, DieRGLarde P, Gro-
enendijk J, Topsch S, Vos P, Salamini F, Schulze-Lefert P. The
barley Mlo gene: a novel control element of plant pathogen resis-
tance. Cell, 1997, 88: 695–705
[18] Botella M A, Coleman M J, Hughes D E, Nishimura M T, Jones J
D G, Somerville S C. Map positions of 47 Arabidopsis sequences
with sequence similarity to disease resistance genes. Plant J,
1997, 12: 1197–1211
[19] Aarts M G M, Hekkert B L, Holub E B, Beynon J L, Stiekema W
J, Pereira A. Identification of R-gene homologous DNA frag-
ments genetically linked to disease resistance loci in Arabidopsis
thaliana. Mol Plant Microbe Interact, 1998, 11: 251–258
[20] Graham M A, Marek L F, Lohnes D, Cregan P, Shoemaker R C.
Expression and genome organization of resistance gene analogs
in soybean. Genome, 2000, 43: 86–93
[21] Mago R, Nair S, Mohan M. Resistance gene analogues from rice:
cloning, sequencing and mapping. Theor Appl Genet, 1999, 99:
50–57
[22] Collins N C, Webb C A, Seah S, Ellis J G, Hulbert S H, Pryor A.
The isolation and mapping of disease resistance gene analogs in
maize. Mol Plant Microbe Interact, 1998, 11: 968–978
[23] Seah S, Sivasithamparam K, Karakousis A, Lagudah E S. Clon-
ing and characterization of a family of disease resistance gene
analogs from wheat and barley. Theor Appl Genet, 1998, 97:
937–945
[24] Leng X, Xiao B, Wang S, Gui Y, Wang Y, Lu X, Xie J, Li Y, Fan
L. Identification of NBS-type resistance gene homologs in to-
bacco genome. Plant Mol Biol Rep, 2010, 28: 152–161
[25] Gao Y L, Xu Z L, Jiao F C, Yu H Q, Xiao B G, Li Y P, Lu X P.
Cloning, structural features, and expression analysis of resistance
gene analogs in tobacco. Mol Biol Rep, 2010, 37: 345–354
[26] Wan H J, Zhao Z G, Malik A, Qian C T, Chen J F. Identification
and characterization of potential NBS-encoding resistance genes
and induction kinetics of a putative candidate gene associated
with downy mildew resistance in Cucumis. BMC Plant Biol, 2010,
10: 186
[27] Huettel B, Santra D, Muehlbauer J, Kahl G. Resistance gene ana-
logues of chickpea (Cicer arietinum L.): isolation, genetic map-
ping and association with a Fusarium resistance gene cluster.
Theor Appl Genet, 2002, 105: 479–490
[28] Nair R A, Thomas G. Isolation, characterization and expression
studies of resistance gene candidates (RGCs) from Zingiber spp.
Theor Appl Genet, 2007, 116: 123–134
[29] Bertioli D J, Leal-Bertioli S C, Lion M B, Santos V L, Pappas G,
Cannon S B, Guimaraes P M. A large scale analysis of resistance gene
homologues in Arachis. Mol Gen Genomics, 2003, 270: 35–45
[30] Monsi B, Wisser R J, Pennill L, Hulbert S H. Full-genome analy-
sis of resistance gene homologues in rice. Theor Appl Genet,
2004, 109: 1434–1447
[31] Ameline-Torregrosa C, Wang B B, O’Bleness M S, Deshpande S,
Zhu H Y, Roe B, Young N D, Cannon S B. Identification and
characterization of nucleotide-binding site-leucine-rich repeat
genes in the model plant Medicago truncatula. Plant Physiol,
2008, 146: 5–21
[32] Li X Y, Cheng Y, Ma W, Zhao Y, Jiang H Y, Zhang M. Identifica-
tion and characterization of NBS-encoding disease resistance
genes in Lotus japonicus. Plant Syst Evol, 2010, 289: 101–110
[33] Liu Z, Crampton M, Todd A, Kalavacharla V. Identification of
expressed resistance gene-like sequences by data mining in
454-derived transcriptomic sequences of common bean (Phaseo-
lus vulgaris L.). BMC Plant Biol, 2012, 12: 42
[34] Liu Z, Feng S, Pandey M K, Chen X, Culbreath A K, Varshney R
K, Guo B. Identification of expressed resistance gene analogs
from peanut (Arachis hypogaea L.) expressed sequence tags. J
Integr Plant Biol, 2013, 55: 453–461
[35] Sanz M J, Loarce Y, Fominaya A, Vossen J H, Ferrer E. Identifi-
cation of RFLP and NBS/PK profiling markers for disease resis-
tance loci in genetic maps of oats. Theor Appl Genet, 2013, 126:
203–218
[36] Loarce Y, Sanz M J, Irigoyen M L, Fominaya A, Ferrer E. Map-
ping of STS markers obtained from oat resistance gene analog
sequences. Genome, 2009, 52: 608–619
[37] Tantasawat P A, Poolsawat O, Prajongjai T, Chaowiset W, Thara-
preuksapong A. Association of RGA-SSCP markers with resis-
tance to downy mildew and anthracnose in grapevines. Genet
Mol Res, 2012, 11: 1799–1809
[38] Palomino C, Fernández-Romero M D, Rubio J, Torres A, Moreno
M T, Millán T. Integration of new CAPS and dCAPS-RGA mark-
ers into a composite chickpea genetic map and their association
with disease resistance. Theor Appl Genet, 2009, 118: 671–682
[39] Flor H H. The complementary genic systems in flax and flax rust.
252 作 物 学 报 第 40卷


Adv Genet, 1956, 8: 29–54
[40] Dilbirligi M, Gill K S. Identification and analysis of expressed
resistance gene sequences in wheat. Plant Mol Biol, 2003, 53:
771–787
[41] Xiao W K, Xu M L, Zhao J R, Wang F G, Li J S, Dai J R. Ge-
nome-wide isolation of resistance gene analogs in maize (Zea
mays L.). Theor Appl Genet, 2006, 113: 63–72
[42] Rossi M, Araujo P G, Paulet F, Garsmeur O, Dias V M, Chen H,
Van Sluys M A, D’Hont A. Genomic distribution and characteri-
zation of EST-derived resistance gene analogs (RGAs) in sugar-
cane. Mol Genet Genomics, 2003, 269: 406–419
[43] Xiao W K, Zhao J, Fan S C, Li L, Dai J R, Xu M L. Mapping of
genome-wide resistance gene analogs (RGAs) in maize (Zea
mays L.). Theor Appl Genet, 2007, 115: 501–508
[44] He L, Du C, Covaleda L, Xu Z, Robinson A F, Yu J Z, Kohel R J,
Zhang H B. Cloning, characterization, and evolution of the
NBS-LRR-encoding resistance gene analogue family in polyploid
cotton (Gossypium hirsutum L.). Mol Plant Microbe Interact,
2004, 17: 1234–1241
[45] Peñuela S, Danesh D, Young N D. Targeted isolation, sequence
analysis, and physical mapping of nonTIR NBS-LRR genes in
soybean. Theor Appl Genet, 2002, 104: 261–272
[46] Bertioli D J, Moretzsohn M C, Madsen L H, Sandal N,
Leal-Bertioli S C, Guimaraes P M, Hougaard B K, Fredslund J,
Schauser L, Nielsen A M, Sato S, Tabata S, Cannon S B, Stou-
gaard J. An analyses of synteny of Arachis with Lotus and Medi-
cago sheds new light on the structure, stability and evolution of
legume genomes. BMC Genomics, 2009, 10: 45
[47] Bindler G, Plieske J, Bakaher N, Gunduz I, Ivanov N, Van der
Hoeven R, Ganal M, Donini P. A high density genetic map of to-
bacco (Nicotiana tabacum L.) obtained from large scale microsa-
tellite marker development. Theor Appl Genet, 2011, 23: 219–230