全 文 :中国农业科学 2006,39(3):433-439
Scientia Agricultura Sinica
收稿日期:2005-10-25;接受日期:2005-12-13
基金项目:国家“863”计划项目(2003AA207160)和福建省重大科技专项(2004NZ01-2)
作者简介:卢泳全,汪旭升对该文有同等贡献。卢泳全(1974-),女,黑龙江人,博士,研究方向为植物分子生物学;汪旭升(1978-),男,浙江人,
硕士,研究方向为生物信息学和基因组学。通讯作者吴为人,Tel: 0571-86971910; E-mail: wuwr@zju.edu.cn
基于水稻内含子长度多态性开发禾本科扩增
共有序列遗传标记
卢泳全 1,2,汪旭升 1,黄伟素 1,肖天霞 1,郑 燕 1,吴为人 1,3
(1浙江大学农业与生物技术学院,杭州 310029;2黑龙江省农业科学院生物技术研究中心,哈尔滨 150086;
3福建农林大学作物科学学院,福州 350002)
摘要:通过在多态位点两侧的保守编码序列上设计引物,可以开发出在不同物种间通用的基于PCR 的分子标记,
称为扩增共有序列遗传标记(ACGM)。【目的】探讨利用已公布的水稻籼、粳两亚种的基因组序列开发禾本科ACGM 的
可行性。【方法】根据水稻两亚种间的内含子长度多态性,开发了 38对 ACGM 引物。用这些引物对玉米、粟、大麦、
小麦、竹子、旱稗草和大米草 6个属共 12 个不同材料进行 PCR 实验。【结果】几乎所有引物都可在至少 1 种材料中
扩增出特异条带,而 1/3 以上的引物可以在全部供试材料中获得特异扩增产物。在每一种供试材料中,平均大约有
2/3的引物可以成功扩增出目的条带。这些引物在各属内不同种、亚种或品种(系)之间的多态性比例在24.1%~90.3%
之间,平均为44.6%。【结论】利用水稻基因组序列信息开发禾本科通用型ACGM 是可行的。
关键词:扩增共有序列遗传标记;内含子长度多态性;ACGM;禾本科
Development of Amplified Consensus Genetic Markers in
Gramineae Based on Rice Intron Length Polymorphisms
LU Yong-quan1,2, WANG Xu-sheng1, HUANG Wei-su1, XIAO Tian-xia1, ZHENG Yan1, WU Wei-ren1,3
(1College of Agriculture and Biotechnology, Zhejiang University, Hangzhou 310029; 2Biotechnology Research Center,
Heilongjiang Academy of Agricultural Sciences, Haerbin 150086; 3College of Crop Science,
Fujian Agriculture and Forestry University, Fuzhou 350002)
Abstract: By designing primers in the conservative coding sequences flanking a polymorphic site, it is possible to exploit a
PCR-based marker called amplified consensus genetic marker (ACGM), which is transferable among different species.【Objective】
The purpose of this study was to investigate the feasibility of developing ACGMs in Gramineae using the published genomic
sequences of indica and japonica rice.【Method】Based on the intron length polymorphisms between the two rice subspecies, 38 pairs
of ACGM primers were developed. Twelve accessions representing 6 grass genus including Oryza, Zea, Setaria, Triticum,
Phyllostachys, Echinochloa crusgalli Beauv and Spartina anglica were used to verify the candidate ACGM markers.【Result】Almost
all primers could acquire specifically amplified products in at least one accession. More than 1/3 primers could obtain specifically
amplified products in all accessions. For each accession, about 2/3 primers on average could obtain specifically amplified products.
The proportion of polymorphisms between species or subspecies within genus was 24.1%-90.3%, with an average of 44.6%.
【Conclusion】These results showed that developing ACGM in Gramineae using rice genome data is feasible.
Key words: Amplified consensus genetic marker; Intron length polymorphism; ACGM; Gramineae
0 引言
【本研究的重要意义】分子标记是现代遗传学研
究的有力工具。自 1980年首次提出分子标记的概念以
来[1],分子标记已广泛应用于遗传图谱构建、基因定
位、基因克隆、基因组比较、遗传多样性分析、标记
434 中 国 农 业 科 学 39卷
辅助育种等方面的研究[2~5]。利用一个物种的分子标
记对另一物种进行遗传或物理作图称为比较作图,是
比较基因组研究的主要方法,可以揭示不同物种在基
因组结构和进化上的关系。【前人研究进展】关于比
较作图研究已有许多报道[6],但这些研究多采用限制
性片段长度多态性(RFLP)标记,技术上比较麻烦。
Brunel等[7]提出了一种基于 PCR技术且适合于比较作
图的分子标记,称为扩增共有序列遗传标记(ACGM)。
该技术是根据一种植物中已知功能基因的保守编码序
列设计引物对另一种植物进行 PCR 扩增。Fourmann
等[8]开发出 32 个可以在拟南芥和油菜之间共用的
ACGM标记,并利用这些标记构建了油菜的遗传连锁
图谱。但是,在不同物种间开发具有一定通用性的
ACGM引物是比较困难的,目前仅见拟南芥和芸苔属
之间的研究报道。
禾本科是一个十分重要的大科,主要粮食作物(如
水稻、小麦、玉米、高粱)和牧草多为禾本科植物。
开发禾本科通用型 ACGM标记,对禾本科比较基因组
研究、同源基因克隆、分子标记辅助育种等无疑具有
非常重要的理论和实际意义。水稻籼、粳两个亚种的
基因组序列草图皆已完成[9,10],而粳稻最近还发布了
全基因组精细图[11]。水稻两个亚种基因组测序的完
成,使得人们能够直接用生物信息学的手段比较两亚
种间的 DNA 序列多态性,这为开发水稻分子标记提
供了极大的便利[12],同时,这也为开发禾本科通用型
ACGM 标记提供了契机。Fourmann 等[8]研究发现,
ACGM的多态位点多位于内含子区域。真核生物基因
组中散布着大量的内含子[13,14]。由于内含子为非编码
序列,受到的选择压力较小,因而更容易积累变异。
笔者利用已公布的水稻两亚种(籼稻 93-11 和粳稻
Nipponbare)的基因组序列[9~11],借助生物信息学的方
法,开发了 5800 多个候选的水稻内含子长度多态性
(ILP)标记,并通过试验从中开发出 173个在水稻中
普遍适用的 ILP标记(DNA Research,已接受)。【本
研究的切入点】上述研究表明,水稻亚种间存在丰富的
内含子长度多态性。可以预见,那些在水稻籼、粳亚种
间存在内含子长度多态性的基因很有可能在其它禾本
科物种中也存在内含子长度多态性,因此,有可能将它
们开发成禾本科通用型 ACGM标记。【拟解决的关键
问题】本研究利用笔者在水稻中已开发的候选内含子长
度多态性标记和已公布的小麦、大麦和玉米的
cDNA/EST序列,对开发禾本科通用型 ACGM标记的
可行性进行了探讨。
1 材料与方法
1.1 候选标记的筛选和引物设计
利用笔者已开发的 5 800多个水稻候选 ILP标记
的有关信息(包括引物序列、所在位置、扩增片段长
度、两亚种间长度差异等;DNA Research,已接受),
并从 GenBank(http://ncbi.nlm.nih.gov/)下载小麦、大
麦和玉米的 cDNA/EST 序列。将所有内含子长度在
400 bp以下的水稻候选 ILP标记引物对小麦、大麦和
玉米的 cDNA/EST 库进行 BLASTN 搜索,选取错配
碱基数<4 的保守引物。对初选的水稻 ILP 标记,进
一步在其内含子两侧的外显子上用 ePrimer3 软件[15]
重新设计引物,以提高引物的保守性。对设计的引物
还在籼、粳稻基因组序列中进行了 e-PCR[16]检验,要
求只产生单一扩增产物。由此即获得候选的 ACGM标
记。所有数据的处理和分析皆在 IBM P650的服务器
上完成,使用 IBM AIX的 Unix操作系统。
1.2 植物材料
选用禾本科 8个属的 14份植物材料(表 1),其
中 Nipponbare和 93-11是基因组已测序的粳稻和籼稻
品种;F683和 F743是 2个玉米自交系(由浙江大学
育成);粟 4a和 No.21是生产上常用的 2个优良品系;
大麦、小麦和旱稗草采自浙江大学农场植物标本园;
早园竹和毛芽竹采自杭州植物园;大米草采自福建罗
源湾滩涂。
1.3 ACGM 的检测
采用 CTAB法[17]提取植物叶片 DNA。PCR反应体
表 1 用于 ACGM 标记分析的植物材料
Table 1 Plant materials used for ACGM analysis
编号
No.
植物材料
Material
染色体组
Genome
1 Oryza sativa ssp. japonica var. Nipponbare粳稻 2n=2x=24
2 Oryza sativa ssp. indica var. 93-11籼稻 2n=2x=24
3 Zea mays var. F683玉米 2n=2x=20
4 Zea mays var. F743玉米 2n=2x=20
5 Setaria italica var. 4a粟 2n=2x=18
6 Setaria italica var. No.21粟 2n=2x=18
7 Hordeum vulgare ssp. distichum二棱大麦 2n=2x=14
8 Hordeum vulgare ssp. tetrastichum四棱大麦 2n=2x=14
9 Triticum macha莫迦小麦 2n=6x=42
10 Triticum spelta斯卑尔脱小麦 2n=6x=42
11 Phyllostachys atrovaginata毛芽竹 2n=2x=48
12 Phyllostachys propinqua早园竹 2n=2x=48
13 Echinochloa crusgalli Beauv旱稗草 2n=2x=54
14 Spartina anglica大米草 2n=12x=120
3期 卢泳全等:基于水稻内含子长度多态性开发禾本科扩增共有序列遗传标记 435
系总体积为 15 µl,其中含 50 ng模板 DNA;上、下游
引物各 0.5 µmol·L-1;200 µmol·L-1 dNTP;1.5 mmol·L-1
MgCl2;1 U Taq DNA聚合酶;1.5 µl 10 × PCR反应缓
冲液。采用降落 PCR技术,反应条件为:94°C预变性
5 min;94℃变性 30 s,59℃退火 30 s(每循环递减 0.3
℃),72°C延伸 1 min,10个循环;94℃变性 30 s,56
℃退火 30 s,72℃延伸 1 min,10个循环;72℃延伸 5
min。对于扩增产物特异性差或没有扩增产物的引物进
一步优化起始退火温度,调整范围为 55~60℃。每对
引物组合至少重复 2次以确保扩增结果的可靠性。扩增
产物上样于 6%的非变性聚丙烯酰胺凝胶,80伏特电泳
2.5 h。参照 Xu等[18]的方法进行银染。
1.4 扩增产物的验证
PCR产物用 6% 的聚丙烯酰胺凝胶分离后,切割
目的条带并回收(天为时代离心柱型聚丙烯酰胺凝胶
DNA回收试剂盒,Cat No. DP211-02)。以回收的 DNA
为模板进行第二轮扩增,反应体系和条件与第一轮相
同。用 3%的琼脂糖凝胶分离 PCR产物,回收目的条
带(天为时代离心柱型琼脂糖凝胶 DNA回收试剂盒,
Cat No. DP209-02),纯化后测序(Invitrogene, 上海)。
用 ClustalX软件[19]对测序结果进行多重比较分析,用
GeneDoc软件[20]显示多序列联配的结果。
1.5 命名
将禾本科 ACGM标记记为 GAn,其中 n为编号,
如 GA16。
2 结果与分析
在 5 800 多个水稻候选 ILP 标记中,约有 4 000
个在小麦、大麦或玉米的 cDNA/EST库中找到同源序
列。从中选取同时在小麦、大麦及玉米中存在同源序
列的且在水稻亚种间差异明显的40个 ILP标记作为侯
选 ACGM 标记,在水稻中进行试验,结果有 38 对
ACGM引物(表 2)在籼稻 93-11和粳稻 Nipponbare
中扩增出目标条带并展示预期的多态性,但其中有 7
对引物(GA2、GA4、GA22、GA24、GA30、GA31
和 GA33)除了得到目标带之外,还扩增出其它条带,
表现出多拷贝(尽管根据 e-PCR预测,所有引物都只
扩增单一条带)。在 e-PCR中,笔者要求引物与模板
是完全匹配的。因此,这里非目标带可能是引物与模
板不完全匹配扩增的结果。这 38个 ACGM标记分布
在除了第 9染色体之外的 11条染色体上,其所在基因
的编码产物大致可分为酶蛋白、转录调控因子和其它
功能蛋白三类,其中以酶蛋白最多。
用这 38对引物对玉米、粟、大麦、小麦、竹子、
旱稗草和大米草共 12份材料进行 PCR检验,结果 37
对(97.4%)可以在 1 种以上的材料中扩增出特异条
带,34 对(89.5%)可以在至少 3 种材料中获得特异
扩增产物,14 对(36.8%)可以在全部供试材料中获
得特异扩增产物。在不同供试材料中成功扩增出特异
条带的引物比例变化在 44.7%(大米草)~81.6%(粟
21 和毛芽竹)之间,平均为 65.8%(表 3)。平均每
对引物得到的特异条带数也因供试材料而变,在 1.56
(玉米)~3.14(斯卑尔脱小麦)之间,平均为 1.85
(表 3)。在各属内不同种、亚种或品种(系)之间
的多态性比例(=显示多态的引物数/特异扩增引物数)
差异很大,变化在 24.1%(小麦)~90.3%(竹子)之
间,平均为 44.6%(表 3)。需要特别指出的是,由
于所有 ACGM 标记在开发时都是要求在 Nipponbare
和 93-11 之间存在多态的,所以它们在水稻亚种间的
多态要比其它族属的种或亚种之间的多态高。
由于供试验材料差异较大,在确定退火温度时要
兼顾不同的试验材料,因此同一引物在不同物种 PCR
中会引起非特意扩增,在凝胶上往往显示出非单一条
带。但是在这些条带中一般都可以清晰分辨出主带,
而非特异扩增条带都很弱。在实际应用中,针对不同
的材料寻找最适扩增条件,非特异条带数量就可能减
少乃至消失。为验证在其它禾本科物种中扩增到的片
段确实来自与水稻同源的目标基因,笔者对引物
GA24在玉米 F743、莫迦小麦和大米草中得到的扩增
产物的主带各随机挑取一个片段进行测序(图 1)。
从水稻中已知 GA24所在的基因编码高等电点α-糖苷
1 2 3 4 5 6 7 8 9 10 11 12 13 14
泳道 1~14分别为 1~14号材料。第 4、9和 14泳道中箭头所指为回收
测序的片段
Lanes 1-14. Correspond to accessions 1-14. The arrows in lanes 4, 9 and 14
point to the bands to be sequenced
图 1 GA24 引物在各种供试材料中的扩增产物(6%非变性
聚丙烯酰胺凝胶电泳)
Fig. 1 Amplified products of primer GA24 in each accession
(6% non-denaturing PAGE)
436 中 国 农 业 科 学 39卷
酶。该基因在粳稻Nipponbare基因组中总长度为 4 847
bp,含有 5个外显子(编码 886个氨基酸)和 4个内
含子,其中 GA24标记位于第二、三外显子和第二内
含子上(图 2)。测序结果显示,扩增到的序列长度
在 168 bp(大米草)~254 bp(玉米)之间。多重比
较结果表明,两侧外显子比较保守,除大米草下游外
显子区有较大缺失和莫迦小麦下游外显子区有小段插
入(CCTGGAG)之外,其它的外显子部分联配得较
好,而内含子则表现出很大的变异(图 3)。这些结
果显示,从玉米、莫迦小麦和大米草中扩增到主带的
片段与预期的完全一样,确实来自与水稻同源的目标
基因。
表 2 开发的 38 个禾本科 ACGM 标记
Table 2 38 ACGM markers developed in Gramineae
标记
Marker
正向引物序列(5′→3′)
Forward primer(5′→3′)
反向引物序列(5′→3′)
Reverse primer(5′→3′)
所在克隆
Clone
染色体
Chromosome
所在基因的功能或推测功能
Gene function or putative function
GA1 CCGTCAACAAAGTTTGCTCC ATTGGACATGCTCTCCATCC AP002882 1 乙酰辅酶 A转移酶
Acetyl-CoA acyltransferases
GA2 AGCTCATCGACTCTGTGCTC GGGTACTCCTCTCTGATCTTGG AP003018 1 谷胱甘肽转移酶 GTPase domain
GA3 CCTCGACGGCTTCTCCTT GCGCATTCCTTGTACAGCTC AP003933 1 蛋白磷酸酯酶 2C protein phosphatase2c
GA4 GACCTCAACAAGCTTGAGCC TGTCCTTGTGGCTGAAGAAG AP005510 2 顶端未分生组织蛋白(NAM) protein
GA5 AGGAGTCCAGGGACATCATC GCACTTTGAACGGCACCT AP004124 2 HLH DNA结合蛋白
HLH DNA-binding protein
GA6 CGGCAGCTGCAAGTACATC GACTGCTCGTCGTACTCGTC AP006068 2 硫氧化还原蛋白 Thioredoxin, putative
GA7 GAGGTCGGCATCAAGAAGTT GTACGACTGCATCGTCGG AP005797 2 细胞色素 P450 Cytochrome P450
GA8 AAGAAGAAGGAGAGGGCGAC AATCAAGCGAGAGTGCCAGT AP005002 2 转座子 Transposable element protein
GA9 GCCCCCGTATGGAACAAC CTCCCTGTCGAAGTTGGC AC098693 3 过氧化氢酶 Catalase
GA10 GGGAGCTTGGAAAATCATCTG TGAAGGTAAGCTAGTCCTTTTGC AC093018 3 蛋白激酶 Protein kinase
GA11 GCACCACAGGAACCTCGTC GATTTTCCATCTTTGCTGCC AC135209 3 蛋白激酶 Protein kinase
GA12 TCCTCCACCACCAGCCAT GCGTCAGCATCTCGTTCAG AC146468 3 核糖体蛋白 Ribosomal protein
GA13 GGAGCTGGAGGCGGTTAAG ACAATGTCGCGCTCGGTAG AC104487 3 Pi蛋白 Pi protein
GA14 TCATATGGCTACATCGCCC GTGAGCACCTCCAGCACC OSJN00189 4 富亮氨酸重复 Leucine rich repeat
GA15 AGAGCTATTGGTGCTGACAGA CAACAGTGGCTTACCACCAT OSJN00015 4 细胞程序性死亡蛋白
Programmed cell death protein
GA16 GCATGGACATACTCTATGAGTGC CCCATAGGGAAAGCAGGAAG AC104284 5 乙酰羟酸还原异构酶
Acetohydroxy acid isomeroreductase
GA17 GCTAAGGTGAACCTCCCCA TGTTGTCGCAGACGATCTTG AC137619 5 ATP合成酶亚单元 ATP synthase subunit
GA18 ACCAGGAACGAGTACAACGG CTACTCCGGCGATCACGA AC137623 5 拟南芥 F14M2.7蛋白 F14M2.7 protein
GA19 AACACGCTCAACGTCAACCT CTCTGTCCACCACGCTGAA AC137623 5 拟南芥 F14M2.7蛋白 F14M2.7 protein
GA20 GACATGATGAAGACGGCAAA GAAGCAGCACACGTAGATGG AC109596 5 表达蛋白 Expressed protein
GA21 GAGGTGCAGAGCGAGGTC TCTCCTTCTGCCCGTACTTG AC134346 5 WRKY基因 DNA结合蛋白
WRKY DNA -binding domain
GA22 AGTTATCCAGGCTGGGCTGT AGCAATGCTCGCCTATCCT AC104283 5 转录调控因子 Transcriptional regulator
GA23 GACATGATGAAGACGGCAAA GAAGCAGCACACGTAGATGG AC109596 5 表达蛋白 Expressed protein
GA24 CCATGCCGTACTGGTCATTC GTAGTCGATGTCCGTCCACA AP003728 6 高等电点 α-糖苷酶
High pI alpha-glucosidase
GA25 ATGTGCTTCCACCCTGACC GCCAATCTGCCTGTGCTT AP003861 7 玉米 DNA胞嘧啶-5甲基转移酶
DNA cytosine-5-methyltransferase- maize
GA26 GGCCAAAATAATGGAAGATCG AGTGATGAAAGAGCAAGGCA AP003930 7 磷脂酶 Phospholipase
GA27 ACCGCCCTAGTCCCAAAC ACAGAGTCAGCAAAGATGCG AP004674 7 酰基转移酶 Acyltransferase
GA28 ACCCCTACGTGGTCTCCG CCACGTCGAGCTTCTCCC AP004380 7 GRAM功能域 GRAM domain
GA29 CGTCATCACCAAGGCTTACA TCCTGATCGGTCACATTGAA AP005529 8 ACT功能域 ACT domain
GA30 AACTTCATGGAGATCGGGC CCCTCCACGTAGCTGAACC AP005544 8 丝氨酸羧肽酶 Serine carboxypeptidase
GA31 CGTCGAGGACATGGACATC GACTCCGGCAGCTCACAG AP004155 8 表达蛋白 Expressed protein
GA32 TGGGTATCATCAGGAGGCT CTTGATCGGAGGCGATAGAA AP004702 8 v-SNARE 蛋白 v-SNARE protein
GA33 AGCTCGTCTTCCCCGTCTAC GAAGGTCGGGGAGGTGTT AP005544 8 膜蛋白 DUF6 Membrane protein DUF6
GA34 AGGCAGTTGCTCTCCGAGTA CCTTCGATGTAACAGTCCCTT AC021893 10 果胶酸酯酶 Pectinesterase
GA35 GCTTGACATAGCTCAGCAGC CTCCGAACCTTGTTGGACTG AC037426 10 表达蛋白 Expressed protein
GA36 CAAGAAGAAGCGCTACCACC CTTCAGCCGCTGCTTGTC AC018929 10 Homeo结构域 Homeo domain protein
GA37 CAAGAACTGGTTCTCGAGCTATG CCTCAAAGCAGAATCACCATC AC146948 11 表达蛋白 Expressed protein
GA38 TTCGTCCTCGTCAGGATCTC TTGCCATTAGGGTCCTTGA CNS08CB7 12 假设蛋白 Hypothetical protein
3期 卢泳全等:基于水稻内含子长度多态性开发禾本科扩增共有序列遗传标记 437
标尺表示基因的长度(bp),黑色方块表示外显子,黑线表示内含子,下方灰色方块表示 GA24标记的范围
The scale indicates the length of the gene (bp); The black boxes indicate extrons; The black lines indicate introns; The gray box underneath indicates the range
of marker GA24
图 2 GA24 所在的基因在粳稻 Nipponbare 基因组中的结构图示
Fig. 2 Structure of the gene where GA24 is located in Nipponbare
表 3 38 对 ACGM 引物在不同禾本科植物中的扩增效果
Table 3 PCR results of 38 pairs of ACGM primers in different grass families
特异扩增引物对 Specific amplification primer pairs材料号
Material No. 数量 Number 百分比 Percentage
每对引物平均条带数
Bands per primer pair
多态引物百分比
% polymorphic primers
植物
Plant
3 27 71.1 1.56
4 27 71.1 1.56
33.3 玉米 Zea mays
5 29 76.3 1.66
6 31 81.6 1.71
29.0 粟 Setaria italica
7 26 68.4 2.08
8 26 68.4 2.15
46.2 大麦 Hordeum vulgare
9 29 76.3 2.97
10 29 76.3 3.14
24.1 小麦 Triticum
11 31 81.6 2.29
12 29 76.3 2.48
90.3 竹子 Phyllostachys
13 24 63.2 2.58 旱稗草 Echinochlea crusgalli
14 17 44.7 1.78 大米草 Spartina anglica
平均Mean 25 65.8 1.85 44.6
星号表示内含子的起始和终止位置。两端浅灰色背景所示区域为引物序列
The asterisks indicate the starting and ending positions of the intron. The terminal regions in light gray background are primer sequences
图 3 GA24 引物在玉米、莫迦小麦和大米草中的扩增产物序列以及籼、粳稻相应序列的多重比较
Fig. 3 Multiple alignments among the sequences of amplified products of primer GA24 in maize, Triticum macha and Spartina
anglica and corresponding sequences of indica rice and japonica rice
438 中 国 农 业 科 学 39卷
3 讨论
开发在不同物种间通用的分子标记的生物学基础
是不同物种间的 DNA 序列同源性。高等真核生物基
因组中具有功能的基因和调控序列仅占很小的比例
(编码序列一般只占整个基因组的十分之一[21]),大
部分都是无用的序列。不同物种间的序列同源性主要
存在于基因和调控序列中,而那些无用序列则往往同
源性很低。因此,开发通用型分子标记主要应基于基
因序列。研究表明,以 cDNA为探针的 RFLP标记可
以较好地在不同物种间互用,因此被大量用于比较基
因组学的研究。但 RFLP 分析在技术上比较复杂和繁
琐,费用也较高,应用上不方便。如果能发展出基于
PCR技术的通用型标记,则无疑在比较基因组学研究
中将具有重要的应用价值。
SSR是目前最常用的基于 PCR技术的分子标记。
但是,由于大多数 SSR存在于基因组无用序列中,因
此 SSR标记仅在近缘(同属)物种间具有一定的通用
性,而在远缘(不同属)物种间的通用性则很低,扩
增出的大多为非特异条带,因而难以用于比较基因组
研究。不过,存在于外显子上的 SSR标记则有较高的
通用性[22]。Saha等[23]根据牛毛草的 EST-SSR开发了
157对 SSR标记引物,试验表明,这些引物在禾本科
中具有一定的通用性。事实上,EST-SSR也可以看作
是一种 ACGM标记,只是其多态位点是位于表达序列
上的。
本研究则是利用 ILP来开发 ACGM标记的。由于
它的引物也是设计在相对保守的外显子区,因此它在
通用性上至少能够与 EST-SSR 相当。在本研究中,
对每一种供试材料而言,平均大约有 2/3 的引物可以
获得预期的扩增产物(表 3)。这个比例是相当高的。
因此,这些引物在禾本科中具有较好的通用性。另外,
这些引物在不同属内的种间(小麦、竹子)、亚种间
(大麦)或品种(系)间(玉米、粟),都能或多或
少地揭示出一定比例的多态性(表 3)。可见,根据
水稻基因组序列信息开发禾本科通用型 ACGM 标记
是可行的。
必须指出的是,由于 ACGM标记必须将引物设计
在内含子两侧的外显子上,因此只有较短的内含子才
适合于开发 ACGM标记。前面已经提到,笔者开发了
5 800多个水稻候选 ILP标记。这些候选 ILP标记的内
含子长度都小于 800 bp。因此,它们都具有开发成
ACGM标记的潜力。作为初步探索,本研究只是根据
已公布的小麦、大麦和玉米的 cDNA/EST序列从那些
水稻候选 ILP标记中筛选出一些进行试验。这种筛选
率取决于原来所设计的水稻候选 ILP引物的保守性和
禾本科其它物种的 cDNA/EST序列数量。原则上,只
要可供利用的禾本科其它物种的 cDNA/EST序列数量
足够多,所有长度适当的内含子两侧的外显子上都可
能设计出比较保守的引物,从而开发成通用性好的
ACGM标记。因此,利用水稻基因组序列信息开发禾
本科通用型 ACGM标记的潜力应该是巨大的。但对该
潜力的具体评估,还有待进一步的研究。
在开发 EST-SSR 标记的研究中发现,多态性高
则通用性差(引物保守性低),而通用性好(引物保
守性高)则多态性低(贾继增等,私人通信)。这是
因为 SSR 位点和 PCR 引物都位于表达序列上,前者
自然是变异越大越好,而后者则越保守越好,二者相
互矛盾。这个矛盾给开发通用型 EST-SSR 标记带来
了困难。ACGM标记可能就不存在这种矛盾,因为内
含子的变异通常与外显子的保守性无关。从这一点看,
ACGM标记的通用性可能会高于 EST-SSR标记。
笔者还用水稻中开发的 ACGM引物对拟南芥、大
白菜和棉花的基因组DNA进行扩增,发现有大约 20%
的引物至少能够在一种物种中得到特异扩增产物。对
前述 GA24引物在大白菜和棉花中的扩增片段也进行
了测序,结果表明它们也是来自与水稻同源的目标基
因的。该结果说明,利用水稻基因组序列信息开发的
ACGM标记,不仅在禾本科中具有相当高的通用性,
而且还可应用于禾本科之外的物种乃至双子叶植物。
因此将具有非常广泛的应用前景。
4 结论
本研究初步探讨了利用已公布的水稻籼、粳两亚
种的基因组序列开发禾本科 ACGM的可行性。试验结
果表明,利用水稻基因组序列信息开发禾本科通用型
ACGM是可行的。
References
[1] Botstein D, White R L, Skolnick M, Davis R W. Construction of a
genetic linkage map in man using restriction fragment length
polymorphisms. Amercia Journal of Human Genetics, 1980, 32:
314-331.
[2] Williams J G, Kubelik A R, Livak K J, Rafalski J A, Tingey S V.
DNA polymorphism amplified by arbitrary primers are useful as
genetic markers. Nucleic Acids Research, 1990, 18: 6531-6535.
3期 卢泳全等:基于水稻内含子长度多态性开发禾本科扩增共有序列遗传标记 439
[3] Vos P, Hogers R, Bleeker M, Reijans M, Lee T van de, Hornes M,
Frijters A, Pot J, Peleman J, Kuiper M. AFLP: a new technique for
DNA fingerprinting. Nucleic Acids Research, 1995, 23: 4407-4414.
[4] Moore S S, Sargeant L L, King T J, Mattick J S, Georges M, Hetzel
D J. Conservation of dinucleotide microsatellites among mammalian
genomes allows use of heterologous PCR primer pairs in closely
related species. Genomics, 1991, 10: 654-660.
[5] Li G, Quiros C. Sequence-related amplified polymorphism (SRAP), a
new maker system based on a simple PCR reaction: its application to
mapping and gene tagging in Brassica. Theoretical and Applied
Genetics, 2001, 103: 455-461.
[6] Gale M. D, Devos K M. Plant comparative genetics after 10 years.
Science, 1998, 282: 656-659.
[7] Brunel D, Froger N, Pelletier G. Development of amplified
consensus genetic marker (ACGM) in Brassica napus from
Arabidopsis thaliana sequences of known biological function.
Genome, 1999, 42: 387-402.
[8] Fourmann M, Barret P, Froger N, Baron C, Charlot F, Delourme R,
Brunel D. From Arabidopsis thaliana to Brassica napus:
development of amplified consensus genetic markers (ACGM) for
construction of a gene map. Theoretical and Applied Genetics, 2003,
105: 1196-1206.
[9] Goff S A, Ricke D, Lan T H, Presting G, Wang R, Dunn M,
Glazebrook J, Sessions A, Oeller P, Varma H, Hadley D, Hutchison
D, Martin C, Katagiri F, Lange B M, Moughamer T, Xia Y,
Budworth P, Zhong J, Miguel T, Paszkowski U, Zhang S, Colbert M,
Sun W L, Chen L, Cooper B, Park S, Wood T C, Mao L, Quail P,
Wing R, Dean R, Yu Y, Zharkikh A, Shen R, Sahasrabudhe S,
Thomas A, Cannings R, Gutin A, Pruss D, Reid J, Tavtigian S,
Mitchell J, Eldredge G, Scholl T, Miller R M, Bhatnagar S, Adey N,
Rubano T, Tusneem N, Robinson R, Feldhaus J, Macalma T,
Oliphant A, Briggs S. A draft seqeunce of the rice genomes (Oryza
sativa L. ssp. japonica). Science, 2002, 296: 92-100.
[10] Yu J, Hu S, Wang J, Wong GK, Li S, Liu B, Deng Y, Dai L, Zhou Y,
Zhang X, Cao M, Liu J, Sun J, Tang J, Chen Y, Huang X, Lin W, Ye
C, Tong W, Cong L, Geng J, Han Y, Li L, Li W, Hu G, Huang X, Li
W, Li J, Liu Z, Li L, Liu J, Qi Q, Liu J, Li L, Li T, Wang X, Lu H,
Wu T, Zhu M, Ni P, Han H, Dong W, Ren X, Feng X, Cui P, Li X,
Wang H, Xu X, Zhai W, Xu Z, Zhang J, He S, Zhang J, Xu J, Zhang
K, Zheng X, Dong J, Zeng W, Tao L, Ye J, Tan J, Ren X, Chen X,
He J, Liu D, Tian W, Tian C, Xia H, Bao Q, Li G, Gao H, Cao T,
Wang J, Zhao W, Li P, Chen W, Wang X, Zhang Y, Hu J, Wang J,
Liu S, Yang J, Zhang G, Xiong Y, Li Z, Mao L, Zhou C, Zhu Z,
Chen R, Hao B, Zheng W, Chen S, Guo W, Li G, Liu S, Tao M,
Wang J, Zhu L, Yuan L, Yang H. A draft sequence of the rice
genome (Oryza sativa L. ssp. indica). Science, 2002, 296: 79-92.
[11] International Rice Genome Sequencing Project. The map-based
sequence of the rice genome. Nature, 2005, 436: 793-800.
[12] Shen Y J, Jiang H, Jin J P, Zhang Z B, Xi B, He Y Y, Wang G, Wang
C, Qian L, Li X, Yu Q B, Liu H J, Chen D H, Gao J H, Huang H, Shi
T L, Yang Z N. Development of genome-wide DNA polymorphism
database for map-based cloning of rice genes. Plant Physiology, 2004,
135: 1198-1205.
[13] Hawkins J D. A survey on intron and exon lengths. Nucleic Acids
Research, 1988, 16: 9893-9908.
[14] Deutsch M, Long M. Intron-exon structures of eukaryotic model
organisms. Nucleic Acids Research, 1999, 27: 3219-3228.
[15] http://www.hgmp.mrc.ac.uk/
[16] Schuler G D. Sequence mapping by electronic PCR. Genome
Research, 1997, 7: 541-550.
[17] Murray M G, Thompson W F. Rapid isolation of high-molecular-
weight plant DNA. Nucleic Acids Research, 1980, 8: 4321-4325.
[18] 许绍斌, 陶玉芬, 杨昭庆, 褚嘉佑. 简单快速DNA银染和胶保存
方法. 遗传, 2002, 24: 335-336.
Xu S B, Tao Y F, Yang Z, Chu J Y. A simple and rapid method used
for silver staining and gel preservation. Hereditas (Beijing), 2002, 24:
335-336. (in Chinese).
[19] Thompson J D, Gibson T J, Plewniak F, Jeanmougin F, Higgins D G.
The ClustalX windows interface: flexible strategies for multiple
sequence alignment aided by quality analysis tools. Nucleic Acids
Research, 1997, 24: 4876-4882.
[20] Nicholas, K B, Nicholas H B. GeneDoc: a tool for editing and
annotating multiple sequence alignments. Distributed by the authors.
1997.
[21] Nowak, R. Mining treasures from ‘junk DNA’. Science, 1994, 263:
608-610.
[22] Thiel T, Michalek W, Varshney R K, Graner A. Exploiting EST
database for the development and characterization of gene-derived
SSR-markers in barly (Hordeum vulgare L.). Theoretical and
Applied Genetics, 2003, 106: 411-422.
[23] Saha M C, Mian M A, Eujayl I, Zwonitzer J C, Wang L, May G D.
Tall fescue EST-SSR markers with transferability across several
grass species. Theoretical and Applied Genetics, 2002, 105:
1196-1206.
(责任编辑 孙雷心)