免费文献传递   相关文献

香菇EST-SSR标记的开发及应用



全 文 :食用菌学报 2010.17(2):1 ~ 6
收稿日期:2009-12-21原稿;2010-03-16 修改稿
基金项目:上海市农业遗传育种重点实验室开放课题“香菇 EST-SSR 标记的开发 、鉴定及其在种质资源多样性分析
中的应用”(编号:shagb2009-03)的部分研究内容
作者简介:刘春滟(1983-), 女 ,安徽农业大学在读硕士研究生 ,主要从事分子生物学研究。
*本文通讯作者 E-mail:zh yuqiong.ah@126.com
文章编号:1005-9873(2010)02-0001-06
香菇 EST-SSR标记的开发及应用
刘春滟1 , 李南羿2 , 张玉琼1*
(1 安徽农业大学生命科学院 , 安徽合肥 230036;2 浙江林学院农业与食品学院 , 浙江临安 311300)
摘 要:从 NCBI 中下载了 12 184条香菇(Lentinula edodes)表达序列标签(expressed sequence t ag , EST)序
列 , 处理后得到全长 3 681 177 bp 的 4 684 个 Unigene。在其中共发掘出 142 个简单重复序列(simple sequence
repeat , SSR), 分布于 120 条 EST 中 ,分布频率为 2.99%(平均分布距离:25.924 kb)。其中 , 单 、二 、三核苷酸
重复是主要的重复类型 , A/ T ,AG/ CT , ACG/ CTG 是单 、二 、三核苷酸的主要重复基序 ,分别占所有 EST-SSR
的 23.23%、21.83%和 10.56%。利用引物设计软件 P rimerPremie r5.0 设计了 40 对引物 ,并利用 6%变性聚
丙烯酰胺凝胶在 18个香菇品种中进行检测。其中 , 22 对引物为多态性引物 ,多态率为 55%。应用 NTSYS软
件的聚类方法分析表明 , 18 份材料遗传相似系数范围为 0.375 ~ 0.984 ,与前人研究结果相符。
关键词:香菇;EST 序列;SSR标记;多态性;遗传多样性
  简单重复序列(simple sequence repeat , SSR)
随机分布在真核生物的基因组中 ,呈孟德尔式遗
传 ,共显性 ,具有数量丰富 、多态性高 、重复性好等
优点[ 1] 。公共数据库中快速增长的表达序列标签
(expressed sequence tag ,EST)数据为开发 SSR标
记提供了一个省时省力又低成本的来源[ 2] , EST-
SSR还具有很高的可转移性[ 3] ,并可被用在构建遗
传图谱[ 4]及比较基因作图[ 5] 等方面。
香菇(Lentinula edodes)具有重要的食药用价
值 ,其“同种异名 ,异种同名”的现象较普遍 ,需要建
立快速准确稳定的鉴定检测方法[ 6] 。本研究采用
18个香菇品种作为模板 ,开发其 EST-SSR标记 ,
研究品种间的遗传差异 ,可进一步应用在食用菌的
菌株鉴定和亲缘关系的分析等方面 ,为香菇种质资
源的评价和遗传育种提供参考。
1 材料和方法
1.1 香菇品种
  18个香菇品种分别为:1.霞若香菇(野生)由
上海市农业科学院食用菌研究所陈明杰研究员
惠赠;2.申香 2 号 、3.申香 4 号 、4.L241-4 、5.L
台 、6.L 冬香 、7.L135 、 8.F135 、9.Q135 、10.
Cr02 、11.C r04 、12.7402 、13.9015 、14.98411 、15.
沪农一号 、16.闵丰一号 、17.香九 、18.庆科 20 由
上海市农业科学院食用菌研究所尚晓冬副研究
员惠赠。
1.2 香菇 DNA的提取
  采用 CTAB 法提取香菇基因组 DNA ,具体
步骤见文献[ 7] 。
1.3 在 EST数据库中发掘 SSR
  截止 2008 年 8月 23 日 ,在 NCBI 数据库中
共搜索到 12 184 条香菇 ES T 序列 , 采用 ES T-
t rimmer[ 8]  软件除去 5 或 3 端的 polyA 或
polyT ,以及长度小于 100 bp 的 ES T 序列 ,对于
长度大于 700 bp 的 EST , 则保留其 5 端的
700 bp;再利用 CAP3 软件[ 9] 进行片段重叠群分
析和聚类 ,拼接时设定的初始装配参数均为默认
值 ,最后将得到的 4 684条高质量的 Unigene ,利
用 M ISA [ 8]软件在其中搜索 SSR ,搜索标准为:
单 、二 、三 、四 、五 、六核苷酸的最少重复次数分别
为 12 、6 、5 、5 、5 、5 次 ,同时也包括中间被一段序
列打断(不超过 10 bp)的不完全重复 SSR。
在统计 SSR重复基序出现的类型时 ,将每种
基序所有的+1位移码及其互补序列均视为同一
个类型。如二核苷酸重复基序 AG与 GA 、CT 与
TC 被归为同一个类型;单核苷酸将分为 A 、C 两
DOI :10.16488/j.cnki.1005-9873.2010.02.014
食 用 菌 学 报 第 17 卷
类 ,而二 、三 、四 、五 、六核苷酸重复基序类型的数
量分别为 4 、10 、33 、102和 350种 。
1.4 EST-SSR引物设计
  利用引物设计软件 PrimerPremier5.0[ 8] ,在
含有 SSR的 Unigene 中设计引物。主要设定参
数为:GC含量为 45%~ 60%,退火温度为 55 ~
60 ℃,预期片段长度在 150 ~ 250 bp 之间 ,引物
长度在 18 ~ 22 bp 之间 , 并由上海赛百盛公司
合成 。
1.5 PCR扩增和电泳检测
  PCR 反应体系为:15 μL 反应体系中含有
1.0 μL的 DNA(25 ~ 35 ng), 1.5 μL 10×PCR
缓冲液 , 0.75 μL 2.5 mmol/L dNTP , 0.9 μL
25 mmol/L MgCl2 , 0.9 μL 5 U rTaq DNA 聚
合酶(购于 Takar a 公司), 10 μmol/L 引物各
0.75μL , 8.45μL ddH2O 。
PCR反应条件为:94 ℃预变性 4 min;94 ℃
变性 30 s ,退火 45 s(除引物 LD08和 LD19退火
温度为 54 ℃和 53 ℃之外 ,其余为 57 ℃), 72 ℃
延伸 30 s , 35个循环;最后 72 ℃延伸 7 min 。
PCR产物采用 6%的变性聚丙烯凝胶电泳
检测其多态性 。
1.6 多态性统计分析
  统计多态性位点 ,有带记为 l ,无带记为 0 ,生
成距阵 ,利用 NTSYS-pc 2.10[ 10] 软件对数据进行
分析 ,以不加权成对算术平均法(UPGMA)对材
料进行聚类。
2 结果与分析
2.1 香菇 EST-SSR的分布频率和特点
  从 NCBI 获得的 12 184条 EST ,经过处理后
得到长为 3 681 177 bp 的 4 684 条高质量的
U nigene ,冗余率为 61.56%, 在其中共搜索到
142个 SSR ,出现的频率为 2.99%,平均距离为
25.924 kb ,即每 25.924 kb有一个 SSR位点 ,分
布在 120 个 Unigene 中。其中有 17 个 Unigene
含 2 个或 2 个以上 SSR 位点 , 最多的一个
U nigene 含有 5 个 SSR位点 。单 、二 、三核苷酸
SSR是主要的重复类型 ,分别为 42 、39和 59个 ,
分别占总 SSR的 29.58%、27.46%、41.55%,没
有搜索到四核苷酸 SSR ,五 、六核苷酸 SSR 各一
种 , 均占总 SSR 的 0.7%。由此可看出 , 香菇
EST 中 SSR出现的种类较丰富而且不同类型的
SSR出现的频率差别也较大。
图 1 香菇 EST-SSR重复基序的分布
Fig.1 Distribution of SSR motifs in ESTs of L.edodes
  按照 1.3 中的统计方法 ,本研究中出现的
单 、二 、三 、五 、六核苷酸重复基序的数量分别为
2 、4 、8 、1 、1种(见图 1)。从各基序出现的次数上
看 , A/T , AG/CT , ACG/CTG 各出现 33 、31 、15
次 ,是出现次数最多的类型 , 分别占总 SSR 的
23.23%、21.83%和 10.56%。
2.2 EST-SSR引物的筛选及评价
  设计的 40对引物中显示扩增的有 36 对 ,
占所设计引物的 90%,其中有 4 对引物扩增出
偏离目的产物的多个条带 , 22 对能够扩增出特
异位点(表 1)并显示出多态性的引物(图 2),占
可扩增引物的 61%,占所设计引物的 55%,实
际扩增片段与预扩增片段基本相符。22对多态
性标记在 18个香菇品种中共扩增出 64个多态
性位点 ,平均每个多态性标记检测到 2.91个多
态性位点 。
2
第 2 期 刘春滟 ,等:香菇 EST-SSR标记的开发及应用
表 1 显示多态性的 22 对 EST-SSR引物的信息
Table 1 Data relating to the 22 EST-SSR primers demonstrating polymorphism in L.edodes strains
引物
Pr imer
序列号
Se rial No.
重复基序
Repeat motifs
引物序列
Pr imer sequence
LD01 161700690 (CAG)7 F:gCTCTgCTTTCCCTTCgTT
R:gTCCCAgTgACTgCTgTTgg
LD02 90553437 (GAA)5 F:CTCCACTAAAgCCCTCAAAATC
R:CgAAAAgCCgTgTAgCATg
LD03 90551273 (CT)6 F:CgCTTCgACTTTTACTggC
R:gTgACTCTAgggCTTAgATTgC
LD04 90550546 (TC)11 F:CgggCATTgACTTACCTTTg
R:CAgCCgATACggATACCTTT
LD05 90549794 (GAA)5 F:CCgCTCTTTgCTCgCTAT
R:TggTCgTTCCCgTgAgTT
LD06 90547028 (TA)8 F:ggggTTTCTAgggAggACA
R:gAACAACCgAgAAggAggg
LD07 90546770
90546960
90547196
90549661
90553564
90555016
(CTT)5 F:CgCTTTTCCCATCTTCCC
R:CgTCgTTCTACCAgCCATT
LD08 90548351 (ACG)5 F:ATTgCggCTggTCTTTCA
R:gTTCATggTgCTTCACCTgTAT
LD09 90546884 (GCT)6 F:TgCTTCAACTCCTgTCCCA
R:ggCTTTgAAATCCCgAAC
LD10 90546779 (GAA)5 F:TgCCgTATCgACAgACAAgA
R:CATCCgAgTCATCATCACCTC
LD11 90551424 (CCT)5 F:CggTCCACgTTATggTAgg
R:gTAACCCAAATCACgAgCAg
LD12 161700574
161701217
(CTG)6 F:CTCCGCTGTCCTCGTTGTA
R:TGAGCCCACCGTTTCCAT
LD13 90554049 (GA)6 F:gAACAATgCAgCAAgACgAC
R:TgAgCCCAgggTTggTAAT
LD14 90551551 (CAG)5 F:AggTCTCCAAgTCCCAATCC
R:TTgCgAACgCCCAgTgTA
LD15 90551394 (ACC)7 F:CCCCTATACCATCgCATCC
R:ggTAACCgTACCCTggCTgT
LD16 90549759 (CAT)5 F:ggCTTCACAACCTCAAACCA
R:ACgAgACCgAgggACTgAT
LD17 90549397 (GCT)6 F:gTCCgAgCAggAACgAgAA
R:ggCgTggAAggTCAAAAT
LD18 90548744 (GAC)6 F:CgAACgAAACAggTCCAgg
R:CgCggTTgATTgAggTTg
LD19 90548810 (GAA)6 F:AAATACgACggAgTgAAggTg
R:AgCCAgggTTATgTCTACAgC
LD20 90548666 (CT)6 F:ATgTTggCTgTCTgACCTgg
R:gAgTTTgTTgggTCCTgTCTTC
LD21 52853213 (CTC)6 F:AggCgAgCCATTggAAgA
R:CAAAAgCAgCCCCgAAAC
LD22 52852702 (CTT)5 F:AggAgCgTAgCCgATTTACC
R:TgCACTCgCCAATgAAgg
3
食 用 菌 学 报 第 17 卷
图 2 引物 LD01 和 LD14 在 18个香菇品种中显示的多态性
Fig.2 Polymorphic bands generated in 18 L.edodes by primers LD01 and LD14
2.3 多态性标记的聚类结果
  统计结果显示 18份材料间遗传相似系数的
范围为 0.375 ~ 0.984 ,说明 18个香菇品种间具
有一定的遗传多样性。其中 , 野生的霞若香菇
(1)与沪农一号(15)间的遗传相似系数最小
(0.375),说明两者之间的亲缘关系比较远;F135
与 L135以及 F135与Q135之间的遗传相似系数
均为 0.984 ,L135与 Q135之间为 0.968 ,说明三
者之间的亲缘关系比较近 ,可能是由于 3 份材料
在选育上采用相同的亲本所致 。根据材料间的
遗传相似系数对 18份材料进行聚类分析(图 3):
在遗传相似系数为 0.504的水平下 ,就可以把野
生型和栽培型品种区分开 ,说明两者之间存在着
很大的遗传差异;在遗传相似系数为0.626和
0.782的水平下 ,香九和沪农一号就可以很明确
的与其它栽培种区分开;在遗传相似系数为
0.884的水平下 ,17个栽培种可分成 8大类 ,第 Ⅰ
类为申香 2号和申香 4号 ,第 Ⅱ类为 L 台 、C r02 、
Cr04和闵丰一号 , 第 Ⅲ类为 L 冬香 , 第Ⅳ类为
7402 ,第Ⅴ类为 L135 、F135 、Q135 和 L241-4 , 第
Ⅵ类为 9015 、98411 和庆科 20 ,第 Ⅶ 类为沪农一
号 ,第Ⅷ类为香九 。
图 3 基于 22 个 EST-SSR 标记的 18 个香菇品种的聚类图
Fig.3 Cluster analysis dendrogram based on 22 EST-SSR markers in 18 L.edodes
3 讨论
  本研究搜索到的香菇 ES T-SSR的分布频率
为 2.99%,平均分布距离为 25.924 kb ,低于林范
学等[ 11] 在 香菇中 的的研 究结 果 (4.23%,
17.3 kb),主要是因为林范学等没有去除低质量
的冗余序列 ,而是直接从下载的 ES T 序列中搜索
SSR位点 。本研究中得到的香菇 EST-SSR的平
均分布距离低于很多植物 ,如小麦(15.6 kb)[ 1 2] 、
柑橘(5.7 kb)[ 9] 等 ,但仍高于玉米(28.32 kb)[ 13] 、
大麦(30.09 kb)[ 2] 等。
分析香菇 EST-SSR的类型 ,发现其 SSR 以
A/ T , AG/CT , ACG/CGT , AAG/CT T 重复为
主 ,这与在其它真菌中的研究结果一致[ 14] 。在最
少重复为 5 次的标准下 ,没有出现四核苷酸重
复 ,与林范学等[ 17]的研究结果相同 。
4
第 2 期 刘春滟 ,等:香菇 EST-SSR标记的开发及应用
根据 LEWERS 等[ 15] 的研究 ,SSR 的长度影
响了水稻不同品种间多态性的高低 ,因此 ,我们
选择了 SSR长度在 12 bp 及以上的 U nigene 设
计引物 ,并从中随机挑选了 40对引物来检测 18
个香菇品种间的多态性。结果显示 ,有 4 对引物
无扩增产物 ,通常是由以下几个原因引起的:引
物之间的序列存在着复杂的高级结构;ES T 序列
的质量较低;在对应的基因组序列中 ,上下游引
物之间存在内含子;至少有一侧的引物跨越了
mRNA的剪切位点 。有 4对引物的扩增产物表
现出很高的非特异性 ,可能是由于引物的特异性
不高 ,扩增出很多与引物同源的序列或是引物和
SSR位点位于转座子区域内 。由于其扩增的不
是特异位点 ,因此不用来分析 SSR的多态性 。有
10对引物有特异性扩增产物但无多态性 ,另有
22对引物有特异性扩增产物且呈现出比较高的
多态性(55%), 远高于黑莓(30%)[ 16] 、甜瓜
(35%)[ 17] 、鲤鱼(42%)[ 18]等 。
采用遗传距离较远的优质品种进行杂交 ,得
到具有优势的杂交一代是杂交选育亲本的原则
之一 。本研究对 18 个香菇品种进行聚类分析 ,
发现野生型的霞若香菇与栽培品种间的遗传差
异较大 ,可以考虑将更多的野生型香菇应用在改
良香菇品种以及选育新品种的研究中。栽培种
的 17个材料的遗传背景差异不大 ,这可能是由
于不同地区间种质资源的流动性较大 ,在选育时
采用相同的亲本所致 ,但仍具有一定的遗传多样
性 ,其中香九和沪农一号与其它品种的亲缘关系
较远 ,遗传差异较大 ,在香菇遗传育种的应用中
具有较大的价值。此外 ,由于 F135与 Q135是同
一菌株在不同地区长期栽培并分别独立保藏的
品种 ,因此相似系数较高为 0.984;庆科 20 是从
栽培菌株 9015 中选育出的 ,因此两者的相似系
数也较高为 0.938 ,这一结果与秦莲花等用 ITS
和 ISS R分子标记技术鉴别香菇生产用种的研究
结论相符[ 19] 。
研究结果表明 ,利用香菇 EST 序列开发 SSR
标记是可行的 。如果收集更多的香菇品种 ,特别
是野生品种 ,引物的多态率可能会更高 ,开发出
更多的 EST-SSR标记 ,为香菇的分类鉴定 、品种
选育提供更加准确可靠的分子依据。
致谢:上海市农业科学院食用菌研究所陈明
杰研究员和尚晓冬副研究员慷慨提供香菇菌种 ,
在此表示深深的谢意!
参考文献
[ 1] LI LZ , WANG JJ , YING G , et al.Development of
SSR markers fr om ESTs of g ramineous species and
their chromosome lo cation on wheat[ J] .Prog ress in
Natural Science , 2008 , 18(12):1485-1490.
[ 2] LI W , DONG P , WEI YM , et al.Genetic variation in
Triticum turgid um L.ssp.tur gidum landraces fr om
China assessed by ES T-SSR markers [ J ] .
Agricultural Sciences in China , 2008 , 7 (9):
1029-1036.
[ 3] SAHA M C , MIAN MAR , EUJAYL I , et al.Tall
fescue EST-SSR marker s with transferability acro ss
seve ral g rass species[ J] .Theo r Appl Gene t , 2004 ,
109:783-791.
[ 4] WANG HX , LI FH , XIANG JH.Polymo rphic EST-
SSR marker s and their mode of inhe ritance in
Fenneropenaeus chinensis [ J] .Aquaculture , 2005 ,
249:107-114.
[ 5] GUO WZ , SANG ZQ , ZHOU BL , et al.Genetic
relationships of D-genome species ba sed on tw o types
o f ES T-SS R marke rs derived fr om G.arboreum and
G.raimond ii in Gossypi um[ J] .P lant Science , 2007 ,
172:808-814.
[ 6]吴学谦 , 李海波 , 魏海龙 , 等.SCAR分子标记技术在
香菇菌株鉴定上的应用研究[ J] .菌物学报 , 2005 ,
24(2):259-266.
[ 7]杨华 , 李联泰.食用菌 DNA 提取方法研究[ J] .中国
食用菌 , 2002 , 22(1):19-22.
[ 8] CH EN CX , ZHOU P , CHOI YA , et al.Mining and
characterizing micr osatellites f rom citrus ESTs[ J] .
Theo r App1 Genet , 2006 , 112:1248-1257.
[ 9] HUANG X , MADAN A.CAP3:a DNA sequence
assembly pro g ram [ J] .Genome Res , 1999 , 9:
868-877.
[ 10] JAIN N , JA IN S , SAINI N , et al.SS R ana ly sis of
chromosome 8 regions associa ted with ar oma and
cooked kernel elongation in Basma ti rice [ J ] .
Euphy tica , 2006 , 152:259-273.
[ 11] 林范学 , 程水明 , 李安政 , 等.香菇基因组中 EST-
SSR的构成和分布[ J] .微生物学通报 , 2007 , 34
(2):438-442.
[ 12] KANT ETY RV , LA ROTA ML , MATT HEWS
DE , et al.Data mining fo r simple sequence repeats in
expressed sequence tag s f rom bar ley , maize , rice ,
so rghum and w heat[ J] .P lant Mol Bio l , 2002 , 48:
501-510.
[ 13] GAO LF , TANG JF , LI HW , et al.Analy sis of
5
食 用 菌 学 报 第 17 卷
microsatellite s in majo r crops assessed by
computational and experimental appro aches[ J] .Mol
Breeding , 2003 , 12:245-261.
[ 14] 刘林 , 李成云 , 杨静 ,等.灰盖鬼伞基因组中微卫星
序列的组成[ J] .西南农业学报 , 2006 , 19(1):
131-135.
[ 15] LEWERS KS , ST YAN SMN , HOKANSON SC , et
a l.S trawber ry GenBank-derived and genomic simple
sequence repeat(SS R)marker s and their utility w ith
str awber ry , blackber ry , and red and black r aspberry
[ J] .J Amer Soc H o rt Sci , 2005 , 130(1):102-115.
[ 16] LEWERS KS , SASKI CA , CUTH BERTSON BJ ,
et al.A blackbe rry (Rubus L.)expressed sequence
tag library fo r the development of simple sequence
repeat ma rke rs[ J] .BMC P lant Bio lo gy , 2008 , 8:69.
[ 17] KONG QC , XIANG , YU Z.Development of EST-
SSRs in Cucumis sativus from sequence database[ J] .
Molecular Eco lo gy No tes , 2006 , 6:1234-1236.
[ 18] WANG D , LIAO XL , CH ENG L , et al.
Development of novel EST-SSR marker s in common
carp by da ta mining from public EST sequences[ J] .
Aquaculture , 2007 , 271:558-574.
[ 19] 秦莲花 , 宋春艳 , 谭琦 , 等.用 ITS 和 ISSR 分子标
记技术鉴别香菇生产用种[ J] .菌物学报 , 2006 , 25
(1):94-100.
[本文编辑]  王瑞霞
Development of Expressed Sequence Tag-Simple
Sequence Repeat (EST-SSR)Markers in Lentinula edodes
LIU Chunyan
1 , LI Nanyi2 , ZHANG Yuqiong1*
(1College of Life Science , Anhui Agr icultur al University , H efei , Anhui 230036 , China;
2 College of Agr icultur e and Food , Zhejiang Forestr y University , Lin an , Zhejiang 311300 , China)
Abstract:A total of 12 184 Lentinula edodes expressed sequence tags (ESTs)were downloaded from NCBI
and shown to be associa ted with 4 684 Unigenes compr ising 3 681 177 bp in length.A MISA sear ch r evealed a
total of 142 simple sequence r epeats(SSRs)with a fr equency of 2.99% and an aver age distance distribution
of 25.9 kb.The most abundant mononucleotide , dinuclotide and tr inucleotide r epeats were A/ T , AG/ CT
and ACG/ CTG , accounting for 23.23%, 21.83% and 10.56% of each type , r espectively.For ty EST-SSR
primer pairs were designed by P rimerPremie r 5.0 , 22 of which r evealed polymorphic bands in the DNA of 18
L .edodes str ains.NTSYS-computed similar ity coe ff icients for the 18 str ains ranged between 0.375~ 0.984 ,
which was approximately in accordance with the ir dive rsity based on previous resear ch.
Key words:Len tinula edodes ;expressed sequence tag (EST);simple sequence repeat (SSR) marker;
polymorph ism;gene tic diversity
6