全 文 :
菌物学报
jwxt@im.ac.cn 15 March 2015, 34(2): 204‐214
Http://journals.im.ac.cn Mycosystema ISSN1672‐6472 CN11‐5180/Q © 2015 IMCAS, all rights reserved.
研究论文 Research paper DOI: 10.13346/j.mycosystema.140020
基金项目:上海市科技兴农重点攻关项目[沪农科攻字(2011)第 1‐2号];上海市科委重点项目(10dz2212400)
*Corresponding author. E‐mail: baodp@hotmail.com
收稿日期:2014‐01‐16,接受日期:2014‐01‐22
美味牛肝菌全基因组 SSR位点的分布规律研究
王莹 陈明杰 汪虹 鲍大鹏*
国家食用菌工程技术研究中心 农业部南方食用菌资源利用重点实验室 上海市农业遗传育种重点开放实验室 上海市农
业科学院食用菌研究所 上海 201403
摘 要:研究利用生物信息学方法对美味牛肝菌全基因组中的 SSR位点进行了统计分析,并与其他 3种担子菌基因组(灰
盖鬼伞、裂褶菌、糙皮侧耳)进行了比较。结果表明,在美味牛肝菌基因组中存在 2 732个 SSR位点,SSR间的平均距离为
17.1kb。73.02%的 SSR 位点分布在基因组中的非编码区,并以单核苷酸和三核苷酸重复类型为主。分布于 5或 3非编译区
的 SSR的相对丰度最高,为 86个/Mb,而分布于编码序列的 SSR相对丰度最低,为 31个/Mb。同时,高通量筛选出 41个
长 SSR位点设计引物并通过 e‐PCR进行了验证。最后通过与其他 3种担子菌基因组相比,发现 SSR数量与基因组大小无关,
SSR 类型都以短重复类型(单核苷酸至三核苷酸)为主,比较发现美味牛肝菌基因组中的 SSR 位点数量相对较多,密度也
较高。
关键词:美味牛肝菌,SSR分子标记,分布规律
Distribution pattern analysis of SSR loci in the genome of Boletus edulis
WANG Ying CHEN Ming‐Jie WANG Hong BAO Da‐Peng*
National Engineering Research Center of Edible Fungi, Ministry of Science and Technology (MOST); Key Laboratory of Resources
and Utilization of Edible Fungi (South), Ministry of Agriculture; Shanghai Key Laboratory of Agricultural Genetics and Breeding;
Institute of Edible Fungi, Shanghai Academy of Agriculture Science, Shanghai 201403, China
Abstract: SSR patterns in the genome of Boletus edulis were characterized and compared with those of Coprinopsis cinerea,
Schizophyllum commune and Pleurotus ostreatus by in silico bioinformatic analysis. The total number of SSRs identified from B.
edulis genome was 2 732, and the average distance between SSR loci was approximately 17.1kb. In the different regions of
genome, 73.02 percent of SSR loci were distributed in no‐coding regions with mono‐ and tri‐nucleotides being the most frequent
motifs. The abundance of SSRs in 5’ or 3’ UTR was up to 86 per megabase (Mb) while fewer in the coding regions with an
average of 31 per Mb. Fourty‐one SSR primers of B. edulis were designed based on the searching results of long SSRs and
validated by the e‐PCR analysis. Among the four basidiomycete genomes, the microsatellite abundance appeared to be
王莹 等 /美味牛肝菌全基因组 SSR位点的分布规律研究
菌物学报
205
unrelated with genome size and the short motifs (mono‐ to tri‐nucleotides) outnumbered other categories. In comparison with
other fungi, the number and abundance of SSRs were higher in the B. edulis genome.
Key words: Boletus edulis, SSR molecular maker, distribution pattern
美味牛肝菌 Boletus edulis Ball. ex Fr是一种分
布广泛、食药兼用、经济价值极高的食用真菌(李
泰辉和宋斌 2002)。它不仅肉质鲜美,风味独特,
营养丰富,其所含的生物碱对腰腿疼痛、盘骨不适、
手足麻木及女性白带异常等症状具有一定的治疗
作用(王茂盛和连宾 2003),并且含有多种生物
活性成分,可以提高人体免疫力、抗癌、抗病毒(唐
薇和鲁新成 1999)的能力。更多的研究认为,美
味牛肝菌作为一种菌根真菌对维持生态平衡、促进
植物生长、抗病、抗逆等方面也起着重要作用(王
茂盛和连宾 2003)。
SSR(simple sequence repeats)简单重复序列
又称微卫星 DNA,指的是由 1–6 个核苷酸组成的
基本单元,经过多次重复所构成的一段 DNA片段,
如(GA)n,(ACC)n 等。经研究发现,SSR 中的
重复单元的数目具有高度变异性,两侧的序列通常
都是保守性较强的单一序列(秦莲花等 2006),并
且广泛分布于真核和原核生物基因组中的编码区
和非编码区。基于 SSR的这些特点,将其发展成为
一种重要的新型分子标记(Li et al. 2002)。SSR分
子标记具有多态性高、呈共显性、稳定性好、技术
简便、快速等优点,因此,被广泛的应用于遗传图
谱的构建、目标基因的标定、指纹图谱的绘制以及
品种鉴定等研究中(Ellegren 2004;Guichoux et al.
2011;Mittal & Dubey 2009)。另外,最近的研究表
明,SSR还具有一定的生物功能,如可以影响基因
的表达调控、转录、蛋白功能及基因组的组织等等。
但是,SSR 标记的开发费用较高(Dutech et al.
2007),如果利用传统的 SSR开发策略来获得整个
基因组中的 SSR标记信息代价高昂。因此,现阶段
针对真菌尤其是担子菌的 SSR 的系统研究还比较
少。随着基因组计划的开展和大规模测序工作的进
行,一些担子菌如双孢蘑菇(Morin et al. 2012)、
灰盖鬼伞(Fitzpatrick et al. 2006)、糙皮侧耳等十
多种担子菌菌株的全基因组得到了测定。基于已知
的全基因组测序数据,通过计算机程序的搜索,就
可以得到基因组水平的 SSR信息,并且所得结果与
实际实验结果基本相同(Qian et al. 2013)。因此,
基于全基因组数据进行 SSR的系统研究,将是未来
SSR分子标记开发的重要手段。
目前,对于美味牛肝菌 SSR分子标记的研究寥
寥无几,最近完成的美味牛肝菌全基因组测序工
作,无疑为我们进行高通量筛选 SSR标记提供了最
好的机会。基于全基因组数据进行 SSR分子标记的
开发,对于深入开展美味牛肝菌的分子遗传学、群
体遗传学、分子生态学和人工驯化研究有着重要的
意义。因此,本文利用生物信息学的方法在美味牛
肝菌全基因组序列中开展 SSR位点分析,对基因组
中的不同区域的 SSR进行统计,并与其他典型的担
子菌基因组进行比较,了解其分布规律及组成特
点,这项研究将为进一步开发美味牛肝菌分子遗传
标记奠定基础。
1 材料与方法
1.1 基因组资源
美味牛肝菌和其他 3种用于分析的担子菌(灰
盖鬼伞、裂褶菌、糙皮侧耳)全基因组和基因注释
数 据 来 自 于 真 核 生 物 基 因 组 数 据 库 JGI
( http://genome.jgi‐psf.org/programs/fungi/index.
jsf)。在美味牛肝菌基因组中,5或 3非编译区,
是指转录开始点和结束位置与基因起始密码子和
终止密码子间的区域;CDS是指蛋白质的编码区;
除去这两个部分以外的区域都称之为非编码 DNA,
包括内含子和基因间区。
ISSN1672‐6472 CN11‐5180/Q Mycosystema March 15, 2015 Vol. 34 No. 2
http://journals‐myco.im.ac.cn
206
1.2 序列中 SSR的搜索
利用软件MISA(http://www.pgrc.ickgatersleben.
de/misa)以正则表达式方式,寻找目标序列文件
中满足定义的微卫星重复单元。所用 SSR的筛选标
准参考 Qian et al.(2013)和 Murat et al.(2010)
为 MISA软件默认值,即单核苷酸单元的重复数大
于等于 10,二核苷酸单元的重复数大于等于 6,
三核苷酸、四核苷酸、五核苷酸和六核苷酸单元的
重复数则大于等于 5。
1.3 SSR引物设计
将通过 MISA 软件识别出来的 SSR,批量转变
为 Primer3的输入文件,用 Primer3.0(http://fokker.
wi.mit.edu/primer3/)设计特异引物。设计引物的
主要参数为:GC 含量为 40%–60%,退火温度为
55–60℃、预扩增片段长度为 100–400bp之间、引
物长度在 18–22bp之间。
1.4 电子 PCR扩增验证
将设计出来的特异引物在美味牛肝菌基因组
序列中用 e‐PCR( ftp://ftp.ncbi.nlm.nih.gov/pub/
schuler/e‐PCR/)进行模拟扩增,参数设置为默
认值。
2 结果与分析
2.1 美味牛肝菌全基因组中 SSR的分布特点
在美味牛肝菌全基因组序列中共搜索到
2 732个 SSR,每隔 17.1kb存在 1个 SSR。其数量
明显少于人类、脊椎动物和有胚植物基因组中的
SSR数量,略少于酿酒酵母基因组中的 SSR数量,
但多于秀丽隐杆线虫基因组中的 SSR数量(Toth et
al. 2000)。在搜索到的所有美味牛肝菌的 SSR中,
三核苷酸 SSR 的数量最多,为 1 340 个,相对丰
度 29 个/Mb,其次为单核苷酸 SSR(1 111 个,
24个/Mb)和二核苷酸 SSR(200个,4个/Mb),
五核苷酸 SSR 的数量最少(表 1),可见,在美味
牛肝菌 SSR中,是以三核苷酸重复为主,单核苷酸
次之,五核苷酸重复最少。
美味牛肝菌的全基因组被分为 3个区域,分别
为 5或 3非编译区、蛋白编码序列以及非编码 DNA
(表 1)。其中非编码 DNA区域的 SSR数量最多,
分别是编码序列和 5或 3非编译区 SSR 数量的 3
倍和 9倍。5或 3非编译区的 SSR相对丰度最高,
其值为 86 个/Mb,证明 SSR 在 5或 3非编译区的
密度很高。而蛋白编码序列中的 SSR数量和相对丰
度都较低,这一结果与之前的研究,认为编码区对
移码突变的选择性会限制 SSR 的扩张的结论相一
致(Metzgar et al. 2000)。
在美味牛肝菌全基因组所有重复单元类型中,
大部分为单核苷酸重复单元,其中又以 A/T的单核
苷酸重复为主,A/T为 1 003个,占单核苷酸重复
总数的 90.28%,占全部 SSR总数的 36.71%。这与
灰盖鬼伞、双色蜡蘑基因组中的结果相一致。有研
究认为,(A+T)类型 SSR 的高频出现是由高密度
散在分布的反转录转座子,如 Alu和 LINE‐1以及经
加工的假基因的 PolyA 尾所产生的(Toth et al.
2000)。但是,在灵芝、黄孢原毛平革菌和裂褶菌
中却不同,它们的单核苷酸重复类型是以 C/G 为
主(Qian et al. 2013)。在二核苷酸重复单元的 SSR
中,AG/CT 重复单元的数量最多,有 75 个,占二
核苷酸重复总数的 37.5%。从图 1 可以看出,出现
频率较高的重复类型主要以三核苷酸重复单元为
主,其中 ACC/GGT重复单元出现频率最高,为 469
个,占三核苷酸重复总数的 35%;其次为含
ACG/CTG 重复单元的 SSR,为 228 个,占总数的
17%;还有 AGC/CGT重复单元为 201个,占总数的
15%。这 3类重复类型占了三核苷酸重复类型总量
的 60%以上,而其他重复类型则相对较少。
ACG/CTG 类型的三核苷酸 SSR 广泛存在于真菌基
因组中,如在灵芝、灰盖鬼伞、双色蜡蘑、黄孢原
毛平革菌、P. placenta、裂褶菌以及 S. lacrymans
中含量都很丰富,而 ACC/GGT 类型三核苷酸 SSR
只在灰盖鬼伞和双色蜡蘑基因组中含量较多,
AGC/CGT 类型的 SSR 只在黄孢原毛平革菌和
王莹 等 /美味牛肝菌全基因组 SSR位点的分布规律研究
菌物学报
207
表 1 美味牛肝菌基因组不同区域中各种 SSR的数量、比例与相对丰度
Table 1 Number, percentage and relative abundance of SSRs in the different regions of the Boletus edulis genome
重复类型
Repeat types
编码序列
CDS
5或 3非编译区
5/3 UTR
非编码 DNA
No‐coding regions
总数
Total
78 132 901 1 111
7.02 11.88 81.10 100
单核苷酸
Mononucleotide
数量 Number (No.)
比例 Percentage (%)
相对丰度 Relative abundance (No./Mb) 5 55 33 24
30 16 154 200
15.00 8.00 77.00 100
二核苷酸
Dinucleotide
数量 Number (No.)
比例 Percentage (%)
相对丰度 Relative abundance (No./Mb) 2 7 6 4
400 56 884 1 340
29.85 4.18 65.97 100
三核苷酸
Trinucleotide
数量 Number (No.)
比例 Percentage (%)
相对丰度 Relative abundance (No./Mb) 23 23 33 29
1 3 21 25
4.00 12.00 84.00 100
四核苷酸
Tetranucleotide
数量 Number (No.)
比例 Percentage (%)
相对丰度 Relative abundance (No./Mb) 0 1 1 1
1 1 6 9
11.11 11.11 66.67 100
五核苷酸
Pentanucleotide
数量 Number (No.)
比例 Percentage (%)
相对丰度 Relative abundance (No./Mb) 0 0 0 0
19 0 28 47
40.43 0.00 59.57 100
六核苷酸
Hexanucleotide
数量 Number (No.)
比例 Percentage (%)
相对丰度 Relative abundance (No./Mb) 1 0 1 1
529 208 1 995 2 732
19.36 7.61 73.02 100
所有 SSR
All SSRs
数量 Number (No.)
比例 Percentage (%)
相对丰度 Relative abundance (No./Mb) 31 86 74 59
图 1 美味牛肝菌基因组中高频率(≥10)出现的 SSR 重复
类型
Fig. 1 The most frequent (≥10) SSR types in the Boletus edulis
genome.
P. placenta中含量丰富(Qian et al. 2013)。这些数
据显示出三核苷酸 SSR 的类型在各种真菌基因组
中,有一致性也有特殊性。在含四核苷酸重复单元
的 SSR中,由于总数较少,所以类型也较单一,只
有 AAAG/CTTT 重复单元稍多为 9 个,占四核甘酸
重复总数的 36%。五核苷酸的情况与四核甘酸基本
相同,数量和类型都很少。对于含有六核苷酸重复
单元的 SSR,虽然 SSR的数量不多,但是六核苷酸
重复类型较多,每种类型只有一到两个 SSR。
总的来说,在美味牛肝菌所有的 SSR中,最多
的重复单元是 A/T,然后依次是 ACC/GGT、ACG/CTG、
AGC/CGT、 AAC/GTT、 C/G、AGG/CCT、AG/CT、
ISSN1672‐6472 CN11‐5180/Q Mycosystema March 15, 2015 Vol. 34 No. 2
http://journals‐myco.im.ac.cn
208
AAG/CTT、AC/GT、CCG/CGG、AT/AT、ACT/ATG、CG/CG
和 AGT/ATC,这些重复单元占了总数的 96.67%。
基于长 SSR 的多态性比短 SSR 的多态性要好
(Cho et al. 2000),且 SSR中多核苷酸重复单元的
SSR的突变率较高(Chakraborty et al. 1997)的研
究结果,我们在美味牛肝菌全基因组中的所有重
复次数不小于 10次的多核苷酸 SSR中,随机选出
41个 SSR位点,针对这些 SSR设计引物(表 2),
并进行 e‐PCR验证,所有引物都成功扩增出片段,
并具有很好的特异性。
表 2 美味牛肝菌基因组中 41个较长 SSR的引物列表
Table 2 Set of primers corresponding to the 41 long microsatellite locus from Boletus edulis genome
SSR序列
SSRs
引物序列
Primer sequence
SSR在基因组中的位置
Position on genome
(ACA)10 (F)ATGTTCGTGAAACCTACGCC
(R)TGCGACATGTTTACTGGAGC
scaffold_2_651486_651515
(GTG)12 (F)ATGTCGTCGCTGTTGGTGT
(R)ACGACGACGTGACGATGAC
scaffold_4_1145321_1145356
(GTG)10 (F)TCTTAGCTCAACGCGGAAAT
(R)AACCTCACCTATGAAGGGGG
scaffold_11_79113_79142
(TCC)11 (F)CATGGATCACGGAGACACAG
(R)TAGCGAGGACGAGATGGACT
scaffold_13_204689_204721
(CCA)11 (F)CATGCCACTACCACACCAAC
(R)TCATGTGTCGTTGGGTCATC
scaffold_19_75331_75363
(TG)11 (F)GATATTGTACGAGCCGCCAT
(R)ACGCATCCAAACCCATCTAC
scaffold_21_44329_44350
(TG)10 (F)TCATGGATTGGATGGGACTT
(R)GCAGACGAAACGACTTAGCC
scaffold_21_240691_240710
(TTG)10 (F)CACAGTGGTGGGAGTCAATG
(R)CGAAATAAGGGGTTTGCTGA
scaffold_28_294976_295005
(CCA)10 (F)GATCTGTGCCACTGAGACGA
(R)GTGCCATTGTCGTTGTTGAC
scaffold_34_111788_111817
(GGGTGA)10 (F)TCCCCTTGTCCTCATTCTTG
(R)TGGCTGTTGTCCTCTTCCTT
scaffold_35_93918_93977
(CCCTCA)11 (F)CTCAAGACCATTGCCCTCAT
(R)CTGACTCGCATTGTCGTTGT
scaffold_35_187015_187080
(ATGCCG)10 (F)GTGTTGCACCTTCGTCATTG
(R)CATGGTCGTGATCCACAAAG
scaffold_37_23737_23796
(TCC)11 (F)GCTATTGAGAGTGCCCGTGT
(R)CCAAGAGGTTGAGGAAGTGG
scaffold_40_234470_234502
(TTG)14 (F)GTTGTTGACGACTGGTGGTG
(R)GGTAGGCGTTTTTGACGGTA
scaffold_46_15572_15613
(TGG)12 (F)GTATGTACGGGGTGGGGAC
(R)GAAGACGACAACGACGACAA
scaffold_47_2582_2617
(AT)10 (F)ATGGTTCAAACGTTCAAGGC
(R)TTCAGAATGAAGGAATCGGG
scaffold_55_105364_105383
(GTG)11 (F)CTGATGTGTGGATGTGGCAT
(R)GCGACAACTTGTGACCATGA
scaffold_57_83740_83772
(TGG)10 (F)CGTCGTTGTATGTACGGTGG
(R)CAGTACCGATGGCAACAATG
scaffold_66_57840_57869
王莹 等 /美味牛肝菌全基因组 SSR位点的分布规律研究
菌物学报
209
续表 2
(AT)14 (F)CGGAGTCTGAGTGACGTGAA
(R)GGAAGCCGTGTGTTCTCTGT
scaffold_74_133661_133688
(CAC)10 (F)GTCGATGACAACCATGCAAC
(R)CATCTTCACAGTGGTGGTGG
scaffold_80_112497_112526
(CCA)11 (F)AACAGTGCAGTGGTGGCAT
(R)AGCGTCGTCGTCGTCTTTAC
scaffold_81_69412_69444
(AT)10 (F)ATAACTTTGGCGGTGAGTGG
(R)GGTCGTTGCGTCTTTCTCTC
scaffold_84_67037_67056
(ACA)12 (F)ACCACCACCACTACTACCGC
(R)TGTCGTCTTCGTCTCAGTGG
scaffold_87_106335_106370
(CAC)11 (F)TCGGAGTCCGGAGTAGAAGA
(R)GCTCACTCCACTCCCTGAAG
scaffold_94_66203_66235
(CCA)10 (F)CAATGGTGACAATGCGACA
(R)GTGTGTCGTCGGGTCATTG
scaffold_113_44285_44314
(TG)12 (F)TTATGGAAGACAAGGGGCAG
(R)GCTCATTTTTCCCTTTGCAG
scaffold_138_75402_75425
(GGT)11 (F)TTTTGTTCGATTGCCACTCA
(R)CCTACTTACGCCGTCACCAT
scaffold_139_8363_8395
(TGG)10 (F)ATTTGCCAGAAAGCGAGTGT
(R)AGACAAACGGAGTACCGCAC
scaffold_142_12791_12820
(GACAAC)12 (F)ACCACCACCACTACTACCGC
(R)GCACATCGTCGTCATCTTTG
scaffold_148_23716_23787
(GTG)10 (F)GGTGGTAGCGCCATGACTAT
(R)CTACACCAACGGCGATGAC
scaffold_149_26726_26755
(CAC)11 (F)CATGATGGCACCAGCAATAG
(R)TCTTGCTCAGACTCCCATCC
scaffold_172_22328_22360
(ACA)11 (F)AGCCAGCACAGAAAGGTCAT
(R)TGTCGTCTTCGTCTCAGTGG
scaffold_177_16393_16425
(GTT)14 (F)GACATTTTCGTTTCCGCAAT
(R)CCGACAACGACAATGATGAC
scaffold_195_20904_20945
(ACG)10 (F)GACGACAATGACGACTCGC
(R)TGTTGTAGTGGTGGTGGTGC
scaffold_197_8449_8478
(GTG)13 (F)ACTGTGCCGATGTTGTTGTC
(R)CTACACCAACGGCGATGAC
scaffold_309_1663_1701
(GTG)12 (F)AGTACCTCGCCATTGTCGTC
(R)CGTGTCACCACCACCACTAC
scaffold_451_294_329
(TGG)12 (F)GTATGTACGGGGTGGGGAC
(R)GAAGACGACAACGACGACAA
scaffold_461_5826_5861
(TGG)12 (F)GTATGTACGGGGTGGGGAC
(R)GAAGACGACAACGACGACAA
scaffold_524_6256_6291
(CAA)10 (F)TTCATTGACCATGATGGGTG
(R)AATAGGCGAGCTGTGGCTAA
scaffold_561_543_572
(GTG)12 (F)GGTGGTAGCGCCATGACTAC
(R)CTACACCAACGGCGATGAC
scaffold_701_1907_1942
(TCC)10 (F)CGGTGTTCTCCTTTGTGCTT
(R)AATATCCTGAGGTGGGGGAT
scaffold_864_1590_1619
ISSN1672‐6472 CN11‐5180/Q Mycosystema March 15, 2015 Vol. 34 No. 2
http://journals‐myco.im.ac.cn
210
2.2 美味牛肝菌基因组编码区的 SSR分布特点
编码区的 SSR 总共有 529 个,占 SSR 总数的
19.36%,其中单核苷酸 SSR只有 78个、二核苷酸
SSR 有 30 个、三核苷酸 SSR 有 400 个、四核苷酸
和五核苷酸各有 1个以及六核甘酸有 16个,分别
占各种 SSR总数的 14.74%、5.67%、75.61%、0.19%、
0.19%和 3.59%。可见,编码序列中的 SSR 以三核
苷酸和单核甘酸为主。其结果与香菇(林范学等
2007)、灰盖鬼伞(刘林等 2006)以及葡萄(蔡斌
等 2009)基因组编码区中的 SSR 以三核苷酸和六
核苷酸重复单元为主的结果略有不同。
美味牛肝菌基因组编码序列的 SSR 重复单元
共有 32种类型,其中三核苷酸 ACG/CTG重复类型
最多。共有 123个,占三核苷酸 SSR数目的 30.75%;
其次是 ACC/GGT、A/T和 AGG/CCT重复类型,分别
有 91个、55个和 52个,以上 4种 SSR重复类型
占所有 SSR 数目的 60.68%。美味牛肝菌编码序列
中 SSR的数目不小于 10的重复类型见图 2。
图 2 美味牛肝菌基因组 CDS区域中高频率出现的 SSR重复
类型
Fig. 2 The most frequent SSR types in the CDS regions of
Boletus edulis genome.
2.3 美味牛肝菌与其他 3种担子菌基因组中 SSR分
布的比较
首先,我们分析了美味牛肝菌和其他 3种担子
菌(灰盖鬼伞、裂褶菌和糙皮侧耳)全基因组中所
有 SSR 的数量,这些基因组的大小从糙皮侧耳的
34.3Mb 到美味牛肝菌的 46.6Mb 大小不等,同时
基因组中所含 SSR的总数从裂褶菌的 1 206个到美
味牛肝菌的 2 732个,虽然美味牛肝菌的基因组最
大,所含的 SSR也最多,但总体看来基因组中 SSR
的数量与基因组大小无关,例如除美味牛肝菌以
外,裂褶菌的基因组最大,所含的 SSR数量却最少。
我们还发现美味牛肝菌和灰盖鬼伞的 SSR 数量相
对丰富,而裂褶菌和糙皮侧耳的 SSR数量很少,只
有不到美味牛肝菌中 SSR的数量的一半。
其次,进一步分析各个基因组中不同重复类
型的 SSR数量和相对丰度的比较结果(表 3),发
现这 4种食用菌基因组都是以三核苷酸 SSR为主,
接着是单核苷酸,只有在糙皮侧耳基因组中二核
苷酸 SSR 的数量(272 个)大于单核苷酸 SSR 的
数量(251个)。并且,糙皮侧耳基因组中的四到
六核苷酸 SSR 的数量都大于其他 3 种担子菌基因
组。观察这 4 种担子菌基因组中各重复类型 SSR
所占各基因组 SSR总数的比例(图 3),我们发现,
在 4 种担子菌基因组中,单核苷酸、二核苷酸和
三核苷酸的 SSR 总和占各基因组所有 SSR 数量的
85%以上。另外,相对于其他 3 种担子菌,美味
牛肝菌基因组中二核苷酸和四核苷酸 SSR 的比例
很小,主要以三核苷酸和单核苷酸重复类型的 SSR
为主。
3 讨论
由于 SSR分子标记具有丰富的等位变异,实验
可重复性好,使得其在群体遗传学(Jarne & Lagoda
1996;Luikart et al. 2003)、分子生态学(Ellegren
2004)及育种实践等领域均有重要研究意义,并
且,SSR分子标记还可以帮助我们解释基因组扩张
现象(Murat et al. 2010)和影响数量遗传性状的
表达(Albanèse et al. 2001)。近年来,对于 SSR分
子标记开发策略的研究逐渐深入,不断探索新的开
发策略。但是,不管是利用传统的 SSR标记开发策
略还是采取富集步骤的标记开发策略,想得到分布
于整个基因组的 SSR标记数据都是耗时和费力的。
王莹 等 /美味牛肝菌全基因组 SSR位点的分布规律研究
菌物学报
211
表 3 4种担子菌基因组中各种 SSR的数量及相对丰度
Table 3 Occurrence and relative abundance of SSRs in the four basidiomycete genomes
重复类型
Repeat types
灰盖鬼伞
Coprinus
cinerea
裂褶菌
Schizophyllum
commune
糙皮侧耳
Pleurotus
ostreatus
美味牛肝菌
Boletus
edulis
761 346 251 1 111 单核苷酸
Mononucleotide
数量 Number (No.)
相对丰度 Relative abundance (No./Mb) 21 9 7 24
375 200 272 200 二核苷酸
Dinucleotide
数量 Number (No.)
相对丰度 Relative abundance (No./Mb) 10 5 8 4
843 593 640 1 340 三核苷酸
Trinucleotide
数量 Number (No.)
相对丰度 Relative abundance (No./Mb) 23 15 19 29
38 24 42 25 四核苷酸
Tetranucleotide
数量 Number (No.)
相对丰度 Relative abundance (No./Mb) 1 1 1 1
10 15 21 9 五核苷酸
Pentanucleotide
数量 Number (No.)
相对丰度 Relative abundance (No./Mb) 0 0 1 0
23 28 88 47 六核苷酸
Hexanucleotide
数量 Number (No.)
相对丰度 Relative abundance (No./Mb) 1 1 3 1
2 050 1 206 1 314 2 732 所有 SSR
All SSRs
数量 Number (No.)
相对丰度 Relative abundance (No./Mb) 56 31 38 59
图 3 4种担子菌基因组中各种 SSR所占各基因组 SSR总数的比例
Fig. 3 Distribution of microsatellites for the four basidiomycete genomes.
相反,如果利用已有的基因组测序数据来搜索 SSR
位点就得到事半功倍的效果。因此,本文在美味牛
肝菌全基因组测序数据基础上,利用生物信息学方
法分析统计了美味牛肝菌全基因组中所有 SSR 位
点的分布,为进一步开发美味牛肝菌 SSR分子标记
打下坚实的基础。并且所用分析方法可以用于其他
担子菌基因组中 SSR的分析。
由于对于 SSR的定义没有一个统一的标准,采
ISSN1672‐6472 CN11‐5180/Q Mycosystema March 15, 2015 Vol. 34 No. 2
http://journals‐myco.im.ac.cn
212
用分析方法和最小长度的定义的不同(Meglecz et
al. 2012),使获得的整个基因组中 SSR的数量也存
在较大的差异。例如,基于滑移率变化在 10个碱
基的理论,Rose & Falush(1998)按照不同重复基
序的 SSR总长度至少为 8–10bp的标准,在酵母基
因组中搜索 SSR位点。同时,Dechering et al.(1998)
又定义真核细胞 SSR 总长不少于 7–10bp。然而,
2003年 Lai & Sun(2003)按照单核苷酸重复 9次,
二、三和四核苷酸重复 4次的标准定义了人类基因
组中的 SSR。最近针对不同真菌基因组,Murat et al.
(2010)和 Li et al.(2009)分别在各自研究中定
义 SSR为单核苷酸重复 10次,二核苷酸重复 6次,
三至六核苷酸分别重复 5次。因此,为了与之前的
实验结果相比较,作为担子菌的美味牛肝菌基因
组,也同样采用上述标准进行 SSR位点的搜索。经
研究发现,46.6Mb 大小的美味牛肝菌基因组共含
有 2 732个 SSR位点,平均每隔 17.1Kb出现 1个
SSR,其中大多数 SSR(73.02%)分布在非编码 DNA
区域,这一分布模式普遍存在于真菌基因组中,也
是真菌基因组较其他高等真核生物 SSR 数量较少
的原因。因为在真菌基因组中基因密度很高,非编
码区的比例很小,最终使得在整个真菌基因组中
SSR的数量较少。
SSR除了作为一种分子标记以外,还具有功能
上的意义,包括它在染色体组织上的影响,对基因
活性、DNA 复制、细胞周期和纠错修复系统的调
节等等(Li et al. 2002;Subramanian et al. 2003)。
通常,我们可以根据 SSR所在位置初步判断它的功
能,分布在外显子中的 SSR 可以改变蛋白的功能
(Verstrepen et al. 2005),分布在 5非编译区的 SSR
可以调节基因的表达,分布在 3’非编译区的 SSR
可以导致转录滑移(Riley & Krieger 2009),而分布
在非编码区的 SSR可以影响基因的转录等。在美味
牛肝菌基因组中,有 529个 SSR分布在外显子中,
这些 SSR 位点可以为功能基因提供“绝对的”分
子标记,可对重要性状的等位基因进行直接鉴定。
存在于 5或 3非编译区的 208个 SSR,部分 SSR可
能对调节基因的表达活性起着一定的作用。另外,
分布在非编码区的 1 995个 SSR,其中较长的 SSR
位点可能具有特殊的功能。例如,帮助姐妹染色单
体凝聚,间接影响着丝粒的形成等(Murphy &
Karpen 1995)。
由于之前的研究已证实长 SSR 的多态性要好
于短 SSR,因此,为了节省实验费用和时间,达到
快速开发高多态性 SSR分子标记的目的。我们从美
味牛肝菌全基因组的所有 SSR 位点中随机选出 41
个重复次数不小于 10次的多核苷酸 SSR位点,同
时也设计了 41 对与其相应的引物,并利用 e‐PCR
进行了验证。e‐PCR即电子 PCR技术,它可以根据
标记位点设计的引物,通过计算机模拟,得到扩增
产物的长度和在染色体上的位置等信息。主要应用
于 PCR 引物辅助设计及验证、基因组测序和基因
图谱的构建与检验等方面,是不必进行实际扩增实
验,就可以筛选出能扩增出目的条带引物的有效方
法,有着重要的实际应用价值(陆景标 2010)。
在与其他 3种担子菌基因组比较后,发现 SSR
数量的多少与基因组大小不存在线性关系,这说明
在不同的基因组中 SSR的进化情况是不同的。在美
味牛肝菌和其他 3种担子菌基因组中,短重复单元
(单核苷酸至三核苷酸)的数量要比长的重复单元
数量要多,支持了长的重复单元的 SSR具有较高的
可变性的观点。
致谢:美味牛肝菌的全基因组和基因注释数据是由与美国
能源部联合基因组研究所(http://www.jgi.doe.gov/)合作
的菌根真菌基因组研究组(PI: Francis Martin)提供,特此
致谢!
[REFERENCES]
Albanèse V, Biguet NF, Kiefer H, Bayard E, Mallet J, Meloni R,
2001. Quantitative effects on gene silencing by allelic
variation at a tetranucleotide microsatellite. Human
Molecular Genetics, 10(17): 1785‐1792
王莹 等 /美味牛肝菌全基因组 SSR位点的分布规律研究
菌物学报
213
Cho YG, Ishii T, Temnykh S, Chen X, Lipovich L, McCouch SR,
Park WD, Ayres N, Cartinhour S, 2000. Diversity of
microsatellites derived from genomic libraries and
GenBank sequences in rice (Oryza sativa L.). Theoretical
and Applied Genetics, 100(5): 713‐722
Cai B, Li CH, Yao QH, Zhou J, Tao JM, Zhang Z, 2009. Analysis
of SSRs in grape genome and development of SSR
database. Journal of Nanjing Agricultural University,
32(4): 28‐32 (in Chinese)
Chakraborty R, Kimmel M, Stivers DN, Davison LJ, Deka R,
1997. Relative mutation rates at di‐, tri‐, and
tetranucleotide microsatellite loci. Proceedings of the
National Academy of Sciences, 94(3): 1041‐1046
Dechering KJ, Cuelenaere K, Konings RN, Leunissen JA, 1998.
Distinct frequency‐distributions of homopolymeric DNA
tracts in different genomes. Nucleic Acids Research,
26(17): 4056‐4062
Dutech C, Enjalbert J, Fournier E, Delmotte F, Barres B, Carlier
J, Tharreau D, Giraud T, 2007. Challenges of
microsatellite isolation in fungi. Fungal Genetics and
Biology, 44(10): 933‐949
Ellegren H, 2004. Microsatellites: simple sequences with
complex evolution. Nature Reviews Genetics, 5: 435‐445
Fitzpatrick DA, Logue ME, Stajich JE, Butler G, 2006. A fungal
phylogeny based on 42 complete genomes derived from
supertree and combined gene analysis. BMC
Evolutionary Biology, 6(6): 99
Guichoux E, Lagache L, Wagner S, Chaumeil P, Leger P, Lepais
O, Lepoittevin C, Malausa T, Revardel E, Salin F, Petit RJ,
2011. Current trends in microsatellite genotyping.
Molecular Ecology Resources, 11(4): 591‐611
Jarne P, Lagoda PJ, 1996. Microsatellites, from molecules to
populations and back. Trends in Ecology & Evolution,
11(10): 424‐429
Lai YL, Sun FZ, 2003. The relationship between microsatellite
slippage mutation rate and the number of repeat units.
Molecular Biology and Evolution, 20(12): 2123‐2131
Li TH, Song B, 2002. Species and distributions of Chinese
edible Boletes. Acta Edulis Fungi, 9(2): 22‐30 (in
Chinese)
Li CY, Liu L, Yang J, Li JB, Su Y, Zhang Y, Wang YY, Zhu YY, 2009.
Genome‐wide analysis of microsatellite sequence in seven
filamentous fungi. Interdisciplinary Science: Computational
Life Sciences, 1(2): 141‐150
Li YC, Korol AB, Fahima T, Beiles A, Nevo E, 2002.
Microsatellites: genomic distribution, putative functions
and mutational mechanisms: a review. Molecular
Ecology, 11(12): 2453‐2465
Lin FX, Cheng SM, Li AZ, Lin FC, 2007. Compose and
distribution of EST‐SSR in genomes of Lentinula edodes.
Microbiology, 34(3): 438‐442 (in Chinese)
Liu L, Li CY, Yang J, Ye YF, Li JB, Zhou XG, Wang YY, Zhu YY,
2006. Analysis of microsatellite sequences in the
genome of basidiomycete fungus, Coprinus cinereus.
Southwest China Journal of Agricultural Sciences, 19(1):
131‐135 (in Chinese)
Luikart G, England PR, Tallmon D, Jordan S, Taberlet P, 2003.
The power and promise of population genomics: from
genotyping to genome typing. Nature Reviews Genetics,
4(12): 981‐994
Lu JB, Li JQ, Lu J, Zhan QW, 2010. Design of SSR primers and
verification of e‐PCR in non‐coding. Seed, 29(9): 1‐6 (in
Chinese)
Meglecz E, Neve G, Biffin E, Gardner MG, 2012. Breakdown
of phylogenetic signal: a survey of microsatellite
densities in 454 shotgun sequences from 154 non model
eukaryote species. PLoS One, 7(7): e40861
Metzgar D, Bytof J, Wills C, 2000. Selection against frameshift
mutations limits microsatellite expansion in coding DNA.
Genome Research, 10(1): 72‐80
Mittal N, Dubey AK, 2009. Microsatellite markers‐A new
practice of DNA based markers in molecular genetics.
Pharmacognosy Reviews, 3(6): 235‐246
Morin E, Kohler A, Baker AR, Foulongne‐Oriol M, Lombard V,
Nagy LG, Ohm RA, Patyshakuliyeva A, Brun A, Aerts AL,
Bailey AM, Billette C, Coutinho PM, Deakin G,
Doddapaneni H, Floudas D, Grimwood J, Hilden K, Kues
U, Labutti KM, Lapidus A, Lindquist EA, Lucas SM, Murat
C, Riley RW, Salamov AA, Schmutz J, Subramanian V,
Wosten HA, Xu J, Eastwood DC, Foster GD, Sonnenberg
ISSN1672‐6472 CN11‐5180/Q Mycosystema March 15, 2015 Vol. 34 No. 2
http://journals‐myco.im.ac.cn
214
AS, Cullen D, Vries, RP, Lundell T, Hibbett DS, Henrissat B,
Burton KS, Kerrigan RW, Challen MP, Grigoriev IV, Martin
F, 2012. Genome sequence of the button mushroom
Agaricus bisporus reveals mechanisms governing
adaptation to a humic‐rich ecological niche. Proceedings
of the National Academy of Sciences, 109(43):
17501‐17506
Murat C, Riccioni C, Belfiori B, Cichocki N, Labbe J, Morin E,
Tisserant E, Paolocci F, Rubini A, Martin F, 2010.
Distribution and localization of microsatellites in the
Perigord black truffle genome and identification of new
molecular markers. Fungal Genetics and Biology, 48(6):
592‐601
Murphy TD, Karpen GH, 1995. Localization of centromere
function in a Drosophila minichromosome. Cell, 82(4):
599‐609
Qian J, Xu H, Song J, Xu J, Zhu Y, Chen S, 2013. Genome‐wide
analysis of simple sequence repeats in the model
medicinal mushroom Ganoderma lucidum. Gene, 512(2):
331‐336
Qin LH, Song CY, Tan Q, Chen MJ, Pan YJ, 2006. Use of ITS and
ISSR markers to identify cultivated strains for Lentinula
edodes. Mycosystema, 25(1): 94‐100 (in Chinese)
Riley DE, Krieger JN, 2009. UTR dinucleotide simple sequence
repeat evolution exhibits recurring patterns including
regulatory sequence motif replacements. Gene, 429(1‐2):
80‐86
Rose O, Falush D, 1998. A threshold size for microsatellite
expansion. Molecular Biology and Evolution, 15(5):
613‐615
Subramanian S, Mishra RK, Singh L, 2003. Genome‐wide
analysis of microsatellite repeats in humans: their
abundance and density in specific genomic regions.
Genome Biology, 4(2): R13
Tang W, Lu XC, 1999. Study of the biological activity and the
antitumor activity against sarcoma‐180 of Boletus edulis.
Journal of Southwest China Normal University, 24(4):
478‐481 (in Chinese)
Toth G, Gaspari Z, Jurka J, 2000. Microsatellites in different
eukaryotic genomes: survey and analysis. Genome
Research, 10(7): 967‐981
Verstrepen KJ, Jansen A, Lewitter F, Fink GR, 2005. Intragenic
tandem repeats generate functional variability. Nature
Genetics, 37(9): 986‐90
Wang MS, Lian B, 2003. Studying on Boletus edulis. Guizhou
Forestry Science and Technology, 31(3): 34‐38 (in Chinese)
[附中文参考文献]
蔡斌,李成慧,姚泉洪,周军,陶建敏,章镇,2009. 葡
萄全基因组 SSR 分析和数据库构建. 南京农业大学学
报,32(4): 28‐32
李泰辉,宋斌,2002. 中国食用牛肝菌的种类及其分布. 食
用菌学报,9(2): 22‐30
林范学,程水明,李安政,林芳灿,2007. 香菇基因组中
EST‐SSR的构成和分布. 微生物学通报,34(3): 438‐442
刘林,李成云,杨静,业艳芬,李进斌,周晓罡,王云月,
朱有勇,2006. 灰盖鬼伞基因组中微卫星序列的组成.
西南农业学报,19(1): 131‐135
陆景标,李杰勤,卢杰,詹秋文,2010. 高粱非编码区 SSR
引物设计以及 e‐PCR的验证. 种子,29(9): 1‐6
秦莲花,宋春艳,谭琦,陈明杰,潘迎捷,2006. 用 ITS
和 ISSR 分子标记技术鉴别香菇生产用种. 菌物学报,
25(1): 94‐100
唐薇,鲁新成,1999. 美味牛肝菌多糖的生物活性及其抗
S‐180肿瘤的效应. 西南师范大学学报,24(4): 478‐481
王茂盛,连宾,2003. 美味牛肝菌研究. 贵州林业科技,
31(3): 34‐38