全 文 :·技术与方法·
生物技术通报
BIOTECHNOLOGY BULLETIN 2011 年第 8 期
454 测序技术开发微卫星标记的研究进展
程晓凤1,2 黄福江1,2 刘明典2 汪登强2
(1西南大学生命科学学院 淡水鱼类资源与生殖发育教育部重点实验室 水产科学重庆市市级重点
实验室,重庆 400715;2农业部长江中上游渔业资源环境重点野外科学观测试验站
中国水产科学研究院长江水产研究所,荆州 434000)
摘 要: 第二代测序技术(454 测序为例)已成为测定基因组序列的一种成熟技术。454 测序亦可应用于目标 DNA 区
域分析,因此可用作微卫星标记的开发。较传统方法而言,具有便捷、高效等特点。目前,运用 454 技术进行基因组测序或转
录组测序开发微卫星标记,用以研究种群生态学、构建遗传图谱等得到越来越多的重视和应用。综述了 454 测序技术在开发
微卫星标记上的应用,并根据其优缺点对其应用前景进行了展望,旨在为应用 454 测序开发微卫星提供参考。
关键词: 454 测序 微卫星 基因组 转录组
Development of Microsatellite Markers Using 454 Pyrosequencing
Cheng Xiaofeng1,2 Huang Fujiang1,2 Liu Mingdian2 Wang Dengqiang2
(1Key Laboratory of Freshwater Fish Reproduction and Development,Education of Ministry,Key Laboratory of Aquatic Science of
Chongqing,School of Life Science,Southwest University,Chongqing 400715;2Key Field Scientific Observing and Experimental
Station of Fishery Resources and Environment of the Middle and Upper Reaches of the Yangtze River,Yangtze
River Fisheries Research Institute,Chinese Academy of Fishery Sciences,Jingzhou 434000)
Abstract: Next-generation sequencing(454 pyrosequencing as an example)has been a mature technology for genome sequencing,
which can be used to analysis the target DNA region and develop microsatellite markers. Compared to the traditional methods,it is
more simple and efficient. Currently,growing attention and application has put on developing microsatellite markers which can be used
to study population ecology,construct genetic map etc. through genome sequencing or transcriptome sequencing using 454 pyrosequenc-
ing. This article reviewed the application of 454 pyrosequencing on developing microsatellite markers,and its merits and drawbacks,
thus it could provide references to microsatellite markers’development when use 454 pyrosequencing.
Key words: 454 pyrosequencing Microsatellite Genome Transcriptome
收稿日期:2011-04-07
基金项目:农业部公益性行业科研专项经费项目(200903048)
作者简介:程晓凤,女,硕士研究生,研究方向:鱼类生态学;E-mail:swu2006cxf@ 126. com
通讯作者:汪登强,男,副研究员,研究方向:生物化学与分子生物学;E-mail:wdq@ yfi. ac. cn
微卫星 DNA(Microsatellite DNA) ,又叫做简单
序列重复(simple sequence repeats,SSRs) ,是由 1 - 6
bp为重复单位的串联重复 DNA。微卫星 DNA侧翼
序列相对保守,而核心序列具有高突变性,因此可以
根据侧翼序列的保守性设计引物,通过 PCR方法检
测微卫星序列的多态性。基于微卫星标记多态性
高、杂合子比例高和共显性等特点,被广泛应用于种
群遗传多样性分析[1]、亲缘关系鉴定[2]、遗传图谱
构建[3,4]等方面的研究。
由于微卫星标记具有种族特异性,必须采用特
异引物进行 PCR检测,因此要开展一个物种的微卫
星 DNA研究,通常需要预先开发这个物种的微卫星
标记[5]。目前,开发微卫星标记的方法虽然很多,
但大都存在步骤繁琐、效率低、耗时长等问题。
2007 年,罗氏 454 公司推出了基于焦磷酸测序
法的第二代基因组测序系统——— Genome Sequencer
FLX System(GS FLX)。2008 年 10 月,全新的 GS
FLX Titanium系列试剂和软件的补充,使 GS FLX的
通量提高了 5 倍,准确性、读长也进一步提升。如
今,454 测序技术以其速度快、读长长、通量高、准确
2011 年第 8 期 程晓凤等:454 测序技术开发微卫星标记的进展
度高、一致性好、简便高效等特点在多数应用中有效
取代了传统的 Sanger 测序法,并已广泛应用于全基
因组测序[6]、比较基因组研究[7]、转录组和基因调
节研究[8]、扩增产物分析[9]等领域中。454 测序不
仅可以对基因组 DNA测序,也可对特定目标 DNA
区域测序,由于较 Illumina Solexa 测序和 ABI SOL-
iD测序,454 测序片段读长最大,因此更适合于用
于微卫星标记的开发,并且具有高效、快捷等优
点。随着此项测序技术的不断发展和完善,用来
开发微卫星标记也必将受到越来越多研究人员的
青睐。
现介绍目前开发微卫星标记常用的方法及存在
的问题,同时综述 454技术应用于微卫星标记开发的
原理、应用情况,并对其应用前景进行展望。
1 当前开发微卫星标记的主要方法
目前,开发微卫星标记的方法很多,主要可分为
以下三类:(1)从公共数据库或相关文献中查找微
卫星位点;(2)近缘物种间引物交叉扩增; (3)从基
因组 DNA 中筛选微卫星位点。
1. 1 从公共数据库或相关文献中查找微卫星位点
DNA数据库如 GenBank、EMBL(European Molec-
ular Biology Laboratory)、DDBJ(DNA Data Bank of Ja-
pan)中包含部分物种的微卫星序列或引物、DNA 序
列或 EST,可直接从中筛选出微卫星位点;此外从相
关文献中也可能查找物种的微卫星位点或引物。这
类方法无疑是获得微卫星位点较为快捷、经济的一种
方法。但是,它受限于数据库中的数据量,目前多是
一些积累了较多 DNA序列的模式生物或经济作物可
以实现,如水稻[10]、高粱[11]和大西洋鲑[12]等。
1. 2 近缘物种间引物交叉扩增
由于微卫星位点的侧翼序列在同一属甚至同一
科内一般比较保守,因此可以使用近缘物种的微卫
星位点或引物进行交叉扩增。如 Hulák 等[13]从 5
种小龙虾中筛选 41 对微卫星引物扩增刺颊小龙虾
(Orconectes limosus)的微卫星位点,结果 10 对引物
扩增成功,并显示出多态性。微卫星引物在物种间
扩增时,一般需要改变扩增条件(如退火温度等)以
获得较好的扩增结果。然而,仅从产物片段大小和
变化方面并非总能较好地确定微卫星的存在,还需
要通过杂交、测序等方法确定所扩增出的条带就是
所期望的产物[14],所以使用近缘物种的微卫星引
物杂交扩增具有一定的风险性和局限性。
1. 3 从基因组 DNA 中筛选微卫星位点
对于大多数生物而言,主要是从基因组 DNA中
筛选微卫星位点,这主要包括以下几种分离策略:传
统分离法[15];基于 RAPD(randomly amplified poly-
morphic DNA)[16]、ISSR-PCR[17,18]、引物延伸[19,20]、
选择杂交[21,22]的分离策略;近年来出现的 TOMMI
法 (targeted oligonucleotide-mediated microsatellite i-
dentification)[23]和 FIASCO法(fast isolation by AFLP
of sequences containing repeats)[24]等。
传统分离法开发微卫星标记存在费时、费力、效
率低、操作过程繁琐等问题,对于某些生物如鸟类、
植物等基因组中微卫星含量较少,或研究需要大量
的微卫星标记时,传统分离法更是力所不及。
而几种富集法虽较传统分离法在时间效率上有
所提高,分子技术和试验设备有所简化和降低,但仍
存在一些问题有待优化或解决。基于 RAPD分离微
卫星具有较大的局限性,因为使用这种方法的前提
是 RAPD产物必须与微卫星位点相关联。基于 IS-
SR-PCR 分离微卫星位点,如果使用简并引物富集
微卫星位点,则设计简并引物具有较大的困难,而如
果使用已知接头序列与重复区序列设计引物分离微
卫星位点需要多次进行 PCR 扩增、设计引物、测序
等,步骤繁琐。引物延伸法分离微卫星,步骤仍较繁
琐,并且阳性克隆重复率也较高。基于选择杂交法
分离微卫星位点主要包括尼龙膜富集法和磁珠富集
法,而磁珠富集法中探针与基因组 DNA的杂交反应
处于液体介质中[22],比探针固定在尼龙膜上反应更
加充分,因此,磁珠富集法的分离效率相对于尼龙膜
富集法较高。磁珠富集法也是当前应用于大规模筛
选微卫星位点最为常用的一种方法,这种方法需要
经过构建富含微卫星的基因组文库、分离微卫星位
点、阳性克隆测序、引物设计、优化 PCR 条件、引物
预扩增和多态性检测等一系列繁琐的步骤。
TOMMI法在整个分离过程中需要进行多次测
序[23],步骤较繁琐,而且多次测序也将提高费用。
FIASCO法结合了 AFLP的方法,省去了许多不必要
的步骤,因此更加快捷、简便。但是这种方法仍然需
要进行酶切、建库、富集、克隆、筛选等一系列较为复
杂、繁琐的步骤[25],同时阳性克隆亦存在较高的重
复率。
38
生物技术通报 Biotechnology Bulletin 2011 年第 8 期
2 454 技术高效分离微卫星位点
454测序技术应用的是大规模平行焦磷酸测序法,
依赖生物发光技术进行 DNA序列分析,在 DNA聚合
酶、ATP硫酸化酶、荧光素酶和双磷酸酶的协同作用
下,将引物上的 dNTP聚合与一次荧光信号释放偶联起
来,通过检测荧光信号的强度,达到实时测定 DNA序
列的目的。全新的 GS FLX Titanium系列试剂使单个
序列平均读长达到 400 bp,系统每轮运行只需 10 h左
右便可完成 4 -6亿个碱基对的测序,所需的每个碱基
的测序成本是 Sanger测序方法的几十分之一左右。此
技术不需要荧光标记的引物和核酸探针,也不需要扩
增产物进行电泳分离。GS FLX系统的流程概括起来,
即“一个片段 = 一个磁珠 = 一条读长”。
454 测序可应用于目标 DNA 区域,即可开发微
卫星标记。对于一般实验室而言,应用 454 测序开
发微卫星标记的步骤:(1)提取基因组 DNA; (2)送
至相应的生物技术公司测序(454 测序) ; (3)获得
测序结果、详细的试验报告; (4)数据分析、引物设
计;(5)引物扩增及其多态性检测。
基因组 DNA 送出测序后一般情况下只需要
2 - 3 d的时间就能得到测序结果,然后可使用 Msat-
commander[26]、MsatFinder[27]或 QDD[28]等生物信息
软件进行后续的数据分析,这些软件不仅可以筛选
出各种类型的微卫星,还可根据微卫星侧翼序列的
长度选择适合引物设计的微卫星序列并同时进行引
物设计。
显而易见,454 测序开发微卫星标记无需建库、
克隆及筛选,不仅可以避免克隆偏差以及无效克隆
造成微卫星丢失而导致微卫星位点分离较少的问
题,而且还提高了微卫星标记开发的效率,使操作过
程近乎一步化,大大节省了时间。整个过程除提取
基因组 DNA外,无需任何的分子技术操作。
3 454 技术开发微卫星标记的应用
国际上,454 测序技术在微卫星领域的相关研
究中的应用越来越广泛。作者查找到约 35 篇应用
454 测序开发微卫星标记的相关文献,2008 年及之
前鲜见报道,2009 年发表的文献数量约占总相关文
献的 22. 9%,2010 年约占 51. 4%,成明显的显著上
升趋势,而 2011 年仅前 3 个月发表的相关文献数目
就有 9 篇,占 25. 7%。从 2009 年至今,已有多个物
种应用 454 测序技术开发了微卫星标记(表 1)。
3. 1 454 技术在动物中开发微卫星标记的应用
微卫星以其高突变性,常用来评估种群遗传分
化、遗传多样性和种群结构等,对物种保护尤其是濒
危物种的保护具有重要意义。Abdelkrim等[45]应用
454 技术对新西兰濒危鸟类 H. malacorhynchos 的遗
传多样性进行评估,仅使用 1 /16th plate,就分离出
13 个多态性微卫星位点,并且整个试验过程仅花了
2 周时间,总花费不超过 1 500 美元,将开发微卫星
标记的费用降低了 3 - 5 倍。Dubut 等[42,64]通过结
合生物素探针―富集法和 454 GS-FLX Titanium 测
序来开发欧洲濒危鱼类 Z. asper 的微卫星位点,研
究人员先构建了 Z. asper 的微卫星富集文库,再用
1 /16th plate 对富集的 DNA 序列进行测序,最后使
用软件 ODD筛选微卫星,开发 55 个新的完全型多
态性微卫星标记。
在某些特殊情况下,并非总能提取到较好的开
发微卫星标记的 DNA 样本,如法证学、古生物遗传
学等领域,其 DNA样本极可能出现质量差或量小等
情况。以古生物遗传学领域为例,由于化石中 DNA
的交联和降解十分严重,使用传统方法几乎不可能
分离得到足够的微卫星位点,而 454 测序技术只需
要微量的 DNA就能够完成测序,使得开发微卫星标
记成为可能。如 Allentoft等[44]2009年用 454测序技
术从新西兰一种已灭绝的重足象鸟(P. elephantopus)
的骨化石中开发得到微卫星标记,他们仅使用了 1 /
4th plate就得到大量的微卫星序列,并筛选出 7 个适
合微卫星引物设计的位点,而作者对其中一个多态性
位点 Moa_MS2 进行了评估,并将其在 3 种已灭绝的
鸟类(D. robustus、E. gravis 和 P. elephantopus)共 52 个
个体中进行交叉扩增,均成功获得扩增产物。Allent-
oft等认为 454测序技术是研究已灭绝生物种群遗传
学的一种快捷、高效、经济的方法。
部分模式生物如 A. mellifera[33,34]、D. rerio[33]、
G. incognitus[39]等也曾运用 454 技术开发的微卫星
标记。如 Perry等[39]对研究性别斗争和协同进化的
模式生物 G. incognitus进行研究,以期通过 454 测序
获得更多的遗传信息,用以进行物种的种群遗传
结构、系统发育、交配冲突等研究,测序后得到的
182 912 条已知序列片段中,有 30 820(16. 8%)条含
48
2011 年第 8 期 程晓凤等:454 测序技术开发微卫星标记的进展
表 1 应用 454 技术开发微卫星标记的物种
物种 测序类型 参考文献
动物
线虫纲
软体动物
昆虫纲
鱼纲
爬行纲
鸟纲
哺乳纲
丽透体垫刃线虫(Deladenus siricidicola) 富集文库测序 [29]
南极帽贝(Laternula elliptica) 转录组测序 [30]
温带臭虫(Cimex lectulariu) 转录组测序 [31]
花曲柳窄吉丁(Agrilus planipennis) 转录组测序 [32]
意大利蜜蜂(Apis mellifera) 基因组测序 [33]
意大利蜜蜂(Apis mellifera) 基因组测序 [34]
红尾肉蝇(Sarcophaga crassipalpis) 转录组测序 [35]
大豆蚜(Aphis glycines) 转录组测序 [36]
斑蝶(Euphydryas editha) 转录组测序 [37]
苹果实蝇(Rhagoletis pomonella) 转录组测序 [38]
云杉树蜂(Sirex noctilio) 富集文库测序 [29]
水黾(Gerris incognitus) 基因组测序 [39]
云杉八齿小蠹(Ips typographus L.) 基因组测序 [40]
奥卡氏镖鲈(Etheostoma okaloosae) 基因组测序 [41]
金吉鲈(Zingel asper) 富集文库测序 [42]
斑马鱼(Danio rerio) 基因组测序 [33]
铜头蝮(Agkistrodon Contortri) 基因组测序 [43]
重足象鸟(Pachyornis elephantopus) 基因组测序 [44]
山蓝鸭(Hymenolaimus malacorhynchos) 基因组测序 [45]
针鼹(Tachyglossus aculeatus) 基因组测序 [46]
南极海狗(Arctocephalus gazella) 转录组测序 [47]
植物
被子植物
裸子植物
蕨类植物
小果野蕉(Musa acuminata) 基因组测序 [48]
小香蒲(Typha minima) 基因组测序 [49]
水曲柳(Fraxinus mandshurica) 转录组测序 [50]
甘薯(Ipomoea batatas (L.)Lam.) 转录组测序 [51]
甜瓜(Cucumis melo) 基因组测序 [52]
木豆(Cajanus cajan(L.)Millsp.) 转录组测序 [53]
朝鲜蓟(Cynara cardunculus var. scolymus L.) 转录组测序 [54]
灰蓝盆花(Scabiosa columbaria L.) 转录组测序 [55]
非洲楝(Khaya senegalensis (Desr.)A. Juss.) 基因组测序 [56]
绿豆(Vigna radiata (L.)Wilczek ) 基因组测序 [57]
绿豆(Vigna radiata (L.)Wilczek ) 转录组测序 [58]
箭叶淫羊藿(Epimedium sagittatum) 转录组测序 [59]
黄瓜(Cucumis sativus L.) 转录组测序 [60]
镰叶相思树(Acacia harpophylla) 富集文库测序 [61]
扭叶松(P. contorta) 转录组测序 [62]
龙骨马尾杉(Phlegmariurus carinatus)
蛇足石杉(Huperzia serrata)
转录组测序 [63]
真菌
松树脂溃疡病菌(Fusarium circinatum) 富集文库测序 [29]
奥氏蜜环菌(Armillaria ostoyae) 基因组测序 [34]
58
生物技术通报 Biotechnology Bulletin 2011 年第 8 期
有微卫星序列,研究人员选取了 23 个位点进行引物
设计,扩增出 16 个位点,其中 10 个表现出多态性。
Malausa 等[34,64]使用探针―富集法构建 A. mellifera
微卫星富集文库,使用 1 /16th plate 测序后获得了
39 473 条序列,其中 22%的序列包含微卫星序列,
开发出 543 个理想的微卫星标记;同时 Malausa 等
对 A. mellifera 基因组直接测序也获得了 37 870 条
片段,但包含微卫星位点的片段比例仅为 3%,开发
到的理想的微卫星标记仅有 186 个。
3. 2 454 技术在植物中开发微卫星标记的应用
目前,所见的 454 技术在植物中开发微卫星标
记的报道,大多是一些粮食作物、经济作物和药用植
物等。
Guo 等[60]用 454 技术对 C. sativus L. 的雌、雄
花分别使用 1 /2th plate 进行转录组测序,获得
353 941条高质量的 EST 序列,再与 5 600 条从
GenBank中获得的 EST 和 mRNA 序列进行拼接,
从 2 860 条 unigenes中筛选出了 3 130 条微卫星序
列,其中有 1 679 条(59%)包含 SSR 的 unigenes
适合引物设计。 Schafleitner 等[51]对 I. batatas
(L.)Lam. 茎、叶的 cDNA 进行测序,分别使用
1 /4th plate,产生出 524 209 条序列片段,其中包含
1 661 个微卫星序列,选取 223 个位点并设计引物
在六倍体 I. batatas 和二倍体 I. trifida 两种物种中
进行 PCR扩增,最终检测到 195 个位点扩增成功,
此研究使 I. batatas (L.)Lam. 可利用的基因信息
丰富了 3 倍,有利于今后对 I. batatas (L.)Lam.
功能基因组以及分子标记等进行研究。
Zeng等[59]使用 1 /2th plate对中国药用植物 E.
sagittatum的 cDNA进行测序,建立了箭叶淫羊藿的
EST数据库,从此数据库中共筛选得到 2 810 个
EST-SSRs位点,作者随机选择了 2 /3 的微卫星位点
并设计引物用于在 52 个淫羊藿物种中进行交叉扩
增,18 对引物扩增成功,16 对引物表现出显著遗传
多样性和等位基因频率。Sexton 等[56]对经济药用
作物 K. senegalensis (Desr.)A. Juss.的遗传变异和
种群再分进行评估,运用 454 平台测序开发微卫星
标记,对筛选出来的 67 个三核苷酸和四核苷酸重复
设计了引物,其中有 11 对引物在种群间表现出多态
性,并将其用于物种间进行杂交扩增,筛选出来的微
卫星位点对于作者研究物种进化和保护遗传学等方
面起着十分重要的作用。
此外,在濒危植物的保护方面也可见报道。如
T. minima为瑞士濒危物种,为了鉴定源种群是否适
合用以引入,Csencsics 等[49]使用 454 测序技术开
发出 T. minima 17 个多态性微卫星位点,对计划引
入物种的遗传多样性进行了评估,整个过程只用了
不到 6 周的时间,花费约 5 000 美元。结果显示,
454 测序技术开发微卫星标记是研究濒危物种种群
遗传、种群保护的一种高效经济的方法。
3. 3 454 技术在真菌中开发微卫星标记的应用
目前,454技术在真菌中开发微卫星标记所见报
道不多。Malausa 等[34]运用 454 技术开发 A. ostoyae
的微卫星标记,获得了 32 488 条序列,平均读长为
179 bp,其中 235个完全型微卫星位点和 69个复合型
微卫星位点适合引物设计。Santana 等[29]使用 FIAS-
CO(fast isolation by AFLP of sequences containing re-
peats)和 ISSR-PCR (inter-simple sequence repeat
PCR)两 种 方 法 构 建 F. circinatum、S. noctili、
D. siricidicola等 3个种群的微卫星富集文库,然后用
454技术进行测序,用 MsatFinder 筛选微卫星及设计
引物,最终 S. noctilio(FIASCO 法建库)、S. noctilio
(ISSR 法建库)、D. siricidicola(FIASCO 法建库)、
F. circinatum(ISSR 法建库)分别获得 336、159、296、
231个扩增性微卫星位点,随后作者设计了 28对引物
对 F. circinatum(ISSR法建库)的微卫星位点进行扩
增,检测出 13个微卫星位点具有多态性。
4 展望 454 技术应用前景
随着 454 测序技术的不断发展和完善,在基因
组学等相关领域中的应用也越来越广泛。应用 454
测序开发微卫星标记,虽与传统方法相比具有明显
的优势,但目前许多研究机构、学校等仍然还沿用传
统的富集法在开发微卫星标记,这是因为 454 技术
也不可避免的存在一些问题。
首先,454 测序通量虽高,但读长仍较短,最大
读长可达 400 bp,但平均读长常远小于 400 bp。如
Malausa等[34]对 14 个物种进行 454 测序,平均读长
为 150 - 275 bp;Guo 等[60]对 C. sativus L. 雌、雄花
进行转录组测序,EST平均读长为 175 bp;Sithichoke
等[57]用 454 技术对 V. radiata (L.)Wilczek 100. 5
68
2011 年第 8 期 程晓凤等:454 测序技术开发微卫星标记的进展
Mb基因进行测序,序列平均读长为 216 bp。正是由
于读长较短,微卫星可能靠近片段的末端,因此没有
足够的侧翼序列以供引物设计,这种片段在进行数
据分析时可能被软件自动丢弃,而剩下适合引物设
计的微卫星序列往往较少。如 Abdelkrim 等[45]从
H. malacorhynchos的测序片段中筛选出了 231 个含
有微卫星的片段,但仅 24 条(10. 4%)片段适合引
物设计。Castoe等[43]对 A. Contortrix 27 Mb 的基因
进行 454 测序,获得了 14 612 个微卫星位点,4 564
个(31. 2%)适合引物设计。当然也鲜有报道
454 技术测序平均读长达 400 bp,如李滢等[65]
对丹参(Salvia miltiorrhiza)进行转录组测序,EST
平均长度 414 bp。序列读长和样本 DNA 的质量
也是有关系的,为了避免 DNA 在送样过程中发
生降解,可以由测序公司提取 DNA,研究者只需
提供组织样本。
其次,使用 454 技术测序目前成本比较高。454
技术虽降低了每个碱基测序的平均费用,但由于是
大规模测序,即使使用最小的 1 /16th plate,也可产
生几千万 bp的序列,因此测序费用是存在的一大问
题。Santana等对 3 个物种进行 454 测序,均得到了
上百个扩增性微卫星位点,而用 Sanger 测序在 100
个克隆中却只发现了 8 个扩增性微卫星位点。然
而,Santana等[29]发现与 Sanger 测序相比,454 测序
技术分离每个微卫星位点的费用减少了 276%。此
外,454 测序技术代替 Sanger 测序,避免了克隆、筛
选,较一般的微卫星标记开发的方法还可以产生多
出 10 倍的微卫星位点。可以看出,传统方法通过建
库、克隆、筛选、Sanger 测序开发微卫星标记的数量
较少,而 454 测序技术通过大规模测序,一次性可以
开发出大量的微卫星标记,所以分离每个微卫星位
点的平均费用比 Sanger测序要少很多。因此 454 测
序则更适合于快捷、高效、大规模地开发微卫星标
记,但当在进行种群遗传等研究时,需要的微卫星位
点数量较少,传统方法虽步骤繁琐、耗时长,但却更
经济。
不可否认,454 测序技术的出现是基因组测序
上一个重要的进步,而在应用于目标 DNA区域如微
卫星标记开发的领域时,454 测序技术的优点也是
显而易见的。
在法证学、古生物遗传学等领域,DNA 样本极
可能出现质量差或量小等情况,所以常常不能提取
到很好的 DNA样本用以开发微卫星标记;同样地,
研究濒危物种时,常常也会存在样本量少的问题;此
外,某些物种的基因组中只含有少量的微卫星,即微
卫星频率一般低于其他物种,如大部分鳞翅类昆
虫[66]、某些螨类[67]以及鸟类等[24],因此从这些生
物中获得的微卫星数量常常不能满足群体分析的需
要。然而,454 技术可对物种进行大规模基因组测
序,通过相应的生物信息软件从大量的基因组序列
中筛选微卫星,从而提高了获得微卫星的可能性。
如 Mikheyev等[37]对鳞翅类昆虫 E. editha 进行转录
组从头测序,快速分离出了 10 个完全型的多态性微
卫星位点,以及从 Saarinen 等[4 1]、Allentoft 等[44]、
Abdelkrim等[45]的研究结果中可以看出,在样本数量
少或质量差,以及基因组中微卫星含量较少时,454
技术无疑是开发其微卫星标记的一种高效、快速、经
济的方法。
自 454技术问世以来,越来越多的学者将其应用
于物种转录组测序,构建 EST数据库。由于微卫星在
基因编码区也有存在,因而可从 EST数据库中筛选微
卫星标记,目前已有部分物种通过构建 cDNA文库开
发 EST-SSR 标记,如 E. editha[37]、C. sativus L.[60]、
P. contorta[62]等。在已有研究中,有近 50%的物种是
通过 454转录组测序开发微卫星标记的,可以看出,
454技术使物种 EST数据库的构建更加容易,而 EST
数据库的丰富,使微卫星标记的开发水到渠成。
454 测序技术在应用于微卫星相关的研究中,
可见少数学者如 Santana[29]、Malausa[34]、Dubut[42]、
Lepais等[61],将以往开发微卫星标记的方法与 454
技术进行结合。研究者先通过富集步骤尽量去除不
含微卫星位点的 DNA 片段,构建微卫星富集文库,
然后再进行测序。
这样测序时如使用同样大小的 plate(如 whole
plate、1 /2、1 /4、1 /16)即可获得更多的微卫星位点,
如果所需微卫星数目不多,即可减小测序使用的
plate,达到节约费用的目的。建立微卫星富集文库
步骤并不复杂,例如使用磁珠富集法,一般情况下只
需 1 周即可成功建库[68],这样仍省去了克隆、筛选
等主要的繁琐步骤,达到更加高效、经济地开发微卫
78
生物技术通报 Biotechnology Bulletin 2011 年第 8 期
星标记的目的。如 Malausa 等[34]通过比较后认为,
先建库后再测序增加了微卫星数量,减小了不理想
的重复序列获得的可能性,如(AT)n( (AT)n 难以
成功扩增) ,同时还能提高 300%的分离效率,而费用
的增加仅 10%。同样,Lepais 等[61]也比较了直接基
因组测序和富集文库测序开发微卫星标记的效率,结
果发现直接进行基因组测序获得的序列片段仅0. 5%
可开发微卫星标记,而富集文库测序,则有 2. 2%的序
列可开发微卫星标记。可见,将构建文库和 454 测序
相结合是一种更加经济、高效可取的方法。
目前,国内使用 454 技术开发微卫星标记已见
少量报道。如 Zeng 等[59]对 E. sagittatum cDNA 进
行测序,从 EST 数据库中筛选 EST-SSRs 位点;Guo
等[60]对 C. sativus L.雌、雄花进行转录组测序,筛选
微卫星序列。但由于 454 技术是从国外引入,加上
费用、读长等问题,在国内要大规模开展应用可能还
需要一段时间。相信随着 454 平台的不断升级,读
长、费用等问题都会逐步得到解决。454 测序技术
以其高效、便捷的优势在微卫星标记开发等领域具
有广阔的应用前景。
参 考 文 献
[1]Hulak M,Kaspar V,Kohlmann K,et al. Microsatellite-based ge-
netic diversity and differentiation of foreign common carp (Cyprinus
carpio)strains farmed in the Czech Republic. Aquaculture,2010,
298(3-4) :194-201.
[2] Serbezov D,Bernatchez L,Olsem EM,et al. Mating patterns and
determinants of individual reproductive success in brown trout (Sal-
mo trutta)revealed by parentage analysis of an entire stream living
population. Molecular Ecology,2010,19(15) :3193-3205.
[3] Jun X,Feng L,Ze Z,et al. A consensus linkage map of the grass
carp (Ctenopharyngodon idella)based on microsatellites and SNPs.
BMC Genetics,2010,11:135.
[4] Shen X,Yang G,Liu Y,et al. Construction of genetic linkage
maps of guppy (Poecilia reticulata)based on AFLP and microsatel-
lite DNA markers. Aquaculture,2007,271(1-4) :178-187.
[5]李明芳,郑学勤.开发 SSR引物方法之研究动态.遗传,2004,26
(5) :769-776.
[6]Bontell IL,Hall N,Ashelford KE,et al. Whole genome sequencing
of a natural recombinant Toxoplasma gondii strain reveals chromo-
some sorting and local allelic variants. Genome Biology,2009,
10:53.
[7] Kuenstner A,Wolf JBW,Backstrom AN,et al. Comparative ge-
nomics based on massive parallel transcriptome sequencing reveals
patterns of substitution and selection across 10 bird species. Molecu-
lar Ecology,2010,19 (Suppl. 1) :266-276.
[8]Gowda M,Li H,Alessi J,et al. Robust analysis of 5-transcript
ends (5-RATE) :a novel technique for transcriptome analysis and
genome annotation. Nucleic Acids Res,2006,34:e126.
[9]Thomas RK,Nickerson E,Simons JF,et al. Sensitive mutation de-
tection in heterogeneous cancer specimens by massively parallel pi-
coliter reactor sequencing. Nat Med,2006,12:852-855.
[10]Cho YG,Ishii T,Temnykh S,et al. Diversity of microsatellite de-
rived from genomic libraries and GenBank sequences in rice(Oryza
sativa L.). Theoretical and Applied Genetics,2000,100(5) :713-
722.
[11]Brown SM,Hopkins MS,Mitchell SE,et al. Multiple methods for
the identificati on of polymorphic simple sequence repeats (SSRs)
in sorghum[Sorghum bicolor (L.)Moench]. Theoretical and Ap-
plied Genetics,1996,93(1-2) :190-198.
[12]Norris AT,Bradley DG,Cunningham EP,et al. Microsatellite ge-
netic variation between and within farmed and wild Atlantic salmon
(Salmo salar)populations. Aquaculture,1999,180(3-4) :247-264.
[13]Hulák M,Kapar V,Kozák P,et al. Cross-species amplification
of microsatellite markers in the invasive spiny-cheek crayfish (Or-
conectes limosus) :assessment and application. Journal of Applied
Genetics,2010,51(1) :73-78.
[14]孙波,鲍毅新. 微卫星位点获取方法的研究进展. 生态学杂,
2009,28(10) :2130-2137.
[15]Rassmann K,Schlotterer C,Tautz D. Isolation of simple-sequence
loci for use in polymerase chain reaction-based DNA fingerprinting.
Electrophoresis,1991,12(2-3) :113-118.
[16]Lunt DH,Hutchinson WF,Carvalho GR. An efficient method for
PCR-based isolation of microsatellite arrays(PIMA). Molecular E-
cology,1999,8:891-894.
[17]Fisher PJ,Gardner RC,Richardson TE. Single locus microsatel-
lites isolated using 5’anchored PCR. Nucleic Acids Research,
1996,24(21) :4369-4371.
[18]Lian C,Zhou Z,Hogetsu T. A simple method for developing mi-
crasatellite markers using amplified fragments of inter-simple se-
quence repeat. Journal of Plant Research,2001,114(3) :381-385.
[19]Ostrander EA,Jong PM,Rine J,et al. Construction of small-in-
sert genomic DNA libraries highly enriched formicrosatellite repeat
sequences. Proc Natl Acad Sci USA,1992,89(8) :3419-3423.
[20]Paetkau D. Microsatellites obtained using strand extension:An en-
richment protocol. Biotechniques,1999,26(4) :690-697.
[21]Karagyozov L,Kalcheva ID,Chapman VM. Construction of random
small-insert genomic libraries highly enriched for simple sequence
repeats. Nucleic Acids Research,1993,21(16) :3911-3912.
[22]Kandpal RP,Kandpal G,Weissman SM. Construction of libraries
88
2011 年第 8 期 程晓凤等:454 测序技术开发微卫星标记的进展
enriched for sequence repeats and jumping clones,and hybridiza-
tion selection for region specific markers. Proc Natl Acad Sci USA,
1994,91(1) :88-92.
[23]Chen K,Knorr C,Bornemann-Kolatzki K,et al. Targeted oligonu-
cleotide-mediated microsatellite identification (TOMMI) from
large-insert library clones. BMC Genetics,2005,6:54.
[24]Zane L,Bargelloni L,Patarnello T. Strategies for microsatellite i-
solation:A review. Molecular Ecology,2002,11(1) :1-16.
[25]曲妮妮,龚世园,黄桂菊,等. 基于 FIASCO 技术的合浦珠母贝
微卫星标记分离与筛选研究. 热带海洋学报,2010,29(3) :
47-54.
[26] Faircloth BC. Msatcommander:detection of microsatellite repeat
arrays and automated,locus-specific primer design. Molecular E-
cology Resources,2008,8(1) :92-94.
[27]Thurston MI,Field D. Msatfinder:detection and characterisation
of microsatellites. Oxford:Centre for Ecology and Hydrology,
2005. Available at:http:/ /www. genomics. ceh. ac. uk /msatfind-
er.
[28]Meglécz E,Costedoat C,Dubut V,et al. QDD:a user-friendly
program to select microsatellite markers and design primers from
large sequencing projects. Bioinformatics,2010,26 (3 ) :
403-404 .
[29] Santana QC,Coetzee MPA,Steenkamp ET,et al. Microsatellite
disc overy by deep sequencing of enriched genomic libraries. Bio-
Techniques,2009,46(3) :217-223.
[30]Melody C,Michael T,Florbela V,et al. Insights into shell deposi-
tion in the Antarctic bivalve Laternula elliptica:gene discovery in
the mantle transcriptome using 454 pyrosequencing. BMC Genom-
ics,2010,11:362.
[31] Bai X,Mamidala P,Rajarapu SP,et al. Transcriptomics of the
bed bug (Cimex lectularius). PLoS One,2011,6(1) :e16336.
[32]Mittapalli O,Bai X,Mamidala P,et al. Tissue-specific transcrip-
tomics of the exotic invasive insect pest emerald ash borer (Agrilus
planipennis). PLoS One,2010,5(10) :e13708.
[33]Martin JF,Pech N,Meglécz E,et al. Representativeness of micro-
satellite distributions in genomes,as revealed by 454 GS-FLX tita-
nium pyrosequencing. BMC Genomics,2010,11:560.
[34]Malausa T,Gilles A,Meglecz E,et al. High-throughput microsa-
tellite isolation through 454 GS-FLX Titanium pyrosequencing of
enriched DNA libraries. Molecular Ecology Resources,2011,11
(4) :638-644.
[35]Hahn DA,Ragland GJ,Shoemaker DDW,et al. Gene discovery
using massively parallel pyrosequencing to develop ESTs for the
flesh fly Sarcophaga crassipalpis. BMC Genomics,2009,10:234.
[36]Bai X,Zhang W,Orantes L,et al. Combining next-generation se-
quencing strategies for rapid molecular resource development from
an invasive aphid species,Aphis glycines. PLoS ONE,2010,5(6) :
e11370.
[37]Mikheyev AS,Vo T,Wee B,et al. Rapid microsatellite isolation
from a butterfly by de novo transcriptome sequencing:performance
and a comparison with AFLP-derived distances. PLoS One,2010,5
(6) :e11212.
[38] Schwarz D,Robertson HM,Feder JL,et al. Sympatric ecological
speciation meets pyrosequencing:sampling the transcriptome of the
apple maggot Rhagoletis pomonella. BMC Genomics,2009,10:633.
[39] Perry JC,Rowe L. Rapid microsatellite development for water
striders by next-generation sequencing. Journal of Heredity,2011,
102(1) :125-9.
[40]Stoeckle BC,Kuehn R. Identification of 18 polymorphic microsat-
ellite loci in the spruce bark beetle Ips typographus (Coleoptera:
Scolytidae)using high-throughput sequence data. European Jour-
nal of Entomology,2011,108(1) :169-171.
[41]Saarinen EV,Austin JD. When technology meets conservation:in-
creased microsatellite marker production using 454 genome sequen-
cing on the endangered Okaloosa Darter (Etheostoma okaloosae).
Journal of Heredity,2010,101(6) :784-788.
[42]Dubut V,Grenier R,Meglécz E,et al. Development of 55 novel
polymorphic microsatellite loci for the critically endangered Zingel
asper L. (Actinopterygii:Perciformes:Percidae)and cross-species
amplification in five other percids. European Journal of Wildlife
Research,2010,56(6) :931-938.
[43]Castoe TA,Poole AW,Gu WJ,et al. Rapid identification of thou-
sands of copperhead snake (Agkistrodon contortrix)microsatellite
loci from modest amounts of 454 shotgun genome sequence. Molec-
ular Ecology Resources,2010,10(2) :341-347.
[44]Allentoft ME,Schuster SC,Holdaway RN,et al. Identification
of microsatellites from anextinct moa species using high-through-
put (454) sequence data. Bio Techniques,2009,46 (3) :
195-200 .
[45]Abdelkrim J,Robertson BC,Stanton JAL,et al. Fast,cost-effec-
tive development of species-specific microsatellite markers by ge-
nomic sequencing. BioTechniques,2009,46(3) :185-192.
[46]Vanpe C,Buschiazzo E,Abdelkrim J,et al. Development of mic-
rosatellite markers for the short-beaked echidna using three different
approaches. Australian Journal of Zoology,2010,57 (3-4) :
219-224.
[47]Hoffman JI. Gene discovery in the Antarctic fur seal(Arctocephalus
gazella)skin transcriptome. Molecular Ecology Resources,2011,
11(4) :703-710.
[48]Hrˇibová E,Neumann P,Matsumoto T,et al. Repetitive part of the
banana (Musa acuminata)genome investigated by low-depth 454
sequencing. BMC Plant Biol,2010,10:204.
[49]Csencsics D,Brodbeck S,Holderegger R. Cost-effective,species-
specific microsatellite development for the endangered dwarf bul-
98
生物技术通报 Biotechnology Bulletin 2011 年第 8 期
rush (Typha minima)using next-generation sequencing technolo-
gy. Journal of Heredity,2010,101(6) :789-793.
[50]Bai X,Rivera-Vega L,Mamidala P,et al. Transcriptomic signatures
of ash (Fraxinus spp.)phloem. PLoS One,2011,6(1):e16368.
[51]Schafleitner R,Tincopa LR,Palomino O,et al. A sweetpotato gene
index established by de novo assembly of pyrosequencing and San-
ger sequences and mining for gene-based microsatellite markers.
BMC Genomics,2010,11(1) :604.
[52]Víctor G,Andrej B,Elizabeth H,et al. Sequencing of 6. 7 Mb of
the melon genome using a BAC pooling strategy. BMC Plant Biolo-
gy,2010,10(1) :246.
[53]Varshney RK,Penmetsa RV,Dutta S,et al. Pigeonpea genomics
initiative (PGI) :an international effort to improve crop productivi-
ty of pigeonpea (Cajanus cajan L.). Mol Breed,2010,26(3) :
393-408.
[54]Davide S,Alberto A,Ezio P,et al. Ontology and diversity of tran-
script-associated microsatellites mined from a globe artichoke EST
database. BMC Genomics,2009,10(1) :454.
[55]Angeloni F,Wagemaker CAM,Jetten MSM,et al. De novo tran-
scriptome characterization and development of genomic tools for
Scabiosa columbaria L. using next-generation sequencing tech-
niques. Molecular Ecology Resources,2011,11(4) :662-674.
[56]Sexton GJ,Frere CH,Dieters MJ,et al. Development and charac-
terization of microsatellite loci for Khaya senegalensis (Meliaceae).
American Journal of Botany,2010,97(11) :111-113.
[57]Tangphatsornruang S,Somta P,Uthaipaisanwong P,et al. Charac-
terization of microsatellites and gene contents from genome shotgun
sequences of mungbean [Vigna radiata (L.)Wilczek]. BMC
Plant Biology,2009,9:137.
[58]Moe KT,Chung JW,Cho Y,et al. Sequence information on sim-
ple sequence repeats and single nucleotide polymorphisms through
transcriptome analysis of mungbean. Journal of Integrative Plant Bi-
ology,2011,53(1) :63-73.
[59]Zeng S,Xiao G,Guo J,et al. Development of a EST dataset and
characterization of EST-SSRs in a traditional Chinese medicinal
plant,Epimedium sagittatum (Sieb. Et Zucc.)Maxim. BMC Ge-
nomics,2010,11(1) :94.
[60]Guo S,Zheng Y,Joung J,et al. Transcriptome sequencing and
comparative analysis of cucumber flowers with different sex types.
BMC Genomics,2010,11(1) :384.
[61] Lepais O,Bacles CE. Comparison of random and SSR-enriched
shotgun pyrosequencing for microsatellite discovery and single mul-
tiplex PCR optimization in Acacia harpophylla F. Muell. Ex Benth.
Molecular Ecology Resources,2011,11(4) :711-724.
[62]Parchman TL,Geist KS,Grahnen JA,et al. Transcriptome se-
quencing in an ecologically important tree species:assembly,an-
notation,and marker discovery. BMC Genomics,2010,11:180.
[63]Luo H,Li Y,Sun C,et al. Comparison of 454-ESTs from Huper-
zia serrata and Phlegmariurus carinatus reveals putative genes in-
volved in lycopodium alkaloid biosynthesis and developmental regu-
lation. BMC Plant Biol,2010,10(1) :209.
[64]Kijas JM,Fowler JC,Garbett CA,et al. Enrichment of microsatel-
lites from the citrus genome using biotinylated oligonucleotide se-
quences bound to streptavidin-coated magnetic particles. Biotech-
niques,1994,16(4) :656-662.
[65]李滢,孙超,罗红梅,等.基于高通量测序 454 GS FLX的丹参转
录组学研究.药学学报,2010,45(4) :524-529.
[66]吉亚杰,张德兴.鳞翅目昆虫基因组中微卫星 DNA的特征以及
对其分离的影响.动物学报,2004,50(4) :608-614.
[67]Navajas MJ,Thistlewood HMA,Lagnel J,et al. Microsatellite se-
quences are under-represe-nted in two mite genomes. Insect Mol
Biol,1998,7(3) :249-56.
[68]孙效文,鲁翠云,梁利群. 磁珠富集法分离草鱼微卫星分子标
记.水产学报,2005,29(4) :482-486.
(责任编辑 李楠)
09