新一代测序技术的发展及应用前景-文献传递-植物通论文库

摘要：Sanger测序的提出给人类破译遗传密码提供了强有力的工具。而近几年飞速发展起来的高通量测序技术无论在成本还是效率上,都对传统测序提出了巨大的挑战。千元人类基因组计划的公布更是加快了测序研发的进程。通过下一代测序技术,科学家不仅能够绘制出各个物种的基因组图谱,还能探讨不同条件下的基因表达差异以及不同物种之间或者物种之内的序列差异,进而为传统生物学以及医学研究开辟新的视角。与此同时,随着各大测序平台的不断改进,普通实验室都有能力承担此类大型测序项目。就目前正在发展的几种高通量测序技术进行了综合阐述,并比较了各种测序技术的优缺点,最后对其应用领域作了简单介绍。

全文：技术与方法
生物技术通报
BIOTECHNOLOGY BULLETIN 2010年第 10期
新一代测序技术的发展及应用前景
杨晓玲施苏华唐恬
(中山大学生命科学院,广州 510275)
摘要: Sanger测序的提出给人类破译遗传密码提供了强有力的工具。而近几年飞速发展起来的高通量测序技术无论
在成本还是效率上, 都对传统测序提出了巨大的挑战。千元人类基因组计划的公布更是加快了测序研发的进程。通过下一
代测序技术, 科学家不仅能够绘制出各个物种的基因组图谱, 还能探讨不同条件下的基因表达差异以及不同物种之间或者物
种之内的序列差异, 进而为传统生物学以及医学研究开辟新的视角。与此同时,随着各大测序平台的不断改进, 普通实验室
都有能力承担此类大型测序项目。就目前正在发展的几种高通量测序技术进行了综合阐述, 并比较了各种测序技术的优缺
点, 最后对其应用领域作了简单介绍。
关键词: 第二代测序第三代测序基因组转录组重测序
Research Progress and Application of Nextgeneration Sequencing
Yang X iaoling Sh iSuhua Tang T ian
( Schoo l of L ife Sciences, Sun Yatsen University, Guangzhou 510275)
Abstrac:t The deve lopm en t of Sange r sequencing has brough t a pow erful too l for hum an be ing to dec ipher the gene tic code. H ow
ever, the arriv al of h ighthroughput sequencing over the past seve ra l years high ly challenges the traditiona lm ethod, no t on ly in cost but
also in effic iency. A race toward the$ 1 000 genom e dram a tica lly acce lerates the speed o f techno log ical innovation. The re fo re, next gen
e ration sequencing w ill a llow us to draw a com plete genom em ap, com pare gene expression under d ifferent conditions, and dem onstrate
sequence variation betw een or w ithin spec ies, a ll o fw hich would open out a new avenue fo r b io log ica l orm edical research. A t the sam e
tim e, w ith the h igh lydeveloped sequenc ing platform s, near ly every resea rch team w ou ld have the oppo rtunity to carry out such research.
In th is paper, we prov ide a snapshot of these new approaches, d iscuss the advantages and lim itations o f them, and also illustra te the ir ap
p lications in var ious fie lds.
Key words: Second genera tion sequencing Th ird generation sequenc ing Genom e T ranscrip tom e Resequenc ing
收稿日期: 20100412
基金项目:国家自然科学基金项目 ( 30730008, 30970208, 40976081) , 973!计划项目 ( 2007CB815703) ,中山大学重点培育计划项目及有害生物
控制与资源利用国家重点实验室创新课题,教育部留学归国人员科研启动基金,中山大学重点培育计划
作者简介:杨晓玲,女,硕士研究生,研究方向:分子进化; Em ai:l sysu lsyx@l gm ai.l com
通讯作者:唐恬,副教授, Em ai:l tt ian _8@ hotm a i.l com
双螺旋结构的发现,遗传密码的破解,第一个完
整基因组图谱的绘制 [ 1]让科学家越来越多地认识
到测序在生物学研究中的重要作用。从 1977年
Sanger和 Coulson关于快速测序技术论文的首次发
表 [ 1, 2] ,到 2010年高通量测序的广泛应用, 海量遗
传信息被相继揭秘;从人类基因组计划,到人类基因
组单倍型图计划,再到人类癌症基因组及个体基因
组计划,人类对于自身的研究也日趋深入。千元基
因组计划的提出,后基因组时代的到来,势必推动测
序技术的突飞猛进, 人类对于自然界的认识也必将
走向一个新的阶段。
1 测序与发展
Sanger测序作为 30多年来惟一的 DNA测序方
法,对现代生物学研究起到了极大的促进作用。然
而随着大规模基因组学的兴起, 多种高通量低成本
的测序技术应运而生,并逐步被应用到生物学研究
的各个领域。目前,新一代测序技术正以 Sanger测
序无可比拟的
速度产生海量数据,不仅引领生命科学全面进
入后基因组时代,更推动了生物信息学、系统生物学
2010年第 10期杨晓玲等:新一代测序技术的发展及应用前景
等交叉学科的迅猛发展。
1. 1 第二代测序 ∀ ∀ ∀ 高通量低成本齐头并进
以高通量低成本为主要特征的第二代测序,不
再需要大肠杆菌进行体内扩增,而是直接通过聚合
酶或者连接酶进行体外合成测序 [ 3]。根据其原理
又可分为两类:聚合酶合成测序和连接酶合成测序。
1. 1. 1 聚合酶合成测序法 Roche公司推出的 454
技术开辟了高通量测序的先河。该技术通量可达
Sanger测序的几百倍, 而成本却只有几十分之一,因
此一经推出,便受到了国际上基因组学专家的广泛
关注。 454采用焦磷酸合成测序法 [ 4] , 避免了传统
测序进行荧光标记以及跑胶等繁琐步骤, 同时利用
乳胶系统对 DNA分子进行扩增, 实现了大规模并行
测序。截止到 2010年 4月, 已有 700多篇文献是采
用了 454测序技术 ( h ttp: / /454. com /pub lications
andresources/publications. asp), 对该技术是一个极
大的肯定。
Illum ina公司推出的 Solexa遗传分析仪是合成
技术的进一步发展与延伸。该技术借助高密度的
DNA单分子阵列,使得测序成本和效率均有了较大
改善。同时 So lexa公司提出的可逆终止子 [ 5]也是
该技术获得认可的原因之一。与 454相比, So lexa
拥有更高的通量, 更低的成本。虽然片段长度较短
仍是主要的技术瓶颈, 但是对于已有基因组的物种
来说, So lexa理所当然成为第二代测序技术的首选。
2008年以来,利用该技术开展的研究大幅度上升,
报道文献达 400多篇 ( http: / /www. illum ina. com /
systems/genom e_ana lyzer_ iix. ilmn)。
1. 1. 2 连接酶合成测序法 2007年 AB I公司在
Church小组 [ 6]研究成果的基础上推出了 SOL iD测
序仪。该技术的创新之处在于双碱基编码 [ 7]的应
用,即每个碱基被阅读两次,因此大大减少了测序带
来的错误率, 同时可以方便的区分 SNP和测序错
误。在测序过程中, 仪器自动加入 4种荧光标记的
寡核苷酸探针,探针与引物发生连接反应,通过激发
末端的荧光标记识别结合上的碱基类型。目前
SOL iD 3. 0测序通量可达 20 G, 而测序片段仅有
35- 50 bp, 这使得该技术与 Solexa相比, 应用范围
还不够广泛。AB I公司正加快研发进度,争取在片
段长度方面做出重大突破。
DanaherM o tion公司推出 Po lonator[ 8]测序仪同
样也是基于 Church小组的研究成果, 但是该设备的
成本要低很多,同时用户在使用时可以根据自己的
研究目的设置不同的测序条件。而 Comp lete G e
nom ics公司推出的 DNA纳米阵列与组合探针锚定
连接测序法 [ 9]则具有更高的容错能力,试剂的消耗
也进一步减少,目前已顺利完成 3个个体基因组的
测序工作。
1. 2 第三代测序 ∀ ∀ ∀ 单分子长片段有望实现
第二代测序技术虽然在各方面都有了较大的突
破, 但是仍然建立在 PCR扩增的基础上。为了避免
PCR扩增带来的偏差,科学家目前正在研制对 DNA
单个分子直接测序的第三代测序仪。最具代表性的
包括 He liscope单分子测序仪, 单分子实时合成测序
法, 纳米孔测序技术等。
H elicos技术仍然是基于合成测序原理 [ 10 ] , 它
采用了一种新的荧光类似物和灵敏的监测系统, 能
够直接记录到单个碱基的荧光, 从而克服了其他方
法须同时测数千个相同基因片段以增加信号亮度的
缺陷。Pac ific B iosc iences公司研发的单分子实时合
成测序法充分利用了 DNA聚合酶的特性,可以形象
的描述为通过显微镜实时观测 DNA聚合酶, 并记录
DNA合成的整个过程。纳米孔测序技术 [ 11, 12]则是
利用不同碱基在通过纳米小孔时引起的静电感应稍
有不同,或者不同碱基通过小孔的能力各有差异,来
加以区分不同的碱基信号。
2 应用与实践
Kahvejian在 2008年的一篇综述中提到 [ 13] :
如果你可以随心所欲地测序, 你会开展哪些研
究? !。人类基因组计划的完成和近年来高通量测序
的兴起,使越来越多的科研工作者认识到,我们对于
生物界的认识才刚刚起步。基因图谱的绘制并不意
味着所有遗传密码的破解, 癌症基因组的开展也没
有解决所有的医学难题。DNA变异的模式和进化
机制,基因调控网络的结构和相互作用方式,复杂性
状及疾病的分子遗传基础等, 仍是困扰生物学家和
医学家的难题,而高通量测序的广泛应用,也许可以
让我们知道的更多。
2. 1 DNA水平的应用
2. 1. 1 全基因组测序新一代测序技术极大地推
77
生物技术通报 B iotechnology Bulletin 2010年第 10期
动了非模式物种的全基因组测序工作, 越来越多的
物种基因组信息的相继公布 [ 14, 15] , 帮助科研工作者
摆脱了以往非模式生物中遗传背景缺乏的束缚。同
时,高通量测序技术凭借其对于微量 DNA灵敏的捕
捉能力,在古生物学研究中也得到了广泛应用。Ras
musse等 [ 16]从 4 000年前爱斯基摩人的一束头发中
提取 DNA, 利用 So lexa进行全基因组测序, 得到大
约 79%的序列,并与现代人类的基因组序列进行比
对,为探索人类的进化历程供了重要的信息。
2. 1. 2 基因组重测序对已知基因组物种进行重
测序是第二代测序技术目前应用最为广泛的领域。
通过测序,科学家可以看到单核苷酸多态性,突变热
点,基因组结构变异、群体多态性等重要信息。末端
配对法 [ 17]的应用则可以方便的鉴定因基因插入,缺
失或拷贝数变化引起的各种变异。Feuk等 [ 18]发
现,人类基因组中存在的结构变异远远超过了人们
的预计,而其中有很多变异都会造成重大的表型改
变。Trick等 [ 19 ]通过 So lexa测序, 鉴定了甘蓝型油
菜栽培种 2万 - 4万多个 SNP。在进化领域, 科学
家通过群体多态性分析探索物种之间的进化模式;
在微生物领域, DNA测序分型已被证明快捷而准
确 [ 20] ;而在医学领域, 基因组重测序在发现 SNP与
重大疾病的关系方面有着重要的意义。
2. 1. 3 宏基因组研究宏基因组测序是指直接从
环境中提取所有物种的 DNA进行全基因组测序,与
传统的微生物研究相比, 宏基因组研究跳出了实验
室培养的局限,真实地描述了大自然生态群落的复
杂性和多样性,对于人类更好地了解微生物群落有
着重要的意义。目前, 欧盟推出的人类肠道宏基因
组计划 (M etaH IT) [ 21] , 就是通过研究人类肠道中所
有的微生物种类,为肠道微生物与肥胖等人类疾病
的关系提供重要的理论依据。
2. 2 RNA水平的应用
2. 2. 1 转录组测序转录水平的调控是生物体最
主要的调控方式,而建立在高通量测序基础上的转
录组研究已逐步取代基因芯片技术成为目前从全基
因组水平研究基因表达的主流方法。对同一样品深
度测序可以捕获低表达的基因,而对大量样品同时
测序可以获得样品之间的表达差异。此外, 研究人
员还可以获得转录本表达丰度,转录发生位点,可变
剪切,转录本 SNP等重要信息。 C loonan等 [ 22]利用
SOL iD对小鼠胚胎干细胞分化前后的转录组进行了
比较,挖掘出不同时期特异表达的基因以及单核苷酸
多态性,阐述了分化路径中的关键因素; Tang等 [ 23]利
用 RNA Seq对小鼠单个卵母细胞进行表达谱分析,
与芯片技术相比,高通量测序可以多检测到 75%的
基因表达,并且有 8% - 19%的基因存在两种以上
的转录形式。
2. 2. 2 小分子 RNA测序小分子 RNA是一类特
殊的调控序列,在生物体内扮演着重要的角色,近几
年受到了科学界的广泛关注。传统的研究方法主要
包括正向遗传学筛选, 克隆测序法, 芯片技术等, 而
近几年兴起的高通量测序给小分子 RNA研究带来
了新的思路。较短的序列长度虽然是目前高通量测
序难以打破的瓶颈,却正好可以覆盖小分子 RNA的
长度。科研工作者通过测序, 可以预测新的 m iR
NA,研究 m iRNA的保守性,建立 m iRNA表达谱, 比
较 m iRNA表达丰度以及发现其他非编码 RNA等。
Lu等 [ 24]利用 454技术对果蝇 3个物种的 m iRNA进
行测序,结果发现 m iRNA和其他基因一样, 也经历
着产生!和消亡!的过程; M orin等 [ 25]利用 So lexa
对人类胚胎干细胞进行小分子 RNA谱带分析,共发
现了 81个差异表达的小分子 RNA, 并鉴定了 23种
未报道的 m iRNA。
2. 3 表观基因组学应用
2. 3. 1 转录因子结合位点测序转录因子是生物
体内常见的调控蛋白, 通过与 DNA特定区域相结
合,达到调控基因表达的目的。利用高通量测序技
术我们可以研究与调控蛋白紧密结合的 DNA序列,
进而探索二者之间的相互作用以及生物调控的基本
模式。这种名为染色质免疫沉淀 -深度测序 ( ChIP
seq)
[ 26]的技术目前被广泛应用于发现转录因子结
合位点等领域。Robertson等 [ 27 ]利用该技术研究了
干涉细胞和对照细胞的 STAT1结合位点, 发现干涉
之后的结合位点明显增加, 同时与 ChIPPCR相比,
该方法的敏感度和准确度都具有明显的优势。
2. 3. 2 DNA甲基化测序 DNA甲基化是另外一种
重要的基因调控方式,它通过改变染色质结构, DNA
稳定性及 DNA与蛋白质相互作用方式, 从而控制基
因表达。高通量测序技术在检测全基因组范围内的
78
2010年第 10期杨晓玲等:新一代测序技术的发展及应用前景
甲基化位点方面也提出了高效的解决方案。Taylor
等 [ 28]通过 454技术, 发现不同的疾病表现出不同的
甲基化模式; Barsk i等 [ 29]应用 So lexa技术绘制了人
类基因组 20多个组蛋白甲基化位点,并发现单甲基
化通常与基因激活相关联, 而三甲基化则与基因沉
默有紧密联系。
3 比较与联合
三代测序技术的原理各有特点 (表 1) ,适用范
围也不近相同。第一代测序技术凭借其长的序列片
段和高的准确率,适合对新物种进行基因组长距框
架的搭建以及后期 GAP填补, 但是成本昂贵,而且
难以胜任微量 DNA样品的测序工作。第二代测序
技术中, 454序列片段最长,比较适合对未知基因组
从头测序,搭建主体结构, 但是在判断连续单碱基重
复区时准确度不高 [ 30]。 Solexa较 454具有通量高、
片段短、价位低的特点, 适合于小片段如 m iRNA的
研究。Solex a双末端测序 ( pa iredend sequencing)可
以为基因组进一步拼接提供定位信息,但是随着反
应轮数增加,序列长度和质量均有所下降,而且在阅
读 AT区时有明显错误倾向。 SOLiD基于双碱基编
码系统的纠错能力以及较高的测序通量,适合转录
本研究以及比较基因组学特别是 SNP检测等, 但是
片段长度问题限制了该技术在基因组拼接中的广泛
应用。第三代测序技术目前正在研发阶段, 尚未正
式投入使用。
在实际应用中,科研人员发现,结合多种测序平
台可以得到更好的效果。Go ldberg等 [ 32 ]整合 Sanger
和 454技术对海洋微生物的测序结果, 得到了更加
完整的基因组图谱, 而成本并没有大幅度增加。此
外, 由于各种测序技术的错误分布并不相同,我们可
以采用两种测序方法相互印证, 解决了单一测序方
法无法验证 SNP正确性的弊端 [ 30]。
表 1 各种测序技术的比较 [ 412, 3033]
通量读长 ( bp) 准确性 (% ) 成本 (美元 /MB ) 测序原理
第一代
3730XL 0. 2M 800- 1 000 99. 99 2 500 双脱氧链终止 DNA测序法
第二代
454 400M 400- 500 99 40 合成测序法 (焦磷酸测序 )
Solexa
GA II 8- 10 G 75 99 2 合成测序法 (可逆终止子 )
H i- Seq 200 G 100
SOLiD
SOLiDTM 3 20 G 25 98 2 连接测序法 (双碱基编码 )
SOLiDTM 4 100 G 50
Polonator 4- 5 G 13 98 1 连接测序法 (开放式程序 )
Com p lete Genom ics 连接测序法 ( DNA纳米阵列 )
第三代
H elicos 35 G 32 96. 4 1 单分子合成测序法
Pacific 单分子实时合成测序法
Nanopore 单分子纳米孔测序法
4 创新与改进
4. 1 测序费用直线下降,千元基因组计划指日可待
2006年, TheX Prize Foundation设立了奖金为 1
千万美元的奖项 [ 30 ] ,颁发给人类基因组测序成本不
超过 1 000美元的研究中心。目前, AB I 3730作为
第一代测序技术的代表, 完成一个人类基因组的成
本约为 100万美元, 而第二代测序技术则需要约 10
万美元,第三代测序技术就更加便宜, 成本大约在
79
生物技术通报 B iotechnology Bulletin 2010年第 10期
1 000至 10 000美元之间。相比于 20年前投资近
30亿美元的人类基因组计划来说, 1 000美元一个
人类基因组的目标显得令人震惊。然而就在 2009
年, 研究人员利用 Complete Genom ics技术, 耗资
4 400美元就完成了人类基因组测序 [ 34] , 相信人类
距离千元基因组的目标已不再遥远。
4. 2 序列长度限制拼接,数据质量有待提高
序列长度一直都是制约新一代测序技术广泛应
用的主要因素。根据现行的测序原理, 通量的增加
注定以牺牲序列片段为代价,而序列长度对于基因
组或转录组的后续拼接非常重要。在测序质量方
面,错误率偏高也是困扰科研工作者的主要问题。
更多的研究者最终依然选择了 Sanger测序, 因为
Sanger测序的准确性毋庸置疑。因此, 如何改善测
序长度,并最大限度的降低测序错误率是目前各大
技术都应着手解决的问题。
当然,任何技术瓶颈的解决都需要一个过程。
我们知道, Sanger测序最初也只有 25 bp的长度,随
着技术的发展, 才逐步增加到 750 bp、1 000 bp; 而
454测序也同样从最初 100 bp提升到 GS FLX的
250 bp,直到现在的 400 bp。即将投入使用的第三
代测序技术可以对 DNA分子直接测序,有望在测序
长度以及准确性方面作出重大突破。
4. 3 样品准备步骤繁琐,文库构建仍需简化
第二代测序技术采用体外扩增的办法, 样品必
须经过打断, 加接头, 反转, 扩增, 割胶等多重步骤,
步骤的增加势必引入各种误差,测序费用也相应提
高,同时在实际操作中,也有很多问题尚待解决。
首先是割胶回收。割胶是建库成败的关键之
举,几个碱基的差别也将影响到测序结果。特别是
在小分子 RNA的研究中,割胶回收片段的长度对后
续测序片段的大小分布而言至关重要。然而目前的
割胶过程受到多种主客观因素的影响,因此,一种高
效,精确的片段分离技术急需引入,其次是样品起始
量的问题。在 RNAseq研究中,先打断后反转可以
得到更全面的转录本信息 [ 35 ] ,但是这种方法的前提
是 RNA的纯度和浓度都必须很高,这必然增加了取
材的难度。再次, 就是成本问题。割胶纯化, 乳滴
PCR以及后续库检都需要庞大的费用。综上所述,
一套节约方便的建库流程有待开发。
4. 4 海量数据提出挑战,信息平台尚未完善
测序技术取得的成就令人瞩目, 然而海量数据
的产生却提出了更大的挑战,一方面,如何充分挖掘
隐藏在原始数据中的生物学意义, 解释各种生物学
现象;另一方面,如何高效的对数据进行分类, 存档
等也成为研究人员必须面临的一个难题。
目前的软件类型主要包括序列比对,组装拼接,
质量评估等。然而,在实际使用过程中,科研工作者
仍面临很多困难。例如, 在使用 AMOScmp对邻近
物种短序列组装的过程中, 只有两个物种的相似度
在 90%以上 [ 36 ] ,才会得到较好的拼接效果。另外,
质量评分也是备受关注的问题之一。在第二代测序
中, 尽管测序公司提供的测序报告包含有质量文件,
但是由于不同的测序平台之间缺乏统一可靠的交叉
评价系统,错误率的问题依然令人担忧。而在数据
存储和管理方面, NCB I已经建立了专门的短序列数
据库 ( the Sequence R ead Archive, SRA ), 云计算时
代的到来也为海量数据的存储以及交流提供了便利
的条件。
参考文献
[ 1 ] Sanger F, A irGM, BarrellBG, et a.l Nu cleot ide sequence of bacterio
ph age ph iX174 DNA. N ature, 1977, 265 ( 5596) : 687695.
[ 2] S anger F, N ick len S, C oulson AR. DNA sequencing w ith chainterm i
nat ing inh ib itors. Proc NalAcad SciUSA, 1977, 74( 12) : 54635467.
[ 3] Aksyonov SA, B ittnerM, B loom LB, et a.lM u ltip lexed DNA sequen
cingbysynthes is. Annual Rev iew of B iochem istry, 2006, 348 ( 1 ):
12738.
[ 4] Rothberg JM , Leam on JH. The developm ent and im pact of 454 se
qu encing. Natu re B iotechnology, 2008, 26( 10 ) : 111724.
[ 5] TurcattiG, Rom ieuA, FedurcoM, TairiAP. A new class of cleavab le
f luorescent nucleotides: syn th es is and opt im izat ion as reversib le ter
m inators for DNA sequen cing by syn thesis. N ucleic Acid Research
Journ a,l 2008, 36 ( 4) : e25.
[ 6] Shendu re J, PorrecaG J, ReppasNB, et a.l Accuratem u ltip lex polony
sequen cing of an evolved b acterial genom e. S cien ce, 2005, 309
( 5741) : 172832.
[ 7 ] M cKernanK J, PeckhamHE, C osta GL, et a.l Sequen ce and s tru ctural
variat ion in a human genom e un covered by sh ortread, massively par
allel l igat ion sequ encing us ing twob ase encoding. Genom e Re
search, 2009, 19 ( 9) : 152741.
[ 8] Polonator Frequent ly Asked Qu est ion s. http: / /www. polonator. org/
80
2010年第 10期杨晓玲等:新一代测序技术的发展及应用前景
faqs. aspx
[ 9] Drm an ac R, SparksAB, C allowM J, et a.l Hum an gen om e sequ encing
u sing unchained base reads on selfassemb ling DNA nan oarrays. Sci
en ce, 2010, 327 ( 5961) : 7881.
[ 10 ] H arris TD, Buzby PR, Babcock H, et a.l S ing lem olecu le DNA se
quencing of a viral genom e. S cien ce, 2008, 320 ( 5872) : 1069.
[ 11 ] E id J, Feh r A, Gray J, et a.l Realt im e DNA sequencing from sing le
polym erase mo lecu les. Science, 2009, 323( 5910) : 1338.
[ 12] RuskN. Cheap th irdgeneration sequ encing. Natu reM ethods, 2009,
6( 4 ): 244.
[ 13 ] Kahvejian A, Quackenbush J, Thom pson JF. W hat would you do if
you cou ld sequen ce everyth ing. N ature B iotechnology, 2008, 26
( 10 ): 112533.
[ 14 ] L iR, FanW, T ianG, et a.l The sequen ce and de novo assemb ly of
the g ian t panda genom e. N ature, 2010, 463( 7279 ): 3117.
[ 15 ] H uang S, L iR, Zhang Z, et a.l Th e genom e of the cucum ber, Cu cu
m is sativus L. Nature Genetics, 2009, 41( 12) : 127581.
[ 16 ] Rasm ussenM, L iY, L indgreen S, et a.l An cien t hum an genom e se
quence of an ext inct PalaeoE sk im o. Natu re, 2010, 463 ( 7282 ) :
75762.
[ 17 ] Fu llwood M J, W ei CL, Liu ET, Ru an Y. Nextgen erat ion DNA se
quencing of pairedend tags ( PET) for tran scrip tom e and genom e
analyses. Genom e R esearch, 2009, 19 ( 4) : 52132.
[ 18 ] Feuk L, C arsonAR, Scherer SW. Stru ctura l variat ion in th e hum an
genom e. Nature Review sG enetics, 2006, 7( 2) : 8597.
[ 19 ] T rick M, Long Y, M eng J, B ancroft I. S ing le nucleotid e polym or
ph ism ( SNP) discovery in the polyp loid B rassica napus us ing Sol
exa transcriptom e sequen cing. P lan t B iotechno logy Jou rna,l 2009, 7
( 4 ) : 33446.
[ 20 ] Therese KL, B artell J, Deepa P, et a.l DNA sequen cing byM icroseq
k it target ing 16S rRNA gen e for species level ident ification ofmyco
bacteria. Ind ian Jou rnal of M ed ical R esearch, 2009, 129 ( 2 ) :
17681.
[ 21 ] Q in J, L iR, Raes J, et a.l A hum an gu tm icrob ial gene cata logu e es
tab lish ed by m etagenom ic sequ encing. N ature, 2010, 464 ( 7285 ) :
5965.
[ 22 ] C loonan N, Forres tAR, Kolle G, et a.l S tem cell transcriptom e profi
ling v ia m assivescale mRNA sequen cing. Natu reM eth ods, 2008, 5
( 7 ) : 6139.
[ 23] Tang F, Barbacioru C, W ang Y, et a.l mRNAS eq w holetran scrip
tom e analysis of a s ingle cel.l Natu re M ethods, 2009, 6 ( 5 ):
37782.
[ 24] Lu J, Sh enY, Wu Q, et a.l The b irth and d eath ofm icroRNA genes
in Drosoph ila. Natu re G enetics, 2008, 40( 3 ) : 3515.
[ 25] M orin RD, OC onnorMD, Griff ithM, et a.l App lication of massively
p ara llel sequ encing to m icroRNA prof iling and d iscovery in hum an
emb ryon ic stem cells. Genom e Research, 2008, 18( 4 ): 61021.
[ 26] M ard is ER. Ch IPseq: w elcom e to the new fron tier. Natu reM ethods,
2007, 4( 8 ): 6134.
[ 27] Robertson G, H irstM, Ba inbridgeM, et a.l Genom ew ide p rofiles of
STAT1 DNA association us ing chrom at in imm un oprecip itat ion and
m assively parallel sequ encing. Natu reM ethod s, 2007, 4 ( 8) : 6517.
[ 28] TaylorKH, K ram er RS, Davis JW, et a.l U ltradeep b isu lfite sequen
cing ana lysis ofDNA m ethylation patterns in mu ltiple gen e p rom ot
ers by 454 sequ encing. C ancer Research, 2007, 67 ( 18) : 85118.
[ 29] Barsk iA, Cuddapah S, C u iK, et a.l H ighresolu tion p rofiling of h is
tone m ethy lations in the hum an genom e. C el,l 2007, 129 ( 4 ):
82337.
[ 30] Shendure J, JiH. N extgenerationDNA sequen cing. N ature B iotech
no logy, 2008, 26: 11351145.
[ 31] H iseq 2000 h ttp: / /www. pol it igenom ics. com /2010 /01 /h iseq2000.
h tm .l Th e SOLiDTM System: N extGeneration Sequencing h ttp: / /
www3. appl iedb iosystems. com /AB _H om e/app lication stechnolog ies /
SOLiDSystemSequencingA /index. htm
[ 32] G oldberg SM, Johnson J, Busam D, et a.l A Sanger /pyrosequen cing
hybrid app roach for the generation of h ighquality draft assemb lies
ofm arinem icrob ialgenom es. ProcN atlAcad Scie, 2006, 103( 30 ):
112405.
[ 33] von Bubnoff A. Nextgen erat ion sequen cing: the race is on. C el,l
2008, 132 ( 5) : 7213.
[ 34] Carroll J. Sequen cing cost slides to $ 4, 400 at C om plete Genom
ics. h ttp: / /www. fierceb iotech. com /story/ sequ encingcos ts lides
4400comp letegenom ics /20091106
[ 35] W ang Z, G erstein M, SnyderM . RNASeq: a revolu tionary tool for
tran scrip tom ics. Natu re R eview sG enetics, 2009, 10( 1 ) : 5763.
[ 36 ] Pop M, Salzberg SL. B io informat ics challenges of new sequen cing
technology. T rends in Genetics, 2008, 24 ( 3) : 1429.
81

新一代测序技术的发展及应用前景

相关文献