全 文 :技术与方法
生物技术通报
BIOTECHNOLOGY BULLETIN 2010年第 10期
新一代测序技术的发展及应用前景
杨晓玲 施苏华 唐恬
(中山大学生命科学院,广州 510275)
摘 要: Sanger测序的提出给人类破译遗传密码提供了强有力的工具。而近几年飞速发展起来的高通量测序技术无论
在成本还是效率上, 都对传统测序提出了巨大的挑战。千元人类基因组计划的公布更是加快了测序研发的进程。通过下一
代测序技术, 科学家不仅能够绘制出各个物种的基因组图谱, 还能探讨不同条件下的基因表达差异以及不同物种之间或者物
种之内的序列差异, 进而为传统生物学以及医学研究开辟新的视角。与此同时,随着各大测序平台的不断改进, 普通实验室
都有能力承担此类大型测序项目。就目前正在发展的几种高通量测序技术进行了综合阐述, 并比较了各种测序技术的优缺
点, 最后对其应用领域作了简单介绍。
关键词: 第二代测序 第三代测序 基因组 转录组 重测序
Research Progress and Application of Nextgeneration Sequencing
Yang X iaoling Sh iSuhua Tang T ian
( Schoo l of L ife Sciences, Sun Yatsen University, Guangzhou 510275)
Abstrac:t The deve lopm en t of Sange r sequencing has brough t a pow erful too l for hum an be ing to dec ipher the gene tic code. H ow
ever, the arriv al of h ighthroughput sequencing over the past seve ra l years high ly challenges the traditiona lm ethod, no t on ly in cost but
also in effic iency. A race toward the$ 1 000 genom e dram a tica lly acce lerates the speed o f techno log ical innovation. The re fo re, next gen
e ration sequencing w ill a llow us to draw a com plete genom em ap, com pare gene expression under d ifferent conditions, and dem onstrate
sequence variation betw een or w ithin spec ies, a ll o fw hich would open out a new avenue fo r b io log ica l orm edical research. A t the sam e
tim e, w ith the h igh lydeveloped sequenc ing platform s, near ly every resea rch team w ou ld have the oppo rtunity to carry out such research.
In th is paper, we prov ide a snapshot of these new approaches, d iscuss the advantages and lim itations o f them, and also illustra te the ir ap
p lications in var ious fie lds.
Key words: Second genera tion sequencing Th ird generation sequenc ing Genom e T ranscrip tom e Resequenc ing
收稿日期: 20100412
基金项目:国家自然科学基金项目 ( 30730008, 30970208, 40976081) , 973!计划项目 ( 2007CB815703) ,中山大学重点培育计划项目及有害生物
控制与资源利用国家重点实验室创新课题,教育部留学归国人员科研启动基金,中山大学重点培育计划
作者简介:杨晓玲,女,硕士研究生,研究方向:分子进化; Em ai:l sysu lsyx@l gm ai.l com
通讯作者:唐恬,副教授, Em ai:l tt ian _8@ hotm a i.l com
双螺旋结构的发现,遗传密码的破解,第一个完
整基因组图谱的绘制 [ 1]让科学家越来越多地认识
到测序在生物学研究中的重要作用。从 1977年
Sanger和 Coulson关于快速测序技术论文的首次发
表 [ 1, 2] ,到 2010年高通量测序的广泛应用, 海量遗
传信息被相继揭秘;从人类基因组计划,到人类基因
组单倍型图计划,再到人类癌症基因组及个体基因
组计划,人类对于自身的研究也日趋深入。千元基
因组计划的提出,后基因组时代的到来,势必推动测
序技术的突飞猛进, 人类对于自然界的认识也必将
走向一个新的阶段。
1 测序与发展
Sanger测序作为 30多年来惟一的 DNA测序方
法,对现代生物学研究起到了极大的促进作用。然
而随着大规模基因组学的兴起, 多种高通量低成本
的测序技术应运而生,并逐步被应用到生物学研究
的各个领域。目前,新一代测序技术正以 Sanger测
序无可比拟的
速度产生海量数据,不仅引领生命科学全面进
入后基因组时代,更推动了生物信息学、系统生物学
2010年第 10期 杨晓玲等:新一代测序技术的发展及应用前景
等交叉学科的迅猛发展。
1. 1 第二代测序 ∀ ∀ ∀ 高通量低成本齐头并进
以高通量低成本为主要特征的第二代测序,不
再需要大肠杆菌进行体内扩增,而是直接通过聚合
酶或者连接酶进行体外合成测序 [ 3]。根据其原理
又可分为两类:聚合酶合成测序和连接酶合成测序。
1. 1. 1 聚合酶合成测序法 Roche公司推出的 454
技术开辟了高通量测序的先河。该技术通量可达
Sanger测序的几百倍, 而成本却只有几十分之一,因
此一经推出,便受到了国际上基因组学专家的广泛
关注。 454采用焦磷酸合成测序法 [ 4] , 避免了传统
测序进行荧光标记以及跑胶等繁琐步骤, 同时利用
乳胶系统对 DNA分子进行扩增, 实现了大规模并行
测序。截止到 2010年 4月, 已有 700多篇文献是采
用了 454测序技术 ( h ttp: / /454. com /pub lications
andresources/publications. asp), 对该技术是一个极
大的肯定。
Illum ina公司推出的 Solexa遗传分析仪是合成
技术的进一步发展与延伸。该技术借助高密度的
DNA单分子阵列,使得测序成本和效率均有了较大
改善。同时 So lexa公司提出的可逆终止子 [ 5]也是
该技术获得认可的原因之一。与 454相比, So lexa
拥有更高的通量, 更低的成本。虽然片段长度较短
仍是主要的技术瓶颈, 但是对于已有基因组的物种
来说, So lexa理所当然成为第二代测序技术的首选。
2008年以来,利用该技术开展的研究大幅度上升,
报道文献达 400多篇 ( http: / /www. illum ina. com /
systems/genom e_ana lyzer_ iix. ilmn)。
1. 1. 2 连接酶合成测序法 2007年 AB I公司在
Church小组 [ 6]研究成果的基础上推出了 SOL iD测
序仪。该技术的创新之处在于双碱基编码 [ 7]的应
用,即每个碱基被阅读两次,因此大大减少了测序带
来的错误率, 同时可以方便的区分 SNP和测序错
误。在测序过程中, 仪器自动加入 4种荧光标记的
寡核苷酸探针,探针与引物发生连接反应,通过激发
末端的荧光标记识别结合上的碱基类型。目前
SOL iD 3. 0测序通量可达 20 G, 而测序片段仅有
35- 50 bp, 这使得该技术与 Solexa相比, 应用范围
还不够广泛。AB I公司正加快研发进度,争取在片
段长度方面做出重大突破。
DanaherM o tion公司推出 Po lonator[ 8]测序仪同
样也是基于 Church小组的研究成果, 但是该设备的
成本要低很多,同时用户在使用时可以根据自己的
研究目的设置不同的测序条件。而 Comp lete G e
nom ics公司推出的 DNA纳米阵列与组合探针锚定
连接测序法 [ 9]则具有更高的容错能力,试剂的消耗
也进一步减少,目前已顺利完成 3个个体基因组的
测序工作。
1. 2 第三代测序 ∀ ∀ ∀ 单分子长片段有望实现
第二代测序技术虽然在各方面都有了较大的突
破, 但是仍然建立在 PCR扩增的基础上。为了避免
PCR扩增带来的偏差,科学家目前正在研制对 DNA
单个分子直接测序的第三代测序仪。最具代表性的
包括 He liscope单分子测序仪, 单分子实时合成测序
法, 纳米孔测序技术等。
H elicos技术仍然是基于合成测序原理 [ 10 ] , 它
采用了一种新的荧光类似物和灵敏的监测系统, 能
够直接记录到单个碱基的荧光, 从而克服了其他方
法须同时测数千个相同基因片段以增加信号亮度的
缺陷。Pac ific B iosc iences公司研发的单分子实时合
成测序法充分利用了 DNA聚合酶的特性,可以形象
的描述为通过显微镜实时观测 DNA聚合酶, 并记录
DNA合成的整个过程。纳米孔测序技术 [ 11, 12]则是
利用不同碱基在通过纳米小孔时引起的静电感应稍
有不同,或者不同碱基通过小孔的能力各有差异,来
加以区分不同的碱基信号。
2 应用与实践
Kahvejian在 2008年的一篇综述中提到 [ 13] :
如果你可以随心所欲地测序, 你会开展哪些研
究? !。人类基因组计划的完成和近年来高通量测序
的兴起,使越来越多的科研工作者认识到,我们对于
生物界的认识才刚刚起步。基因图谱的绘制并不意
味着所有遗传密码的破解, 癌症基因组的开展也没
有解决所有的医学难题。DNA变异的模式和进化
机制,基因调控网络的结构和相互作用方式,复杂性
状及疾病的分子遗传基础等, 仍是困扰生物学家和
医学家的难题,而高通量测序的广泛应用,也许可以
让我们知道的更多。
2. 1 DNA水平的应用
2. 1. 1 全基因组测序 新一代测序技术极大地推
77
生物技术通报 B iotechnology Bulletin 2010年第 10期
动了非模式物种的全基因组测序工作, 越来越多的
物种基因组信息的相继公布 [ 14, 15] , 帮助科研工作者
摆脱了以往非模式生物中遗传背景缺乏的束缚。同
时,高通量测序技术凭借其对于微量 DNA灵敏的捕
捉能力,在古生物学研究中也得到了广泛应用。Ras
musse等 [ 16]从 4 000年前爱斯基摩人的一束头发中
提取 DNA, 利用 So lexa进行全基因组测序, 得到大
约 79%的序列,并与现代人类的基因组序列进行比
对,为探索人类的进化历程供了重要的信息。
2. 1. 2 基因组重测序 对已知基因组物种进行重
测序是第二代测序技术目前应用最为广泛的领域。
通过测序,科学家可以看到单核苷酸多态性,突变热
点,基因组结构变异、群体多态性等重要信息。末端
配对法 [ 17]的应用则可以方便的鉴定因基因插入,缺
失或拷贝数变化引起的各种变异。Feuk等 [ 18]发
现,人类基因组中存在的结构变异远远超过了人们
的预计,而其中有很多变异都会造成重大的表型改
变。Trick等 [ 19 ]通过 So lexa测序, 鉴定了甘蓝型油
菜栽培种 2万 - 4万多个 SNP。在进化领域, 科学
家通过群体多态性分析探索物种之间的进化模式;
在微生物领域, DNA测序分型已被证明快捷而准
确 [ 20] ;而在医学领域, 基因组重测序在发现 SNP与
重大疾病的关系方面有着重要的意义。
2. 1. 3 宏基因组研究 宏基因组测序是指直接从
环境中提取所有物种的 DNA进行全基因组测序,与
传统的微生物研究相比, 宏基因组研究跳出了实验
室培养的局限,真实地描述了大自然生态群落的复
杂性和多样性,对于人类更好地了解微生物群落有
着重要的意义。目前, 欧盟推出的人类肠道宏基因
组计划 (M etaH IT) [ 21] , 就是通过研究人类肠道中所
有的微生物种类,为肠道微生物与肥胖等人类疾病
的关系提供重要的理论依据。
2. 2 RNA水平的应用
2. 2. 1 转录组测序 转录水平的调控是生物体最
主要的调控方式,而建立在高通量测序基础上的转
录组研究已逐步取代基因芯片技术成为目前从全基
因组水平研究基因表达的主流方法。对同一样品深
度测序可以捕获低表达的基因,而对大量样品同时
测序可以获得样品之间的表达差异。此外, 研究人
员还可以获得转录本表达丰度,转录发生位点,可变
剪切,转录本 SNP等重要信息。 C loonan等 [ 22]利用
SOL iD对小鼠胚胎干细胞分化前后的转录组进行了
比较,挖掘出不同时期特异表达的基因以及单核苷酸
多态性,阐述了分化路径中的关键因素; Tang等 [ 23]利
用 RNA Seq对小鼠单个卵母细胞进行表达谱分析,
与芯片技术相比,高通量测序可以多检测到 75%的
基因表达,并且有 8% - 19%的基因存在两种以上
的转录形式。
2. 2. 2 小分子 RNA测序 小分子 RNA是一类特
殊的调控序列,在生物体内扮演着重要的角色,近几
年受到了科学界的广泛关注。传统的研究方法主要
包括正向遗传学筛选, 克隆测序法, 芯片技术等, 而
近几年兴起的高通量测序给小分子 RNA研究带来
了新的思路。较短的序列长度虽然是目前高通量测
序难以打破的瓶颈,却正好可以覆盖小分子 RNA的
长度。科研工作者通过测序, 可以预测新的 m iR
NA,研究 m iRNA的保守性,建立 m iRNA表达谱, 比
较 m iRNA表达丰度以及发现其他非编码 RNA等。
Lu等 [ 24]利用 454技术对果蝇 3个物种的 m iRNA进
行测序,结果发现 m iRNA和其他基因一样, 也经历
着 产生!和 消亡!的过程; M orin等 [ 25]利用 So lexa
对人类胚胎干细胞进行小分子 RNA谱带分析,共发
现了 81个差异表达的小分子 RNA, 并鉴定了 23种
未报道的 m iRNA。
2. 3 表观基因组学应用
2. 3. 1 转录因子结合位点测序 转录因子是生物
体内常见的调控蛋白, 通过与 DNA特定区域相结
合,达到调控基因表达的目的。利用高通量测序技
术我们可以研究与调控蛋白紧密结合的 DNA序列,
进而探索二者之间的相互作用以及生物调控的基本
模式。这种名为染色质免疫沉淀 -深度测序 ( ChIP
seq)
[ 26]的技术目前被广泛应用于发现转录因子结
合位点等领域。Robertson等 [ 27 ]利用该技术研究了
干涉细胞和对照细胞的 STAT1结合位点, 发现干涉
之后的结合位点明显增加, 同时与 ChIPPCR相比,
该方法的敏感度和准确度都具有明显的优势。
2. 3. 2 DNA甲基化测序 DNA甲基化是另外一种
重要的基因调控方式,它通过改变染色质结构, DNA
稳定性及 DNA与蛋白质相互作用方式, 从而控制基
因表达。高通量测序技术在检测全基因组范围内的
78
2010年第 10期 杨晓玲等:新一代测序技术的发展及应用前景
甲基化位点方面也提出了高效的解决方案。Taylor
等 [ 28]通过 454技术, 发现不同的疾病表现出不同的
甲基化模式; Barsk i等 [ 29]应用 So lexa技术绘制了人
类基因组 20多个组蛋白甲基化位点,并发现单甲基
化通常与基因激活相关联, 而三甲基化则与基因沉
默有紧密联系。
3 比较与联合
三代测序技术的原理各有特点 (表 1) ,适用范
围也不近相同。第一代测序技术凭借其长的序列片
段和高的准确率,适合对新物种进行基因组长距框
架的搭建以及后期 GAP填补, 但是成本昂贵,而且
难以胜任微量 DNA样品的测序工作。第二代测序
技术中, 454序列片段最长,比较适合对未知基因组
从头测序,搭建主体结构, 但是在判断连续单碱基重
复区时准确度不高 [ 30]。 Solexa较 454具有通量高、
片段短、价位低的特点, 适合于小片段如 m iRNA的
研究。Solex a双末端测序 ( pa iredend sequencing)可
以为基因组进一步拼接提供定位信息,但是随着反
应轮数增加,序列长度和质量均有所下降,而且在阅
读 AT区时有明显错误倾向。 SOLiD基于双碱基编
码系统的纠错能力以及较高的测序通量,适合转录
本研究以及比较基因组学特别是 SNP检测等, 但是
片段长度问题限制了该技术在基因组拼接中的广泛
应用。第三代测序技术目前正在研发阶段, 尚未正
式投入使用。
在实际应用中,科研人员发现,结合多种测序平
台可以得到更好的效果。Go ldberg等 [ 32 ]整合 Sanger
和 454技术对海洋微生物的测序结果, 得到了更加
完整的基因组图谱, 而成本并没有大幅度增加。此
外, 由于各种测序技术的错误分布并不相同,我们可
以采用两种测序方法相互印证, 解决了单一测序方
法无法验证 SNP正确性的弊端 [ 30]。
表 1 各种测序技术的比较 [ 412, 3033]
通量 读长 ( bp) 准确性 (% ) 成本 (美元 /MB ) 测序原理
第一代
3730XL 0. 2M 800- 1 000 99. 99 2 500 双脱氧链终止 DNA测序法
第二代
454 400M 400- 500 99 40 合成测序法 (焦磷酸测序 )
Solexa
GA II 8- 10 G 75 99 2 合成测序法 (可逆终止子 )
H i- Seq 200 G 100
SOLiD
SOLiDTM 3 20 G 25 98 2 连接测序法 (双碱基编码 )
SOLiDTM 4 100 G 50
Polonator 4- 5 G 13 98 1 连接测序法 (开放式程序 )
Com p lete Genom ics 连接测序法 ( DNA纳米阵列 )
第三代
H elicos 35 G 32 96. 4 1 单分子合成测序法
Pacific 单分子实时合成测序法
Nanopore 单分子纳米孔测序法
4 创新与改进
4. 1 测序费用直线下降,千元基因组计划指日可待
2006年, TheX Prize Foundation设立了奖金为 1
千万美元的奖项 [ 30 ] ,颁发给人类基因组测序成本不
超过 1 000美元的研究中心。目前, AB I 3730作为
第一代测序技术的代表, 完成一个人类基因组的成
本约为 100万美元, 而第二代测序技术则需要约 10
万美元,第三代测序技术就更加便宜, 成本大约在
79
生物技术通报 B iotechnology Bulletin 2010年第 10期
1 000至 10 000美元之间。相比于 20年前投资近
30亿美元的人类基因组计划来说, 1 000美元一个
人类基因组的目标显得令人震惊。然而就在 2009
年, 研究人员利用 Complete Genom ics技术, 耗资
4 400美元就完成了人类基因组测序 [ 34] , 相信人类
距离千元基因组的目标已不再遥远。
4. 2 序列长度限制拼接,数据质量有待提高
序列长度一直都是制约新一代测序技术广泛应
用的主要因素。根据现行的测序原理, 通量的增加
注定以牺牲序列片段为代价,而序列长度对于基因
组或转录组的后续拼接非常重要。在测序质量方
面,错误率偏高也是困扰科研工作者的主要问题。
更多的研究者最终依然选择了 Sanger测序, 因为
Sanger测序的准确性毋庸置疑。因此, 如何改善测
序长度,并最大限度的降低测序错误率是目前各大
技术都应着手解决的问题。
当然,任何技术瓶颈的解决都需要一个过程。
我们知道, Sanger测序最初也只有 25 bp的长度,随
着技术的发展, 才逐步增加到 750 bp、1 000 bp; 而
454测序也同样从最初 100 bp提升到 GS FLX的
250 bp,直到现在的 400 bp。即将投入使用的第三
代测序技术可以对 DNA分子直接测序,有望在测序
长度以及准确性方面作出重大突破。
4. 3 样品准备步骤繁琐,文库构建仍需简化
第二代测序技术采用体外扩增的办法, 样品必
须经过打断, 加接头, 反转, 扩增, 割胶等多重步骤,
步骤的增加势必引入各种误差,测序费用也相应提
高,同时在实际操作中,也有很多问题尚待解决。
首先是割胶回收。割胶是建库成败的关键之
举,几个碱基的差别也将影响到测序结果。特别是
在小分子 RNA的研究中,割胶回收片段的长度对后
续测序片段的大小分布而言至关重要。然而目前的
割胶过程受到多种主客观因素的影响,因此,一种高
效,精确的片段分离技术急需引入,其次是样品起始
量的问题。在 RNAseq研究中,先打断后反转可以
得到更全面的转录本信息 [ 35 ] ,但是这种方法的前提
是 RNA的纯度和浓度都必须很高,这必然增加了取
材的难度。再次, 就是成本问题。割胶纯化, 乳滴
PCR以及后续库检都需要庞大的费用。综上所述,
一套节约方便的建库流程有待开发。
4. 4 海量数据提出挑战,信息平台尚未完善
测序技术取得的成就令人瞩目, 然而海量数据
的产生却提出了更大的挑战,一方面,如何充分挖掘
隐藏在原始数据中的生物学意义, 解释各种生物学
现象;另一方面,如何高效的对数据进行分类, 存档
等也成为研究人员必须面临的一个难题。
目前的软件类型主要包括序列比对,组装拼接,
质量评估等。然而,在实际使用过程中,科研工作者
仍面临很多困难。例如, 在使用 AMOScmp对邻近
物种短序列组装的过程中, 只有两个物种的相似度
在 90%以上 [ 36 ] ,才会得到较好的拼接效果。另外,
质量评分也是备受关注的问题之一。在第二代测序
中, 尽管测序公司提供的测序报告包含有质量文件,
但是由于不同的测序平台之间缺乏统一可靠的交叉
评价系统,错误率的问题依然令人担忧。而在数据
存储和管理方面, NCB I已经建立了专门的短序列数
据库 ( the Sequence R ead Archive, SRA ), 云计算时
代的到来也为海量数据的存储以及交流提供了便利
的条件。
参 考 文 献
[ 1 ] Sanger F, A irGM, BarrellBG, et a.l Nu cleot ide sequence of bacterio
ph age ph iX174 DNA. N ature, 1977, 265 ( 5596) : 687695.
[ 2] S anger F, N ick len S, C oulson AR. DNA sequencing w ith chainterm i
nat ing inh ib itors. Proc NalAcad SciUSA, 1977, 74( 12) : 54635467.
[ 3] Aksyonov SA, B ittnerM, B loom LB, et a.lM u ltip lexed DNA sequen
cingbysynthes is. Annual Rev iew of B iochem istry, 2006, 348 ( 1 ):
12738.
[ 4] Rothberg JM , Leam on JH. The developm ent and im pact of 454 se
qu encing. Natu re B iotechnology, 2008, 26( 10 ) : 111724.
[ 5] TurcattiG, Rom ieuA, FedurcoM, TairiAP. A new class of cleavab le
f luorescent nucleotides: syn th es is and opt im izat ion as reversib le ter
m inators for DNA sequen cing by syn thesis. N ucleic Acid Research
Journ a,l 2008, 36 ( 4) : e25.
[ 6] Shendu re J, PorrecaG J, ReppasNB, et a.l Accuratem u ltip lex polony
sequen cing of an evolved b acterial genom e. S cien ce, 2005, 309
( 5741) : 172832.
[ 7 ] M cKernanK J, PeckhamHE, C osta GL, et a.l Sequen ce and s tru ctural
variat ion in a human genom e un covered by sh ortread, massively par
allel l igat ion sequ encing us ing twob ase encoding. Genom e Re
search, 2009, 19 ( 9) : 152741.
[ 8] Polonator Frequent ly Asked Qu est ion s. http: / /www. polonator. org/
80
2010年第 10期 杨晓玲等:新一代测序技术的发展及应用前景
faqs. aspx
[ 9] Drm an ac R, SparksAB, C allowM J, et a.l Hum an gen om e sequ encing
u sing unchained base reads on selfassemb ling DNA nan oarrays. Sci
en ce, 2010, 327 ( 5961) : 7881.
[ 10 ] H arris TD, Buzby PR, Babcock H, et a.l S ing lem olecu le DNA se
quencing of a viral genom e. S cien ce, 2008, 320 ( 5872) : 1069.
[ 11 ] E id J, Feh r A, Gray J, et a.l Realt im e DNA sequencing from sing le
polym erase mo lecu les. Science, 2009, 323( 5910) : 1338.
[ 12] RuskN. Cheap th irdgeneration sequ encing. Natu reM ethods, 2009,
6( 4 ): 244.
[ 13 ] Kahvejian A, Quackenbush J, Thom pson JF. W hat would you do if
you cou ld sequen ce everyth ing. N ature B iotechnology, 2008, 26
( 10 ): 112533.
[ 14 ] L iR, FanW, T ianG, et a.l The sequen ce and de novo assemb ly of
the g ian t panda genom e. N ature, 2010, 463( 7279 ): 3117.
[ 15 ] H uang S, L iR, Zhang Z, et a.l Th e genom e of the cucum ber, Cu cu
m is sativus L. Nature Genetics, 2009, 41( 12) : 127581.
[ 16 ] Rasm ussenM, L iY, L indgreen S, et a.l An cien t hum an genom e se
quence of an ext inct PalaeoE sk im o. Natu re, 2010, 463 ( 7282 ) :
75762.
[ 17 ] Fu llwood M J, W ei CL, Liu ET, Ru an Y. Nextgen erat ion DNA se
quencing of pairedend tags ( PET) for tran scrip tom e and genom e
analyses. Genom e R esearch, 2009, 19 ( 4) : 52132.
[ 18 ] Feuk L, C arsonAR, Scherer SW. Stru ctura l variat ion in th e hum an
genom e. Nature Review sG enetics, 2006, 7( 2) : 8597.
[ 19 ] T rick M, Long Y, M eng J, B ancroft I. S ing le nucleotid e polym or
ph ism ( SNP) discovery in the polyp loid B rassica napus us ing Sol
exa transcriptom e sequen cing. P lan t B iotechno logy Jou rna,l 2009, 7
( 4 ) : 33446.
[ 20 ] Therese KL, B artell J, Deepa P, et a.l DNA sequen cing byM icroseq
k it target ing 16S rRNA gen e for species level ident ification ofmyco
bacteria. Ind ian Jou rnal of M ed ical R esearch, 2009, 129 ( 2 ) :
17681.
[ 21 ] Q in J, L iR, Raes J, et a.l A hum an gu tm icrob ial gene cata logu e es
tab lish ed by m etagenom ic sequ encing. N ature, 2010, 464 ( 7285 ) :
5965.
[ 22 ] C loonan N, Forres tAR, Kolle G, et a.l S tem cell transcriptom e profi
ling v ia m assivescale mRNA sequen cing. Natu reM eth ods, 2008, 5
( 7 ) : 6139.
[ 23] Tang F, Barbacioru C, W ang Y, et a.l mRNAS eq w holetran scrip
tom e analysis of a s ingle cel.l Natu re M ethods, 2009, 6 ( 5 ):
37782.
[ 24] Lu J, Sh enY, Wu Q, et a.l The b irth and d eath ofm icroRNA genes
in Drosoph ila. Natu re G enetics, 2008, 40( 3 ) : 3515.
[ 25] M orin RD, OC onnorMD, Griff ithM, et a.l App lication of massively
p ara llel sequ encing to m icroRNA prof iling and d iscovery in hum an
emb ryon ic stem cells. Genom e Research, 2008, 18( 4 ): 61021.
[ 26] M ard is ER. Ch IPseq: w elcom e to the new fron tier. Natu reM ethods,
2007, 4( 8 ): 6134.
[ 27] Robertson G, H irstM, Ba inbridgeM, et a.l Genom ew ide p rofiles of
STAT1 DNA association us ing chrom at in imm un oprecip itat ion and
m assively parallel sequ encing. Natu reM ethod s, 2007, 4 ( 8) : 6517.
[ 28] TaylorKH, K ram er RS, Davis JW, et a.l U ltradeep b isu lfite sequen
cing ana lysis ofDNA m ethylation patterns in mu ltiple gen e p rom ot
ers by 454 sequ encing. C ancer Research, 2007, 67 ( 18) : 85118.
[ 29] Barsk iA, Cuddapah S, C u iK, et a.l H ighresolu tion p rofiling of h is
tone m ethy lations in the hum an genom e. C el,l 2007, 129 ( 4 ):
82337.
[ 30] Shendure J, JiH. N extgenerationDNA sequen cing. N ature B iotech
no logy, 2008, 26: 11351145.
[ 31] H iseq 2000 h ttp: / /www. pol it igenom ics. com /2010 /01 /h iseq2000.
h tm .l Th e SOLiDTM System: N extGeneration Sequencing h ttp: / /
www3. appl iedb iosystems. com /AB _H om e/app lication stechnolog ies /
SOLiDSystemSequencingA /index. htm
[ 32] G oldberg SM, Johnson J, Busam D, et a.l A Sanger /pyrosequen cing
hybrid app roach for the generation of h ighquality draft assemb lies
ofm arinem icrob ialgenom es. ProcN atlAcad Scie, 2006, 103( 30 ):
112405.
[ 33] von Bubnoff A. Nextgen erat ion sequen cing: the race is on. C el,l
2008, 132 ( 5) : 7213.
[ 34] Carroll J. Sequen cing cost slides to $ 4, 400 at C om plete Genom
ics. h ttp: / /www. fierceb iotech. com /story/ sequ encingcos ts lides
4400comp letegenom ics /20091106
[ 35] W ang Z, G erstein M, SnyderM . RNASeq: a revolu tionary tool for
tran scrip tom ics. Natu re R eview sG enetics, 2009, 10( 1 ) : 5763.
[ 36 ] Pop M, Salzberg SL. B io informat ics challenges of new sequen cing
technology. T rends in Genetics, 2008, 24 ( 3) : 1429.
81