免费文献传递   相关文献

DNA测序技术的发展历史与最新进展



全 文 :技术与方法
生物技术通报
BIOTECHNOLOGY BULLETIN 2010年第 8期
DNA测序技术的发展历史与最新进展
解增言  林俊华  谭军  舒坤贤
(重庆邮电大学生物信息学院,重庆 400065)
  摘  要:  DNA测序技术是现代分子生物学研究中最常用的技术。从 1977年第一代测序技术的出现, 经过 30多年的发
展, DNA测序技术取得重大进展,以高通量为特点的第二代测序技术逐步成熟并商业化, 以单分子测序为特点的第三代测序
技术也已经出现。介绍每一代测序技术的特点,并重点介绍了第二代测序技术及其应用。展望新的测序技术对于未来生物
学研究及人们自身健康与人类疾病等方面研究的影响。
关键词:  第一代 DNA测序技术  第二代 DNA测序技术  第三代 DNA测序技术  高通量  单分子测序
TheH istory and Advances of DNA Sequencing Technology
X ie Zengyan L in Junhua T an Jun Shu Kunxian
(Co llege of Bio information, Chongqing University of Posts and T elecommunications, Chongqing 400065)
  Abstrac:t  As the comm only used techno logy in m o lecular bio logy, DNA sequenc ing techno logy has seen g rea t advances in m ore
than thirty yea rs since 1977. Nextgenera tion DNA sequencing techno logy, characterized by h ighthroughput, has entered them arket and
been grow ing to m aturity. The th irdgenera tion sequencing techno logy has also arisen, w hich can sequence sing le DNA m o leculars. In
this rev iew, w e introduced three generations of sequenc ing technolog ies and em phasized on the secondgenera tion sequencing techno lo
gy and its applications. A t the end of the review, the effect of new DNA sequencing techno log ies on research and med ic ine w ere pre
v iew ed.
  Key words:  F irstgene ration DNA sequenc ing techno logy Secondgeneration DNA sequencing techno logy Th irdgenera tion
DNA sequencing techno logy  H igh throughput Sing lem o lecular sequenc ing techno logy.
收稿日期: 20100202
基金项目:重庆邮电大学博士启动金 (A200918)
作者简介:解增言,男,博士,讲师,研究方向:生物信息学; Em ai:l zengyanxie@ gm ai.l com
DNA测序技术是分子生物学研究中最常用的
技术,它的出现极大地推动了生物学的发展。成熟
的 DNA测序技术始于 20世纪 70年代中期。 1977
年 Maxam 和 G ilbert[ 1] 报道了通过化学降解测定
DNA序列的方法。同一时期, Sanger[ 2]发明了双脱
氧链终止法。20世纪 90年代初出现的荧光自动测
序技术将 DNA测序带入自动化测序的时代。这些
技术统称为第一代 DNA测序技术。最近几年发展
起来的第二代 DNA测序技术则使得 DNA测序进入
了高通量、低成本的时代。目前,基于单分子读取技
术的第三代测序技术已经出现, 该技术测定 DNA序
列更快,并有望进一步降低测序成本,改变个人医疗
的前景。现介绍 DNA测序技术的发展历史及不同
发展阶段各种主要测序技术的特点。
1 DNA测序技术的出现
早在 DNA测序技术出现之前, 蛋白质和 RNA
的测序技术就已经出现。 1949年, F rederick San
ger
[ 3 ]开发了测定胰岛素两条肽链氨基末端序列的
技术, 并在 1953年测定了胰岛素的氨基酸序
列 [ 4, 5]。 Edman[ 6]也在 1950年提出了蛋白质的 N端
测序技术,后来在此基础上发展出了蛋白质自动测
序技术 [ 7]。
Sanger等 [ 8 ]在 1965年发明了 RNA的小片段序
列测定法,并完成了大肠杆菌 5S rRNA的 120个核
苷酸的测定。同一时期, H olley[ 9, 10]完成了酵母丙氨
酸转运 tRNA的序列测定。
2010年第 8期     解增言等: DNA测序技术的发展历史与最新进展
DNA测序技术出现的较晚, 1975年 Sanger和
Cou lson
[ 11]发明了 加减法 !测定 DNA序列。 1977
年在引入双脱氧核苷三磷酸 ( ddNTP)后,形成了双
脱氧链终止法,使得 DNA序列测定的效率和准确性
大大提高 [ 2]。M axam和 G ilbert[ 1 ]也在 1977年报道
了化学降解法测定 DNA的序列。DNA序列测定技
术出现后,迅速超越了蛋白质和 RNA测序技术,成
为现代分子生物学中最重要的技术。
2 第一代 DNA测序技术
传统的化学降解法、双脱氧链终止法以及在它
们的基础上发展来的各种 DNA测序技术统称为第
一代 DNA测序技术。第一代测序技术在分子生物
学研究中发挥过重要的作用, 如人类基因组计划
( human genom e pro jec,t HGP)主要基于第一代 DNA
测序技术。目前基于荧光标记和 Sanger的双脱氧
链终止法原理的荧光自动测序仪仍被广泛地应用。
21 化学降解法
在该方法中,一个末端被放射性标记的 DNA片
段在 5组互相独立的化学反应中分别被部分降解,
其中每一组反应特异地针对某种碱基。因此生成 5
组放射性标记的分子, 每组混合物中均含有长短不
一的 DNA分子,其长度取决于该组反应所针对的碱
基在原 DNA片段上的位置。最后,各组混合物通过
聚丙烯酰胺凝胶电泳进行分离,再通过放射自显影
来检测末端标记的分子 [ 12]。
化学降解法刚问世时, 准确性较好, 也容易为
普通研究人员所掌握, 因此用得较多。而且化学
降解较之链终止法具有一个明显的优点, 即所测
序列来自原 DNA分子而不是酶促合成产生的拷
贝, 排除了合成时造成的错误。但化学降解法操
作过程较麻烦, 逐渐被简便快速的 Sanger法所
代替。
22 双脱氧链终止法
双脱氧链终止法又称为 Sanger法 [ 2] , 该方法的
原理是:核酸模板在 DNA聚合酶、引物、4种单脱氧
核苷三磷酸 ( dNTP, 其中的一种用放射性 P32标记 )
存在条件下复制时, 在四管反应系统中分别按比例
引入 4种双脱氧核苷三磷酸 ( ddNTP) , 因为双脱氧
核苷没有 3∀OH,所以只要双脱氧核苷掺入链的末
端,该链就停止延长,若链端掺入单脱氧核苷, 链就
可以继续延长。如此每管反应体系中便合成以各自
的双脱氧碱基为 3∀端的一系列长度不等的核酸片
段。反应终止后,分 4个泳道进行凝胶电泳, 分离长
短不一的核酸片段,长度相邻的片段相差一个碱基。
经过放射自显影后, 根据片段 3∀端的双脱氧核苷,
便可依次阅读合成片段的碱基排列顺序。
Sanger法因操作简便, 得到广泛的应用。后来
在此基础上发展出多种 DNA测序技术, 其中最重要
的是荧光自动测序技术。
23 荧光自动测序技术
荧光自动测序技术基于 Sanger原理,用荧光标
记代替同位素标记,并用成像系统自动检测,从而大
大提高了 DNA测序的速度和准确性。
早在 1985年, Sm ith等采用激光激发标记的荧
光, 并用 CCD检测, 比常规电泳测序速度提高 9倍,
测序速度达到 8 000 bp /h以上 [ 13]。
20世纪 80年代初 Jorgenson和 Lukacs[ 14, 15]提
出了毛细管电泳技术 ( cap illary electrophoresis)。
1992年美国的 Math ies实验室首先提出阵列毛细管
电泳 ( cap illary array electrophoresis )新方法,并采用
激光聚焦荧光扫描检测装置, 25只毛细管并列电
泳, 每只毛细管在 15 h内可读出 350 bp, DNA序列
分析效率可达 6 000 bp /h[ 16]。 1995年Woolley[ 17]研
究组用该技术进行测序研究,使用四色荧光标记法,
每个毛细管长 35 cM, 在 9 m in内可读取 150个碱
基, 准确率约 97%。
目前,应用最广泛的应用生物系统公司 ( applied
b iosystems, AB I) 3730系列自动测序仪即是基于毛
细管电泳和荧光标记技术的 DNA测序仪。如 AB I
3730XL测序仪拥有 96道毛细管, 4种双脱氧核苷
酸的碱基分别用不同的荧光标记, 在通过毛细管时
不同长度的 DNA片段上的 4种荧光基团被激光激
发,发出不同颜色的荧光,被 CCD检测系统识别, 并
直接翻译成 DNA序列。
24 杂交测序技术
杂交法测序是 20世纪 80年代末出现的一种测
序方法,该方法不同于化学降解法和 Sanger法, 而
是利用 DNA杂交原理,将一系列已知序列的单链寡
核苷酸片段固定在基片上,把待测的 DNA样品片段
变性后与其杂交, 根据杂交情况排列出样品的序列
65
生物技术通报 B iotechnology  Bulletin 2010年第 8期
信息 [ 18]。杂交测序检测速度快, 采用标准化的高密
度寡核苷酸芯片能够大幅度降低检测的成本 [ 19] ,具
有部分第二代测序技术的特点。但该方法误差较
大,且不能重复测定。
3 第二代 DNA测序技术
随着人类基因组计划的完成, 人们进入了后基
因组时代,即功能基因组时代, 传统的测序方法已经
不能满足深度测序和重复测序等大规模基因组测序
的需求,这促使了新一代 DNA测序技术的诞生。新
一代测序技术也称为第二代测序技术, 主要包括罗
氏 454公司的 GS FLX测序平台、Illum ina公司的
Solexa Genome Analyzer测序平台和 ABI公司的 SOL
iD测序平台 [ 20]。
第二代测序技术最显著的特征是高通量, 一次
能对几十万到几百万条 DNA分子进行序列测序,使
得对一个物种的转录组测序或基因组深度测序变得
方便易行 [ 21]。
新一代测序技术将片段化的基因组 DNA两侧
连上接头,随后用不同的方法产生几百万个空间固
定的 PCR克隆阵列。每个克隆由单个文库片段的
多个拷贝组成。然后进行引物杂交和酶延伸反应。
由于所有的克隆都在同一平面上, 这些反应就能够
大规模平行进行,每个延伸反应所掺入的荧光标记
的成像检测也能同时进行, 从而获得测序数据。
DNA序列延伸和成像检测不断重复, 最后经过计算
机分析就可以获得完整的 DNA序列信息 [ 22]。
31 454测序技术
454生命科学公司在 2005年最早推出了第二
代测序平台 Genom e Sequencer 20, 并测序了支原体
Mycop lasma genitalium 的基因组 [ 23]。并在 2007年
推出性能更优的第二代基因组测序系统 # Genome
Sequencer FLX System ( GS FLX )。罗氏在 2005年便
与 454公司洽谈并购事宜, 2007年完成并购, 紧接
着公布了 DNA双螺旋的发现者之一 # # # 沃森 ( Jim
W atson)的个人基因组, 测序总花费不到一百万美
元 [ 24, 25 ]。454公司在 2010年即将推出初级版的新
一代测序仪 GS Jun io r, 预计每次反应能得到 100 000
条序列,是 GS FLX的十分之一, 读取的序列平均长
度为 400 bp, 准确率达 99%, 更适合规模较小的实
验室 [ 26]。 454测序技术利用了焦磷酸测序原理 [ 25 ] ,
主要包括以下步骤。
311 文库准备 将基因组 DNA打碎成 300 -
800 bp长的片段 (若是 snRNA或 PCR产物可以直
接进入下一步 ) ,在单链 DNA的 3∀端和 5∀端分别
连上不同的接头。
312 连接 带有接头的单链 DNA 被固定在
DNA捕获磁珠上。每一个磁珠携带一个单链 DNA
片段。随后扩增试剂将磁珠乳化, 形成油包水的混
合物,这样就形成了许多只包含一个磁珠和一个独
特片段的微反应器。
313 扩增 每个独特的片段在自己的微反应器
里进行独立的扩增 (乳液 PCR, emu lsion PCR) ,从而
排除了其它序列的竞争。整个 DNA 片段文库的扩
增平行进行。对于每一个片段而言, 扩增产生几百
万个相同的拷贝。乳液 PCR终止后,扩增的片段仍
然结合在磁珠上。
314 测序 携带 DNA的捕获磁珠被放入 PTP
板中进行测序。PTP孔的直径 ( 29 m)只能容纳一
个磁珠 ( 20 m)。放置在 4个单独的试剂瓶里的 4
种碱基,依照 T、A、C、G的顺序依次循环进入 PTP
板, 每次只进入一个碱基。如果发生碱基配对,就会
释放一个焦磷酸。这个焦磷酸在 ATP硫酸化酶和
荧光素酶的作用下,释放出光信号,并实时地被仪器
配置的高灵敏度 CCD捕获到。有一个碱基和测序
模板进行配对,就会捕获到一分子的光信号;由此一
一对应,就可以准确、快速地确定待测模板的碱基
序列 [ 27]。
与其它第二代测序平台相比, 454测序法的突
出优势是较长的读长,目前 GS FLX测序系统的序
列读长已超过 400 bp。虽然 454平台的测序成本
比其他新一代测序平台要高很多, 但对于那些需
要长读长的应用, 如从头测序, 它仍是最理想的
选择。
32 So lexa测序技术
Illum ina公司的新一代测序仪 G enome Analyzer
最早由 So lexa公司研发, 利用合成测序 ( Sequencing
by Synthesis)的原理,实现自动化样本制备及大规模
平行测序。
Genome Ana lyzer技术的基本原理是将基因组
DNA打碎成约 100- 200个碱基的小片段, 在片段
66
2010年第 8期     解增言等: DNA测序技术的发展历史与最新进展
的两个末端加上接头 ( adapter)。将 DNA片段变成
单链后通过接头与芯片表面的引物碱基互补而使一
端被固定在芯片上。另外一端随机和附近的另外一
个引物互补, 也被固定住, 形成桥状结构。通过 30
轮扩增反应,每个单分子被扩增大约 1 000倍, 成为
单克隆的 DNA簇, 随后将 DNA簇线性化。在下一
步合成反应中,加入改造过的 DNA聚合酶和带有 4
种荧光标记的 dNTP。在 DNA合成时, 每一个核苷
酸加到引物末端时都会释放出焦磷酸盐, 激发生物
发光蛋白发出荧光。用激光扫描反应板表面, 在读
取每条模板序列第一轮反应所聚合上去的核苷酸种
类后, 将这些荧光基团化学切割,恢复 3∀端黏性,随
后添加第二个核苷酸。如此重复, 直到每条模板序
列都完全被聚合为双链。这样,统计每轮收集到的
荧光信号结果, 就可以得知每个模板 DNA片段的
序列 [ 28]。
Genome Analyzer系统需要的样品量低至 100
ng,文库构建过程简单, 减少了样品分离和制备的时
间,配对末端读长可达到 2 ∃ 50 bp,每次运行后可获
得超过 20GB的高质量过滤数据,且运行成本较低,
是性价比较高的新一代测序技术。
33 SOLiD测序技术
SOL iD全称为 Supported O ligo Ligation Detetion,
是 ABI公司于 2007年底推出的全新测序技术,目前
已发展到 SOLiD 3 Plus。与 454和 So lexa的合成测
序不同, SOLiD是通过连接反应进行测序的。其基
本原理是以四色荧光标记的寡核苷酸进行多次连接
合成, 取代传统的聚合酶连接反应。具体步骤包括:
331 文库准备 SOLiD系统能支持两种测序模
板:片段文库 ( fragm ent library )或配对末端文库
(m atepaired library)。片段文库就是将基因组 DNA
打断, 两头加上接头, 制成文库。该文库适用于转录
组测序、RNA 定量、m iRNA 研究、重测序、3∀, 5∀
RACE、甲基化分析及 ChIP测序等。配对末端文库
是将基因组 DNA打断后,与中间接头连接,环化,然
后用 E coP15酶切,使中间接头两端各有 27 bp的碱
基,最后加上两端的接头, 形成文库。该文库适用于
全基因组测序、SNP分析、结构重排及拷贝数分
析等。
332 扩增 SOL iD用的是与 454技术类似的乳
液 PCR对要测序的片段进行扩增。在微反应器中
加入测序模板、PCR反应元件、微珠和引物, 进行乳
液 PCR ( emulsion PCR )。PCR反应结束后, 磁珠表
面就固定有拷贝数目巨大的同一 DNA模板的扩增
产物。
333 微珠与玻片连接 乳液 PCR完成之后, 变
性模板,富集带有延伸模板的微珠,微珠上的模板经
过 3∀修饰,可以与玻片共价结合。 SOL iD系统最大
的优点就是每张玻片能容纳更高密度的微珠, 在同
一系统中轻松实现更高的通量。含有 DNA模板的
磁珠共价结合在 SOL iD玻片表面, SOL iD测序反应
就在 SOL iD玻片表面进行。每个磁珠经 SOLiD测
序后得到一条序列。
334 连接测序 SOL iD连接反应的底物是 8碱
基单链荧光探针混合物。探针的 5∀端用 4种颜色的
荧光标记,探针 3∀端第 1、2位碱基是 ATCG 4种碱
基中的任何两种碱基组成的碱基对, 共 16种碱基
对, 因此每种颜色对应着 4种碱基对。 3- 5位是随
机的 3个碱基。 6- 8位是可以和任何碱基配对的
特殊碱基。单向 SOL iD测序包括 5轮测序反应, 每
轮测序反应含有多次连接反应,得到原始颜色序列。
SOL iD序列分析软件根据 双碱基编码矩阵 !把碱
基序列转换成颜色编码序列, 然后与 SOLiD原始颜
色序列进行比较。由于双碱基编码规则中一种颜色
对应 4种碱基对, 前面碱基对的第二个碱基是后面
碱基对的第一个碱基,所以一个错误颜色编码就会
引起连锁的解码错误,改变错误颜色编码之后的所
有碱基。 SOL iD序列分析软件可以对测序错误进行
自动校正,最后 解码!成原始序列。因为 SOL iD系
统采用了双碱基编码技术, 在测序过程中对每个碱
基判读两遍,从而减少原始数据错误,提供内在的校
对功能, 得到的原始碱基数据的准确度大于
9994%, 而在 15X覆盖率时的准确度可以达到
99999%,是目前新一代基因分析技术中准确度最
高的 [ 29, 30 ]。
超高通量是 SOLiD系统最突出的特点, 目前
SOL iD 3单次运行可产生 50 GB的序列数据, 相当
于 17倍人类基因组覆盖度。
3种新一代测序技术各有所长, 它们各种特点
的对比见表 1。
67
生物技术通报 B iotechnology  Bulletin 2010年第 8期
表 1 三种第二代测序技术对比
测序技术 454 S olexa SOL iD
上市时间 2005 2007 2007
价格 ( 万美 元,
2007年 ) 50 45 59
单次反应数据量
( G )
0. 4 20 50
读长 ( bp) 400 50 ∃ 2 50
优势 长读长 低测序成本,高性价比
高通量,高准
确度
34 第二代测序技术的应用
34. 1 从头测序 ( denovo sequencing) 对于基因
组未被测序过的生物,其基因组测序需要从头测序。
由于受测序读取长度的限制,新一代测序技术中只
有 454技术能独立完成复杂基因组如真核生物基因
组的从头测序工作。 So lexa和 SOL iD技术只能完成
简单生物如细菌的基因组的从头测序。在复杂基因
组的从头测序中, 将 So lexa /SOLiD与 454技术或传
统的 Sanger测序技术结合,分别利用它们的高通量
和较长读长的优势,可以大大降低测序成本,提高测
序速度。如最近完成的黄瓜全基因组测序, 就联合
运用了 Solexa技术和 Sanger技术,得到平均 722倍
覆盖度的黄瓜基因组序列, 其中 39倍是用 Sanger
技术得到的, 68. 3倍是用 So lexa的 GA测序平台得
到的 [ 31]。
34. 2 重测序 如果对照一个参考基因组,新一代
测序技术可以短时间内非常轻松的完成一个基因组
的重测序。 2008年, 由中国、美国和英国共同启动
的千人基因组计划 ( 1000Genomes Project)是人类基
因组计划的延续,也是迄今为止最大的基因组重测
序计划。该计划打算测序大约 1 200个全世界不同
国家的人类个体的基因组。454、AB I和 Illum ina共
同加入该计划 [ 32]。
34. 3  SNP研究 SNP全称是 Sing le Nucleot ide
Po lymorphism,意即单核苷酸多态性, 是指不同个体
的基因组上单个核苷酸的变异,包括替换、缺失和插
入。SNP在基因组中分布相当广泛,一般来说, SNP
是指变异频率大于 1%的单核苷酸变异 。 SNP可以
作为新的遗传标记,人体许多表型差异、对药物或疾
病的易感性等等都可能与 SNP有关。研究 SNP是
人类基因组计划走向应用的重要一环, 因为 SNP将
提供一个强有力的工具,用于高危群体的发现、疾病
相关基因的鉴定、药物的设计和测试以及生物学的
基础研究等 [ 33, 34]。
新一代测序技术利用其高通量、低成本的优势,
对较多的个体测序,很容易可以得到大量的 SNP位
点。千人基因组计划即可得到众多的人类基因组
SNP位点。其它的在 SNP研究中的应用如利用 So l
exa测序技术对线虫 CB4858品系进行重测序,寻找
线虫 ( Caenorhabditis elegance )基因组中的 SNP位
点 [ 35] , 以及寻找橄榄型油菜 (B rassica napus )转录组
( transcriptome)中的 SNP位点 [ 36 ]等。
34. 4 转录组及表达谱分析 基因表达谱 ( gene
expression pro file)指细胞在特定的条件下表达的所
有基因。分析基因表达谱是了解组织或器官行使功
能的分子基础及环境和病变影响生物的分子机制等
的重要手段。以往的基因表达谱分析主要依靠基因
芯片技术,该技术需要依赖已知的基因序列来设计
探针,通过荧光标记和杂交, 根据荧光的强度计算表
达量的多少,误差较大, 而且无法检测未知基因的表
达量。
第二代测序技术可对单个细胞样品中的所有
RNA即整个转录组进行整体测序,对每个细胞中表
达 1- 50 000个拷贝 mRNA的基因都能够检测, 该
技术还可以检测以前没发现过的基因或新的转录本
( transcript) ,定量测定基因的表达模式 [ 37]。如 Mor
tazav i等 [ 38]利用 So lexa技术对小鼠的大脑、肝脏和
骨骼肌进行了 RNA测序, 对测得的每条序列进行计
数从而获得每个特定转录本的表达量,能检测到丰
度非常低的转录本。分析测得的序列,至少有 3 500
个基因拥有不止一种剪切形式,其中有接近 10%是
从未被报道过的 RNA的剪切形式。同年 Sugarbak
er
[ 39, 40]利用 mRNA深度测序对恶性胸膜瘤和对照
样品进行比较,发现了肿瘤细胞基因组中存在的 15
个不同的点突变。
34. 5 小分子 RNA( m iRNA )研究 第二代测序技
术还被广泛应用于小分子 RNA (m icroRNA, m iRNA )
或非编码 RNA ( ncRNA )表达研究。非编码的小分
子 RNA参与了许多重要的生物发育过程 [ 41]。它们
68
2010年第 8期     解增言等: DNA测序技术的发展历史与最新进展
的序列长度很短,只有 18- 40个核苷酸, 正好在新
一代高通量测序技术的读长范围内。第二代测序方
法还能发现新的小分子 RNA。如利用 Illum ina的新
一代测序技术对人胚胎干细胞发育前后的分析,获
得了 334个已知的和 104个新发现的小 RNA的表
达谱 [ 42]。
34. 6 转录调控研究 ( ChIPseq) 染色体免疫共
沉淀 ( chromat in immunoprecipitation, ChIP )技术是研
究蛋白 DNA相互作用的重要方法。以往的研究需
结合芯片技术 (即 Ch IPonchip或 ChIPch ip) ,因为
芯片技术基于杂交原理, 需根据已知的序列设计探
针,对于未知的序列无能为力。把 Ch IP技术和第二
代测序技术结合,即 ChIPsequencing( ChIPseq) ,可
以在基因组水平上很方便的检测某种蛋白所结合的
DNA序列,全面了解蛋白与 DNA的相互作用。如
2009年 Ouyang等 [ 43]利用 ChIPseq技术发现, 在小
鼠胚胎干细胞中, 大约有 65%的基因表达是由 12
个转录因子调控的。
4 第三代 DNA测序技术
第二代测序技术以其高通量、低成本的优势,很
快得到了广泛的应用。最近,以单分子测序为特点
的第三代 DNA测序技术已经出现,如生物科学公司
( B ioSc ience Corporat ion)的 He liScope单分子测序仪
(H eliScope S ing leM olecular Sequencer)
[ 44, 45]以及正
在研制的太平洋生物科学公司 ( Pacif ic B iosciences)
的单分子实时 DNA测序技术 [ S ingle M o lecu le Real
T ime ( SMRT) DNA sequencing techno logy]
[ 46]和牛津
纳米孔技术公司 ( Ox fo rd N anopore Techno log ies L td)
的纳米孔单分子测序技术 [ 47 ]等 [ 48, 49]。
斯坦福大学的科学家最近利用 H eliscope单分
子测序仪,用了 48 000美元的试剂和 4个星期的时
间,对一名白人男子的基因组进行了测序。测序的
覆盖度达 28倍, 覆盖了 90%的人类参考基因组。
序列读长 24 - 70 bp, 平均读长为 32 bp, 并鉴定出
280万个 SNP位点和 752个拷贝数变异 [ 50]。
目前,我国也启动了第三代测序技术的研究。
2009年 12月, 中科院北京基因组研究所与浪潮成
立 中科院北京基因组研究所 # 浪潮基因组科学联
合实验室!, 利用各自的优势联合研发国产第三代
测序仪,第一台样机预计 2013年问世, 届时有望缓
解测序仪核心技术受制于国外公司的现状。
5 展望
DNA测序技术经过 30多年的发展, 目前已经
到了第三代,三代测序技术有各自的优势。第一代
测序技术虽然成本高,速度慢,但是对于少量的序列
来说,仍是最好的选择, 所以在以后的一段时间内仍
将存在;第二代测序技术刚刚商用不久,正在逐渐走
向成熟;第三代测序技术有的刚刚出现,有的则正在
研制,相信很快便可进行商业化运作。可以预见,在
未来的几年里会出现三代测序技术共存的局面。
随着新的测序技术的出现,大规模测序的成本
迅速下降,花费 1 000美元测一个人的基因组的目
标相信很快就可以实现。届时, 对于遗传病的诊治
将变得简单、快速, 并能从基因组水平上指导个人的
医疗和保健,从而进入个人化医疗的时代。
同时, 生物学研究的进展将会更多地依赖于测
序技术的进步,不同领域的科学家花很少的钱就可
以对自己熟悉的物种基因组进行测序,从而更好地
指导试验设计,取得更多新发现。
参 考 文 献
[ 1 ] M axam AM, G ilbert W. A new m ethod for sequen cing DNA. Proc
Natl Acad SciUSA, 1977, 74( 2 ) : 560564.
[ 2] S anger F, N ick len S, C ou lson AR. DNA sequen cing w ith chain ter
m in at ing inh ib itors. Proc Nat l Acad Sci USA, 1977, 74 ( 12 ):
54635467.
[ 3 ] S anger F. The term in alp ept ides of in su lin. B iochem J, 1949, 45( 5 ):
563574.
[ 4] Sanger F, Thomp son EO. The am ino acid sequ ence in the glycy l
cha in of insul in. I. The ident ification of low er p ept ides from partial
hyd rolysates. B iochem J, 1953, 53( 3) : 353366.
[ 5] Sanger F, Thomp son EO. The am ino acid sequ ence in the glycy l
cha in of insul in. II. Th e invest igation of pep tides from enzym ic hy
dro lysates. B iochem J, 1953, 53( 3 ): 366374.
[ 6] E dman P. M ethod for d eterm in at ion of the am ino acid sequ ence in
pep tid es. Acta Ch em Scand, 1950, 4: 283293
[ 7 ] N ial lHD. Autom ated Edm an degradat ion: th e protein sequ enator.
M ethods Enzym o,l 1973, 27: 9421010.
[ 8] S anger F, B row nlee GG, B arrell BG. A tw od im en sional fract ionation
procedu re for radioact ive nu cleot ides. JM olB io,l 1965, 13 ( 2) : 373
398.
[ 9 ] H o lley RW, Apgar J, Everett GA, et a.l St ru cture of a ribonu cleic
acid. Science, 1965, 147: 14621465.
69
生物技术通报 B iotechnology  Bulletin 2010年第 8期
[ 10 ] H olley RW, E verettGA, M ad ison JT, et a.l Nu cleot ide sequences in
the yeast alan ine transfer tibonu cleic acid. JB iolCh em, 1965, 240:
21222128.
[ 11 ] S anger F, C ou lsonAR. A rap idm eth od for d eterm in ing sequen ces in
DNA by p rim ed synthes is w ith DNA po lym erase. JMo lB io,l 1975,
94( 3 ): 441448.
[ 12 ] Maxam AM, G ilbert W. Sequ encing end lab eled DNA w ith base
specif ic chem ical cleavages. M ethods E nzym o,l 1980, 65 ( 1 ) :
499560.
[ 13 ] Sm ith LM, Fung S, H unkap illerMW, et a.l The synthesis ofo ligonu
cleotides con tain ing an aliphatic am ino group at the 5∀ term inus:
syn th es is of f luorescent DNA prim ers for use in DNA sequence a
nalys is. Nucleic A cids Res, 1985, 13 ( 7) : 23992412.
[ 14 ] Jorgen son JW, Luk acsKD. Free zone electrophores is in g lass cap il
laries. C lin Chem, 1981, 27 ( 9) : 15511553.
[ 15 ] Jorgen son JW, Luk acsKD. C ap illary zone electrophoresis. Science,
1983, 222( 4621 ): 266272.
[ 16 ] H uang XC, Quesada MA,M ath ies RA. DNA sequencing us ing capil
lary array electrophoresis. Anal Chem, 1992, 64( 18 ): 21492154.
[ 17 ] W ool ley AT, M ath ies RA. U ltrah igh speed DNA sequen cing us ing
cap illary electrophores is ch ips. An al C hem, 1995, 67 ( 20 ) :
36763680.
[ 18 ] Drm an ac R, Labat I, B rukner I, et a.l S equencing ofm egabase plus
DNA by hybrid izat ion: theory of the m ethod. G enom ics, 1989, 4
( 2) : 114128.
[ 19 ] 邱超,孙含丽,宋超. DNA测序技术发展历程及国际最新动态.
硅谷, 2008 ( 17) : 127129.
[ 20 ] Shendure J, J iH. N extgenerat ion DNA sequen cing. Nat B iotechn
o,l 2008, 26( 10 ): 11351145.
[ 21 ] Schu ster SC. N extgenerat ion sequen cing transform s todays b iolo
gy. NatM ethods, 2008, 5 ( 1) : 1618.
[ 22 ] 于亮.放眼未来,看新一代测序.生物通, 2009, 68: 24.
[ 23 ] M argu liesM, Egholm M, A ltmanWE, et a.l G enom e sequencing in
m icrofab ricated h ighdens ity picolitre reactors. Nature, 2005, 437
( 7057 ): 376380.
[ 24 ] W heeler DA, Srin ivasanM, Egho lm M, et a.l The comp lete genom e
of an ind ividual by m ass ively parallel DNA sequencing. Nature,
2008, 452( 7189 ): 872876.
[ 25 ] ht tp: / /www. 454. com /.
[ 26 ] ht tp: / /www. gs jun ior. com /.
[ 27 ] 于亮.新一代测序技术之三国时代 (中 ) : Roche /454.生物通,
2009, 68: 810.
[ 28 ] 于亮. 新一代测序技术之三国时代 (上 ): Illum in a. 生物通,
2009, 68: 57.
[ 29 ] 于亮,吴青. 新一代测序技术之三国时代 (下 ) : AB I. 生物通,
2009, 68: 1114.
[ 30] h ttp: / / solid. appl iedb iosystem s. com /
[ 31] H uang S, L iR, Zhang Z, et a.l The genom e of the cucumber, cucu
m is sativus L. NatG enet, 2009, 41( 12) : 12751281.
[ 32] http: / /www. 1000genom es. org /page. php.
[ 33] Sach idanandam R, W eissm anD, S chm id tSC, et a.l A m ap ofhum an
genom e sequen ce variation con taining 142 m illion s ingle nucleo
t ide polym orph ism s. Natu re, 2001, 409( 6822 ) : 928933.
[ 34] B errim anM, Pain A. V ariety is the sp ice of eukaryot ic life. NatRev
M icrob io,l 2007, 5( 9) : 660661.
[ 35] H ill ier LW, M arth GT, Qu in lan AR, et a.l W holegenom e sequen
cing and varian t d iscovery inC. elegan s. NatM ethod s, 2008, 5( 2 ):
183188.
[ 36] T rick M, Long Y, M eng J, et a.l S ingle nucleot ide polym orph ism
( SNP) discovery in the polyploidB ra ssica napu s us ing Solexa tran
scrip tom e sequencing. Plant B iotechnol J, 2009, 7 ( 4) : 334346.
[ 37] Morozova O, H irstM, M arra MA. App lications of new sequen cing
techno log ies for transcrip tom e analysis. Annu Rev Genom ics Hum
Genet, 2009, 10: 135151.
[ 38] M ortazaviA, W illiam s BA, M cCu e K, et a.l M app ing and qu ant if
y ing m amm alian tran scrip tom es by RNASeq. NatM ethods, 2008, 5
( 7) : 621628.
[ 39] Sugarb aker DJ, R ichardsWG, Gordon G J, et a.l T ranscrip tom e se
qu encing ofm alignant p leura lm esothelioma tum ors. Proc NatlA cad
S ciUSA, 2008, 105( 9) : 35213526.
[ 40] 滕晓坤,肖华胜.基因芯片与高通量 DNA测序技术前景分析.
中国科学, 2008, 38 ( 10) : 891899.
[ 41] H ut tenhofer A, Schattner P, Polacek N. N on cod ing RNAs: hope or
hype?. T rend sGen et, 2005, 21 ( 5) : 289297.
[ 42] Morin RD, O∀ConnorMD, G rif fithM, et a.l Appl icat ion ofmassively
parallel sequ encing to m icroRNA prof iling and d iscovery in hum an
emb ryon ic stem cells. Genom e Res, 2008, 18( 4) : 610621.
[ 43 ] Ouyang Z, Zhou Q, Wong WH. Ch IPSeq of transcript ion factors
pred icts absolu te and differen tialgene exp ress ion in em bryon ic stem
cells. Proc Nat lAcad S ciU SA, 2009, 106( 51 ) : 2152121526.
[ 44] H arris TD, Buzby PR, Babcock H, et a.l S inglemo lecu le DNA se
qu encing of a viral genom e. S cience, 2008, 320( 5872 ): 106109.
[ 45] h ttp: / /www. helicosb io. com /.
[ 46] h ttp: / /www. pacificb iosciences. com /.
[ 47] h ttp: / /www. nanoporetech. com /.
[ 48] Rusk N. Cheap th irdgeneration sequen cing. Natu re, 2009, 6( 4 ):
244245.
[ 49] 孙海汐,王秀杰. DNA测序技术发展及其展望. eScience技术,
2009, 6: 2426.
[ 50] Pushkarev D, Neff NF, Quake SR. S inglem olecule sequencing of an
ind iv idual hum an genom e. Nat B iotechno,l 2009, 27( 9) : 847852.
70