免费文献传递   相关文献

High-throughput sequencing technology and its application in epigenetics

高通量测序技术及其在表观遗传学上的应用



全 文 :第24卷 第7期
2012年7月
Vol. 24, No. 7
Jul., 2012
生命科学
Chinese Bulletin of Life Sciences
文章编号:1004-0374(2012)07-0705-07
高通量测序技术及其在表观遗传学上的应用
张际峰1, 2*,王 洋2,汪成润1,聂刘旺3
(1 淮南师范学院生命科学系, 淮南 232001; 2 复旦大学生命科学学院, 上海 200433;
3 安徽师范大学生命科学学院, 芜湖 241000)
摘 要:DNA测序技术是现代生命科学研究的重要工具之一,而高通量测序技术在全基因组的研究中发挥
着越来越重要的作用。简要回溯 DNA测序技术的产生与发展,着重从 PCR扩增测序和单分子测序两个方
面全面描述了高通量测序中众多代表性的技术及直接测序技术,并从 DNA甲基化、组蛋白修饰、非编码
RNA调控等方面阐述了高通量测序技术在表观遗传学上的运用。
关键词:高通量测序;表观遗传学;DNA甲基化;组蛋白修饰;非编码 RNA
中图分类号:Q34;Q755 文献标识码:A
High-throughput sequencing technology and its application in epigenetics
ZHANG Ji-Feng1, 2*, WANG Yang 2, WANG Cheng-Run1, NIE Liu-Wang3
(1 Department of Life Science, Huainan Normal University, Huainan 232001, China; 2 School of Life Science, Fudan
University, Shanghai 200433, China; 3 College of Life Science, Anhui Normal University, Wuhu 241000, China)
Abstract: The DNA sequencing technology is one of the most powerful tools in modern life science research, and
the high-throughput sequencing technologies play a key role in genomic sequencing of different organisms. Here,
we presented a brief review of the invention and development of the DNA sequencing technologies. Furthermore,
we described the representative sequencing technologies and their instruments of high-throughput sequencing
technologies, which could be divided into two categories, PCR-based sequencing and single molecule sequencing.
Then we also provided insights into their future directions. In addition, the availability of high-throughput
sequencing technologies has recently allowed the survey of genome-wide epigenetic variation, such as DNA
methylation, histone modification and noncoding RNAs, and we described some of these approaches briefly.
Key words: high-throughput sequencing; epigenetics; DNA methylation; histone modification; noncoding RNAs
收稿日期:2012-03-25; 修回日期:2012-05-19
基金项目:安徽省高校省级自然科学研究项目(KJ2011
B161, KJ2010B443);国家自然科学基金项目(3037-
0211)
*通信作者:E-mail: jifengzhang2007@sina.com
DNA测序技术始于 20世纪中叶,最为经典的
代表是 1977年英国剑桥的 Sanger提出的末端终止
法 [1]和美国哈佛的 Alan Maxam和Walter Gilbert同
年发明的的化学裂解法 [2]。它们被称之为经典 DNA
测序法或称手工 DNA测序法,而其中 Sanger测序
法一直沿用至今,是应用最为广泛的方法之一 [3]。
此后,该技术也有一定的改进和提高,如运用四色
荧光替代了有害健康的放射性同位素对 DNA进行
标记;利用高效灵敏的毛细管电泳替代了传统的凝
胶电泳等。这些都大大提高了其分辨率与分离效率,
使得测序技术有了突破性的发展 [4]。目前商业化的
Sanger测序法测序仪有 ABI公司的 ABI3730自动
测序仪和 Amersham公司的 MegaBACE等。值得
一提的是,这些测序仪在人类基因组计划的 DNA
测序后期起到了关键的作用,也加速了人类基因组
计划的完成。读长长 (大于 1 000 bp)和准确率高 (可
以达到 99.99%以上 )等优势使其至今在 DNA测序
领域还占一席之地。
∙ 技术与应用 ∙
生命科学 第24卷706
然而传统测序技术存在对电泳分离技术的依
赖,无法进一步提升分析速度和并行化程度,很难
降低测序成本等局限 [5]。因此,新的测序方技术由
此诞生。
1 高通量测序技术
高通量测序技术属于一类循环阵列合成测序的
技术群。这类技术首先都是将基因组 DNA随机片
段化、制备文库,通过对数以万计克隆阵列 (polony)
的延伸反应产生信号的检测,最终获取测序的信息。
该技术有两个方面的突出优势:其一,通过使用微
阵列配置实现大规模的并行化测序,提高测序效率;
其二,无需电泳分离过程和细菌转染、质粒制备等
克隆过程,设备趋于微型化,从而降低了各环节的
成本,节省了时间和人力 [5-6]。2005年,以 454焦磷
酸测序为代表的高通量测序技术被首次报道后,其
他各类相关测序技术相继出现 [7]。根据所分析样本
在测序前是否需要 PCR克隆扩增,可将其分为
PCR扩增测序和单分子测序 [3,8]两大类。
1.1 PCR扩增测序
目前,在 PCR扩增测序技术中,较为成熟的
主要有 Roche公司的 454焦磷酸技术、Illumina公
司的 Solexa 技术、ABI 公司的 SOLiD 技术、Po-
lonator G.007和 Complete Genomics等。这些技术
分别使用了不同的测序原理,简述如下。
1.1.1 454焦磷酸测序
作为最早的商业化运营的测序平台,Roche公
司的 454焦磷酸测序技术核心是借助微乳滴 PCR
技术 (emulsion PCR)来实现 DNA片段的扩增,利
用焦磷酸法检测是一类边合成边测序 (sequencing
by synthesis)[9]技术。
首先,单链 DNA文库构建,即待测小片段通
过接头 (adaptor)与磁珠相连,构建每个磁珠仅含单
条序列的文库。其次,DNA片段微乳滴 PCR,即
扩增试剂将磁珠乳化,形成油包水的微反应器。每
个特定的片段在各自的微反应器里进行独立的微乳
滴 PCR扩增。最后,焦磷酸测序,即将混合物转
移并放置到 PicoTiterPlate(PTP)板中进行测序。4种
dNTP都按照一定顺序流入 PTP板,依次循环。如
果发生碱基配对,就会释放一个焦磷酸基团。这个
焦磷酸在相关酶的作用下产生级联反应,最终获得
测序相关的光信号。
与其他高通量测序技术相比,454焦磷酸测序
技术的主要优势是速度和读长,最新的 GS FLX Ti-
tanium系列试剂和软件能使该技术的平均读取长度
达到 400 bp。它更有助于后续的序列拼接工作。然
而,该技术的一个缺陷在于其缺乏一种用于阻断相
同碱基连续进入的终止机制,因此,导致该技术测
序结果常出现插入或缺失等错测类型。此外,焦磷
酸检测依赖于一系列酶的参与,无疑提高了测序成
本 [10-11]。
1.1.2 Solexa测序
Illumina公司的 Solexa测序是一种单分子阵列
原位扩增测序。Solexa测序的技术核心是通过桥式
PCR产生“DNA簇”和“可逆性末端终结 ( revers-
ible terminator) [12-13]。
DNA片段两端加上非对称的接头,它与芯片
上的寡核苷酸杂交而固定在芯片表面上,形成寡核
苷酸“桥状”结构。随后以寡核苷酸为引物进行桥
式 PCR(bridge PCR)。Solexa测序仪的边合成边测
序法使用了荧光标记的核苷酸以及可逆的末端终
结。所谓的“可逆性末端终结”即为每个核苷酸的 3
端带有能够封闭 dNTP的 3’端黏性基团,且又可用
化学切除方法恢复其黏性,继续聚合下一个 dNTP,
直到测序完成。因此,能够保证测序的每个循环只
掺入单个碱基,这是与 454测序技术的重要区别之
一。
与 454测序相比,Solexa测序技术拥有更高的
通量,更低的成本。在生物基因组的重测序工作中,
该技术发挥着很大的优势。而序列读长较短是其主
要技术瓶颈。Solexa技术主要的错误来源是核苷酸
的替换。2010年,该公司推出了一款新的高通量测
序系统——HiSeq 2000测序平台在序列读长方面已
有所改善。
1.1.3 SOLiD测序
ABI公司的 SOLiD (Supported Oligo Ligation
Detection)测序系统于 2007年 10月投入商业使用。
其构建 DNA文库和微乳滴 PCR等的技术步骤与
454焦磷酸测序技术极为相似,只是磁珠直径只有
后者的 1/20。而 SOLiD技术独特之处在于其连接
反应的“双碱基校正”技术 [14-15]。
SOLiD技术连接反应的底物是 8 bp长的核苷
酸单链荧光探针。该探针 5端均有荧光标记,其 3
端前两个位置的碱基是确定的,它对应于 5端不同
的荧光信号颜色。一次 SOLiD测序常需多轮数次
反应才能完成 (通常有 5轮,每轮又常含 7次连接
反应 )。在第 1轮的第 1次其连接上一条探针,测
序仪会记录下该条 3端第 1~2位为确定碱基探针的
张际峰,等:高通量测序技术及其在表观遗传学上的应用第7期 707
荧光信号,随后切除该探针的第 6~8位 3个碱基和
其荧光信号基团,结果连接了 3端前 5个碱基 , 并
获得前两位碱基的荧光信号。以此类推,第 2次连
接反应得到探针的第 6~7位的颜色信息。每次获得
5个碱基长度及相应的荧光信号,多次连接反应后,
开始第 2轮测序。因第 2轮测序的引物比第 1轮前
移 1个碱基,该轮测序将依次得到第 0~1位、第
5~6位、第 10~11位……的荧光信号,经过 5轮的
测序,将得到所有位置的荧光信号,进而推断出相
应的碱基序列。利用这一技术,SOLiD测序系统单
次运行可产生 30~50 Gb的序列数据。
SOLiD测序的双碱基校正技术让每个碱基被重
复测定两次,以及测序引物更换和连接酶的运用都
能大大降低错误测序发生概率,使其成为准确率最
高的高通量测序技术之一 (准确度大于 99.94%)。
但因同一簇扩增产物存在移相问题,该技术序列读
长相对较短 (其长度多为 30~35 bp)。
1.1.4 Polonator 和Complete Genomics测序
Polonator G.007与 SOLiD技术类似,但它不
采用双碱基编码策略,而是利用单碱基探针。经微
乳滴 PCR的“DNA簇”接上通用接头,在连接酶
的作用下,与一个含有 9个碱基核苷酸荧光探针发
生一系列连接反应的测序技术 [6]。在 1次接连反应
结束后,系统也将被重置,在下一个碱基位置进行
引物与 9碱基探针第二次连接反应,经过这种反复
的重置和连接,最终获得所有位置的荧光信号信息。
Polonator测序价格较其他测序技术更低廉。还有因
系统被反复重置而使得测序错误不累加,但也因此
导致该技术读长更短。
2006年成立的 Complete Genomics公司发明的
Complete Genomics测序技术是与 Polonator测序技
术类似的另一类技术。它采用了独特的“纳米球”
设计,有效利用芯片的三维空间。具体而言,在
DNA片段两侧加上了 4个接头进行环形 PCR扩增,
获得数百个拷贝的产物折叠卷曲成球状结构——
DNA纳米球 (DNA nanoballs,DNBs),在芯片上形
成高密度的纳米球阵列。在测序方面,它也是单个
碱基读取荧光信号的连接测序,但是其采用了新颖
的组合探针锚定连接 (combinatorial probe-anchor li-
gation,cPAL)的方法 [16]。即 cPAL的荧光探针来源
独立的探针库,该探针又与锚定序列发生连接反应,
通过荧光颜色对应读取出相应的碱基信息。该技术
错误测序率可达到 Solexa测序 1/50,其快速和低成
本有望实现个人基因组测序服务。
1.2 单分子测序
PCR扩增测序虽然在诸多方面较传统 Sanger
测序技术有了不小的突破,但仍存在读长短、操作
复杂、成本高等种种缺陷。单分子测序技术能够直
接观察和测定核苷酸序列。它主要包括基于合成测
序技术的 HeliScope单分子测序、VisiGen单分子测
序和 Pacific Biosciences单分子实时测序等。
1.2.1 HeliScope和VisiGen单分子测序
2008年,Helicos Biosciences公司成功开发了
第一台单分子测序仪器——HeliScope系统。以边
合成边测序为基础,该技术优势在于采用一种新的
荧光类似物和能够直接记录单个碱基荧光的灵敏监
测系统。具体来说,无需 PCR扩增的核苷酸单链
直接进行合成延伸反应,在 DNA聚合酶作用下,
具有荧光标记的 4种单核苷酸逐一与模板链进行
互补配对延伸,并激发核苷标记物产生荧光。这些
荧光信号被全内反射显微镜 (total internal reflection
microscopy, TIRM)技术系统记录下来,最终转化为
测序信息。此后洗涤掉荧光物质,进行下一个延伸
反应 [17]。值得一提的是,HeliScope单分子测序在
投入商业运行时一度被测序的低准确率所困扰。双
向测序有望能够降低其单分子测序造成的“缺失”
错误发生率。
VisiGen生物技术公司研发了一种借助于“蛋
白质纳米装置”实时观察和记录 DNA聚合酶合成
DNA过程的单分子的合成测序仪 (2008年该公司被
Invitrogen公司收购 )。它主要利用了荧光供体在与
受体相靠近状态下,受体分子会激发产生荧光的荧
光能量转移现象这一原理,又被称为荧光共振能量
转移 (fluorescence resonance energy transfer, FRET)。
在 DNA延伸过程中,携带有荧光受体基团的底物
dNTP分子 (标记在 γ-磷酸上 )与携带有荧光供体
基团的 DNA聚合酶相接近,荧光能量转移发生,
产生相应荧光信号。通过全内反射显微镜记录和分
析荧光信号,并最终转换为 DNA序列信息 [15,18]。
1.2.2 Pacific Biosciences单分子实时测序
Pacific Biosciences公司开发了一种单分子实时
技术 (single molecule real time, SMRT)。该技术仍然
是以边合成边测序的方法为基础,利用一种叫做“零
级波导”(zero mode waveguide, ZMW)的纳米结构
实现实时观察 DNA的聚合。通过在金属薄片上蚀
刻出无数纳米级小孔 (小孔直径数十纳米,但小于
光的波长,使光线无法透过 ),光线照射能够使小
孔底部出现指数衰减的消逝波,产生一个很小体积
生命科学 第24卷708
的检测空间,同时在小孔底部固定 DNA聚合酶分
子。在边合成边测序过程中,聚合酶分子捕获具有
荧光标记的 dNTP底物 (标记在 γ-磷酸上 ),在检
测区产生荧光信号。通过连续实时的检测每个纳米
孔的荧光信号,SMRT技术的测序速度可以达到每
秒 10个碱基,准确率也相对较高 [19]。
1.3 直接测序
目前,无需 PCR扩增和 DNA合成等过程的直
接测序技术已经出现,但很多还只处于理论阶段的
研究。直接测序技术的具体思路是通过显微成像、
高分子和纳米技术等手段直接鉴别 DNA链上的 4
种碱基序列。目前主流理论有以下 3种类型。第一
类是利用非光学显微镜成像,直接获得线性排列核
苷酸序列。如日本大阪大学一研究小组利用扫描隧
道显微镜的图像,已可以将鸟嘌呤与其他 3种碱基
区分开来 [20]。第二类是纳米孔,即线性 DNA分子
在电场驱动下通过直径 1纳米左右生物小孔,利用
4种碱基在通过时电流发生的变化,直接读取 DNA
的序列 [21]。第三类是石墨烯和碳纳米管,利用其良
好的导电性,当 DNA分子垂直通过石墨烯上 1 nm
宽的缝隙时,缝隙两边的石墨烯边缘可以作为电极
来直接确定 DNA的序列。如哈佛大学一研究小组
正在致力于这项研究 [22]。
2 高通量测序技术在表观遗传学上的应用
表观遗传学 (epigenetics) 是研究与 DNA排序
无关的,但能在发育和细胞增殖过程中稳定遗传的
基因表达谱系或细胞表型现象、信息形式及机制的
一门遗传学交叉学科。表观遗传学的现象很多,
DNA甲基化 (DNA methylation)、组蛋白修饰 (histone
modification)、染色质重塑 (chromatin remodeling)、
非编码 RNA调控 (non-coding RNAs regulation)、基
因沉默、核仁显性、休眠转座子激活和性别相关性
基因剂量补偿效应等都是典型的表观遗传现象 [23];
而这些现象之间往往又相互影响,共同作用于表观
遗传修饰。如非编码 RNA(ncRNAs)就涉及了基因
表达调控的多种表观遗传机制 (图 1)。高通量测序
运用于表观遗传的研究,目前主要集中在 DNA甲
基化、组蛋白修饰及非编码 RNA调控等方面 [24]。
2.1 在DNA甲基化研究中的应用
研究 DNA甲基化的高通量测序技术方法主要
包括:全基因组重亚硫酸盐测序 (bisulfite sequenc-
ing,Bi-seq)和简化表达重亚硫酸盐测序 (reduced
representation bisulfite sequencing, RRBS)、甲基化
DNA免疫共沉淀测序 (methylated DNA immunopre-
cipitation sequencing, MeDIP-seq)、甲基化 DNA富
集结合高通量测序 (methylated DNA binding domain
sequencing, MBD-Seq)和甲基化敏感性限制酶测序
(methylation-sensitive Restriction Enzyme sequencing,
MRE-seq),以及单分子实时测序 (single-molecular、
real-time sequencing, SMRT)和单分子纳米孔技术的
测序 (single-molecule nanopore DNA sequencing) 等
技术。
2.1.1 Bi-seq和RRBS技术的表观遗传学应用
目前,重亚硫酸盐修饰被公认为 DNA甲基化
检测的“金标准”。它的原理为全基因组 DNA重亚
硫酸盐转换,经重亚硫酸盐处理后基因组 DNA未甲
基化胞嘧啶 (C) 转换为尿嘧啶 (U),而甲基化 C保持
不变。Bi-seq和 RRBS技术均是基于上述修饰。全
基因组 Bisulfite测序技术可以得到单碱基分辨率的
全基因组甲基化图谱。这一技术最初被 Cokus等 [25]
应用在植物拟南芥的全基因甲基化图谱分析上 (借
助了 Solexa测序技术 )。2009年,Lister等 [26]利用
全基因组 Bisulfite测序发表了第一篇人类的的全基
因组甲基化图谱 (利用了 Solexa测序 ),随后该技
术开始在人类疾病,如肥胖症的研究中得以应
用 [27]。基于对黄种人的外周血单核细胞 DNA样品
进行 Bisulfite处理后,结合 Solexa测序技术进行深
度测序,2010年,Li等 [28]成功绘制出了“炎黄一号”
高精确度的全基因组甲基化图谱。然而,重亚硫酸
盐法增加了测序的成本,在一定程度上限制了该技
术的广泛应用。但随着测序成本的不断下降,利用
Bisulfite测序技术进行小样本量间的全基因组范围
的精细差异分析,将会在疾病的甲基化致病机理研
究中发挥越来越重要的作用。
简化表达亚硫酸盐测序 (RRBS),又称基于酶
切消化的重亚硫酸盐测序是另一类的甲基化测序方
法,它是将限制性长度选择、重亚硫酸氢盐转化、
图1 几种重要的表观遗传修饰相互作用模式图
张际峰,等:高通量测序技术及其在表观遗传学上的应用第7期 709
PCR扩增及克隆技术相结合的一项技术,2005年,
Meissner等 [29]最初结合 Sanger测序发明了该项技
术,并将其成功应用于鼠胚胎干细胞去甲基转移
酶前后的甲基化谱的检测。接着Meissner领导的研
究小组通过改用MspI酶切来富集小鼠全基因组近
90%的 CpG岛片段,结合 Illumina公司的高通量
测序技术,建立并完善了适用于哺乳动物全基因组
甲基化测序分析的方法 [30]。2010年,该课题组又
发表了一篇关于 RRBS的文章,在其先前的工作基
础上进一步优化 RRBS技术并挖掘其在临床应用上
的潜力 [31]。此后,Smallwood等 [32]也将该技术应用
于哺乳动物成熟卵母细胞的甲基化作用检测研究。
2.1.2 MeDIP-seq、MBD-seq和MRE-seq技术的表
观遗传学应用
甲基化 DNA免疫共沉淀测序 (MeDIP-seq)主
要是利用特异性识别 5-甲基胞嘧啶 (5-mC)的抗体
的原理来富集基因组甲基化片段,并结合高通量测
序技术 [33]。该方法已被运用于癌症发病机理的研究,
如Ruike等 [34]选择 Illumina公司的高通量测序技术,
利用MeDIP技术对人类乳腺癌细胞系进行了全基
因组范围的甲基化研究。而甲基化 DNA富集结合
高通量测序 (MBD-Seq)方法的原理是通过特异性结
合甲基化 DNA的蛋白MBD2b或 5-mC抗体富集高
甲基化的 DNA片段,并结合高通量测序对富集到
的 DNA片段进行测序,从而检测全基因组范围内
的甲基化位点。 Serre等 [35]尝试利用这种方法研究
了具有不同甲基化程度的 3个同源癌症细胞株,寻
找到了很多新的甲基化区域,结果显示该方法具有
良好的灵敏性和特异性。甲基化敏感性限制酶测序
(MRE-seq)技术主要利用甲基化敏感性限制性酶
(methylation-sensitive restriction enzyme, MRE)对基
因组 DNA进行切割,未甲基化位点可以被酶切而
产生不同长度的片段,然后,结合高通量测序技术
获得序列的甲基化信息。利用MeDIP-seq和MRE-
seq技术对甲基化和非甲基化 DNA进行检测,Mau-
nakea等 [36]研究发现基因内部的甲基化作用对组织
特异性启动子有着重要的调控作用。
2.1.3 SMRT和单分子纳米孔测序技术的表观遗传
学应用
单分子实时测序法 (SMRT)是由 Flusberg 等 [37]
提出的一种直接检测 DNA甲基化的方法,其原理
是利用 DNA聚合酶进行边合成边收集荧光信号的
方法进行测序。它能直接测定 DNA模板上的核苷
酸修饰,包括 5-mC、N6-甲基腺嘌呤 (N6-mA)、5-
羟甲基化胞嘧啶 (5-hmC)。如 Pacific Biosciences 公
司发明的一种直径只有几十纳米的纳米孔 ( zero-
mode waveguides,ZMWs)装置 [38]可实现这一测序
技术。而单分子纳米孔技术的测序由 Bayley课题
组 [39]提出,单分子纳米孔测序仪能直接分辨出未
修饰的胞嘧啶和甲基化胞嘧啶,其原理是外切酶消
化后的单链 DNA以单个碱基的方式经过小孔,基
于这一过程产生的不同的电流信号和碱基滞留时间
进行测序。这两项技术的发展无疑大大加速了表观
遗传学研究的步伐。
2.2 在组蛋白修饰研究中的应用
组蛋白修饰包括甲基化、乙酰化、磷酸化、泛
素化和 SUMO化等。目前研究主要集中在组蛋白
甲基化和乙酰化修饰上。最常用研究方法应为染
色质免疫共沉淀测序 (chromatin immunoprecipitation
sequencing, ChIP-seq),它是染色质免疫沉淀技术
(ChIP)和高通量测序技术 (如 454焦磷酸测序、
Solexa、SOLiD和 Helicos单分子测序 )结合,其原
理主要是:先通过 CHIP技术特异性地富集能与目
的蛋白结合的 DNA片段,然后对这些 DNA片段
进行高通量测序,最后定位基因组信息,从而获
得全基因组范围内组蛋白 -DNA及染色质修饰等
DNA区段信息,是研究全基因组范围内组蛋白和
DNA互作的有力工具 [40]。目前 454焦磷酸测序、
Solexa测序、SOLiD测序及 HeliScope单分子测序
均能实现 ChIP-Seq的分析测序。
与先前的结合芯片技术 (CHIP-chip)技术相比,
ChIP-seq技术具有更高的准确性和更大的覆盖范围
等优势 [41]。2007年,ChIP-Seq技术最初被报道运
用于哺乳动物 T细胞和胚胎干细胞的组蛋白修饰研
究 [42-43]。此后,利用 ChIP-seq技术处理前列腺癌细
胞,并对表观遗传标记的核小体的全基因定位,He
等 [44]对核小体动力学与基因转录调控进行了研究。
Hurtado等 [45]基于 ChIP-seq 技术对乳腺癌细胞的研
究,揭示乳腺癌细胞雌性激素受体活性和内分泌响
应的决定因素来自于 FOXA1蛋白。不久前,Bonn
等 [46]在 ChIP技术基础上结合 Solexa测序,发展了
一种新方法“批分离特异染色质免疫共沉淀测序技
术”(batch isolate tissue-specific chromatin for immu-
noprecipitation, BiTS-ChIP-seq),利用该技术研究果
蝇的胚胎细胞,发现在胚胎发育中染色质修饰特异
性组合能够决定增强子活性。
2.3 在非编码RNA调控研究中的应用
除 DNA甲基化和组蛋白修饰外,非编码 RNA
生命科学 第24卷710
是表观遗传调控的另一个重要方面。研究表明,基
因表达调控的多种表观遗传机制涉及非编码 RNA。
非编码 RNA能够直接参与胞嘧啶甲基化和组蛋白
修饰,且与染色质重塑等其他表观遗传修饰密切相
关 [24](图 1)。另一方面,非编码 RNA家族成员众多,
除了 rRNA、tRNA等持家非编码 RNA外,还有种
类繁多的具有调节功能的调节非编码 RNA,其中
很多都参与了表观遗传修饰 (表 1),而长链 ncRNA
(lncRNA)和 microRNA(miRNA)最为典型。
RNA测序 (RNA-seq)是高通量测序技术在这
一领域的又一应用。基于 mRNA逆转录生成的
cDNA,利用高通量测序能够获得不同来源基因的
mRNA含量,这又称 mRNA-seq;当然,包括各种
非编码 RNA在内的不同类型的转录本都可以进行
高通量测序,如从总 RNA中只提取长度为 21~24 nt
的 RNA,则得到全部的 miRNA转录本 , 相应的方
法又称 miRNA-seq;这些 RNA测序统称为 RNA-
seq[47]。与先前的 RNA测序技术,如大规模平行信
号测序系统 (massively parallel signature sequencing,
MPSS)相比,高通量 RNA测序 (RNA-seq)在非编
码 RNA测序研究方面具有覆盖面更广和准确性更
高等优势 [47]。其中 Illumina公司的 Solexa测序平
台应用最为广泛。例如 Guttman等 [48]利用这一测
序技术对哺乳动物细胞的数千个 lincRNAs (large in-
tervening noncoding RNAs)进行测序和表观遗传学
分析;Barski等 [49]利用高通量测序获得并描述人
类 T细胞的 Pol III基因相关的非编码 RNA,进而
与 Pol II基因进行了比较研究;Li等 [50]通过比较
不同条件下获得多种籼稻幼苗的 miRNA数据,探
究植物在氧化胁迫和生理性适用条件下 miRNA的
重要的调节功能等。
利用并结合快速发展的高通量测序技术,表观
遗传学研究手段发生着日新月异的变化,特别在人
类疾病研究领域,这给我们尽早攻克人类的复杂疾
病带来了希望。随着测序技术的发展和新的测序技
术不断涌现,与之交叉的其他研究领域不断增加,
这无疑为给生命科学各领域的飞速发展注入了强劲
的驱动力。
[参 考 文 献]
[1] Sanger F, Nicklen S, Coulson AR. DNA sequencing with
chain-terminating inhibitors. Proc Natl Acad Sci USA,
1977, 74(12): 5463-7
[2] Maxam AM, Gilbert W. A new method for sequencing
DNA. Proc Natl Acad Sci USA, 1977, 74(2): 560-4
[3] 占爱瑶, 罗培高. DNA测序技术概述. 生物技术通讯,
2011, 22(4): 584-8
[4] Miller JR, Delcher AL, Koren S, et al. Aggressive assem-
bly of pyrosequencing reads with mates. Bioinformatics,
2008, 24: 2818-24
[5] Mitra RD, Church GM. In situ localized amplification and
contact replication of many individual DNA molecules.
Nucleic Acids Res, 1999, 27(24): 34-9
[6] Shendure J, Porreca GJ, Reppas NB, et al. Accurate multi-
plex polony sequencing of an evolved bacterial genome.
Science, 2005, 309(5471): 1728-32
[7] Harris TD, Buzby PR, Babcock H, et al. Single-molecule
DNA sequencing of a viral genome. Science, 2008,
320(5872): 106-9
[8] Shendure J, Ji H. Next-generation DNA sequencing. Nat
Biotechnol, 2008, 26(10): 1135-45
[9] Margulies M, Egholm M, Altman WE, et al. Genome se-
quencing in microfabricated high-density picolitre reac-
tors. Nature, 2005, 437: 376-80
[10] Mardis ER. The impact of next-generation sequencing
technology on genetics.Trends Genet, 2008, 24(3): 133-41
[11] http://www.454.com.
[12] Fedurco M, Romieu A, Williams S, et al. BTA, a novel re-
agent for DNA attachment on glass and efficient genera-
tion of solid-phase amplified DNA colonies. Nucleic Acids
Res, 2006, 34: e22
[13] Turcatti G, Romieu A, Fedurco M. et al. A new class of
cleavable fluorescent nucleotides: synthesis and optimiza-
tion as reversible terminators for DNA sequencing by syn-
thesis. Nucleic Acids Res, 2008, 36(4): e25
[14] Smith DR, Quinlan AR, Peckham HE, et al. Rapid whole-
genome mutational profiling using next-generation se-
quencing technologies. Genome Res, 2008, 18 (10) :
1638-42
表1 真核生物基因组中具有表观遗传学调控功能的ncRNAs主要类别列表
类型 英文名 中文名 长度(nt)
miRNA Micro RNA 微小RNA 20~24
piRNA PIWI-interacting RNA PIWI蛋白互作RNA 24~31
siRNA Small interfering RNA 小干扰RNA 20~24
PAR Promoter-associated RNA 启动子相关RNA 16~200
eRNA Enhancer RNA 增强子RNA 100~9 000
lncRNA Long non-coding RNA 长不编码RNA >200
张际峰,等:高通量测序技术及其在表观遗传学上的应用第7期 711
[15] 周晓光, 任鲁风, 李运涛, 等. 下一代测序技术: 技术回
顾与展望. 中国科学, 2010, 40(1): 23-37
[16] Complete Genomics Technology Paper [EB/OL]. http://
www.completegenomics.com
[17] Harris TD, Buzby PR, Babcock H, et al. Single-molecule
DNA sequencing of a viral genome. Science, 2008, 320:
106-9
[18] Hardin S, Gao X, Briggs J, et al. Methods for real-time
single molecule sequence determination: US, 7329492
[P]. 2008-02-12
[19] Eid J, Fehr A, Gray J, et al. Real-Time DNA sequencing from
single polymerase molecules. Science, 2009, 323: 133-8
[20] Tanaka H, Kawai T. Partial sequencing of a single DNA
molecule with a scanning tunnelling microscope. Nat
Nanotechnol, 2009, 4: 518-22
[21] Clarke J, Wu HC, Jayasinghe L, et al. Continuous base
identification for single-molecule nanopore DNA sequenc-
ing. Nat Nanotechnol, 2009, 4: 265-70
[22] Albertorio F, Hughes ME, Golovchenko JA, et al. Base
dependent DNA-carbon nanotube interactions: activation
enthalpies and assembly-disassembly control. Nanotech-
nology, 2009, 20(39): 395101-9
[23] 郑小国, 陈亮, 楼巧君, 等. 表观遗传学研究方法进展.
生物技术通报, 2011, 9: 63-71
[24] 杨旭, 焦睿, 杨琳, 等. 基于新一代高通量技术的人类疾
病组学研究策略. 遗传, 2011, 33(8): 829-46
[25] Cokus SJ, Feng SH, Zhang XY, et al. Shotgun bisulphite
sequencing of the Arabidopsis genome reveals DNA
methylation patterning. Nature, 2008, 452: 215-9
[26] Lister R, Pellzzola M, Dowen RH, et al. Human DNA
methylomes at base resolution show widespread epige-
nomic differences. Nature, 2009, 462(7271): 315-22
[27] Turcot V, Bouchard L, Faucher G, et al. DPP4 gene DNA
methylation in the omentum is associated with its gene
expression and plasma lipid profile in severe obesity. Obe-
sity, 2011, 19(2): 388-95
[28] Li Y, Zhu J, Tian G, et al. The DNA methylome of human
peripheral blood mononuclear cells. PLoS Biol, 2010,
8(11): e1000533
[29] Meissner A, Gnirke A, Bell GW, et al. Reduced represen-
tation bisulfite sequencing for comparative high-resolution
DNA methylation analysis. Nucleic Acids Res, 2005,
33(18): 5868-77
[30] Smith ZD, Gu HC, Bock C, et al. High-throughput
bisulfite sequencing in mammalian genomes. Methods,
2009, 48(3): 226-32
[31] Gu HC, Bock C, Mikkelsen TS, et al. Genome-scale DNA
methylation mapping of clinical samples at single-nucle-
otide resolution. Nat Methods, 2010, 7(2): 133-6
[32] Smallwood S, Tomizawa S, Krueger F, et al. Dynamic
CpG island methylation landscape in oocytes and preim-
plantation embryos. Nat Genet, 2011, 43: 811-5
[33] Nair SS, Coolen MW, Stirzaker C, et al. Comparison of
methyl-DNA immunoprecipitation (MeDIP) and methyl-
CpG binding domain(MBD) protein capture for genome-
wide DNA methylation analysisreveal CpG sequence cov-
erage bias. Epigenetics, 2011, 6(1): 34-4
[34] Ruike Y, Imanaka Y, Sato F, et al. Genome-wide analysis
of aberrant methylation in human breast cancer cells using
methyl-DNA immunoprecipitation combined with high-
throughput sequencing. BMC Genomics, 2010, 11(1):
137-47
[35] Serre D, Lee B, Ting A. MBD-isolated genome sequenc-
ing provides a high-throughput and comprehensive survey
of DNA methylation in the human genome. Nucleic Acids
Res, 2010, 38: 391-9
[36] Maunakea A, Nagarajan R, Bilenky M, et al. Conserved
role of intragenic DNA methylation in regulating alterna-
tive promoters. Nature, 2010, 466: 253-7
[37] Flusberg BA, Webster DR, Lee JH, et al. Direct detection
of DNA methylation during single-molecule, real-time se-
quencing. Nat Methods, 2010, 7(6) : 461-5
[38] Korlach J, Marks PJ, Cicero RL, et al. Selective aluminum
passivation for targeted immobilization of single DNA
polymerase molecules in zero-mode waveguide nanostruc-
tures. Proc Natl Acad Sci USA, 2008, 105: 1176-81
[39] Clarke J, Wu HC, Jayasinghe L, et al. Continuous base
identification for single-molecule nanopore DNA sequenc-
ing. Nat Nanotechnol, 2009, 4(4): 265-70
[40] 王薇, 施小龙, 陆祖宏. 基于二次打断IPed DNA片段
ChIP-Seq的模拟分析. 科学通报, 2010, 55(14): 1347-57
[41] Park PJ. ChIP-seq: advantages and challenges of a matur-
ing technology. Nat Rev Genet, 2009, 10(10): 669-80
[42] Barski A, Cuddapah S, Cui K, et al. High-resolution pro-
filing of histone methylations in the human genome. Cell,
2007,129(4): 823-37
[43] Mikkelsen TS, Ku M, Jaffe DB, et al. Genome-wide maps
of chromatin state in pluripotent and lineage-committed
cells. Nature, 2007, 448(7153): 553-60
[44] He HH, Meyer CA, Shin H, et al. Nucleosome dynamics
define transcriptional enhancers. Nat Genet, 2010, 42(4):
343-7
[45] Hurtado A, Holmes KA, Ross-Innes CS, et al. FOXA1 is a
key determinant of estrogen receptor function and endo-
crine response. Nat Genet, 2011, 43(1): 27-33
[46] Bonn S, Zinzen RP, Girardot C, et al. Tissue-specific anal-
ysis of chromatin state identifies temporal signatures of
enhancer activity during embryonic development. Nat Ge-
net, 2012, 44(2): 148-56
[47] Wilhelm BT, Marguerat S, Watt S, et al. Dynamic reper-
toire of a eukaryotic transcriptome surveyed at single-nu-
cleotide resolution. Nature, 2008, 453(7199): 1239-43
[48] Guttman M, Garber M, Levin JZ, et al. Ab initio recon-
struction of cell type-specifi c transcriptomes in mouse re-
veals the conserved multi-exonic structure of lincRNAs.
Nat Biotechnol, 2010, 28(5): 503-10
[49] Barski A, Chepelev I, Liko D, et al. Pol II and its associat-
ed epigenetic marks are present at Pol III–transcribed non-
coding RNA genes. Nat Struct Mol Biol, 2010, 17(5): 629-34
[50] Li T, Li H, Zhang YX, et al. Identification and analysis of
seven H2O2-responsive miRNAs and 32 new miRNAs in
the seedlings of rice (Oryza sativa L. ssp. indica). Nucleic
Acids Res, 2011, 39(7): 2821-33