全 文 :第26卷 第3期
2014年3月
生命科学
Chinese Bulletin of Life Sciences
Vol. 26, No. 3
Mar., 2014
文章编号:1004-0374(2014)03-0276-11
DOI: 10.13376/j.cbls/2014041
高通量siRNA筛选技术发展与展望
席建忠1,2*,马 明1,王干诚1,骆宇峰2
(1 北京大学工学院生物医学工程系,北京 100871;
2 北京大学分子医学研究所生物膜和膜技术国家重点实验室,北京 100871)
摘 要:RNA干扰 (RNA interference, RNAi)技术被认为是 20世纪生命科学领域最伟大的发现之一,是最
具发展前景的生物医药技术和基因功能研究方法。因此,高通量 siRNA筛选技术也成为生物学最强有力的
研究工具之一。特别是在当今后基因组时代,高通量 siRNA筛选技术已经成为揭示复杂信号网络调控、寻
找新药物靶点分子等诸多问题的利器。将对这一技术的产生和发展进行回顾,总结描述我们的筛选经验,
通过介绍若干典型筛选工作,来梳理高通量筛选技术的发展脉络,最后展望了高通量 siRNA筛选技术的发
展趋势。
关键词:高通量筛选;RNA干扰;靶基因;共同致死
中图分类号:Q819;Q78 文献标志码:A
Development and perspective of high-throughput
siRNA screening technology
XI Jian-Zhong1,2, MA Ming1, WANG Gan-Cheng1, LUO Yu-Feng2
(1 Department of Biomedical Engineering, College of Engineering, Peking University,
Beijing 100871, China; 2 State Key Laboratory of Biomembrane and Membrane Biotechnology,
Institute of Molecular Medicine, Peking University, Beijing100871, China)
Abstract: RNA interference (RNAi) has been considered as one of the most important discoveries in 20th century. It
has been widely applied in drug discovery and genetic network research, thus high-throughput screening (HTS)
having become the most powerful tool. Especially in post-genome period, HTS has been applied to unveil the
regulatory network, to identify new drug target, and so on. In this work, we will go over the history of HTS,
收稿日期:2014-02-16
基金项目:国家重点基础研究发展计划(“973”项目)(2011CB809106,2012AA020103);国家自然科学基金项目
(81030040,31371443,81325010)
*通信作者:E-mail: xi@coe.pku.edu.cn
席建忠教授实验室主要从事大规模功能基因技术的研发和应用,包括
细胞芯片、大规模药物筛选、基因操纵、miRNA等。近五年,围绕药物
筛选、药效评估动物模型等方面,取得了突出成绩。
席建忠 教授
席建忠,等:高通量siRNA筛选技术发展与展望第3期 277
1 高通量siRNA筛选的历史
1998年,Fire等 [1]在线虫中发现,打入的双
链 RNA可以通过降低目标基因 mRNA的含量,有
效地抑制基因的表达,双链 RNA的抑制效果明显
好于任何一条单链。随后,Clemens等 [2]通过在果
蝇细胞系中导入长链的双链 RNA,对 insulin代谢
通路进行了干扰,首次在实验室培养的细胞系中实
现了双链 RNA的沉默。Elbashir等 [3]进一步研究
阐释了这个过程的分子机制,21-nt双链 RNA分子
被证明是导致基因沉默的最终因素。长链的双链
RNA或者 shRNA,通过 dsRNA特异的 RNase III
(Dicer)的剪切,形成 siRNA。这些 siRNA先被装
载在 exportin中而停留在细胞质,进一步装载入
RISC复合体。通过 siRNA的引导,RISC复合体识
别并剪切和 siRNA序列匹配的 mRNA分子,从而
实现目的基因的沉默 [4]。由于 siRNA的沉默机制依
赖 21 bp序列的识别,加上可能存在的非完全匹配
的情况,难免会带来脱靶效果 (off-target effect)。因
此,对特定基因进行 RNAi沉默需要引入一系列生
物信息学的算法,兼顾沉默效果和尽量少的脱靶效
果。为了有效地解决脱靶问题,后续出现 esiRNA
技术,通过对特定基因编码区一次性引入多条双链
siRNA,最大程度地提高了靶基因的抑制特异性 [5]。
高通量筛选和常规单一实验方法的区别在于,
通过大规模,甚至是在全基因组范围内,系统研究
某一关键问题。这种方法可以适当牺牲实验数据的
深度和准确性,来方便、快速地获得大批量基因和
靶点的所有数据。这对一些暂时没有头绪的研究问
题非常重要,如研究哪些基因参与到细胞程序性坏
死时,如果已有文献无法给出足够的候选基因,进
行全基因组范围内的筛选,有望把所有参与调控这
个过程的基因全部挑选出来,可以为研究提供全新
的思路。正是由于这些特点,高通量筛选已经成为
生命科学研究不可或缺的有力工具。大规模的全基
因组 RNAi文库正是在这样的背景下应运而生的。
目前已经有大量的商业化 siRNA文库,如 Ambion、
Dharmacon、Qiagen、Sigma、Invitrogen等公司可提
供人类、大鼠、小鼠等模式生物的全基因组 siRNA、
shRNA、esiRNA文库。各类 siRNA文库具有不同
的特点 (表 1)。
高通量 siRNA筛选的快速发展得益于业已成
熟的自动化化合物筛选的经验和仪器。将 RNAi文
库从库存的平板加入到实验平板特定的孔中,是
一件非常繁琐且容易出错的工作。使用高通量液
体工作站等自动化机器,极大地简化了这一工作。
此外,高通量筛选面临的另外一个核心步骤是,
信号的获取和处理。高通量筛选结果主要以信号
(signal based)和图像 (image based)的形式产生,前
者读取快但是信息相对少;后者读取慢但可以获得
更深层次的数据。高通量筛选机器能够自动聚焦,
以较快的速度在目标区域内读取数据,而且读出的
数据可利用配套软件进行初步分析和诠释,方便实
验者进一步理解。
2 高通量siRNA筛选过程中的几个关键问题
建立良好的筛选模型 (assay)是开展高通量筛
选至关重要的一步。我们的经验是应该把握“一个
表1 各种siRNA文库的特点比较
名称 描述 优缺点及适用范围
siRNA文库 针对目标基因CDS区域设计的RNA duplex, 初期RNAi筛选采用,由于RNA的不稳定性,
生物信息学预测,将脱靶效应降到最低 保存时间、在细胞内的停留时间均受限制
化学修饰的siRNA文库 为了增加稳定性和降低脱靶效应,对siRNA 稳定性更好,在细胞内可以抑制基因长达72 h
两端进行适当的化学修饰
esiRNA文库 针对目标基因CDS的一长段序列,通过内 由于RNA duplex的不稳定性,需要现做现用;
切酶,将长链双链RNA切割成众多双链 需要特殊的设计软件来选取基因编码区片
siRNA (RNA duplex) 段。不过能有效降低脱靶效应
shRNA文库 嵌合在质粒或病毒中,翻译出长链RNA, 常见的是慢病毒载体装载的shRNA文库,将
经过折叠形成带有发卡结构的shRNA, shRNA嵌合到细胞基因组内,稳定地抑制
经过细胞内剪切成为成熟的siRNA 基因表达
describe our experience, illustrate the typical works, and finally discuss the perspective of HTS.
Key words: high-throughput screening;RNA interference;target gene;synthetic lethal
第26卷278 RNA研究的新技术和新方法专题
原则和两个关键点”。所谓“一个原则”就是,在
不影响实验准确度的前提下,力求每个操作步骤尽
量简单;如有必要,可以牺牲一些其他性能,来保
证筛选步骤和操纵的简洁。“两个关键点”着眼在
siRNA文库的转染效率和后期数据读出两个步骤。
为了确保较高 siRNA文库的转染效率,应该首先考
虑比较方便的转染方法,不得已可以考虑电转或病
毒转染的方法。为确保读出数据快速和方便,应避
免采用如共聚焦等需要长时间采集数据的方法。这
些原则和关键点的应用将在后续的篇幅中详细论
述。此外,对高通量筛选中涉及到的一系列重要的
细节性的问题,我们也将在本文中进行介绍。
一个典型的高通量筛选分为 3个部分:预实
验 (pilot screen)、第一轮筛选实验及第二轮验证
(validation)实验。
预实验非常重要,不仅要衡量高通量筛选实验
方案的可行性,还要尽可能地优化实验条件,考察
实验正负对照之间窗口的大小,衡量实验数据分析
方法的可靠性等因素,为“一个原则和两个关键点”
的落实提供实验依据。广义的预实验还包括实验对
象细胞系的选取、实验时间点的优化、实验结果数
据的获取形式等。影响预实验的要素分为操作性因
素和准确性因素两个大方面 (表 2)。简单来说,操
作性因素有以下几点:(1)细胞系的选取,选取一
株细胞系,作为一个库 (seed library),每次实验都
从这个库中来取,尽量减少不同批次细胞之间的差
异对实验造成影响 ,保证这些细胞的传代次数接近;
(2)筛选文库的选择,如考虑使用 siRNA文库筛选,
还是使用 shRNA文库,或者采用操作性较差但脱
靶效应更低的 esiRNA文库;(3)转染形式的选择,
可以利用脂质体转染进行正向转染或反向转染,也
可利用病毒转染或者电转等方法;(4)实验信号的
采集和分析,如根据筛选模型可选用信号读取方式,
或图片方式。
准确性方面首先考虑选取合适的正负对照实验
组。正对照反映了实验系统是否正常工作,负对照
反映了不同批次之间实验的平行性。两者之间的窗
口是预期实验数据所处的空间。一个能够反映正负
对照窗口大小和平行性的参数是 Z factor,计算公
式如下:
(3 3 ) 1
| |
c c
c c
Z + −
+ −
−= −
−
σ σ
µ µ
σ表示标准差,μ表示平均值,C+和 C-分别
是正对照和负对照。通过选取不同时间点和批次的
正负对照,算出 Z′的值,来衡量这个实验体系是
否足够稳定。一个合格的筛选体系要保证 Z′在 0.7
以上。同时,还要考虑假阳性、温度敏感性、边缘
效应、转染效率和信号淬灭等实验细节。这个参数
综合反映出高通量筛选的条件和可靠性,是衡量高
通量筛选有效性的指标。
根据预实验结果确定筛选方案。方案中涉及的
操作步骤尽量少,每步操作尽可能简单。为了增加
数据的说服力,一般可以选取 1~2个正对照实验分
子,来监控筛选数据的可靠性。在这种情况下,筛
选就分为两轮。
第三个阶段是实验数据的处理。当实验样本量
较少时 (例如 1 000个左右 ),可以直接拿实验数据 /
负对照数据,得到两者比值 (fold change)。以这个
比值为参数,来考核初步的阳性结果 (hits)。当实
验样本量过于庞大 (例如全基因组筛选,104量级 )
时,实验批次之间数据有较大的波动性,需要对实
验数据进行归一化,再考量哪些是初步的阳性结果,
如归一化的一种方法是采用每批次实验数据 /该批
次负对照数据,获得所有数据的平均值和方差,在
默认实验数据整体呈正态分布的假设前提下,用正
态归一化公式,获得每个个体相对整体的归一化值。
偏离平均数据较远的点,可以作为初步的阳性结果
进行下一步验证。
表2 筛选设计需要考虑的因素汇总
操作性因素 准确性因素
细胞系、转染方式 尽量选择易于培养、转染效率高的细胞系 正负对照 正负对照之间的窗口的大小是否合适
文库的选择 选择不同的siRNA,要充分考虑siRNA导 Z factor Z值尽量在0.7~1.0
入细胞的方式、作用时间等
实验时间的优化 根据蛋白质代谢、RNAi起作用时间、质粒 假阳性比例 初步得到阳性结果中不真实结果的比例
表达时间等因素设计。不同的实验时间
窗口,获得的实验结果可能完全不一样
实验数据的读取和分析 信号的获得尽量选择更快速、方便直观的 转染效率 细胞系的可操作程度
方式,同时考虑减少后续数据处理的难度
席建忠,等:高通量siRNA筛选技术发展与展望第3期 279
最后一个阶段是验证。由于高通量筛选是一种
部分牺牲实验精确性达到快速大批量获取实验数据
的方法,对于初步的阳性结果务必进行进一步验证。
在验证时,为了避免脱靶效果的干扰,可以再合成
几条同一基因不同靶点序列的 siRNA,观察是否还
有同样的效果,甚至对于个别感兴趣的初步阳性结
果,可以采取多种实验方法来加以佐证。
总结来说,“一个原则和两个关键点”是设计
高通量筛选务必首先考量的因素,Z factor是衡量
高通量筛选有效性的最有说服力的指标。
3 高通量筛选技术应用的筛选思路和典型实例
3.1 逐一筛选和文库筛选
逐一筛选是把候选筛选目标基因 siRNA一一
导入到筛选体系内,再一一检测每种 siRNA的抑制
效果;而文库筛选 (selection-based screening)则是
把所有 siRNA (一般用 shRNA)混在一起作为一个
整体文库,均匀地混合后加入足够多的候选细胞中。
不同于逐一筛选,文库筛选需要很好的分选方法来
收集阳性结果,再进一步确认有表型的 siRNA,得
到的细胞群落通常包含多个 siRNA的信息,需要后
期实验来仔细确认。
MacKeigan等 [6]对人类激酶库和磷酸酶库介
导细胞凋亡的研究是一个非常典型的高通量筛选实
例。他们选取 HeLa细胞为对象,采用化学合成的
siRNA文库,针对 650个激酶和 222个磷酸酶作为
靶点,每个靶点平行设计两个独立位点的 siRNA,
混合在一起抑制基因表达。细胞提前一天铺在 96
孔板上,siRNA通过正向转染进入细胞;72 h后,
通过 ELISA标记组氨酸 -DNA 碎片;凋亡信号用该
平板的对照组进行归一化得到比值变化。预实验表
明,基因沉默效率可以达到 80%以上,细胞转染
效率 99%以上,CDK6、NLK等作为正对照,比值
变化在 5倍以上。结合实验方法本身的误差,将界
定比值变化大于 2的作为后续验证的对象。筛选结
果发现了一系列之前没有报道的介导凋亡的激酶,
共有 73个激酶 (11%)和 72个磷酸酶 (32%)。
由于细胞本底凋亡的信号很低 (大约 5%以
下 ),因此,用上述筛选策略只能得到促进细胞凋
亡的靶点。为了得到抑制细胞凋亡的靶点,可以
通过药物诱导,刺激细胞凋亡,适当提高背景凋亡
值。在转染 siRNA后 48 h,将 3种药物 (cisplatin、
taxol、etoposide)依次加入到每个孔中,24 h后检
测凋亡信号。MK-STYX作为正对照,可以有效降
低这些药物刺激介导的凋亡。有 12个未报道的激
酶 /磷酸酶参与其中,MacKeigan等在后续的验证
中,进一步证实它们参与抑制药物引起的凋亡过程。
MacKeigan等的筛选工作的另外一个亮点是,
如何获取抑制细胞凋亡这部分的靶点信息。由于本
底凋亡信号较低,只能得到促进凋亡的靶点,而选
择 taxol等药物诱导刺激,提高细胞凋亡背景,获
得抵抗这些药物介导凋亡的靶点。这些靶点作为潜
在的抗癌位点,为后续研究提供了充足的信息。
另一个有启发性的逐一筛选例子是 Adamson
等 [7]的工作。他们筛选的目标是同源重组效率
(homologous recombination, HR)(图 1)。值得注意的
是,需要在靶点基因的表达量下调后,再检测同源
重组效率。因此,如果把 I-SceI和 siRNA同时转染
进去,在 siRNA将基因沉默前,I-SceI已经对靶点
序列进行了切割。细胞在该位点发生 DNA双链断
裂,有一定概率通过启动同源重组,寻找下游的模
板 (iGFP),将原本有点突变而无法发光的 SceGFP
的区域,修复成模板 iGFP的没有点突变的区域,
发出绿色荧光信号。因此,需要在 siRNA导入后
48~72 h后,再过表达 I-SceI,对报道载体的靶点序
列进行切割,进而启动同源重组,检测效率。为了
达到这个目的,他们在转染 siRNA文库后 72 h后,
利用腺病毒侵染,过表达 I-SceI,这样避免了重复
转染对细胞的毒性。由于背景的信号比较高,因此,
这次筛选可以得到提高信号和降低信号两个区域的
信息 (背景同源重组效率为 8.4%,负对照为 0.4%)。
对 22 109个 siRNA的筛选显示,14%的基因可以
参与到同源重组效率的调节过程中,第二轮筛选对
其中的 467个之前未报道过的基因进行了验证,最
终发现 RBMX通过调节 BRCA2的表达量,促进同
源重组过程。
Shalem等 [8]基于 Cas9/CRISPR技术的筛选工
作,是文库筛选的一个典型例子。Cas9/CRISPR是
一个序列特异性的 DNA酶,同时具有内切和外切
活性,通过装载 sgRNA (和靶点 DNA序列互补 ),
能够对特异 DNA靶点进行识别和切割。因此,只
需要构建特异性的 sgRNA,便可以对任何基因进行
有效的切割,进而引起基因的敲除 (图 2)。将混合
在一起的 sgRNA文库装载在慢病毒中,形成 sgRNA
文库。侵染黑色素瘤细胞系,加入 vemurafenib刺激,
经过一段时间的培养,存活下来的细胞是对这种药
物刺激有抗性的群落。他们通过整合 sgRNA到基
因组,特异性地敲除某些基因,从而获得对
第26卷280 RNA研究的新技术和新方法专题
vemurafenib的抗性。将这些细胞的基因组测序,得
到整合入细胞的部分,便是敲除基因的 sgRNA,从
而知道这些细胞中哪些基因被敲除。在 18 080个基
因 sgRNA文库筛选结果中,之前有报道的 NF1和
MED12均排名很高,同时也发现了一些新的靶点:
NF2、CUL3、TADA2B和 TADA1。这些基因的敲除,
都有助于增强该细胞系对 vemurafenib的抗性。
文库筛选需要特别注意两个问题:一是确保克
隆数有足够的代表性;二是控制进入每个细胞内的
RNA数量。如果一个文库靶点数过少,加上外在
的筛选压力太大,筛选得到的靶点很有可能非常有
限。此外,如果想要研究单个基因,那么需要保证
每个细胞内只进入一个 RNA。这时,需要调整文
库的数目 (如病毒滴度数 ),确保大多数细胞内只
有一个 RNA或者干脆没有,再用抗性去除那些没
有 RNA进入的细胞。
将文库siRNA逐一转染到孔板的每个孔,72 h后,基因被沉默降低到一定程度。加入包被I-SceI的腺病毒,侵染细胞过表达
I-SceI。48 h后,细胞内sensor上靶点序列被I-SceI切割,诱导同源重组。将细胞固定染色,通过高通量筛选仪器获取信号,进
行分析统计。
图1 逐一筛选流程图[7]
包括4个步骤: 针对基因编码区靶点的DNA序列在芯片上合成后,通过公用的接头,PCR克隆进入慢病毒载体,并包裹病毒;
将慢病毒文库侵染细胞,启动shRNA序列表达的序列被整合到细胞基因组上,而沉默细胞内该基因的表达;在特定时间、药
物诱导下,存活下来的细胞得以扩增;提取细胞的基因组,深度测序,找到相应shRNA拷贝数。
图2 文库筛选流程图[8]
席建忠,等:高通量siRNA筛选技术发展与展望第3期 281
3.2 高通量筛选在不同细胞信号通路中的应用
高通量筛选在研究特定细胞信号通路中的关键
分子时具有很大优势,往往可以找到信号通路中所
有直接或间接的关键基因。这部分通过对 p53通路
和 K-ras因子研究的两个例子给予阐释。
3.2.1 高通量筛选对p53信号通路的研究
在高通量筛选未完全成熟的时候,Berns等 [9]
通过文库筛选,详细阐释了 p53通路中未知关键因
子的作用 (图 3)。他们先构建了 23 742条 shRNA
载体文库靶向 7 914个人类基因,存贮在 96孔板上。
将每个 96孔板的质粒混在一起,包被病毒成为包
含这 96个靶向基因的子病毒文库,侵染细胞后铺
在平板上。被侵染的细胞之前经历过改造,加入了
温度敏感的 SV40启动子,连接上 pRB和 p53的
shRNA。这种细胞在 32 °C时可以顺利增殖,但是
在 39 °C时却难以增殖。预实验已证明,这两种状
态的差别直接决定于 p53 shRNA的引入。在大规模
筛选中,绝大部分平板克隆数和对照组的数据相似,
克隆数显著增加的平板被挑出,适当扩增后鉴定哪
种 shRNA被引入。筛选得到 6个靶点基因,除了
p53外,另外 5个是 RPS6KA6 (ribosomal S6 kinase 4,
RSK4)、 HTATIP (histone acetyl transferaseTIP60)、
HDAC4 (histone deacetylase 4)、 KIAA0828 (a putative
S-adenosyl-L-homocysteine hydrolase, SAH3)和 CCT2
(T complex protein 1, b-subunit)。这些新的基因在后
续的验证环节得到了证实,并被最终定位到 p53的
代谢通路中,完善了整个 p53通路的图谱,尤其在
p21表达量的调控等关键步骤中有显著作用。他们
设计实验的亮点在于,在全基因组中,参与 p53通
路的基因比例非常非常低,如果用逐一筛选,得到
的结果大多数可能是阴性,费时费力。这彰显了文
库筛选的优势,也是信号通路筛选的经典工作。
3.2.2 高通量筛选对K-Ras参与通路的研究
高通量筛选还可以通过找到一系列和某个关键
基因发生关联的基因,对这个基因的作用进行新的
阐释。最近一系列筛选工作揭开了与突变 K-Ras基
因相关联的未知基因 [10-12]。在很多癌症患者中,
K-Ras基因有很高比例的突变。筛选与该基因突变
相关的基因,有望发现特异杀死肿瘤细胞的靶基因。
比较有代表性的是 Luo等 [11]的工作,揭示了 K-Ras
在细胞分裂通路中的间接角色。他们选取 DLD-1,
一种含有 K-Ras G13D点突变结直肠癌细胞系,通
过 shRNA沉默基因,寻找和 K-Ras突变共同致死
的基因 (图 4),以期未来可以找到这些基因的相应
小分子抑制剂,通过抑制这些靶点,在结直肠癌细
胞系内有治疗的效果。筛选结果显示,含有 K-Ras
突变的细胞系,对细胞分裂通路的扰动非常敏感。
尤其是在 PLK1 (一种细胞分裂的磷酸酶 )受到抑制
时,细胞的死亡率特别高;而在野生型 DLD-1细
胞系中,却没有这样的现象,这就是所谓的共同致
死。这种现象也发生在 APC/C和蛋白酶体受到抑
制的情况下。这些有趣的发现和他们设计巧妙的筛
选方法是分不开的。
他们的筛选思路是,通过慢病毒把相应 shRNA
文库整合到细胞基因组内,一旦整合入某条 shRNA,
这些细胞内由于可以表达 shRNA,相应基因的表达
基因靶点shRNA序列通过PCR和克隆,装载入质粒。这些质粒逐一转染孔板,获取病毒。将每个孔板的病毒均匀混合,在
32 °C侵染细胞群,39 °C激活特定启动子表达后,筛选得到存活下来的细胞。提取这些细胞的基因组测序。
图3 p53信号通路调控因子筛选流程图[9]
第26卷282 RNA研究的新技术和新方法专题
量会下调。如果造成共同致死,这些细胞无法存活
下来,在多次传代之后,最终细胞群落基因组内该
shRNA的含量会很低。反之,那些不造成共同致死
的 shRNA,最初的细胞群落和最终的细胞群落内
shRNA含量差别不大。通过半定量比较这两群细胞
中整合到基因组中的 shRNA的含量,可以找到哪
些造成了共同致死。如何半定量得到 shRNA的变
化是整套筛选思路的最大亮点。他们发明了一种短
链荧光标记基团,结合在慢病毒 shRNA结构中的
公共部分,因此,所有整合到基因组的 shRNA都
可以被非特异性的标记。这些荧光基团和 DNA结
合时没有荧光,当释放到溶液中后,却可以发出荧
光。当这些标记后的 DNA样本加入到合成含有相
应基因的微阵列后,就和探针相结合,释放出原先
结合的荧光基团,产生荧光。通过比较最初和最
终细胞群落的荧光强度,可以确定哪些引起了共
同致死。
为了进一步验证,他们采用了另外一种竞争性
的实验体系,对筛选得到的基因进行二次确认 (图
5)。构建含有 K-ras突变和 GFP的细胞系,和 K-Ras
野生型细胞系按照数量 1 : 1混合在一起。混合细胞
转染相应 shRNA,7~8 d后,通过流式实验定量这
两种细胞的比例。这两种筛选方法具有非常强的启
发性和借鉴意义。
3.2.3 细胞自噬通路中的高通量筛选
细胞自噬和细胞凋亡,与细胞坏死一样,是细
靶点基因的shRNA序列合成后,装载入病毒。将文库侵染
细胞,并不断传代至第17代。提取第一代和第十七代细胞
的基因组,分别加入Cy5和Cy3的荧光集团。最后均匀铺在
合成有基因相应shRNA序列的微阵列上,Cy5和Cy3由于原
先与它们结合的DNA和微阵列的DNA结合,而荧光集团被
竞争下来,释放到溶液中。检测相应的荧光信号,定量相
应基因的表达量变化。
图4 病毒文库筛选共同致死基因流程图[11]
构建本底表达GFP的K-ras突变细胞系。将它与野生型细胞
1:1等量混合,侵染慢病毒包裹的相应的某条shRNA,整合
入基因组内。药物刺激下,存活性好的细胞得以繁殖,反
之则减少。7~8 d后,流式实验检测GFP比例,间接反映共
同致死基因的效果。
图5 K-ras突变共同致死基因的筛选流程[11]
胞走向死亡的 3个方式。细胞自噬依赖于自噬小体
(autophagosome)的形成,进而吞噬细胞器进行消化,
释放营养物质。这些营养物质通过反馈,激活
mTOR进而抑制细胞自噬过程,将自噬小体形成没
有“危害”的溶酶体 (lyosome)。正是这种精细的负
反馈,保证细胞自噬这种“危险”的行为朝着有利
于生物体的方向发展。自噬小体重新形成溶酶体的
过程,被称为 ALR,这个过程之前研究很少。针对
这一问题,我们实验室和清华大学俞立教授实验室
进行合作,取得不错的成果 [13]。首先,利用质谱从
分离出的 ALR复合体中定位到 700个左右蛋白质,
然后结合生物信息学分析结果,我们从中挑选出
114个潜在调节基因,开展大规模 siRNA筛选。通
过这些巧妙的实验,我们第一次揭示了 Clathrin和
PtdIns (4,5) P2在 ALR形成过程中发挥关键作用。
这个工作的启发意义在于,通过多种方法来缩小筛
选范围,可以有效地提高筛选效率,快速找到新的
靶点基因,为研究打开新的思路。
3.3 与小分子化合物联合用药共同致死的筛选
另一个应用是将已知药物和 RNAi文库结合起
席建忠,等:高通量siRNA筛选技术发展与展望第3期 283
来进行共同筛选,来寻找已知药物的作用靶点或增
敏靶点 (图 6)。Whitehurst等 [14]选取紫杉醇作为研
究对象,用 84 508个 siRNA靶向 21 217个人类基因,
找到了 87个初步阳性结果。由于人类肺小细胞癌
细胞系 NCI-H1115对紫杉醇具有较高的耐受性
(IC50是普通细胞系的 10倍 ),因此被选取开展癌
细胞抗药性研究。为了便于共筛,他们采用前文所
述的反向技术,把每个靶点基因的几个 siRNA混合
在一起,点在 96孔板底。实验组 (紫杉醇 +RNA)
和对照组 (单独 RNA)分别有 3个独立重复,药物
组 (10 nmol/L紫杉醇 )在每个孔板上均有 6个孔,
作为整个板子的负对照。在其上均匀地铺好细胞48 h,
加入 10 nmol/L紫杉醇,再经过 48 h后,通过试剂
盒检测该孔 ATP的总浓度。
由于实验的数据量非常大,他们采取了特别严
格的数据处理方法,以期找到效果最好的候选靶点。
这种方法有很强的借鉴意义。首先,实验组和对照
组的 6个数据,用两样本的 t值检验,算出 FDR值
(即 p值 ),找到大于 0.05的靶点。接着,每个靶
点的实验组的平均值比上对照组的平均值,得到比
值。将21 217个靶点的比值从高往低排序,取前2.5%
的靶点 (该方法称为 2.5th centile rank)。将这两种方
法获得的靶点库进行比较,同时满足这两项条件的,
才是这次筛选得到的初步阳性结果。在验证环节,
同一靶点的 siRNA分别单独和紫杉醇共筛,检测是
否均具有原先效果,从而减少 siRNA的脱靶效果。
5%的 FDR选择是一个非常严格的标准,如果把
FDR放宽到 10%,会出现大多数已知的 r-tublin
ring complex的组成部分。之前的研究表明,这些
组分对紫杉醇的效果非常敏感,所以这些数据对这
次筛选没有太大意义。可见,根据需要适当调节初
筛的标准,才能得到新的有趣的结果。针对这些靶
点的进一步研究,发现 ACRBP和 TUBGCP2与
10-2 nmol/L量级的紫杉醇仍然有共同抑制效果,这
是 10 nmol/L浓度的 1/1000。这些靶点如果可以成
为药物靶点,则可以显著减少紫杉醇的用药剂量,
从而极大地减少它的副作用。
小分子 RNA和药物共筛,对开发低剂量的联
合治疗方法有很大帮助。需要注意的是,必须在预
实验这一阶段找到合适的药物剂量,从而减少后续
大规模筛选的工作量。值得一提的是,如果预计可
能发现的靶点基因非常少,如寻找对某种化合物的
抗性基因,可以采取上文所提及的反向筛选思路,
通过慢病毒将 shRNA整合到基因组,加入药物处理,
对存活的细胞测序便可以得到结果。在逐一筛选例
子中,MacKeigan等筛选抑制细胞凋亡的例子,也
是结合小分子化合物共筛的例子。
就与化合物共筛而言,也可以以某一个基因为
研究对象,对小分子化合物文库进行筛选。这类筛
选具有非常强的应用价值。一方面,可以寻找到某
个突变基因的共同致死药物,进而可以对含有这种
突变的患者进行治疗;另一方面,也可以结合现有
化合物库,对已经有明确靶点的药物,但由于毒性
或效果不佳未通过临床全部实验的药物进行再开
在siRNA逐一转染孔板48 h后,基因被沉默到很低的水平。加入紫杉醇药物刺激,48 h后,裂解细胞,通过试剂盒检测ATP含
量,高通量仪器读取每孔信号。
图6 药物和RNAi文库共筛流程图[14]
第26卷284 RNA研究的新技术和新方法专题
发,找到它们新的作用,或是所谓的“老药新用”,
发现现有药物在治疗其他疾病中的作用。
4 高通量siRNA筛选的新发展方向
高通量筛选正在呈现出一些新的思路和发展方
向,比较有代表性的两个例子是自组装细胞芯片筛
选方法和活体动物模型筛选技术。
自组装细胞芯片是在一张玻璃片上覆盖 PNI
膜,通过刻蚀产生规则的小孔矩阵 (图 7)。PNI膜
具有温度敏感性,低温下遇水快速溶解,细胞无法
在其上生长。每个小孔的孔径可以根据需要进行适
当调节,保证其中容纳的细胞数在 1 000个左右,
具有统计意义。通过反向转染,可以在刻蚀产生的
小孔内点上 RNAi文库;在整个芯片上铺细胞,形
成细胞岛,每个小岛就是一个独立的样本。一张 4
cm2的芯片上,可以容纳 12×12个点,筛选容量超
过一个 96孔板。自组装芯片具有良好的平行性,
孔与孔之间交叉污染极少,可以有效地保证实验准
确性。针对该芯片,我们实验室已经开发出一套与
之相匹配的拍照和数据开发程序,允许以芯片为平
台,进行更加快速的高通量筛选。
自组装芯片首先被应用于细胞迁移的高通量筛
选。传统鉴定迁移的方法,第一种是刻痕技术。在
细胞长满后,用钝器划开一道线,把两边的细胞分
开,在之后的十几个小时内观察这道线两端细胞的
生长情况,找到这道刻痕被填补的时间,来界定细
胞的迁移能力。第二种是 transwell技术。在膜两侧,
一端加入细胞和没有 FBS的培养基,另外一端加入
含有 FBS的培养基,细胞为了摄取营养,从膜的一
侧向另外一侧迁移;选取合适的时间点,对越过膜
的细胞进行统计,衡量细胞的迁移能力。由于操作
复杂,这两种传统技术都不能支持高通量筛选,自
组装芯片却可以解决这一难题。在反向转染的孔上
刻蚀覆盖PNI膜的细胞芯片,在孔中点入反向转染试剂。
细胞在这些孔中着陆后,反向转染试剂缓慢释放,进入细
胞。特定时间后,释放PNI膜,细胞岛得以向外扩张。通过
高通量仪器拍摄扩张之前和之后细胞岛的图片,计算面积
比值,定量该RNAi对迁移的影响。
图7 基于自组装细胞芯片的细胞迁移筛选流程图[15]
用病毒侵染FAH敲除的小鼠肝脏,将相应shRNA整合入细胞基因组序列。在药物刺激下,生存能力强的细胞得以繁殖而扩
增。提取前后肝脏的基因组,PCR扩增和深度测序。比较前后shRNA拷贝数的变化,找到拷贝数积累的shRNA。
图8 活体慢病毒shRNA文库筛选流程图[16]
席建忠,等:高通量siRNA筛选技术发展与展望第3期 285
铺满细胞后,降低温度释放 PNI膜,原先的细胞岛
便失去了周围的生长屏蔽,可以自由地向外扩张,
通过计算扩张面积的变化,衡量迁移能力。这种操
作简单的方法可以允许高通量测定大量 RNAi文库
对细胞迁移能力的影响,从而实现高通量筛选。我
们实验室运用这种方法对人类全基因组 miRNA文
库对细胞迁移能力,进行了高通量筛选,第一次发
现 20%的 miRNA参与到细胞迁移过程的调节中,
并且发现 miR-23b通过调控 PAK2等一系列下游靶
点,在细胞核活体水平上有效抑制细胞迁移过程 [15]。
自组装芯片由于通量更高、操作更简单,而可
以胜任绝大多数孔板为平台的高通量筛选工作。我
们实验室和其他实验室合作,已经对细胞自噬 [13]、
凋亡、细胞衰老等一系列课题进行了筛选,得到丰
富的信息。
另外一个有启发性的工作是Wuestefeld等 [16]
直接在小鼠体内,对肝再生有关的 RNAi文库进行
筛选,最终找到MKK4这个关键激酶 (图 8)。他们
构建了 FAH-/-小鼠模型,这种小鼠只有在 NTBC药
物的治疗下才能够生存,否则会因为肝衰竭在一个
月内死亡。shRNA文库被整合在转座载体中,在
SB13转座酶的作用下,可以被整合到受体细胞的
基因组中。他们选取了 5只小鼠,把文库和 SB13
一起注射进去;6个月后,提取肝细胞 DNA进行
深度测序,把整合到基因组的 shRNA拷贝数,用
刚注射后的基因组的 shRNA拷贝数作为本底归一
化。在这 5只小鼠中,MKK4 shRNA均得到了高
度富集。后续的验证环节进一步证实,MKK4基因
通过 JNK1通路,直接参与到肝细胞细胞周期调控,
以及肝细胞再生过程。
5 讨论和总结
衡量高通量筛选的成功与否取决于筛选范围和
准确度,这在很大程度上由筛选模型决定。“一个
原则、两个关键点”详细总结了如何建立细胞模型、
如何选取 siRNA文库和转染方法、如何采集分析数
据等。其中,尽可能地简化筛选步骤至关重要。打
个形象的比方,这就相当于在一片湖水里捕鱼,渔
网的网眼要多大才比较合适。如果网眼太大,很可
能大鱼也会轻易逃脱;如果网眼太小,所有无关轻
重的小鱼小虾也都在网里面,造成打渔船承重太厉
害,甚至寸步难行。总之,高通量 siRNA筛选技术
已经成为生命科学研究中不可或缺的工具。随着第
二代或者第三代测序技术的飞速发展,新的高通量
筛选方法将不断出现,将两者的有效结合必将生命、
医学研究发展推向新的高度。
[参 考 文 献]
[1] Fire A, Xu SQ, Montgomery MK, et al. Potent and
specific genetic interference by double-stranded RNA in
Caenorhabditis elegans. Nature, 1998, 391(6669): 806-11
[2] Clemens JC, Worby CA, Simonson-Leff N, et al. Use of
double-stranded RNA interference in Drosophila cell lines
to dissect signal transduction pathways. Proc Natl Acad
Sci USA, 2000, 97(12): 6499-503
[3] Elbashir SM, Harborth J, Lendeckel W, et al. Duplexes of
21-nucleotide RNAs mediated RNA interference in
cultured mammalian cells. Nature, 2001, 411(6836): 494-8
[4] Ohrt T, Merkle D, Birkenfeld K, et al. In situ fluorescence
analysis demonstrates active siRNA exclusion from the
nucleus by Exportin 5. Nucleic Acids Res, 2006, 34(5):
1369-80
[5] Yang D, Buchholz F, Huang Z, et al. Short RNA duplexes
produced by hydrolysis with Escherichia coli RNase III
mediate effective RNA interference in mammalian cells.
Proc Natl Acad Sci USA, 2002, 99(15): 9942-7
[6] MacKeigan JP, Murphy LO, Blenis J. Sensitized RNAi
screen of human kinases and phosphatases identifies new
regulators of apoptosis and chemoresistance. Nat Cell
Biol, 2005, 7(6): 591-600
[7] Adamson B, Smogorzewska A, Sigoillot FD, et al. A
genome-wide homologous recombination screen identifies
the RNA-binding protein RBMX as a component of the
DNA-damage response. Nat Cell Biol, 2012, 14(3): 318-
28
[8] Shalem O, Sanjana NE, Hartenian E, et al. Genome-scale
CRISPR-Cas9 knockout screening in human cells.
Science, 2014, 343(6166): 84-7
[9] Berns K, Hijmans EM, Mullenders J, at al. A large-scale
RNAi screen in human cells identifies new components of
the p53 pathway. Nature, 2004, 428(6981): 431-7
[10] Barbie DA, Tamayo P, Boehm JS, et al. Systematic RNA
interference reveals that oncogenic KRAS-driven cancers
require TBK1. Nature, 2009, 462(7269): 108-12
[11] Luo J, Emanuele MJ, Li D, et al. A genome-wide RNAi
screen identifies multiple synthetic lethal interactions with
the Ras oncogene. Cell, 2009, 137(5): 835-48
[12] Scholl C, Fröhling S, Dunn IF, et al. Synthetic lethal
interaction between oncogenic KRAS dependency and
STK33 suppression in human cancer cells. Cell, 2009,
137(5): 821-34
[13] Rong Y, Liu M, Ma L, et al. Clathrin and phosphatidy-
linositol-4,5-bisphosphate regulate autophagic lysosome
reformation. Nat Cell Biol, 2012, 14(9): 924-34
[14] Whitehurst AW, Bodemann BO, Cardenas J, et al.
Synthetic lethal screen identification of chemosensitizer
loci in cancer cells. Nature, 2007, 446(7137): 815-9
[15] Zhang HS, Hao Y, Yang JY, et al. Genome-wide functional
screening of miR-23b as a pleiotropic modulator suppressing
cancer metastasis. Nat Commun, 2011, 2: 554
第26卷286 RNA研究的新技术和新方法专题
席建忠报告讨论
付向东 ( 加州大学圣地亚哥分校 )
Q:你做细胞微阵列 (cell microarray)用的芯片都是多大的?都是 96孔的吗?
A:我们用的主要是有三种不同的型号的,做的比较好的是 96孔的芯片,还有大一点的芯片,有 300
多孔。
Q:那么你这个除了用于研究 RNA干扰、microRNA外,还可以用于功能筛选吗?
A:是的,我们现在技术也用于大规模筛选影响细胞功能的化学小分子,已经取得了很好的结果。
邵宁生 ( 军事医学科学院 )
Q:合作的话,是找您还是找公司?
A:如果你有成熟的细胞模型,不需要我们再花时间优化筛选模型,完全可以找公司合作,比如吉诺
瑞等。如果你们需要建立或优化筛选模型,我们还是有一些经验的,我们可以给您一些建议,或者开展合作。
施蕴渝 ( 中国科学技术大学生命科学学院 )
Q:从芯片中如何反应细胞迁移?
A:细胞迁移前和迁移后的 microarray进行比较,如果细胞发生迁移,就会检测到信号分布的变化。
由于凋亡会释放细胞内的核酸,会干扰结果,因而也需要做一个凋亡的对照。
[16] Wuestefeld T, Pesic M, Rudalska R, et al. A direct in vivo
RNAi screen identifies MKK4 as a key regulator of liver
regeneration. Cell, 2013, 153(2): 389-401