全 文 :生命科学
Chinese Bulletin of Life Sciences
第 22卷 第 1期
2010年 1月
Vol. 22, No. 1
Jan., 2010
文章编号 :1004-0374(2010)01-0074-05
收稿日期:2009-06-30;修回日期:2009-09-17
基金项目:国家自然科学基金项目(30971673)
*通讯作者:Tel: 010-82995408;E-mail: fangxd@big.
ac.cn
位点控制区(LCR)调控基因表达的研究进展
王 海,阮修艳,方向东*
(中国科学院北京基因组研究所基因组科学及信息重点实验室,北京 100029)
摘 要:最早在人类 β珠蛋白基因座中发现的位点控制区(locus control regions,LCR)对于珠蛋白基因
在红细胞分化和发育过程中的特异性表达起着重要作用。LCR位于珠蛋白基因上游 6~25 kb,由至少 7
个 DNaseI超敏感位点所组成,具有很强的增强子活性,可以激活和促进珠蛋白基因的转录。LCR 增
强子活性具有组织特异性,并与拷贝数成正比。此外,LC R 还参与基因在细胞核内的定位、组蛋白
修饰、染色质开放、边界结构域形成,以及 DNA复制起始等精细调控过程。有多个模型阐述 LCR 远
程调控基因表达的分子机制,被普遍接受的是成环模型(looping model)。在生长激素(GH)、TH2细胞因
子、MHC II等基因区域也发现有类似珠蛋白的 LCR 结构,都在深入研究之中。
关键词:LC R;转录调控;β 珠蛋白基因座
中图分类号:Q 75 8 文献标识码:A
Gene expression regulated by locous control region
WANG Hai, RUAN Xiu-yan, FANG Xiang-dong*
(Key Laboratory of Genome Science and Information, Beijing Institute of Genomics,
Chinese Academy of Sciences, Beijing 100029, China)
Abstract:The locus control region (LCR) was first identified in the human β globin locus. It plays an important
role of regulating gene expression in differentiation and development of erythrocyte. The LCR is located 6 - 25 kb
upstream of the first globin gene and consists of 7 DNase I hypersensitive sites. The most prominent property
of the LCR is their strong transcription-enhancing activity. LCR can also participate in histone modification,
chromatin ‘open’, nuclear localization, domain boundaries formation, and timing and origin of DNA replication.
Four models of LCR function have been proposed, while most of the experimental results support the looping
model. Besides in β globin locus, LCRs are found in the loci of growth hormone, TH2 cytokine, MHCII and many
other genes.
Key words:LCR; transcriptional regulation; β globin locus
位点控制区(locus control regions,LCR)是真
核细胞中能够远程调控相关基因表达水平的DNA 序
列,具有组织特异性和拷贝数依赖性。染色体DNA
对DNase I的敏感性是一项非常重要的表观遗传学指
标。当基因处于转录活性状态的时候,其所在区域
的染色质结构会处于相对松散的状态,因此DNase I
易于接触到染色体DNA,这个染色质区域的DNA
对DNase I的敏感性就会比染色质致密、转录活性
低的区域高。在具有转录活性的基因 5端启动子区
域,以及转录单元上、下游几十乃至几百 kb以外
的区域,还会存在对DNase I高度敏感的区域,被
称为超敏感位点(hypersensitive site,HS),每个位
点又含有由多个通用和组织特异性的转录因子结合
位点组成的 200~300 bps的核心序列。LCR就是由
多个DNase I HS所组成[1]。
LCR最早是在人类 β珠蛋白基因座中发现的。
7 5第1期 王 海,等:位点控制区(LCR)调控基因表达的研究进展
最初研究发现,含有 1.5 kb启动子的 5 kb β珠蛋
白基因片段可以在红白血病细胞系中表达,表明该
片段含有能使基因适当表达的必要调控元件;但
是,同样的基因在转基因小鼠中的表达量却很低,
无法达到正常生理所需水平,这就提示该基因片段
还缺少体内高效表达所必需的其他重要调控元件[1]。
另外,某些β地中海贫血患者的β珠蛋白基因正常,
但珠蛋白却不表达,DNA序列分析显示其β珠蛋白
基因上游缺失一段很长的非编码序列,从而导致致
密的异染色质结构延伸到整个基因区域,抑制基因
转录。这些实验均提示,一段位于 β珠蛋白基因上
游的DNA序列在珠蛋白的表达中可能发挥重要的调
控作用。随后的研究发现,该区域富含 DNase I
HS s,其结构、功能和作用机制逐步引起广泛关
注,并在 1990年被正式命名为位点控制区[2]。近
年来,科学家们又陆续在其他许多基因座中发现了
LCR结构,同样具有调控真核基因表达的作用。随
着各种真核生物基因组计划的陆续完成和表观基因
组学研究的逐步拓展,可望发现更多在真核生物的
发育和分化过程中发挥重要调控作用的 LCR结构。
1 LCR的结构
LCR可以使受调控基因在发育或分化过程中以
一定的时序和模式表达,它可以含有多种顺式调控
元件,包括增强子(enhancer)、沉默子(silencer)、
绝缘子(insulator)、核基质结合区(nuclear-matrix at-
tachment regions, NMRs)等。这些调控元件可以通
过结合转录因子及其共激活物,以及基质蛋白或染
色质修饰蛋白等蛋白质复合物,在时间和空间上特
异性调控基因的转录[3]。LCR具有很强的增强子活
性,但与一般只含有一个DNase I超敏感位点的增
强子不同的是:LCR含有多个这样的位点[4]。
LCR可以位于目标基因的上游,也可以位于基
因的内含子(如人的腺苷脱氨基酶[5])和基因下游(如
CD2[6]、TH2细胞因子[7]),有的还存在于相邻基因
的内含子中(如 CD4[8])。LCR的调控元件可以成簇
排列,也可以分散分布;可以协同,也可以单独
调控基因的特异性表达。
2 LCR的功能
LCR最主要的功能是其组织特异的强增强子活
性,与传统的增强子和沉默子相似,LCR也是远距
离调控基因转录,确保基因在发育的不同阶段正确
表达。这一过程是LCR上的组织特异或通用的转录
因子结合位点,通过转录因子介导的与启动子之间
的相互作用来完成的。转基因小鼠的研究结果表
明,LCR的转录调控作用不依赖其在染色体DNA的
插入位置,但与其拷贝数呈正比[4 ]。
LCR在组蛋白的翻译后修饰中起着重要作用,
LCR的部分序列缺失将导致组蛋白H3和H4的乙酰
化、H3K4的甲基化水平明显降低。而H3和H4的
乙酰化、H3K4的甲基化又是染色质结构松散的标
志,提示 LCR 可以“打开”,并维持“开放”的
染色质结构[4,9],这种较为松散的结构,将有利于
转录因子结合 DNA,实现激活基因转录的目的。
LCR还具有绝缘子的功能,即抑制增强子激活
基因转录或阻止因异染色质结构蔓延所导致的基因
沉默等效应。LCR也可以通过影响基因在细胞核中
的定位来调控基因的转录;控制 DNA复制起始和
DNA去甲基化[10]。
3 LCR的作用机制
LCR是转录调控元件远程调控真核基因表达的
典型例子,目前有几个模型来阐述其作用机制(图 1)。
成环模型(looping model) 认为 LCR通过转录因
子等蛋白质复合物介导,在空间上与启动子靠近,
形成相互作用的环状结构[11]。LCR拥有与启动子相
似的转录因子结合位点,而且在数量上多很多,因
此,转录因子很容易先结合于 LCR,之后染色质结
构发生弯曲,LCR与启动子相互靠近,结合成环,
更多的转录因子被传递到启动子区域,发挥转录激
活的效应。跟踪模型(tracking model)认为富集到
LCR的转录激活蛋白沿着染色体纤维移动,直到目
标基因的启动子位置激活转录,在这个移动、寻找
的过程中,结合于LCR的激活蛋白没有离开LCR[12]。
易化跟踪模型(facilitated tracking model)是跟踪模型
和成环模型的结合,认为特异的转录激活蛋白首先
与LCR结合,之后通过成环作用再与接近启动子的
上游DNA结合,然后这些转录调控因子在染色体纤
维上通过短距离移动确认目标启动子,进而激活转
录[13]。连接模型(linking model) 认为 LCR和启动子
上结合的特异性转录激活蛋白是通过多个非DNA结
合蛋白和染色质修饰蛋白顺序连接,并通过改变染
色质构象来激活转录[14]。
这些模型都只能简单地描述 LCR的作用机制,
实际上LCR调控基因转录是十分复杂的过程,尽管
四种模型都还有不足之处,但更多的实验倾向于支
持成环模型。
7 6 生命科学 第22卷
图1 LCR的作用机制模型[1]
A成环模型;B 跟踪模型;C 易化跟踪模型;D 连接模型
较浅的绿色盒子:启动子区域;加深的绿色盒子:珠蛋白
基因;彩色的椭圆形和圆形:转录因子;红色小方格:4
个血红系统特异的HSs;蓝色方块:5HS5和 3HS1,代表
绝缘子;波纹箭头:激活转录
4 LCR与珠蛋白表达的调控
由于 β珠蛋白基因座是多个基因成簇排列,具
有红系组织和不同发育时相的特异性,因此是研究
哺乳动物发育或分化过程中转录调控的理想模型[2]。
人类 β-珠蛋白基因簇位于染色体 11p15.5,由 5个
高度同源的功能基因和 1个假基因组成,其中 ε-基
因在胚胎期表达;Gγ -和 Aγ -基因在胎儿期表达;
δ-和 β-基因在成年期表达。LCR 位于 ε-基因上游
图2 人和小鼠的β珠蛋白基因座[1]
6~25 kb处(图 2),在红系特异的珠蛋白基因表达中
发挥重要调控作用[2]。
其中HS2~4具有增强子活性;HS5具有绝缘子
作用,可以有效阻止红细胞中 β珠蛋白基因座周围
的异染色质区域的延伸;HS1、6和 7的功能尚有
待确定。当 LCR缺失时,β珠蛋白基因表达水平明
显降低,说明 LCR能维持相关基因的正常转录水
平。转基因小鼠的研究表明,HS3 核心序列的缺
失,可以导致包括LCR在内的整个β珠蛋白基因区
域的组蛋白低乙酰化;而HS3的完全缺失则没有类
似效应[15]。但也有研究发现,处于活性状态和非活
性状态的珠蛋白基因区域都有组蛋白H3和H4乙酰
化、H3K4甲基化等修饰[16] ,而且删除 LCR,组
蛋白乙酰化水平没有明显的变化,说明 LCR的结
构、组蛋白修饰和珠蛋白基因表达三者之间的因果
关系较为复杂。红系特异转录因子NF-E2和GATA-1
都可以将乙酰转移酶(HAT)富集到 LCR,催化 LCR
区域组蛋白的乙酰化。之后,乙酰化修饰以 LCR
为中心向两侧传播,正向调控基因转录[16]。
在珠蛋白尚未表达的红系祖细胞中,LCR的
5HS5与珠蛋白下游的3HS1即可结合形成稳定的染
色质结构。但是,只有在已完全正常分化的红细胞
中,β珠蛋白上下游的HSs位点才会与不同的珠蛋
白启动子结合,形成具有调控活性的环状染色体结
构(active chromatin hub, ACH) 激活转录[17]。在不表
达珠蛋白的细胞中,这种活化的环状结构则难以形
成[18]。这些都支持 LCR的成环作用机制。也有实
验证实,β-LCR可能在转录前就将珠蛋白基因定位
于适合转录的细胞核位置。
研究 β-LCR的经典方法同样适用于研究其他
LCR,可用 DNase I或小球核酸酶(micrococcal
nuclease,MNase)作图寻找和确定HSs;染色质构
象捕获技术(chromosome conformation capture, 3C)
7 7第1期 王 海,等:位点控制区(LCR)调控基因表达的研究进展
可检测成环作用机制;染色质免疫共沉淀技术
(chromatin immunoprecipitation, ChIP)可检测染色体
DNA上转录因子结合状态以及染色质组蛋白的末端
修饰状况;荧光原位杂交技术(fluorescence in situ
hybridization, FISH)可分析LCR在细胞核中的定位等
等。近年发展起来的高通量测序技术则有助于发现
和确定更多的 LCR结构。
5 LCR与其他基因的表达调控
除了 β 珠蛋白 LCR,人们还发现许多其他受
LCR时空调控的基因座,其中最具代表性的有生长
激素(GH)、TH2细胞因子和MHCII。
5.1 生长激素(growth hormone, GH)基因座
人生长激素基因簇包括在脑下垂体表达的生长
激素基因 G H N 和其他四个在胎盘表达的基因:
CSA、CSB、CSL和 GHV。HS I和 HS II是脑下
垂体特异的DNase I超敏位点,分别位于GHN基因
上游 14.5 kb和 15.3 kb,而其他HSs则位于上游更
远的位置[4]。对转基因小鼠的脑下垂体组织的分析
结果表明,一个 32 kb的组蛋白乙酰化区域从 LCR
延伸到GHN,并且HS I和 HS II上乙酰化水平最
高,提示HAT结合到HS I和 HS II上使该区域组
蛋白乙酰化,并且双向传播乙酰化,这些结果支持
追踪模型假说[4]。
HS I和GHN启动子包含众多转录激活蛋白Pit-1
的结合位点。从HS I上删除包含两个 Pit-1结合位
点的区域将导致组蛋白乙酰化水平的急剧下降,脑
下垂体中GHN的表达也严重减少[19],说明HS I既
参与GH基因座的表观遗传修饰,又具有增强子的
活性。
5.2 TH2细胞中的细胞因子基因座
CD4+T细胞在受到抗原刺激时会向两个方向分
化:产生 IFN-γ的 TH1细胞和产生 IL4、IL5和 IL13
的TH2细胞。TH2的细胞因子基因座为5- Il5-Rad50-
Il13-Il4-Kif3a-3,其 LCR位于 Rad50基因的 3端,
包括 HS4~7[7]。3C的实验结果表明,在 T细胞中
不管基因是否表达,Il4、Il5和 Il13的启动子之间
都相互结合,先形成预置染色质中心(pre-posed
chromatin hub) ;基因表达时,HS4~7参与结合形
成稳定的染色质中心,促使基因转录。另外,
GATA-3和 STAT6等转录因子也参与建立和维持这
些染色质结构。
除了位于同一条染色体上的调控序列会作用于
相邻基因调控转录,不同染色体上的DNA调控序列
之间也可以相互作用。TH1细胞中的 Inf-γ的启动子
位于人的 10号染色体,而 TH2 细胞因子的 LCR则
位于 11号染色体[20]。研究表明, TH2 的 LCR在发
育早期参与 Inf-γ与Rad50、Il5等TH2基因座之间的
相互作用。随着 T细胞分化,不同染色体之间的相
互作用会逐渐减弱,而倾向于同一染色体上的相互
作用,即在 CD4+细胞中 Inf-γ和 TH2 细胞因子基因
座相互作用成环,这种结构使得两者都有表达的可
能性。在分化的 TH1或 TH2 细胞中,两者的相互
关联消失,一个处于活化状态,另一个则处于静默
状态 [ 2 0 ]。
5.3 组织相容性抗原 II基因座
主要组织相容性抗原 II(MHC II)只在免疫系统
的抗原递呈细胞中表达,两个重要的基因特异性激
活蛋白 RFX(regulatory factor X)和 CIITA都可以与
鼠源H2-Ea基因和人源HLA-DRA启动子结合,调
控MHC II的转录[21]。H2-Ea基因启动子含有S-Y单
元,其 LCR位于基因上游 1.3~20 kb,其 3端包含
四个与S-Y方向相反的Y-S基序,它同样可以结合
RFX和 CIITA,这些基序可以通过转录因子等蛋白
质介导的相互作用形成环状结构。
与 RFX和 CIITA 结合的Y-S位点附近有大范
围的组蛋白乙酰化,而且乙酰化可以延伸到下游基
因编码区,上游到 16 kb,LCR两侧的乙酰化水平
也达到最高[21],说明乙酰化从 LCR开始向两侧传
播。与 β珠蛋白 LCR 的HS2相似,MHC II的 LCR
也没有较高的组蛋白乙酰化水平,可能是与核小体
结构的缺失有关。
6 小结
LCR在真核基因的转录调控过程中发挥着至关
重要的作用,对其结构、功能和作用机制也已经有
了较为系统的认识。然而,LCR调控基因特异性表
达是相当复杂的过程,目前尚不能圆满解释LCR与
启动子相互作用并且形成环状结构的分子机理;还
不清楚 LCR影响DNA甲基化、组蛋白修饰、染色
质结构变化的表观遗传学机制等,这些问题都有待
于进一步的深入研究。
[参 考 文 献]
[1] Li Q, Peterson KR, Fang X, et al. Locus control regions.
Blood, 2002, 100(9): 3077-86
[2] Stamatoyannopoulos G. Control of globin gene expression
7 8 生命科学 第22卷
during development and erythroid differentiation. Exp
Hematol, 2005, 33(3): 259-71
[3] Maston GA, Evans SF, Green MR. Transcriptional regula-
tory elements in the human genome. Annu Rev Genomics
Hum Genet, 2006, 7: 29-59
[4] Dean A. On a chromosome far, far away: LCRs and gene
expression. Trends Genet, 2006, 22(1): 38-45
[5] Aronow BJ, Silbiger RN, Dusing MR, et al. Functional analy-
sis of the human adenosine deaminase gene thymic regula-
tory region and its ability to generate position-independent
transgene expression. Mol Cell Biol, 1992, 12(9): 4170-85
[6] Lang G, Mamalaki C, Greenberg D, et al. Deletion analysis
of the human CD2 gene locus control region in transgenic mice.
Nucleic Acids Res, 1991, 19(21): 5851-6
[7] Lee GR, Fields PE, Griffin TJ, et al. Regulation of the Th2
cytokine locus by a locus control region. Immunity, 2003,
19(1): 145-53
[8] Adlam M, Siu G. Hierarchical interactions control CD4 gene
expression during thymocyte development. Immunity, 2003,
18(2): 173-84
[9] Jenuwein T, Allis CD. Translating the histone code. Science,
2001, 293(5532): 1074-80
[10] Simon I, Tenzen T, Mostoslavsky R, et al. Developmental
regulation of DNA replication timing at the human β globin
locus. EMBO J, 2001, 20(21): 6150-7
[11] Grosveld F. Activation by locus control regions? Curr Opin
Genet Dev, 1999, 9(2): 152-7
[12] Bondarenko VA, Liu YV, Jiang YI, et al. Communication
over a large distance: enhancers and insulators. Biochem Cell
Biol, 2003, 81(3): 241-51
[13] Zhu X, Ling J, Zhang L, et al. A facilitated tracking and
transcription mechanism of long-range enhancer function.
Nucleic Acids Res, 2007, 35(16): 5532-44
[14] Bulger M, Groudine M. Looping versus linking: toward a
model for long-distance gene activation. Genes Dev, 1999,
13(19): 2465-77
[15] Fang X, Sun J, Xiang P, et al. Synergistic and additive prop-
erties of the β-globin locus control region (LCR) revealed by
5’HS3 deletion mutations: implication for LCR chromatin
architecture. Mol Cell Biol, 2005, 25(16): 7033-41
[16] Litt MD, Simpson M, Recillas-Targa F, et al. Transitions in
histone acetylation reveal boundaries of three separately
regulated neighboring loci. EMBO J, 2001, 20(9): 2224-35
[17] Palstra RJ, Tolhuis B, Splinter E, et al. The β-globin nuclear
compartment in development and erythroid differentiation.
Nat Genet, 2003, 35(2): 190-4
[18] Tolhuis B, Palstra RJ, Splinter E, et al. Looping and interac-
tion between hypersensitive sites in the active β-globin locus.
Mol Cell, 2002, 10(6): 1453-65
[19] Ho Y, Elefant F, Cooke N, et al. A defined locus control
region determinant links chromatin domain acetylation with
long-range gene activation. Mol Cell, 2002, 9(2): 291-302
[20] Spilianakis CG, Lalioti MD, Town T, et al. Interchromo-
somal associations between alternatively expressed loci.
Nature, 2005, 435(7042): 637-45
[21] Masternak K, Peyraud N, Krawczyk M, et al. Chromatin
remodeling and extragenic transcription at the MHC class II
locus control region. Nat Immunol, 2003, 4(2): 132-7