全 文 :·综述与专论·
生物技术通报
B IO TECHNOLOGY BULL ETIN 2009年第 12期
假基因的发现与研究
徐娜 李宝玉 柳纪省
(中国农业科学院兰州兽医研究所 家畜疫病病原生物学国家重点实验室 农业部畜禽病毒学重点开放实验室
农业部草食动物疫病重点开放实验室 ,兰州 730046)
摘 要 : 随着人类基因组计划的顺利实施 ,人们分离、鉴定新基因的速度越来越快 ,对于占人类基因组 97%的非表达序
列的研究 ,即对所谓“垃圾 ”DNA的研究已成为全球范围内关注的热点。现就假基因的发现、命名和分类、特性和分布、产生、
作用机理、功能、进化及展望等方面进行论述。
关键词 : 假基因 分类 特性与分布 产生 作用机理 功能与进化
The D iscover ies and Research of Pseudogene
Xu Na L i Baoyu L iu J ixing
(Anim al Infectious D iseases Research Laboratory, Lanzhou Veterinary Research Institu te, Chinese Academ y of Agricultural Sciences,
S ta te Key Laboratory of Veterinary Etiological B iology, Key Laboratory of Veterinary Public Health of M inistry of Agriculture, Lanzhou 730046)
Abs trac t: W ith the Human Genome Projectpis successful imp lementation, the separation and identification of new genes is increas2
ing significanty1A s 97% of the non2exp ression human genome sequence, the so2called“junk”DNA research has become a global con2
cern hot1This article described the discovery of p seudogenes, nomenclature and classification, characteristics and distribution, genera2
tion, mechanism, function, evolution and p rospects1
Key wo rds: Pseudogenes Classification Characteristics and distribution Generation Mechanism Function and evolution
收稿日期 : 2009208227
作者简介 :徐娜 (19832) ,女 ,在读硕士研究生 ,研究方向 :分子病毒学 ; E2mail: junjun258660350@1261com
通讯作者 :柳纪省 (19552) ,男 ,博士生导师 ,研究员 , Tel: 093128342682, E2mail: liujixing@ hotmail1com
假基因 (p seudogene)是指基因组中与正常基因
序列相似 ,但是缺乏功能的 DNA序列。随着人类基
因组计划的顺利实施 ,人们分离、鉴定新基因的速度
越来越快 ,对于占人类基因组 97%的非表达序列所
谓“垃圾 ”DNA的研究 (只有约 3%的人类基因组是
由外显子序列组成的 ) ,已成为全球范围内关注的
热点。预计人类基因组中有大约 20 000 种假基
因 [ 1 ] ,并且在线虫、果蝇 [ 2 ]以及酵母等当中发现了
大量假基因的存在。
1 假基因的发现
Jacq等 [ 3 ] 在非洲爪蟾 DNA 中克隆一个 5S
rRNA相关基因 , 5S rRNA是核糖体大亚基的一个组
分 ,非洲爪蟾的 5S rRNA基因的一个重复单位含有
一个 5S rRNA基因、一个不转录的假基因 (101 bp的
5S rRNA基因的片段 ) ,每个重复单位被不转录的间
隔序列隔开 ,间隔序列的长度变化不定 ,最长达 400
bp。将其与原基因相比 ,在 5′端有 16 bp的缺失以
及 14 bp的错配 ,他们将这个截短的 5S rRNA的同源
物称为假基因 ,并在其同源基因的名称前加假基因
符号ψ,以示区别。
2 假基因的命名和分类
211 假基因的命名
不同类别假基因的命名 ,一般来说以 gPx表示 :
g代表已经证实的来自于数据库的编码蛋白质的基
因 , P为假基因 , x为具体代码。如 cyp21。
212 假基因的分类
根据是否保留相应功能基因的间隔序列 (如内
含子 ) ,假基因分为两大类 :一类保留了间隔序列 ,
称为复制型假基因 ( dup licated p seudogene) ;另一类
则缺少间隔序列 ,称为处理后假基因 ( p rocessed
p seudogene)。人类假基因中大约有一半多是处理
后假基因。根据结构和起源假基因可分为加工假基
生物技术通报 B iotechnology B u lle tin 2009年第 12期
因 (p rocessed p seudogene)和未加工假基因 ( nonp roc2
essed p seudogene) [ 4 ]。
3 假基因的特性和分布
311 假基因的特性
与相应的正常基因相比 ,假基因往往缺少正常
基因的内含子 ,末端有很短一段 A·T碱基对 ,两侧
有顺向重复序列。大多数假基因本身存在多种遗传
缺陷。这些遗传缺陷包括 :可读框中的无义突变 ;非
3的整数倍的核苷酸插入或缺失导致阅读框移码 ;
控制基因转录或剪接的调控区的缺失突变 ,这些缺
陷引起基因功能的损失发生在转录水平和 /或翻译
水平 [ 5 ]。
312 假基因的分布
假基因普遍存在于生物的基因组中 ,假基因与
其功能基因在染色体上的排列并非共线性关系 ,而
是散布于有活性的功能基因之间。线虫中占总数
53%的假基因集中在染色体短臂末端 ,而这个区域
只有 30%的基因。在果蝇中 ,靠近染色体中心的着
丝点附近假基因分布密度明显增加 ,预示在染色体
上可能存在假基的热点 ( hotspot)。假基因在人类染
色体上的分布与染色体长度成比例 ,但加工假基因在
G + C含量为 40% ~46%的染色体区域密度最高。
未加工假基因则聚集在基因组富含基因的区域。
4 假基因的产生
根据假基因形成机制的不同 ,假基因可分为加
工假基因和未加工假基因。
411 加工假基因的产生
复制过程中对基因 DNA 序列进行修饰 (无义
突变、插入、缺失、移码 ) [ 6 ] ,导致复制后的基因无法
进行正常的编码 ,由此产生的缺陷引起基因功能在
转录水平或翻译水平 ,或两个水平上丧失 ,形成沉默
的冗余片段 ,从而使其丧失正常功能不再产生蛋白
质。它们往往保留了功能基因的外显子 2内含子结
构 ,有时这种结构是不完整的。
412 未加工假基因的产生
通过 DNA 转录为 mRNA 后 ,再逆转录成为
cDNA重新整合进入基因组 (很可能发生在生殖细胞
中 ) ,在长期进化选择过程中因为随机突变积累而
丧失功能 ,又得以保留成为假基因 ,这样产生的功能
基因有缺陷的拷贝便是处理后的假基因。
5 假基因的作用机理
假基因的作用有序列专一性 ,只影响与基因本
身相似的一些序列。由假基因介导的基因调控有两
种可能的作用机理 : DNA指导的调控和 RNA指导
的调控。
511 DNA调控的机理
假基因和基因的前 700核苷酸区域的调控元件
相互竞争 ,而对抑制蛋白的利用是有限的 ,因此它们
与转录抑制剂竞争性结合 ,从而调控功能基因的
表达。
512 RNA调控的机理
最近显示非编码蛋白质的 RNA履行了一系列
的生物学功能 ,比如参与基因沉默、催化和发育调控
有关的小 RNA。假基因与它类似的活性基因的
mRNA相互竞争 ,与一种去稳定蛋白质结合 ,这种去
稳定蛋白质是一种 RNA消化酶 ,与 mRNA的起始
端附近 700个核苷酸区域结合。非编码 RNA起稳
定 makorinlmRNA作用 ,并且 makorinl和 makorinl2p l
的 mRNA前 700个核苷酸都含有一个稳定因子的
识别位点 ,为此假基因表达后通过直接竞争的方式
剔除稳定因子。
6 假基因的功能
假基因与正常基因有相似的序列 ,但是与正常
基因存在结构上的差异。这些差异包括在不同部位
上程度不等的核苷酸缺失或插入 ,在基因内含子和
外显子连接区发生序列变化 ,在编码序列当中含有
终止密码子 ,或在转录启动区出现缺陷等。这些变
化使此类基因不能转录或翻泽 ,或者产生有缺陷的
蛋白质从而失去了原有的生物学功能。
长期以来 ,人们认为假基因是貌似正常、却没有
功能的“死亡基因 ”, 是基因组进化的“化石记
录 ”[ 7 ]。但是近年来 ,关于假基因的讨论日益增多 ,
越来越多的试验证实假基因能够转录并且表达。现
在已经知道 ,大约有 5% ~20%的人类假基因能够
活跃转录 ,在小鼠体内也发现有大量的假基因转录
产物。
611 调节基因的表达
相比其功能基因 ,相当一部分假基因的转录产
物发生了改变 ,这可能是受到了假基因启动子区域
多样性的影响。这些转录产物在体内往往不能表达
82
2009年第 12期 徐娜等 :假基因的发现与研究
或仅仅在其功能基因发生特殊表达的情况下才表
达 [ 8 ]。2003年 ,一个日本研究小组发现了第一个有
功能的假基因 , H irot等培育出一种转基因小鼠 ,这
些转基因小鼠带有一个名叫“性别致死 ”的基因。
这个外来基因在大多数小鼠身上并没有产生显著影
响 ,但在某一个品系中 ,所有的小鼠在幼年时就死
了。研究结果表明 ,在该品系的小鼠中 ,插入一个叫
makorinl2p l的假基因 ,这个假基因是 makorinl基因
的变异体 ,比 makorinl基因要短很多 ,不编码蛋白
质 ,而且当它损坏后 ,对应的真基因也不工作 ,说
明不编码蛋白质的基因对生存至关重要。H irot认
为一个假基因可能调节与它们同源的功能基因
表达。
612 基因调控
早在 1999年 ,研究人员在静水椎实螺中就发现
一氧化氮合酶 (NOS)基因的一个假基因能够转录形
成反义 RNA,与 NOS正常基因的转录物 mRNA形
成 RNA2RNA杂合体 ,进而抑制一氧化氮合酶的合
成。Healy等证实了假基因 Est26对功能基因表达
的重要调控作用。Troyanovsky和 Leube还描述了一
个功能基因与假基因共同协作编码人类 cytokeratin
17表达的有趣试验。但目前对于假基因确切的基
因调控功能仍有待研究。
613 假基因干预细胞的基因沉默机制
Frank等 (2002)研究结果表明 ,有些假基因包
含着许多重复多次的 DNA序列 ,这种重复的 DNA
序列能够激发某种反应 ,最终阻止特定的基因被打
开 ,干预细胞的基因沉默机制 ,进而影响到疾病。强
直性肌营养不良和弗里德赖希型共济失调 (共济失
调指四肢与躯体活动不协调引起的走路、持物不稳 ,
口齿不清等现象 )是人类两种与 DNA异常有关的
疾病。科学家以携带与这两种疾病相关的不正常的
重复 DNA的试验鼠为对象 ,通过对这些不正常的重
复 DNA进行操作 ,调整了基因沉默状况 ,达到了影
响这两种疾病严重程度的目的。
614 产生基因的多样性
假基因可以说是产生基因多样性的源泉。抗体
多样性的例子在人类、兔以及其他脊椎动物中都能
找到。基因的转换也可能在基因与假基因之间进
行 ,假基因序列以及其他特有特征通过自然选择得
到了保留。假基因还常常与它们的同源功能基因重
组产生抗原多样性 [ 9 ]。有报道证实一些细菌病原
体存在着在表达抗原基因的时候产生序列多样性的
机制。最近 ,日本奇玉大学的研究人员在试验过程
中发现毁坏了一个假基因 ,结果就毁掉了一个白鼠。
美国杜克大学的科研人员给基因型相同的老鼠在胎
生期间喂食维生素 B12 ,发现食物中假基因含量的高
低能够影响老鼠出生后的身体颜色。
7 假基因与进化
在进化过程中 ,假基因通过复制和反转录转座
这两种方式不断地在人类的基因组中出现。由于假
基因大部分都不能转录 ,没有生物学功能 ,所以不再
像正常基因一样受到进化的选择 ,而是逃避了选择
压力 ,进化过程很难把它们从基因组里剔除出去 ,导
致假基因在生物基因组中大量存在。
711 假基因可以确定物种的亲缘关系和进化距离
通常采用多序列比对工具 ClustalW 程序 ,比较
功能基因和相近假基因的序列 ,找出假基因功能缺
失的位置及终止密码子的位置等序列特征 ,进而使
用 N2J方法来确定假基因之间或者假基因和功能基
因之间的进化距离 ,从而获得以下信息 :假基因和对
应基因的进化年代 ,插入缺失的位置偏好 ,插入缺失
的序列特征 ,基因组中长序列删除的特性 ,单位点突
变频率。
712 假基因为物种的进化提供了丰富的材料
假基因与内含子、卫星序列和转位因子等冗余
DNA一样 ,是不受进化的负选择作用的。假基因很
好地保留了数百万年前基因组中祖先基因的分子记
录 ,被视为“分子化石 ”,因此假基因在进化和比较
基因组学中是重要的资源。
8 展望
随着更多物种基因组测序计划的展开或完成 ,
基因数据库中的序列数据正在以天文数字增长。利
用现有的分析工具 ,可以从全基因组序列中获得群
系的假基因分布信息 ,使假基因数据库逐步完善。
对假基因的研究能促进人类从另一个角度认识某些
遗传病 ,从而使人们对人类基因组本身和复杂的进
化起源和进化过程有更深刻地了解。
(下转第 36页 )
92
生物技术通报 B iotechnology B u lle tin 2009年第 12期
cation, 2008, 61: 168~174.
8 Lehrer R I, Ganz T. Ciba Found Symp, 1992, 171: 276~290.
9 Schneider JJ, Unholze A, Schaller M, et al1J Mol Med, 2005, 83:
587~5951
10 Ganz T, Selsted ME, Szklarek D, et al1J Clin Invest, 1985, 76 ( 4 ) :
1427~24351
11 De Smet K, Contreras R1B iotechnology Letters, 2005, 27: 1337~
1347.
12 高真贞 ,董开忠. 西北民族大学学报 , 2007, 28 (2) : 63~66.
13 Bensch KW , Raida M, Magert HJ, et al. FEBS Lett, 1995, 368:
331~335.
14 Garcia JR, Krause A, Schulz S, et al. The FASEB Journal, 2001, 15:
1819~1821.
15 刘青 , 张阳根 , 王厚照. 实用医技杂志 , 2006, 13 ( 15 ) : 2577
~2579.
16 Pazgiera M, Hooverb DM, YangHuman D, et al. Cell Mol L ife Sci,
2006, 63: 1294~1313.
17 Valore EV, Ganz T. B lood, 1992, 79: 1538~1544.
18 Rahman A, Fahlgren A, Sitohy B, et al. β2Defensin Production by
Human Colonic Plasma Cells: A New Look at Plasma Cells in U lcer2
ative Colitis, Inflamm Bowel D is, 2007, 13: 847~855.
19 Yenugu S, Ham il KG, Radhakrishnan Y, et al. Endocrinology, 2004,
145: 3165~3173.
20 Batoni G,Maisetta G, Esin S, Campa M. M ini2Reviews in Medicinal
Chem istry, 2006, 6: 1063~1073.
21 Torres AM, Kuchel PW , et al. Toxicon, 2004, 44: 581~588.
22 Lundya FT, Nelson J, Lockhart D. Molecular Immunology, 2008, 45:
190~193.
23 W u Z, Hoover DM, Yang D, et al. Proc Natl Acad Sci, 2003, 100:
8880~8885.
24 Xie C, Prahl A, Ericksen B, et al. J B iol Chem, 2005, 280: 32921~
32929.
25 Yount NY, Yeaman MR. Proc Natl Acad Sci, 2004, 101: 7363~
7368.
26 Torres AM, Kuchel PW. Toxicon, 2004, 44: 581~588.
27 Sawai MV, J ia HP, L iu L, et al. B iochem istry, 2001, 40: 3810~
3816.
28 De Smet K, Contreras R. B iotechnology Letters, 2005, 27: 1337~
1347
29 Ganz T. CR B iologies, 2004, 327: 539~549.
30 Valore EV, Martin E, Ganz T, et al. J Clin Invest, 1996, 97 ( 7 ) :
1624~1629.
31 L inzmeier RM, Ganz T, et al. Genom ics, 2005, 86: 423~430.
32 Harwig SS, Park AS, Lehrer R I. B lood, 1992, 79: 1532~1537.
33 McCray PB J r, Bentley L. Am J Resp ir CellMol B iol, 1997, 16 (3) :
343~349.
34 Papo N, Shai Y. Cell Mol L ife Sci, 2005, 62: 784~790.
35 B iragyn A. Curr Protein Pep t Sci, 2005, 6: 53~60.
(上接第 29页 )
参 考 文 献
1 A itken A, Baxter H, Dubois T, et a11B iochem Soctrans, 2002, 30
(4) : 351~360.
2 Yg Z, et al. J Boil Chem, 2001, 276: 8403~8408.
3 Jacq C,M illler JR, B rowldee GG. Cell, 1977, 12 (1) : 109~120.
4 Harrison PM, Gerstein M. Journal of Molecular B iology, 2002, 318
(5) : 1155~1174.
5 Adolph KW. B iochem B iophys Res Commun, 1999, 259: 527~535.
6 Bensasson D, Petrov DA, Zhang DX, et al. Mol B iol Evol, 2001, 18:
246~253.
7 Harrison PM, Hegyi H, Balmqubmmaniau S, et a1. Genome Research,
2002, 12 (2) : 272~280.
8 Zuckerkandl E. Genetica, 2002, 115: 105~129.
9 Glusman G, Sosinsky A, Ben2A sherx E, et al. Genom ies, 2000, 63:
227~245.
63