全 文 :第 29 卷 第 2 期 作 物 学 报 V ol. 29, N o. 2
2003 年 3 月 194~ 201 页 A CTA A GRONOM ICA S IN ICA pp. 194~ 201 M ar. , 2003
功能基因组学及其研究方法α
张祖新 张方东 郑用琏
(华中农业大学作物遗传改良国家重点实验室, 湖北武汉 430070)
摘 要 功能基因组学是在结构基因组学丰富信息资源的基础上, 应用大通量的实验分析方法并结合统计和计算机分
析研究基因的表达、调控与功能以及生物的生长、发育规律的新型交叉学科。基因功能研究采用从基因到表型和从表
型到基因两种策略, 使用多种方法创造大量变异及大通量识别并克隆基因和研究基因表达模式的技术。如基因陷阱、
基于差异杂交的基因表达差异研究技术、DNA 芯片和蛋白质芯片等。随着研究技术不断改进和创新, 功能基因组研究
将成为生命科学研究的重点和热点。
关键词 功能基因组; 蛋白质组; 从表型到基因; 从基因到表型; 差异杂交; DNA 芯片
中图分类号: Q 753 文献标识码: A
Functiona l Genom ics and It′sM ethodology
ZHAN G Zu2X in ZHAN G Fang2Dong ZH EN G Yong2L ian
(N ational K ey L ab of C rop Genetic Im p rovem ent, H uazhong A g ricultural U niversity , W uhan 430070, China)
Abstract Functional genom ics refers to the developm en t and app lication of global experim en tal app roaches to
assess gene function, gene exp ression p rofile, o rgan ism grow th, developm en t and m etabo lic regulation by
m ak ing use of the info rm ation and reagen ts p rovided by structural genom ics. It is characterized by h igh
th roughput experim en talm ethodo logies com bined w ith statistical and computational analysis of the results. T he
fundam en tal strategies in investigation of gene function are from pheno type to gene and from gene to
pheno type. M any large2scale experim en tal m ethods are used to induce m utation, iden tify and clone gene. Fo r
examp le: gene trap, studying m ethods of differen tial hybidrization2based gene exp ression, DNA ch ip s, p ro tein
ch ip s, etc. W ith advance of imp rovem en t and innovation of m ethodo logy, w e believe that functional genom ics
w ill becom e the ho t spo t in the field of life science.
Key words Functional genom ics; P ro teom ics; F rom pheno type to gene; F rom gene to pheno type; D ifferen tial
hybridization; DNA ch ip s
基因组 (Genom e) 的提出已有近 80 年的历史,
它是指生物染色体的全套基因。随着模式生物基因
组计划和人类基因组计划 (H GP) 的提出和实施,
1986 年 T hom as Roderick 提出了“Genom ics”这个
词, 用以描绘基因组作图、测序和基因组分析等研
究内容。随着基因组计划的深入开展, 其研究的内
容从基因组的作图和测序向基因功能的研究转变和
扩展。为反映这一转变, 基因组分析被分成“结构
基因组学 (Structural genom ics)”和“功能基因组学
(Functional genom ics)”两个阶段。前者代表基因组
分析的最初阶段, 其基本的目标是构建生物高分辩
率的遗传图谱、物理图谱、表达图谱和序列图谱。
后者代表基因组分析的最新阶段, 其研究内容是在
利用结构基因组学丰富的信息资源的基础上、应用
大通量的实验分析方法并结合统计和计算机分析来
研究基因的表达、调控与功能, 基因间、基因与蛋
白质之间和蛋白质与底物、蛋白质与蛋白质之间的
相互作用以及生物的生长、发育等规律[ 1 ]。
结构基因组学阶段主要研究基因组遗传排列方
式, 将生物全部的遗传信息以遗传标记、DNA 片α 基金项目: 国家自然科学基因 (30170580)和国家“863”项目 (2001AA 222201)资助。
作者简介: 张祖新 (19642) , 男, 副教授, 博士研究生, 专业: 遗传学
Received on (收稿日期) : 2001212206, A ccep ted on (接受日期) : 2002206218
段或核酸序列的形式展现出来。这些成果为科学家
进一步了解基因的功能奠定了基础。功能基因组学
研究的基本策略是将基因和蛋白质的研究从单个的
研究扩展到以系统的方式对生物体内所有基因和蛋
白质进行研究, 利用结构基因组学所积累的数据,
从中得到有价值的信息, 阐述DNA 序列的功能。
到 2002 年为止, 已有 40 多种生物包括少数真核生
物如酵母、线虫、果蝇、拟南芥已完成了全基因组
测序, 人类基因组工作框架图已经公布[ 2, 3 ] , 水稻
全基因组框架序列也已完成[ 4 ]。但是, 人们对这些
DNA 序列在生命活动中的功能和意义仍知之甚少。
功能基因组阶段的研究目标就是对所有基因如何行
使其职能从而控制各种生命现象的问题作出回答。
1 表型驱动和基因驱动
来自于基因组DNA 序列资料的快速积累意味
着大量基因有待功能分析。在结构基因组学研究中
常用的图位克隆、候选基因等方法, 1 次只能分析 1
个或少数基因, 显然已不适合于多基因的平行分
析。为达到功能基因组学的研究目标, 有两种研究
策略可用于基因功能分析, 即从基因到表型 (Gene
to pheno type)和从表型到基因 (Pheno type to gene)。
1. 1 从表型到基因
该研究策略是应用多种方法创造并鉴定表型变
异, 再分析变异体的内部基因改变, 从而了解基因
的功能。创造变异的经典方法为物理、化学诱变,
它们的出发点是创造大量的随机突变并从中筛选感
兴趣的表型, 再研究其发生的分子机理。该方法产
生的变异包括点突变、缺失突变和其它类型的染色
体变异等。因变异有可能发生在非转录区、或大量
的隐性变异难以得到表型、或导致突变个体死亡,
故用于遗传分析的突变是有限的。从表型到基因的
另一方法是 T 2DNA 和转座子插入。将 T 2DNA 或
转座子与报告基因或遗传标记结合, 然后转化到生
物基因组中, 选择由 T 2DNA 或转座子插入引起的
表型变异。T 2DNA 和转座子标签的主要特点是可
以通过其特定序列来分离基因, 但前者可随机插入
到整个基因组中, 且插入后比较稳定; 后者则具有
插入热点和区域优先特性, 且可能发现再次转座。
在植物中, 利用转座子标签法鉴定并分离了许多基
因, 如在玉米中使用M utato r 分离了与叶绿体膜蛋
白转位有关的 hcf 106 基因[ 5 ]和 R f 2 基因[ 6 ]; 在拟
南芥中利用 EnhanceröInh ibito r 系统, 组建了一种
含有 3 个单元的载体, 即不能独立转座且由
CaM V 35s 启动子控制的 E n 转座酶、可转座的 I 因
子和潮霉素磷酸转移酶基因, 将该载体导入到拟南
芥中, 发现并分离了一种雄性不育基因[ 7 ]。
1. 2 从基因到表型
该策略是通过使特定基因发生定向突变、缺
失、失活和敲除后的表型变异来推测在生物体内基
因的作用。主要包括以下几种:
1. 2. 1 基因中断 (Gene disrup tion) 这种方法在
酵母中最先应用, 由于在酵母的单倍体或二倍体中
存在着高频率的同源重组, 导致精确而又高效率的
基因失活。植物中可用于实验分析的同源重组比例
很低, 不过, 在拟南芥中也有成功应用的实例。
Kamp in 等报道他们将一个 K an 抗性基因插入到
A GL 5 基因内, 构成了一个A GL 5 失活结构, 再将
这一结构与 pZM 104 载体相连, 通过农杆菌介导转
化到拟南芥中, 并获得了 750 个具有 Kan 抗性的转
基因植株, 其中有一个所期望的插入系。然后, 将
该插入系自交, 选择纯合的A GL 5 基因敲除的植株
进行遗传研究[ 8 ]。但利用这种方法分析生物的每一
个基因需要成千上万的转基因系, 这难以实现。
1. 2. 2 基因沉默 (Gene silencing) 在转基因植
株中存在着转入基因控制内源同源基因表达的现
象, 而被抑制的基因往往与植株的产量、品质和抗
逆性有关。利用这一特点, 可以有目的设计转基因
的序列, 如将靶基因序列反向连接或将其反义
RNA 转入到植物中, 从而达到使靶基因转录后失
活[ 9 ]。然而, 这一方法同样需要许多独立的转基因
系。更重要的是, 有些必不可少基因的抑制, 会导
致显性致死。同时对多基因家族的各成员分析也受
到限制。但 Guo 发现注射到细胞中的有义RNA 可
以抑制其内源同源基因的表达[ 10 ] , F ire 等证实D s
RNA 在体内RN ase 作用下将D s RNA 降解成 21~
25 n t 的片段, 这些小片段与内源mRNA 结合后,
可由RN ase 高效降解, 表现出基因敲除的特性, 且
可传递给子代[ 11 ] , 这一现象叫 RNA in terference。
可见, RNA in terference 可用于基因功能研究, 也
可将D s RNA 注射到不同的器官和组织, 进行发育
生物学研究[ 12, 13 ]。
1. 2. 3 利用嵌合 RNA öDNA 寡聚核苷酸 (CO ) 产
生特定基因突变 对已知序列的 EST s, 根据其
序列设计嵌合RNA öDNA 分子。该分子与原 EST s
序列相比, 含有一个或少数几个核苷酸变异, 从而
5912 期 张祖新等: 功能基因组学及其研究方法
使得表达产物发生 1 个或少数几个氨基酸变异。将
这种分子导入到生物体中, 由于同源重组或者
DNA 修复酶的错误修复而产生突变表型, 进而推
测基因功能[ 14 ]。如磺酰尿除草剂通过阻止乙酰乳酸
合成酶 (AL S) 的生物合成而抑制植物的生长。在烟
草中, AL S 由双等位基因家族所编码。而除草剂对
含有一个编码突变的AL S 突变株无毒害。p ro2196
的突变对除草剂 ch lo rsulfuron 具有抗性, 但对其他
除草剂敏感。根据这一特点, Beetham 设计了两种
嵌合 RNA öDNA 分子: CO 2A L S 1 和 CO 2A L S 2。
CO 2A L S 1 是用 CAA 代替了 p ro2196 正常的 CCA ,
CO 2A L S 2 是用CTA 代替CCA。将这两种分子导入
烟草细胞悬浮系中, 发现了对除草剂抗性的恢复
系, 且通过测序分析证明了碱基替换[ 15 ]。在其他动
植物中也证明了该方法的可行性[ 16, 17 ]。
1. 2. 4 基因陷阱 (Gene trap ) 基因陷阱的实质
是将带有能被特异激活表达的报告基因或内含子剪
接的供体ö受体序列的转座因子插入到基因组中,
使被插入基因座功能丧失或改变而表现出突变型,
研究者则可通过转座因子的保守序列和报告基因的
表达来识别插入突变体并分离捕获突变基因; 它有
别于一般转座因子插入钝化技术的特点在于: 凡是
报告基因得以表达的个体就表示转座因子插入到了
功能基因附近或功能基因内部, 因而, 基因的识别
是基于报道基因的表达, 而不依赖于表型突变。另
外, 该技术有利于多效性基因和多基因家族的基因
识别。基因陷阱根据其转座子中报告基因的结构和
所插入的基因组位置的差异而有不同的称谓。如果
转座子带有一个弱启动子报告基因, 只有插入到增
强子附近才能表达的则称为增强子陷阱 (enhancer
trap)。如在果蝇中一般使用其 P 转座子, 由于这种
转座子倾向于整合到功能转录单位的 5′端, 插入的
报告基因的启动子由被插入位点附近的增强子所激
活。因而广泛用于果蝇新基因的鉴定[ 18 ]。O′Kane
报道将带有 L acZ 的 3′端、hsp 70 的终止密码和
Po ly (A ) 的 0. 9 kb 的 E coR É 片段插入到 P 转座子
后将其转化到果蝇中, 共获得 49 个转化系, 在胚胎
中, 70% 表现为 L acZ 表达受空间调节[ 19 ]。但是,
尽管报告基因表达, 由于插入位点距基因较远, 许
多增强子陷阱并不表现出表型突变, 也不能提供插
入位点附近基因的功能信息。另外, 在有些情况
下, 增强子陷阱的报告基因的表达受多个不同转录
单位的增强子影响, 在这种情况下分析和克隆基因
就非常困难。如果转座子中含有一个没有启动子的
报告基因, 报告基因只有以正确的方向插入到转录
单位的 exon 中才能表达, 并产生一融合转录物, 这
类结构被称为启动子陷阱 (p romoto r trap ) [ 20 ]。如果
转座子中的报告基因前含有 1 个或几个剪接受体
(SA ) 序列, 当含有该结构的转座子插入到基因组
的 in tron 中后, 通过转录后加工, 则可产生一上游
exon 和报告基因的融合产物, 这类结构被称为基因
陷阱 (gene trap) [ 20 ]。由于转录物的融合, 启动子陷
阱和基因陷阱所产生的插入, 也能产生被插入位点
前的DNA 序列所产生的多肽与报告基因的融合蛋
白, 这一特点, 可以提供蛋白质在细胞中定位信
息。Sp radling 报道: 在伯克利果蝇基因组计划
(Berkeley D rosoph ila Genom e P ro ject, BD GP ) 对果
蝇基因组定位和测序的同时, 开始了一项基因插入
计划, 以期最大限度地利用果蝇来获得人类基因功
能信息。他们首先用一个经遗传改造的 P2转座子插
入果蝇基因组的OR F, 收集了 1045 个具有一个 P
因子插入的果蝇品系。每个果蝇品系中有 1 个OR F
被插入, 共占果蝇成年期成活必需的 3600 个基因
的 25% 以上。这些插入品系中, 67% 的产生隐性突
变, 这为果蝇功能基因组研究提供了极大的便
利[ 21 ]。在植物中则更多地使用玉米转座子来构建基
因陷阱, 如 A cöD s 系统。将报告基因 (如 iaaH 、
K an) 置于 3 个相连剪接受体和一段短的 in tron 之
前, 通过转录后的选择性剪接而使报告基因表达;
另一个剪接供体置于D s 之后, 构建一个D s 基因陷
阱 (D sG)。更为精巧的设计是, 将含有D sG 的转基
因植株与另一个载有由 CaM V 35s 启动子驱动的
A ctivato r 转座酶基因 (A c)的转基因植株杂交, 由于
A c 提供转座酶而使D sG 在植株体内发生转座, 在
杂种后代 F 1 自交, F 2 种子播在含有NAM 和 KAN
的培养基中, 对D sG 正向选择, 对 iaaH 负向选择,
留下的是那些载有被转座的D sG 植株。将这些植株
自交, 所得种子再对 GU S 活性进行选择[ 22 ]。这种
基因陷阱方法可在杂种后代中产生大量的插入突
变, 这为大通量基因功能分析提供了实验材料, 成
为功能基因组分析中研究者所青睐的方法。
2 基因的鉴别与克隆
2. 1 突变基因的鉴别与分离
目前, 鉴别和分离突变基因的方法主要有:
(1) 图位克隆 (Positional clon ing)。即根据基因在遗
691 作 物 学 报 29 卷
传图谱上的精细定位, 构建含有目标基因的相互覆
盖重叠群, 再将这些克隆作为探针以同样的方式获
得更多相互覆盖的亚克隆, 对亚克隆进行测序, 所
获得的序列借助生物信息学方法进行分析来鉴别基
因并获得功能信息[ 23 ]。生物信息学方法鉴别基因可
以基因组序列为对象检索N CB I、DDBJ 和 EM BL
等数据库, 或根据基因结构的启动子、终止子、剪
接位点、CpG 岛来判断[ 24 ]。这种方法从理论上可以
鉴定和克隆所有表型突变基因, 对小基因组生物和
已建立了高分辨率遗传图谱的生物的实际应用相对
容易一些, 但实际应用于大基因组生物是非常困难
的。 (2) 从基因组文库和 cDNA 文库中筛选。如转
座子标签 (T ransposon tagging) , 即以转座子的保守
序列为标记筛选基因组文库和 cDNA 文库[ 6, 7 ], 以
转座子序列为引物用 PCR 扩增基因组文库[ 22 ]。T 2
DNA 和转座子插入、基因陷阱等都具有可利用的
标签序列。另外, 同源序列法利用表型相同或相似
类型基因的保守序列设计引物扩增基因中待定功能
片段, 对所得片段进行遗传作图或以之为探针筛选
基因组文库[ 26, 27 ]。 ( 3 ) 单核苷酸变异的检测
(SN P s)。在生物体中存在大量的单核苷酸变异, 对
这一类变异的检测和基因鉴别则可以采用 SN P 检
测法。W ang 对 2. 3 M b 的人类基因组检测, 发现了
3241 个 SN P s[ 28 ]; Cargill 等研究了与心血管疾病和
神经性疾病相关的 106 个基因的 114 个等位基因,
发现了 560 个 SN P s, 其中编码序列的 SN P s 占
70% [ 29 ]。大通量检测 SN P s 可使用寡聚核苷酸芯片
技术。 (4) 直接测序法。对于基因沉默等产生的变
异, 可利用被转化的DNA 筛选基因组和 cDNA 文
库, 对阳性克隆直接测序, 再根据基因结构或生物
信息学方法来获取基因及其功能信息。当然, 这些
方法并不能绝对分开, 既可以单独使用, 也可以几
种方法结合使用。对特定的基因鉴定与克隆, 应根
据变异来源和特点, 选择最适宜的方法。
2. 2 差异表达基因的鉴别与分离
生物的生长发育受时空的精确调节, 分析基因
在不同发育时间、不同组织、不同生理状态下基因
差异表达模式, 研究生物生长、发育规律也是功能
基因组学研究的主要内容之一。获得生物全身基因
表达谱 (body m ap) , 为基因功能的识别、发育遗传
学、病理学、生理学等多学科研究可提供宝贵的资
料。因而必须涉及在不同组织、器官和不同生理状
态下表达基因的分离。根据基因表达的差异来分离
和克隆基因的方法有许多, 下面主要介绍基于差异
杂交技术和基于DNA 芯片技术的方法。
2. 2. 1 基于DNA 差异杂交的方法 这类方法
实质上是差异杂交技术的发展和改良, 它们包括差
异显示 (D ifferen tial disp lay, DD )、代表性差异分析
(R ep resen tional differen t analysis, RDA )、基因表达
指纹 (Gene exp ression fingerp rin ting, GEF )、基因
表达系列分析 (Serial analysis of gene exp ression,
SA GE) 和抑制性扣除杂交 (Supp ression subtractive
hybridization, SSH ) 等。差异杂交法的基本原理是:
分别构建有待分离的目标基因表达存在差异的A
材料和 B 材料的 cDNA 文库, 并用各自的总
mRNA 为探针去分别筛选两个文库, 就可以分别
找出在A 材料和B 材料中特异表达的 cDNA 片段。
差异杂交最早用于植物基因分离的例子是豌豆中核
酮糖 1, 52二磷酸羧化酶基因的分离[ 30 ]。目前已用
这种方法分离获得了许多基因, 如花粉发育基
因[ 31 ]、衰老基因[ 32 ]、胚胎发育基因[ 33 ]等。这种方法
主要的不足是杂交信号弱, 阳性克隆鉴定的工作量
很大。DD 对差异杂交的改进是利用锚定引物 (T ) 12
M N (M = G, A 或C; N = G, A , C 或 T ) 加上 1 个
随机引物扩增出的 cDNA 片段并在序列胶上加以
比较, 获得基因差异表达信息的一种方法[ 34 ]。由于
扩增引物组合可以任意变化, 因而可以反应总
cDNA 的信息, 并解决了差异杂交信号弱的问题。
该方法提出后已在动物和植物中都有成功分离基因
的报道[ 35~ 39 ]。但DD 主要的不足是假阳性频率高,
给鉴定和分离工作增加了难度; 其次由于 3′端引物
倒数第二个碱基的简并, 使得某些真实的差异未能
被扩增。RDA 则是利用特异性的接头为引物, 扩增
供试体 cDNA , 差异杂交时驱动子 cDNA 过量[ 40 ]。
由于末端补齐后再进行 PCR 扩增, 则两端具有接
头的 D S DNA 则能被扩增, 只有一端有接头 D S
DNA 和 SS DNA 及无接头的驱动体DNA 则不能
扩增, 因而富集的是供试体与驱动体有差异的
cDNA。然而, 代表性差异分析仍不能解决不同的
mRNA 丰度巨大差异问题, 往往需要进行多轮扣
除杂交。SSH 只是在 RDA 基础上, 将供试体分为
两份分别与两种不同的接头连接, 并分别利用接头
为引物进行 PCR 扩增, 然后杂交、退火、两份供试
体混合、再扩增。理论上只有两端带有不同接头的
模板才能被指数性地扩增。这样, PCR 产物进一步
克隆鉴定之后就为A 中特异表达 cDNA。该方法不
7912 期 张祖新等: 功能基因组学及其研究方法
需构建 cDNA 文库, 又能在一次实验中对所有
cDNA 进行筛选。目前也有利用该方法分离基因的
报道[ 41 ]。然而, 应用该方法后所得的产物 cDNA 种
类大大减少, 转化所得的克隆数大大减少。而
SA GE 则是 cDNA 的一端为与生物素结合锚定引
物, 另一端为特异接头, 杂交后以两种特异性接头
为引物进行 PCR 扩增[ 42 ]。
2. 2. 2 DNA 芯片 (DNA ch ip ) DNA 芯片又被
称为基因芯片、DNA 阵列 (DNA array) 或寡核苷酸
微芯片 (O ligonucleo tide m icroch ip ) 等。该技术是由
Forder 首先提出, 其基本原理是: 首先将DNA 序
列 (每个序列的长度在几十个到几百个碱基的范围
内) 通过光蚀刻技术与固相化学合成相结合或自动
化快速打印、喷射法将DNA 固定在固相表面组成
密集的分子阵列[ 43 ]。由于其大小与计算机的芯片差
不多, 又含有非常丰富的信息, 故形象地称之为
DNA 芯片。DNA 芯片可分为两种类型: É 型是将
待测的DNA 分子样品固定在固体表面并与一系列
游离的标记探针杂交; Ê 型是将预先设定的寡核苷
酸固定在支持物上再与标记的DNA 样本进行杂
交, 由已知的寡核苷酸序列确定被检测样品的
DNA 序列。
DNA 芯片技术的特性赋予它广泛的用途, 现
主要应用方面有: (1) DNA 测序。寡聚核苷酸芯片
利用固定探针与样品杂交产生的杂交图谱可排列出
样品的序列, 这种方法快速而具有诱人的前景。
Chee 等用含有 135000 个寡核苷酸探针的阵列测定
了全长为 16. 6 kb 的人线粒体基因组序列, 准确度
达 99% [ 44 ]。H acia 等用 48000 个寡核苷酸阵列分析
了人与黑猩猩B R CA 1 基因序列差异, 结果发现在
3. 4 kb 的核苷酸序列同源性在 83. 5%~ 98. 2% ,
说明两者在进化上的相似性[ 45 ]。 (2) 变异检测。设
计一组特异的、每一个寡核苷酸片段只有一个碱
基发生突变的探针, 将其固定在芯片上, 在与待测
样本杂交, 则可高效检测单核苷酸变异。另外, 也
可应用于基因组中重复序列的鉴定以及拷贝数改变
鉴定[ 46, 47 ]。 (3) 基因诊断。将正常人和病人基因组
中分离的DNA 分别与芯片杂交, 比较杂交图谱,
就可得出病变的DNA 信息。这种基因芯片诊断技
术具有快速、高效、敏感、经济、自动化的特点。如
A ffym etrix 公司以 P 53 基因全长序列和已知突变为
探针, 制成 P 53 芯片, 以期在癌症早期诊断中发挥
作用。现在, 肝炎病毒检测诊断芯片、结核杆菌耐
药性检测芯片、多种恶性肿瘤相关病毒基因芯片等
系列诊断芯片开始进入市场。 (4) 药物筛选。利用
芯片分析用药前后肌体不同组织、器官基因表达的
差异, 不但可以了解哪些基因在药物作用后表达
了, 哪些表达停止了, 以及哪些表达升高, 哪些表
达下降, 使我们能在分子水平了解药物的作用靶
点、作用方式及代谢途径; 而且还可筛选药物的有
效成分, 解决传统药物开发遇到的困难。 (5) 基因
表达水平检测。将 cDNA 芯片与标记特定组织或发
育时期的mRNA 或 cDNA 探针杂交, 根据杂交信
号的有无或强弱, 获得基因的表达信息。根据不同
材料间基因差异表达的信息, 推论某个基因的功能
或鉴定和分离目的基因[ 48~ 50 ]。cDNA M icroarray 技
术在基因功能鉴定方面克服了图位克隆法需要高密
度遗传图、转座子标签法需要的转座子存在等条件
限制, 且具有大通量、灵敏度高、稳定性好、如果
使用生物素荧光标记则对研究者无放射性伤害等优
点。随着DNA 固定化技术和扫描检测技术的不断
发展, cDNA M icroarray 已用来研究成千上万的基
因表达模式和目标基因的鉴定与分离。如人类内风
湿关节炎、肠炎的相关基因的鉴定[ 51 ] , 成年人和婴
儿脑中优先表达的候选基因的确定[ 49 ] , 47 个已知
基因在老鼠胸腺上皮细胞、T 细胞和由CD 3 抗体激
活的 T 细胞中表达水平的研究[ 52 ] , 拟南芥根部和
茎部差异表达基因的研究[ 48 ] , 不同生理条件下
(37℃, 42℃)和不同发育条件下 (黑暗和光照) 拟南
芥幼苗中差异表达基因的研究[ 54 ] , 不同生长条件下
(碳源缺乏和碳源正常) 酵母基因表达的差异分
析[ 54 ] , 从人类外周血淋巴细胞 1046 个未知序列构
成的微阵中, 鉴定出 48 个热击蛋白和蛋白激酶相
关基因[ 55 ]等。最近, 也有报道将 cDNA M icroarray
与代表性差异分析和与抑制性扣除杂交相结合来寻
找不同样本中差异表达基因。W elfo rd 利用RDA 与
芯片技术相结合分析了两种具有不同生物学行为的
肉瘤组织中 50 个基因的差异表达结果[ 56 ]。Seta 等
用 SSH 文库富集嗜铬细胞瘤 (pheoch romocytom a)
细胞系在 1%O 2 处理 6 小时后特异增强表达的
mRNA , 并制作 cDNA M icroarray, 以正常条件生
长的细胞系 (21%O 2) 和低氧条件生长的细胞系的
mRNA 分别与芯片杂交, 发现M A PK 磷酸酶21 基
因 (M K P 21) 在文库大量富集, N orthern blo t 和
W estern blo t 分析证实在低氧条件下, M K P 21 的
mRNA 和蛋白质水平都要提高将近 8 倍[ 57 ]。
891 作 物 学 报 29 卷
尽管DNA 芯片技术有着十分诱人的应用前
景, 但该技术仍需不断发展和完善; 虽然技术本身
得自动化程度高, 但仍有较高的错误率[ 58, 59 ] , 它们
可能来源于: (1) 操作者操作失误和机器手点样误
差; (2) cDNA 的污染, 在良好控制条件下, 污染率
为 1%~ 5% , 否则会更高; (3) cDNA 部分测序所
得信息不完整, 使得生物信息学分析反馈结果出
错; (4) 许多商品化芯片的DNA 错误率和污染率
仍较高。因此, 研究者利用DNA 芯片技术研究基
因表达模式仍需特别仔细, 采取严格措施防止错误
的产生。另外, 由于所用仪器设备昂贵, 目前只有
少数资金雄厚的生物技术公司和科研单位能开展这
类研究。同时如何构建一个开放的 A rray2based
exp ression database, 彼此利用研究资料, 合理解释
DNA 芯片所检测到的大量信息是急需解决的问题。
3 蛋白质组学
1994 年W ilk ins 提出了蛋白组 (P ro teom e) 来表
示基因组编码的蛋白质的全部集合, 亦即基因组的
综合功能谱。由于存在同一基因可按不同的方式产
生多种产物, 加之蛋白质翻译后的修饰、蛋白质间
相互作用, 使得mRNA 数量不一定总是与蛋白质
种类相一致, 蛋白组只代表了生物体全部蛋白质的
一部分。蛋白组与周围环境相互作用产生表型组
(phenom e) , 即生物所显示的所有特征的总和。要
完全阐述基因功能, 仅仅靠基因序列是远远不够
的, 其主要原因有: (1) 生命活动包含许多代谢途
径, 而蛋白质就是这些代谢途径的执行者; (2)
OR F 指示基因存在的可能, 并不意味着功能基因;
(3) 基因表达产物是蛋白质, 但基因和蛋白质间也
并非一一对应的线性关系; (4) mRNA 和蛋白也不
是共线性的, 蛋白质翻译后的修饰、加工和细胞定
位, 对蛋白质功能的体现十分重要。因此, 以阐明
生物体内蛋白质的表达模式和功能模式为目标的蛋
白质组学 (P ro teom ics) 是功能基因组学研究的重要
内容之一。
SD S2PA GE 电泳和可按照分子的等电点和分
子量将蛋白质分离的双向电泳 (2D ) 技术是蛋白组
学研究的传统技术[ 60 ]。该技术在发展早期, 仅仅只
能鉴定那些与已被纯化的蛋白质共迁移或者有已知
抗体可进行免疫杂交的蛋白质。研究蛋白质一级结
构的方法诸如: (1) Edm an degradation 法, 标记末
端氨基酸并被特异性地切除和识别。该过程已被自
动化, 由测序仪完成, 每次可确定 50 个氨基酸残
基。(2) 蛋白质微量测序 (P ro tein m icrosequencing) ,
通过气相自动化 Edm an 降解接着进行高效液相色
谱进行, 这种方法可以对皮摩尔量的蛋白质直接测
序如利用聚丙烯酰胺胶的条带洗脱物进行测序。
(3) 20 世纪 90 年代发展起来的基于质谱仪的质谱
法 (m ass spectrom etry, M S) 和电喷离子串质谱法
( electro sp ray ion ization2tandem m ass spectrom etry
ES I2M S) , 这些方法使汽化的电离蛋白质在真空下
根据其质量和电荷之比得以快速、准确的鉴定, 可
提供许多蛋白质基团和结构的信息[ 61 ]。利用 2D 和
M S 法对蛋白质部分测序, 根据基因组学的序列图
谱将这些多肽与DNA 序列相对应, 则可作出蛋白
质在基因组上的分布图[ 1 ]; 利用蛋白质在 22D 上位
移的多态性, 可以识别与生理、发育等相关的蛋白
质, 并可对控制编码蛋白的数量因子 (PQL s) 作
图[ 62 ]。而当今发展的可同时监测细胞内所有蛋白丰
度和修饰状态的技术, 如蛋白质芯片, 则可高效地
揭示蛋白质表达模式和蛋白质之间的相互作用[ 63 ]。
研究蛋白质间相互作用的方法有酵母双杂合系统
(Two hybrid system ) [ 64 ] , 这一系统是以酵母转录激
活因子 GAL 4 的结构和活性特点为基础设计的。将
待分析的目标蛋白基因 (如A、B )分别与DNA 结合
结构域 (B D ) 和转录激活结构域 (A D ) 融合, 构建含
有B D 2A 或 A D 2B 的酵母表达质粒, 并组建含有
U SA ö启动子ö报告基因和缺失内源编码 GAL 4 蛋
白及其抑制蛋白 GAL 80 基因的菌株, 将所构建的
质粒共转化到同一酵母菌株中。如果A 蛋白能与B
蛋白相互作用, 则可形成BD - A + AD - B 复合体,
该复合体的BD 结构域和AD 结构域共同作用于报
告基因前的U SA , 驱动启动子使报告基因表达。也
就是说, 报告基因表达说明A、B 两蛋白可以相互
作用形成复合体。因此, 根据报告基因表达量可以
确定待测蛋白是否相互作用。该系统也可进行蛋白
质配体筛选。不过, 该系统也存在较高的假阳性和
不适合对致死的蛋白质分析的不足。Gavin 等报道
了另一开创性的新方法, 他们利用将酵母基因组中
的 1739 个基因用双重的分子标签标记, 而这些基
因表达的蛋白质则能利用这些标签通过亲和柱分离
出来。由于每一种蛋白质都可能与其他蛋白质形成
复合物, 通过回收标记的蛋白质就可发现与该蛋白
质相互作用的蛋白质复合物。利用这一技术, 他们
第一次描述了酵母 (S accharom y ces cerev isae) 中蛋白
9912 期 张祖新等: 功能基因组学及其研究方法
质的完整网络及其相互作用的功能图谱[ 65, 66 ]。
功能基因组的研究还处于发展的初期, 虽然许
多高效率、大通量的基因功能平行分析技术不断提
出和发展, 但许多技术手段及其配套应用还不太成
熟。因此, 功能基因组研究的技术体系的建立、优
化、改进和创新成为功能基因组学目前研究的主要
内容之一。自人类基因组工作框架图完成以来, 科
学家都开始把研究重点转向基因功能剖析及应用,
许多生物的功能基因组计划也开始启动, 我们相
信, 随着研究的不断深入, 在揭示诸如生物生长、
生育、代谢调控等生命活动规律, 在对人类重大疾
病的发生机理、疾病防治和新药开发等研究方面将
会有新突破; 重要农作物功能基因组的研究, 在鉴
定并克隆重要的产量、品质、抗性相关的基因, 阐
述作物杂种优势形成的机理以及生长、发育等规律
方面, 也将取得重大的进展; 同时也必将大大推动
植物发育生物学、植物生理学和植物遗传学等学科
的发展。
References
[ 1 ] H ieter P, H ieterM B P. Functional genom ics: It′s all how you
read it. S cience, 1997, 278: 601~ 602
[ 2 ] L ander E S, L inton L M , B irren B, et al. Initial sequencing
and analysis of the hum an genom e. N ature, 2001, 409: 860~
921
[ 3 ] V enter J C, A dam sM D , M yers E W , et al. The sequence of
the hum an genom e. S cience, 2001, 291: 1304~ 1351
[ 4 ] Yu J, Hu S2N , W ang J, et al. A draft sequence of the rice
genom e (O ry za sativa L. ssp. Ind ica). S cience, 2002, 296:
79~ 92
[ 5 ] Settles A M , Yonetani A , Baron A , et al. Sec2independent
p ro tein translocation by the m aize Hcf106 p ro tein. S cience,
1997, 278: 1467~ 1470
[ 6 ] Cui X Q , W ise R P, Schnable P S. The rf 2 nuclear resto re
gene of m ale2sterile2cytop lasm m aize. S cience, 1996, 272:
1334~ 1336
[ 7 ] A arts M G M , D irkse W G, Stlekem a W J. T ransposon
tagging of a m ale sterility gene in A rabidop sis. N ature, 1993,
363: 715~ 717
[ 8 ] Kamp in S A , L ijegren S J , B lock L M , et al. Targeted
disrup tion in A rabidop sis. N ature, 1997, 389: 802~ 803
[ 9 ] Baulcom be D C. RNA as a target and an initiato r of post2
transcrip tional gene silencing in transgenic p lants. P lant
M olecular B iology , 1996, 32: 79~ 88
[ 10 ] Guo S, Kemphues K J. P ar21, a gene required for establish ing
polarity in C. elegans em bryos, encodes aputative seröth r k inase
that is asymm etrically distributed. Cell, 1995, 81: 611~ 620
[ 11 ] F ire A. , Xu S Q , M ontogom ery M K, et al. Po tent and
specific genetic interference by double2stranded RNA in
Caenorhabd itis elegans. N ature, 1998, 391: 806~ 810
[ 12 ] M isquitte L , Paterson B. Targeted disrup tion of gene function
in D rosoph ila by RNA interference (RNA i) : A ro le for nautilus
in em bryonic som atic m uscle form ation. P roc N atl A cad S ci
U SA , 1999, 96: 1451~ 1456
[ 13 ] F raser A G, Kam ath RS, Zipperien P, et al. System atic
functional genom ic analysis of C. elegans chromosom e I by RNA
interference. N ature, 2000, 408: 325~ 330
[ 14 ] Yoon K, Cole2Strauss A , Km iec E B, et al. Targeted gene
correction of ep isom al DNA in m amm alian cells m ediated by a
chim eric RNA ·DNA oligonucleo tide. P roc N atl A cad S ci
U SA , 1996, 93: 2071~ 2076
[ 15 ] Beetham P R, Kipp P B, Saw ycky X L , et al. A too l for
functional p lant genom ics: ch im eric RNA öDNA oligonucleo tides
cause in vivo gene2specific m utations. P roc N atl A cad S ci
U SA , 1999, 96: 8774~ 8778
[ 16 ] Kren B T , Parashar B, Bandyopadhyay P, et al. Correction of
the UDP2glucuronosyltransferase gene defect in the Gunn rat
model of Crigler2N ajjar syndrom e type I w ith a ch im eric
o ligonucleo tide. P roc N atl. A cad S ci U SA , 1999, 96: 10349~
10354
[ 17 ] Zhu T , Peterson D J, TaglianiL , et al. Targeted m anipulation
of m aize genes in vivo using chim eric RNA öDNA
oligonucleo tides. P roc N atl A cad S ci U SA , 1999, 96: 8768~
8773
[ 18 ] Bellen H J , O′Kane C J , W ilson C, et al. P2elem ent2m ediated
enhancer detection: A versatile m ethod to study developm ent in
D rosophila. Genes D ev , 1989, 3: 1288~ 1300
[ 19 ] O′Kane C J , Gehring W J. Detection in situ of genom ic
regulatory elem ents in D rosophila. P roc N atl A cad S ci U SA ,
1987, 84: 9123~ 9127
[ 20 ] Sp ringer P S. Gene trap s: Tools for p lant developm ent and
genom ics. T he P lant Cell, 2000, 12: 1007~ 1020
[ 21 ] Sp radling A C, Stren D , Beaton A , et al. The BerKely
D rosophila genom e p ro ject gene disrup tion p ro ject: single P2
elem ent insertions m utating 25% of vital D rosophila genes.
Genetics, 1999, 153: 135~ 177
[ 22 ] Sp ringer P S, M cCom bieW R, Sundaresan V , et al. Gene trap
tagging of PROL IFERA , an essentialM N M 223252like gene in
A rabidop sis. S cience, 1995, 268: 877~ 880
[ 23 ] M artienssen R A. Functional genom ics: P robing p lant gene
function and exp ression w ith transponsons. P roc N atl A cad S ci
U SA , 1998, 95: 2021~ 2026
[ 24 ] A ntequera F, B ird A. N um ber of CpG islands and genes in
hum an. P roc N atl A cad S ci U SA , 1993, 90: 11995~ 11999
[ 25 ] Song W L , W ang G L , Chen L L , et al. A recep tor k inase2like
p ro tein encoded by the rice resistance gene, X a21. S cience,
1995, 270: 1804~ 1806
[ 26 ] Yu Y G, Buss G R. Iso lation of a super fam ily of candidate
disease resistance genes in soybean based on a conserved
nucleo tide2binding site. P roc N atl A cad S ci U SA , 1996, 93:
11751~ 11756
[ 27 ] L eister D , Kurth J , L aurie D A , et al. Rap id reorganization of
resistance gene homologoues in cereal genom es. P roc N atl A cad
S ci U SA , 1998, 95: 370~ 375
[ 28 ] W ang D G, Fan J B, Siao C2J , et al. L arge2scale
identification, m app ing, and genotyp ing of single2nucleo tide
polymorphism s in the hum an genom e. S cience, 1998, 280:
1077~ 1082
[ 29 ] Cargill M , A ltshuler D , Ireland J , et al. Characterization of
single2nucleo tide polymorphism in coding regions of hum an
002 作 物 学 报 29 卷
genes. N ature Genet, 1999, 22: 239~ 247
[ 30 ] Bedbrook J R , Sm ith S M , E llis R J. M olecular cloning and
sequencing of cDNA encoding the p recursor tc the sm all subunit
of ch lorop last ribulose21, 52biophosphate carboxylase. N ature,
1980, 287: 692~ 697
[ 31 ] W eterings K, Reijn W , A arssen R V. Characterization of a
pollen2specific cDNA clone from N icotiana tabacum exp ress
during m icrogam togensis and germ ination. P lant M olecular
B iology , 1992, 18: 1101~ 1111
[ 32 ] Buchanan2W ollaston V. Iso lation of cDNA clones for genes that
are exp ressed during leaf senescence in B rassica napus. P lant
P hy siol, 1994, 105: 839~ 846
[ 33 ] A alen R B, Op sahl2Ferstad H G, L inestad C, et al.
T ranscrip ts encoding an a dorm ancy2related p ro tein are p resent
in both the aleurone layer and the em bryo of develop ing barley
(H ord eum vulgare L. ) seed. J. P lant, 1994, 5: 385~ 396
[ 34 ] L iang P, Pardee A B. D ifferential disp lay of eukaryo tic
m essenger RNA by m eans of the polym erase chain reaction.
S cience, 1992, 257: 2054~ 2057
[ 35 ] U tans V , L iang P, W yner L R, et al. Chronic cardiac
rejection: identification of five up2regulated genes in
transp lanted hearts by differential mRNA disp lay. P roc N atl
A cad S ci U SA , 1994, 91: 6463~ 6467
[ 36 ] Zimm erm an J W , Schultz R. A nalysis of gene exp ression in the
p reimp lantation mouse em bryo: U se of mRNA differential
disp lay. P roc N atl A cad S ci U SA , 1994, 91: 5456~ 5460
[ 37 ] Johnson R R , Cranston H J, Chaverra M E, et al.
Characterization of cDNA clones for differentially exp ressed
genes in em bryo of dorm ant and nondorm ant A vena f atua L.
Caryop ses. P lant M olecular B iology , 1995, 28: 113~ 122
[ 38 ] Hannappel U , Balzer H J , Ganal M W. D irect iso lation of
cDNA sequences from specific chromosom al regions of the
tom ato genom e by differential disp lay technique. M ol Gen
Genet, 1995, 249: 19~ 24
[ 39 ] W ilk inson J Q , L anadan M B, Conner T W , et al.
Identification of mRNA s w ith enhanced exp ression in ripening
straw berry fruit using polym erase chain reaction differential
disp lay. P lant M olecular B iology , 1995, 27: 1097~ 1108
[ 40 ] L isitsyn N , W igler M. Cloning the difference betw een two
comp lex genom es. S cience, 1993, 259: 946~ 951
[ 41 ] D iatchenko L , L au Y F C, Campbell A P, et al. Supp ression
subtractive hybridization: A m ethod for generating
differentially regulated or tissue2specific cDNA p robes and
libraries. P roc N atl A cad S ci U SA , 1996, 93: 6025~ 6030
[ 42 ] V elculescu V E, Zhang L , Vogelstein B, et al. Serial analysis
of gene exp ression. S cience, 1995, 270: 484~ 487
[ 43 ] Foder S P A , Read J. L igh t2directed, spatially addressable
parallel chem ical synthesis. S cience, 1991, 251: 767~ 773
[ 44 ] Chee M. A ccessing genetic inform ation w ith h igh2density DNA
arrays. S cience, 1996, 274: 610~ 614
[ 45 ] Hacia J G. Resquencing and m utational analysis using
oligonucleo tide m icroarrays. N ature Genetics S upp lem ent,
1999, 21: 42~ 47
[ 46 ] Pollack J R , Perou C M , A lizadeh A A , et al. Genom e2w ide
analysis of DNA copy2num ber changes using cDNA
m icroarrays. N ature Genetics, 1999, 23: 41~ 46
[ 47 ] Nouzova M , N eum ann P, N avratilova A , et al. M icroarray2
based survey of repetitive genom ic sequences in V icia spp. P lant
M olecular B iology , 2000, 45: 229~ 244
[ 48 ] Schena M , Schalon D , Davis R W. Q uantitative monitoring of
gene exp ression pattem s w ith a comp lem entary DNA
m icroarray. S cience, 1995, 270: 467~ 470
[ 49 ] Zhao N D , Hashida H , Takahash i N , et al. H igh2density
cDNA filter analysis: a novei app roach for large2scale,
quantitative analysis of gene exp ression. Gene, 1995, 156: 207~
213
[ 50 ] Bow tell D D L. Op tions available2from start to finish2fo r
obtaining exp ression data by m icroarray. N ature Genetics
S upp lem ent, 1999, 21: 25~ 32
[ 51 ] Heller R H , Schena M , Chai A , et al. D iscovery and analysis
of inflamm atory disease2related genes using cDNA m icroarrays.
P roc N atl A cad S ci U SA , 1997, 94: 2150~ 2155
[ 52 ] Bem ard K, A uphan N , Granjeaud S, et al. M ultip lex
m essenger assay: sim ultaneous, quantitative m easurem ent of
exp ression of m any genes in the context of cell activation.
N ucleic A cid s R esearch, 1996, 24 (8) : 1435~ 1442
[ 53 ] Desp rez T , Am selem J, Caboche M , et al. D ifferential gene
exp ression in A rabidop sis monito red using cDNA arrays. T he
P lant J ournal, 1998, 14: 643~ 652
[ 54 ] Tao H , Bausch C, R ichmond C, et al. Functional Genom ics:
Exp ression anaiysis of E scherich ia co li grow ing on m inim al and
rich m edia. J ournal of B acteriolog , 1999, 181: 6425~ 6439
[ 55 ] Schena M , Shalon D , Heller R , et al. Parallel hum an genom e
analyses: m icroarray2based exp ression monitoring of 1000
genes. P roc N atl A cad S ci U SA , 1996, 93: 10614~ 10619
[ 56 ] W elford S M , Gregg F, Chen E, et al. Detection of
differentially exp ressed genes in p rim ary tumor tissues using
rep resentational differences analysis coup led to m icroarray
hybridization. N ucleic A cid s R esearch, 1998, 26 (12) : 3059~
3065
[ 57 ] Seta K A , Kim R , Kim H W , et al. Hypoxia2induced
regulation of MA PK phosphatase21 as identified by subtractive
supp ression hybridization and cDNA m icroarray analysis. J B iol
Chem , 2001, 276: 44405~ 44412
[ 58 ] Knight J. W hen the ch ip s are dow n. N ature, 2001, 410:
860~ 861
[ 59 ] Halgren R G, F ielden M R , Fong C J , et al. A ssessm ent of
clone identity and sequence fidelity for 1189 IMA GE cDNA
clones. N ucleic A cid s R esearch, 2001, 29: 582~ 588
[ 60 ] O′Farrell P H. H igh reso lution two2dim ensional electrophoresis
of p ro teins. J B io Chem , 1975, 250: 4007~ 4021
[ 61 ] Yates J R Ë . M ass spectrom etry and the age of the p ro teom e.
J M ass S pectrum , 1998, 33: 1~ 19
[ 62 ] Zivy M , V ienne D D. P ro teom ics: a link betw een genom ics,
genetics and physio logy. P lant M olecular B iology , 2000, 44:
575~ 580
[ 63 ] Zhu H , Klem ic J F, Chang S, et al. A nalysis of yeast p ro tein
k inases using p ro tein ch ip s. N ature Genetics, 2000, 26: 283~
289
[ 64 ] Serebriisk ii I, Khazak V , Golem is E A. A two2hybrid dual2
bait system to discrim inate specificity of p ro tein interactions. J
B iol Chem , 1999, 274: 17080~ 17087
[ 65 ] Kum ar A , Snyder M. P ro tein comp lexes take the bait.
N ature, 2002, 415: 123~ 124
[ 66 ] Gavin A C, Boβsche M , Krause R , et al. Functional
organization of the yeast p ro teom e by system atic analysis of
p ro tein comp lexes. N ature, 2002, 415, 141~ 147
1022 期 张祖新等: 功能基因组学及其研究方法