免费文献传递   相关文献

水稻的功能基因组学



全 文 :植物生理学通讯 第 44卷 第 6期,2008年 12月 1055
水稻的功能基因组学
王江 *
中国科学院上海生命科学研究院植物生理生态研究所, 上海 200032
Functional Genomics in Rice
WANG Jiang*
Institute of Plant Physiology & Ecology, Shanghai Institutes for Biological Sciences, Chinese Academy of Sciences, Shanghai
200032, China
提要: 文章介绍近几年来水稻结构基因组学、基因表达的大规模分析平台、全基因组的突变群体库以及基因分离克隆方
法上的研究进展。
关键词: 水稻; 基因组; 基因表达; 突变库; 基因克隆
收稿 2008-07-26 修定 2008-09-22
资助 国家 “863” 计划(200 6AA10A1 02)。
* E-mail: jwang@sippe.ac.cn; Tel: 021-54924082
水稻(Oryza sativa L.)是与小麦具有同等重
要地位, 其种植面积占粮食作物总面积的30%左
右, 而稻谷产量则占粮食总产的 40% 以上。我
国是世界水稻的生产和消费大国, 种植面积占世
界水稻面积的 20%左右, 仅次于印度; 总产量占
世界总产的 33%左右, 居世界第一位(http://www.
knowledgebank.irri.org)。由于工业化的发展, 耕地
逐渐减少, 人口增加, 气候的变化(Peng等 2004)等
众多因素, 粮食安全问题日益成为人们关注的课
题。
采用培育矮秆抗倒品种技术也称“绿色革命”、
以及三系杂交稻育种技术, 我国水稻单产在1960年
到 2 0 0 0 年间增长了 3 倍 ( h t t p : / / w w w .
knowledgebank.irri.org), 但是要满足人口日益增长
的需求, 在 2025年之前产量还需要再提高 50%
(Khush 2001a, b)。近年来, 国际上将注意力集中
在水稻功能基因组研究上, 希望利用迅猛发展的现
代生物技术为上述问题的解决提供契机。
1 水稻结构基因组学
基因组学(genomics)研究主要是指建立高精度
的遗传、物理图谱和转录图谱, 探索基因组的结
构、基因的结构和功能以及物种的进化。水稻由
于相对较小的基因组(约 389 Mb)、比较完善的遗
传转化系统(尤其是粳稻品种) (Hiei等 1994)、高
密度的遗传图与物理图资源( C h e n 等 2 0 0 2 ;
Harushima等 1998)、积累丰富的 EST/cDNA数据
库和良好的分子生物学基础(Kikuchi等2003; Liu等
2007; Wu等 2002)、与其它禾本科作物基因组具
有广泛的高度共线(Moore等1995) 等原因, 它已成
为单子叶禾本科作物基因组学研究的模式生物。
国际水稻基因组测序计划(International Rice
Genome Sequencing Project, IRGSP)正式启动于
1998年, 由日本启动, 随后有中国、美国、英国、
法国、韩国、印度、泰国等 10多国家分别加入,
旨在制作粳稻品种 ‘日本晴 ’(Oryza sativa L. ssp.
Japonica cv. Nipponbare)全基因组的高质量的精确
序列图。我国承担第 4 号染色体的测序任务。
2000年 4月美国Monsanto公司率先完成了水稻基
因组草图(Barry 2001)。2002年 4月北京基因组研
究所和美国 Syngenta公司两个测序中心分别利用
鸟枪法完成籼稻品种 ‘93-11’和粳稻品种 ‘日本晴 ’
的全基因序列草图(Goff等 2002; Yu等 2002)。
2002年 11月, 参与 IRGSP 的日本和中国分别在
《Nature》杂志公布了 ‘日本晴 ’第 1号和第 4号
染色体的基于物理图的精确测序图谱( F en g 等
2002; Sasaki等 2002)。2005年 8月, 国际水稻基
因组测序计划宣布完成了 ‘日本晴 ’全基因组(约
389 Mb)的 95% (约 370 Mb)高质量精确序列图谱,
还包含了 2条染色体上完整的着丝粒序列(IRGSP
2005)。
专论与综述 Reviews
植物生理学通讯 第 44卷 第 6期,2008年 12月1056
当前基于物理图精确测序的图谱研究表明
(IRGSP 2005; Ouyang等 2007; Tanaka等 2008), 水
稻 ‘日本晴 ’全基因组已获得372.1 Mb的高质量精
确序列, 余下的 5%分布于 12条染色体上的 38个
间隙(gaps)、10个着丝粒和 10个端粒处; 水稻全
基因组预测有 56 278个基因位点, 因为 6 498个基
因位点编码10 432个转录本, 所以总转录本为66 710;
如果去除 15 236个转座因子相关的蛋白编码基因
后, 共有41 042个基因位点编码非转座因子相关的
蛋白, 平均 9.4 kb含一个基因, 其中约 29%的基因
成族出现, 约71%与拟南芥基因(Arabidopsis, 28 000~
29 000个基因)享有同源性(反过来, 约 90%的拟南
芥基因与水稻基因享有同源性)。31 439个基因位
点已经得到 ESTs序列、全长 cDNA序列、Tiling
芯片检测、大规模平行测序(massively parallel sig-
nature sequencing, MPSS)检测的 RNA转录水平上
的确认, 8 226个基因位点的编码蛋白序列与功能
已知的蛋白质序列相同或相似, 另有13 632个基因
位点的编码蛋白含有已知的功能域。基因组中
2 859个可能是水稻及禾本科作物所独有的, 推测
它们与单双子叶分化相关。另外, 0.38%~0.43%
核基因组中还有细胞器里的DNA片段。水稻的全
基因组注释可以在以下两个网站查询: 日本的“Rice
Annotation Project database” 数据库(RAP-DB http://
rapdb.dna.affrc.go.jp)和美国的 “TIGR Rice Genome
Annotation” 数据库(http://www.tigr.org/tdb/e2k1/
osa1), 其中 RAP-DB数据库的数据已整合到NCBI
(National Center for Biotechnology Information)、
DDBJ (DNA Data Bank of Japan)和EMBL (European
Molecular Biology Laboratory)三大数据库中。
栽培稻除了上面提到的亚洲栽培稻(Ory za
sativa)—— 分为粳稻(Japonica)和籼稻(Indica)两亚
种以外, 还有非洲栽培稻(Oryza glaberrima) (均具
AA型染色体组, 单倍体都为 12条染色体)。在稻
属(Oryza)中还另有 22个野生稻, 它们分别代表 10
个不同类型的染色体组( A A、B B、C C、D D、
EE、FF、GG、HH、KK、JJ ) , 变异类型十分
丰富, 含有许多未开发的重要农艺性状如抗病性状
等, 为水稻遗传育种研究的宝贵资料, 并为阐明水
稻起源和演化提供理论基础, 具有重要应用前景和
科学价值。在2003年美国起始了一项 “Oryza Map
Alignment Project (OMAP)”计划旨在利用现有的
IRGSP ‘日本晴 ’基因组序列装配各野生稻基因组
全序列, 以便更好地挖掘野生稻资源及了解水稻的
起源和演化(Ammiraju等 2006; Wing等 2005)。目
前该计划已经构建了 11个野生稻品种和 1个非洲
栽培稻品种(两者包含了稻属中全部10个不同类型
的染色体组)的具高覆盖率的 BAC文库, 并正在大
规模地分析这12个BAC文库中各个克隆两末端序
列以及克隆的指纹信息, 并根据 IRGSP 基因组全
序列装配各野生稻基因组的BAC物理图谱, 优先装
配第 1、3 和 10 号 3条染色体。
2 水稻基因表达的大规模分析平台
芯片技术主要是有利于科学家在一次实验中
检测了成千上万个基因表达水平的变化, 或者更广
泛地识别染色体上转录活性区域及甲基化等特殊区
域(Rensink和 Buell 2005)。这个技术是现代生物
信息井喷时代的一个重要的检测手段。通过比较
两张不同芯片的结果, 就能在全基因组水平上调查
各个基因的变化及其程度, 这样有助于我们发现突
变体中不同处理之间或者处理前后以及不同发育阶
段中那些特异基因发生变化, 从中寻找重要功能基
因。
在水稻的商业基因芯片中有两个著名的国际
产品, 一个是Affymetrix (昂飞)公司的GeneChip®
Rice Genome Array, 另一个是Agilent(安捷伦)公司
的 Rice Oligo Microarray kit, 两者使用不同生产工
艺在芯片上原位合成寡核苷酸探针(probes)。前者
在一张芯片上设计了共610 665个合成的长度25 bp
的寡核苷酸探针, 分为 55 515组, 每组含 11个探
针, 在11个探针中要求至少7个探针能共同检测一
个水稻转录本, 总共能检测大概48 564个粳稻转录
本和 1 260个籼稻转录本。而后者以前是一张 22
k的芯片(NCBI里Gene Expression Omnibus, 简称
GEO, 号码为GPL892), Agilent公司新近开发了一
张 4×44 k芯片由 4个 44 k微阵列组成, 含 40 901
个合成的长度 60 bp的寡核苷酸探针, 总共能检测
大概 44 000个水稻转录本(Shimono等 2007)。另
外, 在我国北京华大基因研究中心生物芯片平台
(http://www.genomics.org.cn/bgi_new/platforms/
ricechip.htm)提供的对外服务, 为北京基因组研究所
设计的长度 70 bp的寡核苷酸点样制造的芯片(Ma
等 2005)有 2个版本, 第 1个版本为 BGI-RiceChip-
60K单张一套, 第2个版本为BGI-RiceChip-30K两
植物生理学通讯 第 44卷 第 6期,2008年 12月 1057
张成一套, 能检测大概41 k的非转座因子相关的水
稻基因。美国加州大学戴维斯分校的NSF45K寡
核苷酸点样制造的芯片, 有43 312个寡核苷酸探针
长度分布在 50~70 bp之间, 能检测 44 974个水稻
转录本(http://www.ricearray.org/)。
上述基因芯片的设计, 都是依据已知的水稻表
达序列(如EST、全长 cDNA等数据库)以及 IRGSP
预测的水稻基因序列进行的。因此, 这些基因芯片
在检测未知的水稻表达序列上能力欠缺, 由此产生
了水稻全基因组或染色体的 tiling(覆瓦式)芯片。
tiling芯片是针对分析全基因组所有转录活性区域
的DNA微阵列, 根据各条染色体已知的序列, 扩增
一个个相互重叠的片段(Jiao等2005)或者每隔十或
十几个碱基合成一段寡核苷酸探针, 这样一步步覆
盖整个水稻基因组或染色体(Li等 2007, 2006,
2005)。一般 tiling芯片由一个可操作的数目(如几
十张芯片)组成, 为了提高芯片的杂交质量还要求在
设计的寡核苷酸探针中剔除一些高度重复区域内的
探针。tiling芯片不但能全基因组验证已有的转录
本, 而且能发现新的转录活性区域。第一个利用一
套34张tiling芯片分析得到的水稻全基因组转录活
性图, 验证了 35 970 个(81.9%)已知的或预测的水
稻基因转录本, 并发现5 464个新的转录活性区域,
一些转录活性区域还存在正向和反向的转录本(Li
等 2006)。
一些发表的基因芯片表达信息沉积在 2个公
共生物信息网站NCBI的GEO和EBI的ArrayExpress
(Edgar和Barrett 2006; Parkinson等 2005), NCBI网
站显示水稻基因芯片平台已接近100种, 芯片杂交
信息数据超过 600张(包括样品的重复检测), 这些
数据包括了不同发育时期、不同组织器官、各种
突变体、各种环境条件胁迫下的水稻样品, 其中
Affymetrix芯片 183张, 另一个是Agilent的 22 k芯
片164张。虽然在芯片质量控制(microarray quality
control, MAQC)基础上各家设计的基因芯片之间检
测基因表达的信息有较好的重复性(Cana les 等
2006; Shi等 2006), 但是目前各基因芯片之间的实
验结果还不能很好地进行直接比较, 需要一些研究
数据以及数据的校正和转换。另外, 除了商用的芯
片分析软件GeneSpring外, 整合和开发各种开放的
芯片分析软件仍然十分必要。
除了基因芯片采用杂交手段检测全基因组表
达水平变化外, 水稻基因表达的大规模分析平台里
还有两个以测序为基础的检测方法: 大规模平行测
序技术(massively parallel signature sequencing,
MPSS) (Nobuta等 2007)和基因表达的系统分析
(serial analysis of gene expression, SAGE) (Gowda
等 2004; Matsumura等 1999, 2003)。两者检测的
理论基础都是一个长度20 bp 左右的寡核苷酸序列
足以作为特定基因的识别标签, 这些识别标签在表
达文库中出现的频率能很好地代表特定基因体内的
表达丰度(Brenner等 2000a, 2000b; Velculescu等
1995)。最近一篇文章报道了利用MPSS技术建立
的整个基因组的水稻表达图谱(Nobuta等2007), 该
研究从 22个水稻mRNA文库中检测了 46 971 553
个短序列识别标签, 验证和识别了大量已知的和未
知的转录本, 还从 3个小RNA文库中检测了 2 953
855个短序列识别标签, 是目前最深入地挖掘作物
中小 RNA的研究工作。20~24 bp的小 RNAs, 包
括micro-RNAs (简称miRNA)和 short interfering
RNAs (简称 siRNAs), 两者都能通过序列互补与靶
基因的mRNA结合并降解靶mRNA, 使靶基因沉
默。siRNAs还能通过DNA的甲基化或组蛋白的
修饰引起靶基因的转录沉默。小RNA的研究是当
今生物领域的热点之一, 被公认为广泛地控制植物
的各生长发育, 以及生理代谢途径包括环境胁迫响
应途径。MPSS技术是高度自动化的价格昂贵的
检测技术, 目前只掌握在少数几家实验室。由于没
有芯片杂交的背景噪音, 不能采用信号与背景比值
的阈值来剔除假阳性, MPSS技术分析中小部分短
序列识别标签的真伪难辨, 但是与tiling等基因芯片
相比, 大大提高了对极低表达丰度的转录活性位点
的检出。
通过MPSS技术和tiling芯片的研究工作, 发现
水稻基因组的转录比我们目前想象的要复杂得多,
成千上万个已知基因可能存在至今没有识别的各种
转录本, 这些特殊的转录本的表达可能只在高度特
定的时期、组织或处理中才出现; 以前认为基因间
和重复序列区域是非转录区域, 研究发现这些区域
的转录活性大大出乎人们意外。这些工作加深人
们对基因的认识水平。
信息时代的基因表达的大规模分析平台给我
们带来极大的便利, 通过上述各种实验方法系统地
分析水稻各个组织、各个发育阶段、各个相关突
植物生理学通讯 第 44卷 第 6期,2008年 12月1058
变体以及各种处理条件下全基因组的基因表达数据
库, 然后加以合理地整合分析, 预计能大大加速水
稻功能基因的信息阐述。
3 水稻全基因组的突变群体库
突变体是研究水稻功能基因组的基础和前
提。目前国际上许多国家都竞相开展水稻随机插
入的突变体库的构建, 希望建立一个全基因组饱和
突变体库。插入突变的基因功能研究方法就是将
一个序列已知的DNA片段整合到植物基因组中, 从
而导致被插入植株的功能突变, 而已知序列的DNA
片段可作为整合位点的标记, 故也称为基因标签技
术(gene tagging)。表 1列出了各种水稻插入突变
群体库类型的一些基本情况。
水稻插入突变体的一些实验设计方案, 包括了
基因的敲除(gene knockout)、基因的增强(gene
activation)、基因的过量表达(gene over-expression)
系统、以及基因 /启动子捕获(gene/promoter trap)
和增强子捕获(enhancer trap) , 并使用 T-DNA
(transfer DNA)、外源转座子(如 Ac/Ds系统、En/
Spm)和内源逆转录转座子(如 Tosl7)作为插入因
子。T - D N A 是根癌农杆菌( A g r o b a c t e r i u m
tumefaciens) Ti (tumor inducing)质粒或发根农杆菌
(Agrobacterium rhizogenes) Ri (root inducing)质粒上
的一段特殊DNA, 它可以从农杆菌转移出并稳定地
整合入植物染色体中, 是目前植物中常用的一类介
导外源基因的转化载体。当前采用T-DNA介导的
水稻遗传转化系统(尤其是粳稻品种)已经相当完善
了(Hiei等 1994; Toki等 2006), 加上T-DNA插入基
本可随机发生在染色体的所有基因上, 因此是目前
获取大量水稻插入突变植株的主要手段。外源转
座子由T-DNA介导整合到水稻基因组中后, 可在相
应的转座酶作用下再次发生转座, 增加插入。因
此, 对水稻全基因组饱和插入突变群体来说, 在一
定程度上可减少数量巨大的T-DNA初始转基因水
稻植株, 但其不足之处是目前发现的再转座现象常
距原始插入位点的距离较近, 即具有再转座的热点,
故不易大规模产生新的插入突变植株。内源逆转
录转座子(retrotransposon) Tosl7在水稻组织培养过
程中比较活跃, 可被激活发生再次转座插入事件, 并
且在水稻全基因组中存在相对较少的拷贝数, 因此
在水稻中得到开发利用(Hirochika 2001; Hirochika
等 1996)。
利用T-DNA, 外源转座子(如Ac/Ds系统、En/
Spm)、内源逆转录转座子(如 Tosl7)随机插入到水
稻基因组, 一些插入影响到插入位点基因的表达造
成基因功能丧失(loss-of-function), 即基因敲除, 其
中一部分基因被敲除后产生可筛选的突变表型, 由
于插入的DNA序列已知, 一旦遗传分析确定突变表
表 1 水稻插入突变群体库

插入的类型 增加插入的方法 插入拷贝数 插入的热点
定位的插入旁邻 被插入的基因位
参考文献 序列数目(总共约 点数目(总共约
177 000) 28 000)
外源转座子 农杆菌转化, 田间 1~7 有 ~7 200 ~2 500* I
Ac/Ds 自交或杂交
外源转座子 农杆菌转化, 田间 1~7 有 8 416 ~2 500* II
Spm/dSpm 自交或杂交
内源逆转座 组织培养 5~10 有 ~32 450 ~5 000 III
子 Tos17
T-DNA 农杆菌转化 1~2 可能无 ~143 000a ~21 000a IV
T-DNA含有 农杆菌转化 1~2 可能无 ~46 083 - V
增强子
基因过量表 农杆菌转化 - - 8 225 5 462 VI
达系统
  *表示 Ac/Ds和 Spm/dSpm相加的总数。a 表示数目包含了 T-DNA含有增强子的这一插入类型的 T-DNA旁邻序列。I: Chin等
1999; Eamens等 2004; Jiang等 2007; Kohli等 2001; Kolesnik等 2004; Park等 2007; van Enckevort等 2005。II: Kumar等 2005。III:
Miyao等 2007, 2003; Piffanelli等 2007。 IV: Hsing等 2007; Jeon等 2000, 2002, 2006; Ryu等 2004。V: Hsing等 2007; Jeong等 2002,
2006。VI: Nakamura等 2007。数据来源于 RiceGE数据库(http://signal.salk.edu/cgi-bin/RiceGE, 2008年 5月 1日)及上述文献资料。
植物生理学通讯 第 44卷 第 6期,2008年 12月 1059
型与插入的标签连锁, 即可通过 TAIL-PCR或反向
PCR方法获得插入标签的旁邻序列, 了解突变基因
的信息。另一方面, 建立突变库中各个水稻插入
DNA序列的旁邻序列(flanking sequence tags, FSTs)
数据库, 然后筛选感兴趣基因的插入突变株再进行
基因功能的研究。目前, 水稻中已经产生了大约
177 000个FSTs, 这些序列表明大约 28 000个基因
位点(包括起始密码子ATG上游 5非翻译区, 但不
包括3 非翻译区和启动子区域)里插有已知DNA序
列, 占全基因组预测总基因位点的 48%左右(http://
signal.salk.edu/cgi-bin/RiceGE, 2008年 5月 1日)。
基因组中存在许多基因家族, 基因成员间在功
能上有一定的重叠或互补, 因此单基因的插入突变
所造成的基因敲除, 在大多数情况下没有产生明显
的表型变化, 给基因功能分析带来难度; 而有些基
因的表达明显具有组织器官的特异性, 发育阶段的
特异性, 以及环境条件的特异性, 同样单纯的基因
敲除方法很难发现这些特征。为了克服这些困难,
前者可以通过基因的增强系统(gene activation)和过
量表达系统得到一定改善, 后者可以利用基因 /启
动子捕获和增强子捕获得到完善。基因的增强系
统和过量表达系统两者都能造成基因的功能获得
(gain-of-function)。基因的增强系统(Hsing等2007;
Jeong等 2002, 2006)是通过在 T-DNA一端引入多
个强的增强子序列, 使增强子插入位点附近, 几千
碱基范围甚至上万碱基范围内的基因表达都增强,
从而解决一些基因冗余的问题。由于增强子作用
的范围大, 因此可以适当减少原始的转化插入株; 另
一方面, 多个基因同时增强表达所造成的表型改变,
需要逐个基因的功能验证。基因的过量表达系统
(Nakamura等2007)则是使用强的启动子序列(如玉
米的Ubi启动子)引导水稻基因组各个全长cDNA的
表达。由于这种表达是异位的增强表达, 因此有时
会产生一些非基因自身功能的多余表型变化。
捕获系统是以报告基因(如 GUS、荧光蛋白
GFP和RFP等等)的表达来挖掘特异表达的插入突
变基因, 而不管插入突变体的表型。增强子捕获系
统中, 报告基因与最小启动子融合, 典型的最小启
动子仅含 TATA box及转录起始位点, 其本身不能
单独驱动报告基因的表达, 经附近增强子激活后, 才
能导致报告基因表达。由于增强子捕获不受插入
位置的限制, 且在相当远的距离也能起作用, 因此
带增强子捕获系统的T-DNA不仅可插入在转录单
元内, 而且可位于转录单元外, 两者都能起捕获功
能, 而其插入的方向性也不影响捕获。基因 /启动
子捕获系统中, 报告基因前则无启动子成分, 并且
位于T-DNA或Ds的边界附近, 只有插入在一个转
录单元内且方向正确时才能表达。为了使插入在
内含子中的报告基因不被剪切剔除, 一般在报告基
因之前带上一个或多个剪切受体位点(splicing ac-
ceptor sites), 这样就可与染色体上基因的剪切供体
位点(splicing donor sites)相对应, 剪切后留下的报
告基因可与染色体基因融合, 蛋白序列正确融合的
报告基因就能指示插入突变基因的表达特征, 而且
一些融合适当的报告蛋白还可提供相关突变蛋白质
的定位信息。
水稻突变群体库除了 T-DNA、转座子、逆
转录转座子 Tosl7的插入突变, 以及人为增强或过
量表达基因外, 还包括天然自发突变和人工物理化
学诱变。天然自发突变的频率极低, 理化诱变技术
虽可快速获得大量突变群体, 但是射线诱变常引起
DNA大片段的缺失或重排, 且变异位点不易确定。
尽管如此该技术仍取得了一定的进展, 日本发现的
一个 γ射线(gamma ray)辐射引起的DNA大片段的
缺失诱变, 正好是一处两个串联的高度同源基因
(GluB5和GluB4)的位点, 因此射线诱变也许在染色
体上串联的功能重叠的基因群分析中有一定优势
(Morita等 2007)。国际水稻研究所(IRRI)利用快中
子(fast neutron)和 γ射线辐射诱变, 以及化学试剂
双环氧丁烷(diepoxybutane, DEB)和甲磺酸乙酯
(ethylmethanesulfonate, EMS), 产生了约 60 000个
IR64的突变体, 并获得了 38 000个M4系和大量
的表型鉴定(Wu等 2005)。
上述提到的双环氧丁烷、甲磺酸乙酯以及叠
氮钠(sodium azide)和N-甲基亚硝基脲(N-methyl-N-
nitrosourea, MNU)等是常用的化学诱变剂。这些
化学诱变剂产生的基因突变多为点突变, 而且一个
基因内常会在不同碱基位点发生点突变, 经大规模
筛选能找到一系列等位突变基因的植株。点突变
的另一特点是, 突变表型与上述插入突变(常引起基
因功能的丧失)相比, 常常表现比较温和, 适合于一
些特殊基因(如插入突变能导致早期致死的基因)功
能的深入全面的研究。TILLING (targeting in-
duced local lesions in genomes)技术(McCallum等
植物生理学通讯 第 44卷 第 6期,2008年 12月1060
2000)的发展, 使得大规模自动化筛选特定基因位点
内发生化学点突变成为现实。在水稻作物中, 美国
和日本近年都发展了其水稻TILLING计划 (Suzuki
等 2008; Till等 2007)。在 TILLING技术中, 建立
高密度突变的群体库、设计能扩增出基因特定区
域的引物以及高灵敏的检测系统都是技术中的关
键。另外, 化学诱变虽然在被检测的DNA区域内
是相当均匀的, 但是这种均匀性在整个染色体上的
情况仍然未见报道。
水稻突变群体库的创建工作当前正在蓬勃发
展, 上述提到的各种技术手段都各有其优缺点, 但
随着研究的不断深入, 研究手段将得到不断完善。
4 正向遗传学与反向遗传学
传统的遗传学即正向遗传学(forward genetics)
分离基因的方法, 是首先研究突变体中某一已知突
变性状的表现以及其遗传行为(如突变性状在后代
中的传递规律、核质基因的判断、控制突变性状
的基因数目等等), 然后对主效基因进行染色体上的
定位及精细定位, 接着对定位区域内的候选基因筛
选并且验证其功能, 最后分离出控制突变性状的基
因。这种方法被称为图位克隆法。反向遗传学
(reverse genetics)是相对正向遗传学而言, 是在功能
基因序列发生已知突变后的基础上, 对这些突变基
因进行分析, 研究该基因突变后在生物体内的功能
作用即表型变化。在具备了水稻 T-DNA、外源
转座子以及内源逆转录转座子Tosl7插入突变群体
和其它全基因组上已知序列突变的资源库后, 水稻
功能基因组学的研究正逐步由正向遗传学(突变—
—基因)向反向遗传学(基因——突变)发展。
图位克隆新基因的方法需要建立一个遗传背
景差异大的水稻品种间或亚种间的杂交群体进行基
因定位, 精细定位群体通常要分析 500~30 000株
F2代个体的性状及其基因型, 需要大片的田地。而
对于那些筛选分析工作难度大的性状, 大群体分析
的操作相当费时费力。水稻染色体上部分区域序
列的高度同源性, 都给图位方法克隆一些新基因带
来一定局限。
在过去长期的传统育种工作中, 人们已经挖掘
出了大量自然突变发生的具有重要农艺性状的突变
体, 对这些重要基因的定位工作仍然得到高度重视,
尤其在当今水稻全基因组序列的公布对图位克隆方
法极大促进的基础下, 这一点也可从目前报道已克
隆的水稻重要基因大多还是使用图位克隆方法的事
实上得到反映。另一方面, 最近已有几篇文章报道
正对一些水稻插入突变库进行了大规模的性状观察
或筛选(Chern等 2007; Jiang等 2007; Larmande等
2008; Miyao等2007), 但是从中筛选出有重要意义
的大量突变体的工作仍然正在进行中, 此外在水稻
T-DNA或Tos17插入突变体库应用中, 多个实验室
报道只有较低的频率观察到突变性状与插入标签存
在连锁, 部分原因是在构建插入突变群体的组织培
养过程中, 产生了大量的非T-DNA或Tos17等已知
序列插入造成的突变体。这些现象使得先从突变
体库筛选特定突变性状, 再判断已知插入序列位点
的基因与突变性状的连锁关系, 最后分离出基因的
传统正向遗传学方法困难不小。
反向遗传学研究水稻基因的功能, 既可以通过
对插入突变库构建插入序列的旁邻序列FSTs数据
库, 也可以对突变库分组后进行筛选特定区域的序
列突变的单株(An等 2005)。大规模的突变体的构
建一方面对反向遗传学研究带来极大的便利, 另一
方面这些大量突变体种子的储存、繁殖和分发则
是极大的不便。加上对转基因植株种植的政策管
理, 也给种子的繁殖和分发形成一定的阻碍。另
外, 水稻中部分功能基因的冗余在一定程度上也给
反向遗传学研究方法造成了一些困难, 虽然增强或
过量表达基因的方法能够弥补一些不足。
除了上述两种基因克隆方法外, 其它一些基因
克隆方法也正在应用或逐步展开, 如从突变体芯片
里大规模基因的表达变化中筛选候选基因, 或从一
系列特定芯片中众多基因的相似表达模式上挖掘功
能新基因, 从蛋白质蛋白质或蛋白质核酸相互作用
的筛选方法中寻找新基因, 从传统的代谢途径中各
步骤的相关蛋白酶家族里筛选功能基因, 从系统进
化树中寻找相关功能基因等等。加快水稻基因功
能的识别仍然是当前备受关注的主题。
参考文献
Ammiraju JS, Luo M, Goicoechea JL, Wang W, Kudrna D, Mueller
C, Talag J, Kim H, Sisneros NB, Blackmon B et al (2006).
The Oryza bacterial artificial chromosome library resource:
construction and analysis of 12 deep-coverage large-insert
BAC libraries that represent the 10 genome types of the
genus Oryza. Genome Res, 16: 140~147
An G, Lee S, Kim SH, Kim SR (2005). Molecular genetics using T-
DNA in rice. Plant Cell Physiol, 46: 14~22
植物生理学通讯 第 44卷 第 6期,2008年 12月 1061
Barry GF (2001). The use of the Monsanto draft r ice genome
sequence in research. Plant Physiol, 125: 1164~1165
Brenner S, Johnson M, Bridgham J, Golda G, Lloyd DH, Johnson
D, Luo S, McCurdy S, Foy M, Ewan M et al (2000a). Gene
expression analysis by massively parallel signature sequenc-
ing (MPSS) on microbead arrays. Nat Biotechnol, 18:
630~634
Brenner S, Williams SR, Vermaas EH, Storck T, Moon K, McCollum
C, Mao JI, Luo S, Kirchner JJ, Eletr S et al (2000b). In vitro
cloning of complex mixtures of DNA on microbeads: physi-
cal separation of differentially expressed cDNAs. Proc Natl
Acad Sci USA, 97: 1665~1670
Canales RD, Luo Y, Willey JC, Austermiller B, Barbacioru CC,
Boysen C, Hunkapiller K, Jensen RV, Knight CR, Lee KY et
al (2006). Evaluation of DNA microarray results with quan-
titative gene expression pla tforms. Nat Biotechnol, 24:
1115~1122
Chen M, Presting G, Barbazuk WB, Goicoechea JL, Blackmon B,
Fang G, Kim H, Frisch D, Yu Y, Sun S et al (2002). An
integrated physical and genetic map of the rice genome.
Plant Cell, 14: 537~545
Chern CG, Fan MJ, Yu SM, Hour AL, Lu PC, Lin YC, Wei FJ, Huang
SC, Chen S, Lai MH et al (2007). A rice phenomics study—
phenotype scoring and seed propagation of a T-DNA inser-
tion-induced rice mutant population. Plant Mol Biol, 65:
427~438
Chin HG, Choe MS, Lee SH, Park SH, Koo JC, Kim NY, Lee JJ, Oh
BG, Yi GH, Kim SC et al (1999). Molecular analysis of rice
plants harboring an Ac/Ds transposable element-mediated
gene trapping system. Plant J, 19: 615~623
Eamens AL, Blanchard CL, Dennis ES, Upadhyaya NM (2004). A
bidirectional gene trap construct suitable for T-DNA and Ds-
mediated insertional mutagenesis in rice (Oryza sativa L.).
Plant Biotechnol J, 2: 367~380
Edgar R, Barrett T (2006). NCBI GEO standards and services for
microarray data. Nat Biotechnol, 24: 1471~1472
Feng Q, Zhang Y, Hao P, Wang S, Fu G, Huang Y, Li Y, Zhu J, Liu
Y, Hu X et al (2002). Sequence and analysis of rice chromo-
some 4. Nature, 420: 316~320
Goff SA, Ricke D, Lan TH, Presting G, Wang R, Dunn M,
Glazebrook J, Sessions A, Oeller P, Varma H et al (2002). A
draft sequence of the rice genome (Oryza sativa L. ssp.
japonica). Science, 296: 92~100
Gowda M, Jantasuriyarat C, Dean RA, Wang GL (2004). Robust-
LongSAGE (RL-SAGE): a substantially improved LongSAGE
method for gene discovery and transcriptome analysis. Plant
Physiol, 134: 890~897
Harushima Y, Yano M, Shomura A, Sato M, Shimano T, Kuboki
Y, Yamamoto T, Lin SY, Antonio BA, Parco A et al (1998).
A high-density rice genetic linkage map with 2275 markers
using a single F2 population. Genetics, 148: 479~494
Hiei Y, Ohta S, Komari T , Kumashiro T (1994). Efficient
transformation of r ice (Oryza sativa L.) mediated by
Agrobacterium and sequence analysis of the boundaries of the
T-DNA. Plant J, 6: 271~282
Hirochika H (2001). Contribution of the Tos17 retrotransposon
to rice functional genomics. Curr Opin Plant Biol, 4: 118~122
Hirochika H, Sugimoto K, Otsuki Y, Tsugawa H, Kanda M (1996).
Retrotransposons of rice involved in mutations induced by
tissue culture. Proc Natl Acad Sci USA, 93: 7783~7788
Hsing YI, Chern CG, Fan MJ, Lu PC, Chen KT, Lo SF, Sun PK, Ho
SL, Lee KW, Wang YC et al (2007). A rice gene activation/
knockout mutant resource for high throughput functional
genomics. Plant Mol Biol, 63: 351~364
IRGSP (2005). The map-based sequence of the rice genome.
Nature, 436: 793~800
Jeon JS, Lee S, Jung KH, Jun SH, Jeong DH, Lee J, Kim C, Jang S,
Yang K, Nam J et al (2000). T-DNA insertional mutagenesis
for functional genomics in rice. Plant J, 22: 561~570
Jeong DH, An S, Kang HG, Moon S, Han JJ, Park S, Lee HS, An K,
An G (2002). T-DNA insertional mutagenesis for activation
tagging in rice. Plant Physiol, 130: 1636~1644
Jeong DH, An S, Park S, Kang HG, Park GG, Kim SR, Sim J, Kim
YO, Kim MK, Kim J et al (2006). Generation of a flanking
sequence-tag database for activation-tagging lines in japonica
rice. Plant J, 45: 123~132
Jiang SY, Bachmann D, La H, Ma Z, Venkatesh PN, Ramamoorthy
R, Ramachandran S (2007). Ds insertion mutagenesis as an
efficient tool to produce diverse variations for rice breeding.
Plant Mol Biol, 65: 385~402
Jiao Y, Jia P, Wang X, Su N, Yu S, Zhang D, Ma L, Feng Q, Jin Z,
Li L et al (2005). A tiling microarray expression analysis of
rice chromosome 4 suggests a chromosome-level regulation
of transcription. Plant Cell, 17: 1641~1657
Khush GS (2001a). Challenges for meeting the global food and
nutrient needs in the new millennium. Proc Nutr Soc, 60:
15~26
Khush GS (2001b). Green revolution: the way forward. Nat Rev
Genet, 2: 815~822
Kikuchi S, Satoh K, Nagata T, Kawagashira N, Doi K, Kishimoto
N, Yazaki J, Ishikawa M, Yamada H, Ooka H et al (2003).
Collection, mapping, and annotation of over 28,000 cDNA
clones from japonica rice. Science, 301: 376~379
Kohli A, Xiong J, Greco R, Christou P, Pereira A (2001). Tagged
Transcriptome Display (TTD) in indica rice using Ac
transposition. Mol Genet Genomics, 266: 1~11
Kolesnik T, Szeverenyi I, Bachmann D, Kumar CS, Jiang S,
R a m a m oo r t hy R , C a i M , Ma Z G , Su nd a r es a n V ,
Ramachandran S (2004). Establishing an efficient Ac/Ds tag-
ging system in rice: large-scale analysis of Ds flanking
sequences. Plant J, 37: 301~314
Kumar CS, Wing RA, Sundaresan V (2005). Efficient insertional
mutagenesis in rice using the maize En/Spm elements. Plant
J, 44: 879~892
Larmande P, Gay C, Lorieux M, Perin C, Bouniol M, Droc G, Sallaud
C, Perez P, Barnola I, Biderre-Petit C et al (2008). Oryza
Tag Line, a phenotypic mutant database for the Génoplante
rice insertion line library. Nucleic Acids Res, 36: D1022~1027
Li L, Wang X, Sasidharan R, Stolc V, Deng W, He H, Korbel J, Chen
X, Tongprasit W, Ronald P et al (2007). Global identifica-
植物生理学通讯 第 44卷 第 6期,2008年 12月1062
tion and characterization of transcriptionally active regions
in the rice genome. PLoS ONE, 2: e294
Li L, Wang X, Stolc V, Li X, Zhang D, Su N, Tongprasit W, Li S,
Cheng Z, Wang J et al (2006). Genome-wide transcription
analyses in rice using tiling microarrays. Nat Genet, 38:
124~129
Li L, Wang X, Xia M, Stolc V, Su N, Peng Z, Li S, Wang J, Deng
XW (2005). Tiling microarray analysis of rice chromosome
10 to identify the transcriptome and relate its expression to
chromosomal architecture. Genome Biol, 6: R52
Liu X, Lu T, Yu S, Li Y, Huang Y, Huang T, Zhang L, Zhu J, Zhao
Q, Fan D et al (2007). A collection of 10,096 indica rice full-
length cDNAs reveals highly expressed sequence divergence
between Oryza sativa indica and japonica subspecies. Plant
Mol Biol, 65: 403~415
Ma L, Chen C, Liu X, Jiao Y, Su N, Li L, Wang X, Cao M, Sun N,
Zhang X et al (2005). A microarray analysis of the rice
transcriptome and its comparison to Arabidopsis. Genome
Res, 15: 1274~1283
Matsumura H, Nirasawa S, Terauchi R (1999). Technical advance:
transcript profiling in rice (Oryza sativa L.) seedlings using
serial analysis of gene expression (SAGE). Plant J, 20:
719~726
Matsumura H, Reich S, Ito A, Saitoh H, Kamoun S, Winter P, Kahl
G, Reuter M, Kruger DH, Terauchi R (2003). Gene expres-
sion a na lysis of plant host-pa thogen in ter actions by
SuperSAGE. Proc Natl Acad Sci USA, 100: 15718~15723
McCallum CM, Comai L, Greene EA, Henikoff S (2000). Targeted
screening for induced muta tions. Nat Biotechnol, 18:
455~457
Miyao A, Iwasaki Y, Kitano H, Itoh J, Maekawa M, Murata K,
Yatou O, Nagato Y, Hirochika H (2007). A large-scale col-
lection of phenotypic data describing an insertional mutant
population to facilitate functional analysis of rice genes.
Plant Mol Biol, 63: 625~635
Miyao A, Tanaka K, Murata K, Sawaki H, Takeda S, Abe K,
Shinozuka Y, Onosato K, Hirochika H (2003). Target site
specificity of the Tos17 retrotransposon shows a preference
for inser t ion wi thin genes and a ga inst inser t ion in
retrotransposon-rich regions of the genome. Plant Cell, 15:
1771~1780
Moore G, Devos KM, Wang Z, Gale MD (1995). Cereal genome
evolution. Grasses, line up and form a circle. Curr Biol, 5:
737~739
Morita R, Kusaba M, Iida S, Nishio T, Nishimura M (2007).
Knockout of glutelin genes which form a tandem array with
a high level of homology in rice by gamma irradiation. Genes
Genet Syst, 82: 321~327
Nakamura H, Hakata M, Amano K, Miyao A, Toki N, Kajikawa
M, Pang J, Higashi N, Ando S, Toki S et al (2007). A genome-
wide gain-of function analysis of rice genes using the FOX-
hunting system. Plant Mol Biol, 65: 357~371
Nobuta K, Venu RC, Lu C, Belo A, Vemaraju K, Kulkarni K, Wang
W, Pillay M, Green PJ, Wang GL et al (2007). An expression
atlas of rice mRNAs and small RNAs. Nat Biotechnol, 25:
473~477
Ouyang S, Zhu W, Hamilton J, Lin H, Campbell M, Childs K,
Thibaud-Nissen F, Malek RL, Lee Y, Zheng L et al (2007).
The TIGR Rice Genome Annotation Resource: improve-
ments and new features. Nucleic Acids Res, 35: D883~887
Park SH, Jun NS, Kim CM, Oh TY, Huang J, Xuan YH, Park SJ, Je
BI, Piao HL, Cha YS et al (2007). Analysis of gene-trap Ds
rice populations in Korea. Plant Mol Biol, 65: 373~384
Parkinson H, Sarkans U, Shojatalab M, Abeygunawardena N,
Contrino S, Coulson R, Farne A, Lara GG, Holloway E,
Kapushesky M et al (2005). ArrayExpress—a public reposi-
tory for microarray gene expression data at the EBI. Nucleic
Acids Res, 33: D553~555
Peng S, Huang J, Sheehy JE, Laza RC, Visperas RM, Zhong X,
Centeno GS, Khush GS, Cassman KG (2004). Rice yields
decline with higher night temperature from global warming.
Proc Natl Acad Sci USA, 101: 9971~9975
Piffanelli P, Droc G, Mieulet D, Lanau N, Bes M, Bourgeois E,
Rouviere C, Gavory F, Cruaud C, Ghesquiere A et al (2007).
Large-scale characterization of Tos17 insertion sites in a
rice T-DNA mutant library. Plant Mol Biol, 65: 587~601
Rensink WA, Buell CR (2005). Microarray expression profiling
resources for plant genomics. Trends Plant Sci, 10: 603~609
Ryu CH, You JH, Kang HG, Hur J, Kim YH, Han MJ, An K, Chung
BC, Lee CH, An G (2004). Generation of T-DNA tagging
lines with a bidirectional gene trap vector and the establish-
ment of an insertion-site database. Plant Mol Biol, 54:
489~502
Sasaki T, Matsumoto T, Yamamoto K, Sakata K, Baba T, Katayose
Y, Wu J, Niimura Y, Cheng Z, Nagamura Y et al (2002). The
genome sequence and structure of rice chromosome 1. Nature,
420: 312~316
Shi L, Reid LH, Jones WD, Shippy R, Warrington JA, Baker SC,
Collins PJ, de Longueville F, Kawasaki ES, Lee KY et al
(2006). The MicroArray Quality Control (MAQC) project
shows inter- and intraplatform reproducibility of gene ex-
pression measurements. Nat Biotechnol, 24: 1151~1161
Shimono M, Sugano S, Nakayama A, Jiang CJ, Ono K, Toki S,
Takatsuji H (2007). Rice WRKY45 plays a crucial role in
benzothiadiazole-inducible blast resistance. Plant Cell, 19:
2064~2076
Suzuki T, Eiguchi M, Kumamaru T, Satoh H, Matsusaka H,
Moriguchi K, Nagato Y, Kurata N (2008). MNU-induced
mutant pools and high performance TILLING enable find-
ing of any gene mutation in rice. Mol Genet Genomics, 279:
213~223
Tanaka T, Antonio BA, Kikuchi S, Matsumoto T, Nagamura Y,
Numa H, Sakai H, Wu J, Itoh T, Sasaki T et al (2008). The
Rice Annotation Project Database (RAP-DB): 2008 update.
Nucleic Acids Res, 36: D1028~1033
Till BJ, Cooper J, Tai TH, Colowit P, Greene EA, Henikoff S,
Comai L (2007). Discovery of chemically induced muta-
tions in rice by TILLING. BMC Plant Biol, 7: 19
Toki S, Hara N, Ono K, Onodera H, Tagiri A, Oka S, Tanaka H
( 2 0 0 6 ) . E a r ly i nfec t i on o f sc u t el lu m t i ss u e w i t h
植物生理学通讯 第 44卷 第 6期,2008年 12月 1063
Agrobacterium allows high-speed transformation of rice.
Plant J, 47: 969~976
van Enckevort LJ, Droc G, Piffanelli P, Greco R, Gagneur C, Weber
C, Gonzalez VM, Cabot P, Fornara F, Berri S et al (2005).
EU-OSTID: a collection of transposon insertional mutants
for functional genomics in r ice. Plant Mol Biol, 59: 99~
110
Velculescu VE, Zhang L, Vogelstein B, Kinzler KW (1995). Serial
analysis of gene expression. Science, 270: 484~487
Wing RA, Ammiraju JS, Luo M, Kim H, Yu Y, Kudrna D,
Goicoechea JL, Wang W, Nelson W, Rao K et al (2005). The
Oryza map alignment project: the golden path to unlocking
the genetic potential of wild rice species. Plant Mol Biol,
59: 53~62
Wu J, Maehara T, Shimokawa T, Yamamoto S, Harada C, Takazaki
Y, Ono N, Mukai Y, Koike K, Yazaki J et al (2002). A
comprehensive rice transcript map containing 6591 ex-
pressed sequence tag sites. Plant Cell, 14: 525~535
Wu JL, Wu C, Lei C, Baraoidan M, Bordeos A, Madamba MR,
Ramos-Pamplona M, Mauleon R, Portugal A, Ulat VJ et al
(2005). Chemical- and irradiation-induced mutants of indica
rice IR64 for forward and reverse genetics. Plant Mol Biol,
59: 85~97
Yu J, Hu S, Wang J, Wong GK, Li S, Liu B, Deng Y, Dai L, Zhou
Y, Zhang X et al (2002). A draft sequence of the rice genome
(Oryza sativa L. ssp. indica). Science, 296: 79~92