全 文 :第25卷 第10期
2013年10月
生命科学
Chinese Bulletin of Life Sciences
Vol. 25, No. 10
Oct., 2013
文章编号:1004-0374(2013)10-0978-05
大肠杆菌最小基因组分析和删减进展
薛小莉*,覃重军
(中国科学院上海生命科学研究院植物生理生态研究所,中科院合成生物学重点实验室,上海 200032)
摘 要:大肠杆菌是基础研究最透彻、应用广泛的微生物,构建含减小甚至是最小基因组的大肠杆菌将为
合成生物学的研究和应用提供理想的底盘生物。介绍了大肠杆菌最小基因组的生长与繁殖必需基因的生物
信息学分析和实验鉴定,基因组敲除技术,以及删减基因组的大肠杆菌菌株的构建和应用等方面的研究进展。
关键词:最小基因组;必需基因;基因组敲除
中图分类号:Q813;O621.33 文献标志码:A
Progresses in the analysis and development of Escherichia coli minimal genome
XUE Xiao-Li*, QIN Zhong-Jun
(Key Laboratory of Synthetic Biology, Institute of Plant Physiology and Ecology,
Shanghai Institutes for Biological Sciences, Chinese Academy of Sciences, Shanghai 200032, China)
Abstract: Synthetic biology is a key research focus in recent years. Construction of Escherichia coli strains with
reduced even minimal genome will provide a desired chassis cell for research work in synthetic biology. In this
paper, progresses in the analysis and the identification of E. coli minimal genome and essential genes, the genome
deletion techniques, and the construction and application of E. coli strains with reduced genome were reviewed.
Key words: minimal genome; essential gene; genome deletion
收稿日期:2013-07-05
基金项目:国家重点基础研究发展计划(“973”项目)
(2011CBA00801)
*通信作者:E-mail: xlxue@sibs.ac.cn
合成生物学是近年来的研究热点之一。它是在
系统生物学的基础上,借鉴工程学思想和现代生物
学技术方法来设计和构建新的生物元件、网络和体
系,并最终人工重构新型的生命体 [1]。构建一个易
于预测和调控的生理性质优良的底盘生物将为合成
生物学的研究提供一个良好的工作平台。大肠杆菌
(Escherichia coli)是在分子水平上研究最清楚的模
式生物,且由于生长快速,遗传操作简单,在基础
研究和工业应用上有着其他模式生物无可比拟的优
势。然而,天然的大肠杆菌的基因组包含很多对生
存非必需的基因、转座元件、噬菌体 DNA、前噬
菌体、毒力因子、假基因和基因残余等。去除这些
生存非必需的区域将有利于降低大肠杆菌基因组的
复杂度,增强其可预测和调控性;而且去除了生存
非必需的代谢途径可以提高细胞对目标生物产品的
转化效率,使其成为理想的研究与应用的底盘生物。
对越来越多已完成的细菌基因组测序数据的比
较和分析,推动了最小基因组概念的产生。最小基
因组是指在最理想的条件下,即在所有的必需的营
养成分都很充足,且不存在任何环境压力的情况下,
维持一个有功能的细胞生命形式所需的最小数目的
基因集合 [2] 。最小基因组的研究有助于理解复杂的
遗传调控,并为设计和改造细菌菌株提供基础。
构建最小基因组可以从两个途径来实现:一个
是“自上而下”的基因组删减途径,即通过不断删
减基因组中生长非必需的区域而得到基因组减小化
的甚至是最小化的菌株;另一个是“自下而上”的
基因组全合成途径,即通过理性设计,从基本元件
逐步组装构建功能基因模块,最后全合成基因组 [3]。
自下而上的全合成人工设计的最小基因组的策
略受到技术方面和研究所得知识的限制,难以一步
薛小莉,等:大肠杆菌最小基因组分析和删减进展第10期 979
实现。目前报道的人工全合成天然的小基因组为
2010年美国科学家 J. Craig Venter和他的科研团队
发表的约 1 Mb的丝状支原体 (Mycoplasma mycoides)
基因组,并将其植入去除了遗传物质的山羊支原体
(M. capricolum)体内,创造出世界上首个由化学合
成基因组控制的细菌 [4]。这是合成生物学里程碑式
的成果,解决了最小基因组人工合成的技术屏障。
然而,他们合成的基因组几乎跟天然的基因组一
样,只是在合成的基因组中添加了一些水印标记
(watermark)。人工合成最小基因组需要对组成生存
必需的基因集合有全面的功能分析。虽然目前在这
方面已取得很多进展,但仍然还不够全面,很难保
证化学合成出来的人工设计的最小基因组能正常工
作,即能维持一个有功能的细胞生命形式。
另一方面,自上而下的基因组删减策略比较简
单可行。因为基因组敲除的技术已经发展成熟,可
对基因组中生存非必需的 DNA进行大片段删减的
测试,测试可敲除的区域再合并到一个菌株中,这
样逐步构建一系列基因组减小化的菌株,最终得到
基因组最小化的菌株。基因组删减策略首先需要解
决的问题是确定哪些是生存非必需的可敲除的区
域。大肠杆菌最小基因组的分析将为基因组删减的
研究工作提供重要的信息。
1 大肠杆菌最小基因组分析
1.1 最小基因组的理论分析
最小基因组的预测可以用比较基因组学的方
法,即通过寻找不同微生物基因组中的保守基因来
确定生存必需的基因集合。1996年,Mushegian和
Koonin[5]最早利用比较基因组学的方法分析了基因
组分别为 1.83 Mb和 0.58 Mb的革兰氏阴性菌流感
嗜血杆菌 (Haemophilus influenzae)以及革兰氏阳性
菌生殖道支原体 (Mycoplasma genitalium)。他们认
为在这两个进化距离比较远的物种中保守的基因极
有可能是生存必需的,由此提出了 256个保守的蛋
白质编码基因组成的最小的基因集合。然而,有些
生存必需基因的功能可能被非同源的基因替代,这
些基因在比较基因组学的分析中会被遗漏。随着参
与比较的基因组数目的增加,被认为是生存必需的
基因大量减少。当参加比较的基因组达到 8个时,
保守的最小基因集合已经降为了 156个 [6]。此外,
约三分之一的生存必需基因的功能是未知的,这也
大大影响了比较基因组学方法对生存必需基因预测
的准确性 [7]。
通过将这些生存必需基因与生存必需功能的模
块联系起来,如细胞内的途径、亚系统和网络,能
更准确和有效地分析细菌最小基因组。Forster和
Church[7]认为最小细胞是仅需依赖于小分子底物就
能自我复制的,因此只需要包含基因组复制、转录、
RNA处理及修饰、翻译及翻译后修饰等几个生化
亚系统。他们提出了理论最小基因组为 113 kb,共
151个基因,包括 38个 RNA及 113个蛋白质编码
基因。这些基因多来源于大肠杆菌,但是出于最简
化考虑,他们使用了噬菌体的复制和翻译机器。
为了得到更接近最小细菌基因组的预测,Gil
等 [8]综合了比较基因组分析及多方面的实验数据,
提出了最小基因集合为 206个蛋白质编码基因,包
括了完整的 DNA和 RNA代谢、蛋白质修饰折叠转
运、能量和中间产物代谢等。但是,该研究只分析
了生存必需的蛋白质编码基因,而未考虑 tRNA和
rRNA,因此还是不够全面。
1.2 实验鉴定大肠杆菌生存必需基因
生存必需基因的鉴定对大肠杆菌最小基因组的
分析至关重要,除了理论分析外,还应结合实验方
法的鉴定结果。对基因组范围大规模的生存必需基
因的鉴定包括遗传足迹法 (genetic footprinting)检测
插入失活基因、单基因失活,以及对已报道文献中
相关实验数据的整合等。
Gerdes等 [9]用遗传足迹法对大肠杆菌 K-12菌
株 MG1655基因组进行了 Tn-5转座子插入突变,
共鉴定 620个生存必需基因。这是首次在大肠杆菌
全基因组范围内进行的比较全面的生存必需基因的
鉴定。但是,基因组中存在转座子不容易插入的位
点 (insertion cold spot),该方法容易将存在不易插入
位点的或基因长度较短而未被失活的生存非必需基
因错误评估为生存必需基因。此外,该方法鉴定的
是对大肠杆菌生长重要的基因,并非严格意义的生
存必需基因。有些生存非必需基因的失活可能会使
得菌株生长变慢而在一个群体中失去生存优势,这
类基因的失活不易被检测到而被误认为是生存必需
基因。
相比而言,Baba等 [10]通过单基因敲除查找生
存必需基因的方法更为严谨。他们共得到 3 985个
单基因敲除的大肠杆菌菌株,称为 Keio collection;
而对 303个基因无法得到敲除菌株,因此,这些基
因被认为是实验条件下生存必需基因。然而,不管
是哪种方法,通过失活基因来鉴定生存必需基因都
会遗漏基因组中存在的执行生存必需功能的冗余基
生命科学 第25卷980
因。对于这些基因,失活或敲除一个基因并不影响
另一个基因发挥功能,因而不会被鉴定为生存必需
基因。
在 EcoGene数据库 (http://www.ecogene.org/old/
topic.php?topic_id=5)中,其他研究者根据 Baba等
发表的生存必需基因结果进行了不断的更新。在
EcoGene中,只有在所有测试过的生长条件中都为
生存必需的基因才被定义为必需基因。例如,在不
同温度、氧浓度、盐浓度或添加了不同的营养物质
后可以得到单一的基因敲除菌株的话,则该基因被
认为是生存非必需基因。此外,因基因组其他位置
的抑制突变 (suppressor mutation)使得有些生存必需
基因可以得到敲除菌株,则该基因仍应被列为生存
必需基因。据此,共列出了 289个生存必需基因。
此外,PEC (The Profiling of Escherichia coli chromosom)
数据库 (http://www.shigen.nig.ac.jp/ecoli/pec/index.jsp)
还搜集了不同实验数据来源的大肠杆菌生存必需基
因的信息。在这个数据库中大肠杆菌 K-12菌株
MG1655的生存必需基因为 302个,而 K-12菌株
W3110的生存必需基因为 300个。由于不同的研究
中培养和实验条件可能会不一致, PEC数据库中生
存必需基因的信息也只能作为一个参考。
2 大肠杆菌基因组删减进展
2.1 大肠杆菌基因组删减技术
基因组删减技术包括精确敲除和随机敲除。
随机敲除是利用转座子随机插入和切离介导的重组
造成染色体 DNA片段的缺失。但是,随机敲除在
后续的缺失突变体筛选和鉴定方面比较麻烦,而且
无法控制敲除片段的大小和位置。为了快速地删减
大肠杆菌基因组,科学家们发展了不同的精确打靶
技术,其中包括位点特异性重组、自杀质粒介导的
同源重组和 λ噬菌体 Red系统介导的线性 DNA重
组 [11]。
位点特异性重组介导的基因组敲除利用了 Cre/
loxP或 Flp/FRT位点特异重组系统 [12]。Cre (Flp)是
位点特异性整合酶,能介导 2个 loxP (FRT)位点之
间的 DNA片段的整合。在目的敲除区域两端插入
的同一方向的 34 bp的 loxP (FRT)位点在整合酶的
作用下发生分子内整合,而使得 2个位点之间的
DNA片段缺失。该方法需要先在染色体目标敲除
区域两端插入两个 loxP (FRT)位点,步骤比较繁琐,
并且会在染色体上留下一个 loxP (FRT)“疤痕”,会
对后续的敲除工作产生干扰,因此不太适合用于基
因组的连续敲除。
自杀质粒介导的敲除方法利用了不能在宿主
菌中自主复制的质粒与宿主染色体之间的同源重
组,在选择抗性筛选标记的情况下,该质粒必须与
宿主染色体同源的区域进行遗传交换整合到染色体
上 [13]。质粒还带有与目的敲除区域两端同源的片段,
通过选择 sacB (蔗糖敏感 )或 rpsL (链霉素敏感 )
等反选标记 (count selection marker)[14]促进第二次同
源重组,或利用 I-SceI内切酶介导的双链断裂重
组 [13],使得质粒骨架被切除下来,根据同源重组的
位置不同可以得到野生型或目标区域敲除的菌株。
该方法在每次的敲除都需要先构建特殊的基因打靶
载体,因此比较繁琐。
Red系统介导的线性 DNA重组系统由于直接
利用了 PCR扩增的线性 DNA片段,避免了繁琐的
载体构建过程而更被广泛使用。Red系统只需要线
性 DNA含有大于 40 bp与染色体目的敲除区域两
端同源的片段即可发生有效的重组 [15]。在 Red系
统中,Gam蛋白抑制了大肠杆菌中的 RecBCD核酸
酶活性,使得线性 DNA片段不被降解;Exo外切
酶从 5到 3方向切割线性DNA使其产生单链末端;
Bet单链 DNA结合蛋白则促进了线性 DNA与染色
体的重组。通过选择线性 DNA片段上的抗性标记
即可筛选到目的区域敲除的菌株。抗性标记的去除
可以利用直接识别 2个 FRT位点而可以删除中间区
域的 Flp重组酶 [15]或 I-SceI内切酶介导的双链断裂
重组 [12]。
2.2 大肠杆菌基因组删减进展及基因组减小化菌株
的应用
将大肠杆菌基因组中的生存非必需区域逐渐
删减,可以降低基因组的复杂度,有利于更好地研
究细胞的基础调控机制。具有减小基因组的细胞也
减少了非必需的代谢途径,有利于整合异源的高效
生产元件以获得高产的优化菌株。2001年,日本展
开了最小基因组工厂 (minimal genome factory)项目,
其目标就是构建几种模式微生物的最小基因组,
使其适合于作为细胞工厂应用于工业生产,其中
包括了最小基因组大肠杆菌的构建 [16]。2005年,
Hashimoto等 [14]报道利用基因组无痕敲除方法将大
肠杆菌MG1655基因组中不含生存必需基因的大于
40 kb的区域进行了平行敲除,再利用 P1噬菌体转
导将这些敲除累积在一个菌株中,这样得到了 ∆16
菌株。该菌株基因组从 4.6 Mb减小至 3.2 Mb,减
小了 29.7%。但是,随着敲除区域的增加,敲除菌
薛小莉,等:大肠杆菌最小基因组分析和删减进展第10期 981
株生长变得缓慢,∆16菌株生长代时达到 45 min,
而野生型菌株的生长代时仅为 26 min。此外,这些
生长非必需区域的敲除使得细胞大小和染色体复
制与分配都受到了影响 [14]。在此基础上,他们继
续将基因组删减,在 2011年得到了基因组减小至
2.89 Mb的 ∆33菌株,基因组减小了 38.9%,这是
目前已知的基因组最小的大肠杆菌菌株 [17]。值得一
提的是,Kato和 Hashimoto[18]报告了覆盖大肠杆菌
MG1655整个基因组范围的敲除信息,包括对染色
体上不同区域进行的大片段敲除、中等长度及小片
段的敲除,以及回补的区域等信息。这些信息对于
大肠杆菌最小基因组的删减和研究来说非常宝贵。
从应用的角度出发,最小基因组不一定意味着
最小的生存必需基因集合,而是对工业应用有利的
合适的基因集合。Mizoguchi研究组选取了基因组
大小仅为 0.64 Mb,且被认为与大肠杆菌有共同祖
先的蚜虫共生菌巴克纳氏菌 (Buchnera),通过比较
大肠杆菌和巴克纳氏菌的基因组,列出了大肠杆菌
特有的基因作为候选的敲除基因 [19]。为了得到健壮
生长的大肠杆菌菌株,他们保留了对生长重要的基
因,在此基础上,对有连续 10个生长非必需基因
的区域进行敲除,并检测这些敲除菌株对生长是否
有影响。将对生长没有影响的敲除区域再富集在一
个菌株,构建了MGF01菌株。该菌株基因组减小
至 3.6 Mb,基因组减小 22%。MGF01菌株在生长
对数期的生长速率与野生型菌株一样,但在野生型
菌株进入生长静止期后该菌株还能继续保持生长,
最后的细胞密度为野生型的 1.5倍,因此比野生型
菌株更具生长优势。以该菌为生产宿主,其 L-苏
氨酸的产量比野生型高 2.4倍 [20]。
为了构建合适的底盘细胞,Posfai研究组利用
比较基因组学的方法分析了在大肠杆菌MG1655基
因组中存在,而在其他几株大肠杆菌基因组中不存
在的区域,确定了 100处计划敲除的区域,总长度
占基因组的 20%。据此,他们连续敲除了 43处生
存非必需基因,包括重组或转移元件以及隐蔽的毒
力因子等,将基因组减小了 15% [21-22]。敲除后的菌
株生长未受到影响,而且具有更高的转化效率。其
中,他们构建的菌株MDS42 (基因组减小 14.3%)
已有商业出售 (http://www.scarabgenomics.com/default.
aspx)。MDS42由于去掉了大量的生存非必需基因,
提高了作为商业菌株的生产力。例如,同样的遗传
改造在野生型菌株和MDS42菌株中,后者生产 L-
苏氨酸的产量增加了约 80%[23]。由于删除了所有移
动的遗传元件,MDS42的进化频率降低,有利于
不稳定的质粒和基因的保存和传代,比较适合作为
合成生物学研究和应用的底盘生物 [24]。在此基础上,
通过敲除压力诱导的易于出错的 DNA聚合酶,使
得MDS42的基因组更加稳定,即使是一些生长抑
制的生物分子元件也能稳定保持,因此MDS42菌
株是更理想的宿主 [25]。
3 结语与展望
对大肠杆菌最小基因组和生存必需基因的理论
和实验分析可以为基因组删减过程中目标敲除区域
的选择提供重要信息,但是这些方法都存在各自的
局限性,因此需要综合参考多方面的数据。此外,
目前已有的基因组敲除方法效率较低,只能一次敲
除一到两个片段,敲除速度较为缓慢。高通量基因
组敲除技术有待发展,以便更快速和高效地删减大
肠杆菌基因组。大肠杆菌基因组的减小化不仅有利
于全基因组的调控和预测等基础研究,也为生物技
术的应用提供了合适的表达宿主。在大肠杆菌最小
基因组的基础上,可以添加异源的强大生物元件以
生产不同的产物,为医药、化学品、生物能源等大
规模的工业生产提供理想的表达宿主,具有广阔应
用前景。
[参 考 文 献]
[1] Khalil AS, Collins JJ. Synthetic biology: applications
come of age. Nat Rev Genet, 2010, 11(5): 367-79
[2] Koonin EV. How many genes can make a cell: the
minimal-gene-set concept. Annu Rev Genomics Hum
Genet, 2000, 1: 99-116
[3] Jewett MC, Forster AC. Update on designing and building
minimal cells. Curr Opin Biotechnol, 2010, 21(5): 697-
703
[4] Gibson DG, Glass JI, Lartigue C, et al. Creation of a
bacterial cell controlled by a chemically synthesized
genome. Science, 2010, 329(5987): 52-6
[5] Mushegian AR, Koonin EV. A minimal gene set for
cellular life derived by comparison of complete bacterial
genomes. Proc Natl Acad Sci USA, 1996, 93(19): 10268-
73
[6] Klasson L, Andersson SG. Evolution of minimal-gene-sets
in host-dependent bacteria. Trends Microbiol, 2004, 12(1):
37-43
[7] Forster AC, Church GM. Towards synthesis of a minimal
cell. Mol Syst Biol, 2006, 2: 45
[8] Gil R, Silva FJ, Pereto J, et al. Determination of the core
of a minimal bacterial gene set. Microbiol Mol Biol Rev,
2004, 68(3): 518-37, table of contents
[9] Gerdes SY, Scholle MD, Campbell JW, et al. Experimental
determination and system level analysis of essential genes
生命科学 第25卷982
in Escherichia coli MG1655. J Bacteriol, 2003, 185(19):
5673-84
[10] Baba T, Ara T, Hasegawa M, et al. Construction of
Escherichia coli K-12 in-frame, single-gene knockout
mutants: the Keio collection. Mol Syst Biol, 2006, 2:
2006.0008
[11] Feher T, Papp B, Pal C, et al. Systematic genome
reductions: theoretical and experimental approaches.
Chem Rev, 2007, 107(8): 3498-513
[12] Yu BJ, Kang KH, Lee JH, et al. Rapid and efficient
construction of markerless deletions in the Escherichia
coli genome. Nucleic Acids Res, 2008, 36(14): e84
[13] Posfai G, Kolisnychenko V, Bereczki Z, et al. Markerless
gene replacement in Escherichia coli stimulated by a
double-strand break in the chromosome. Nucleic Acids
Res, 1999, 27(22): 4409-15
[14] Hashimoto M, Ichimura T, Mizoguchi H, et al. Cell size
and nucleoid organization of engineered Escherichia coli
cells with a reduced genome. Mol Microbiol, 2005, 55(1):
137-49
[15] Datsenko KA, Wanner BL. One-step inactivation of
chromosomal genes in Escherichia coli K-12 using PCR
products. Proc Natl Acad Sci USA, 2000, 97(12): 6640-5
[16] Mizoguchi H, Mori H, Fujio T. Escherichia coli minimum
genome factory. Biotechnol Appl Biochem, 2007, 46(Pt
3): 157-67
[17] Iwadate Y, Honda H, Sato H, et al. Oxidative stress
sensitivity of engineered Escherichia coli cells with a
reduced genome. FEMS Microbiol Lett, 2011, 322(1): 25-
33
[18] Kato J, Hashimoto M. Construction of consecutive
deletions of the Escherichia coli chromosome. Mol Syst
Biol, 2007, 3: 132
[19] Shigenobu S, Watanabe H, Hattori M, et al. Genome
sequence of the endocellular bacterial symbiont of aphids
Buchnera sp. APS. Nature, 2000, 407(6800): 81-6
[20] Mizoguchi H, Sawano Y, Kato J, et al. Superpositioning of
deletions promotes growth of Escherichia coli with a
reduced genome. DNA Res, 2008, 15(5): 277-84
[21] Kolisnychenko V, Plunkett G 3rd, Herring CD, et al.
Engineering a reduced Escherichia coli genome. Genome
Res, 2002, 12(4): 640-7
[22] Posfai G, Plunkett G 3rd, Feher T, et al. Emergent
properties of reduced-genome Escherichia coli. Science,
2006, 312(5776): 1044-6
[23] Lee JH, Sung BH, Kim MS, et al. Metabolic engineering
of a reduced-genome strain of Escherichia coli for
L-threonine production. Microb Cell Fact, 2009, 8: 2
[24] Umenhoffer K, Feher T, Baliko G, et al. Reduced
evolvability of Escherichia coli MDS42, an IS-less
cellular chassis for molecular and synthetic biology
applications. Microb Cell Fact, 2010, 9: 38
[25] Csorgo B, Feher T, Timar E, et al. Low-mutation-rate,
reduced-genome Escherichia coli: an improved host for
faithful maintenance of engineered genetic constructs.
Microb Cell Fact, 2012, 11: 11