免费文献传递   相关文献

Progress in the Study of Environmental Microbes by Metagenomic Methods

元基因组学方法在环境微生物中的研究进展



全 文 :·特约综述· 2015, 31(11):51-59
生物技术通报
BIOTECHNOLOGY BULLETIN
收稿日期 :2015-07-21
作者简介 :刘捷孟,博士,研究方向 :宏基因组学 ;E-mail :icaruswing@126.com
通讯作者 :戚继,博士,教授,研究方向 :植物基因组学、计算生物学 ;E-mail :qij@fudan.edu.cn
微生物包括真细菌、古细菌、病毒和肉眼无法
观察到的微小真核生物,这些生物虽然个体微小、
结构简单,但是数量庞大并且广泛分布于土壤、水
体、空气等各种环境中。例如,在土壤环境中,每
克泥土中所包含的微生物细胞数量可以高达数亿乃
至数十亿。另一方面,微生物中的原核生物大约诞
生于 40 亿年以前,远远早于常以多细胞结构为主的
真核生物。漫长的演化历史使得地球上的原核生物
拥有丰富的生物多样性,这些特点使得它们在几乎
所有的生态体系中都扮演着重要的角色。
早期的微生物研究离不开微生物的分离、纯
化和培养。然而,自然环境中超过 99% 的微生物
的存活无法脱离其自身所在的特殊环境,因而无法
在实验室进行培养等前期实验[1],很大程度上限
元基因组学方法在环境微生物中的研究进展
刘捷孟1,2  戚继1
(1. 复旦大学生命科学学院 遗传与发育协同创新中心 植物科学研究所,上海 200433 ;2. 复旦大学 理论生命科学研究中心物理系,
上海 200433)
摘 要 : 新一代测序技术的快速发展,使得元基因组学研究方法成为了理解环境微生物群落结构和相互作用的重要手段之
一。元基因组学方法不需要将环境样本中的微生物单独分离培养,而是作为整体进行研究,因而可以回避传统研究时分离培养微
生物的困难。基于这一优势,人体、海洋和土壤等环境有关的各项环境微生物测序计划相继启动,并取得了一系列重要的研究进展。
探讨了元基因组测序数据分析中所经常采用的方法,以及有关流程的优势和局限性,并进一步讨论了这些方法在各种环境微生物
研究中的应用和成果。
关键词 : 元基因组 ;高通量测序 ;生物信息 ;环境微生物
DOI :10.13560/j.cnki.biotech.bull.1985.2015.11.001
Progress in the Study of Environmental Microbes by
Metagenomic Methods
Liu Jiemeng1,2 Qi Ji1
(1. State Key Laboratory of Genetic Engineering,School of Life Sciences,Fudan University,Shanghai 200433 ;2. The T-Life Research
Center,Department of Physics,Fudan University,Shanghai 200433)
Abstract: With the development of Next Generation Sequencing Technology(NGS), metagenomics has become a significant strategy
to understand the structures of environmental microbial community and their interactions. Metagenomics analyzes the environmental microbes
as a whole rather than extracting the individuals for culture and thus it can avoid the troubles of conventional culturing progress and bypass the
accompanying difficulties. Due to this advantage, several sequencing projects of environmental microbes on human, ocean, soil etc. have been
launched and largely promoted the progress on metagenomic studies. In this review, we will discuss both the merits and restrictions of current
methods and pipelines adopted in the analysis on metagenomic data and introduce the progress brought by their applications in the researches of
various environmental samples.
Key words: metagenomics ;high-throughput sequencing ;bioinformatics ;environmental microbe
生物技术通报 Biotechnology Bulletin 2015,Vol.31,No.1152
制了后续的生理生化与组学研究。针对这一现状,
Handelsman 等[2]提出了使用元基因组方法从整体角
度来研究那些无法在实验室培养的微生物。
元基因组方法是将某个特定生态环境所包含的
所有微生物个体的基因组作为一个整体,一起提取
出来进行研究。其中,元基因组(Metagenome)又
可以称为宏基因组、环境基因组、群体基因组以及
生态基因组等,指环境样本包含的所有微生物的遗
传物质 ;而研究元基因组的学科称为元基因组学
(Metagenomics)。随着二代高通量测序技术的出现和
普及,元基因组方法这种直接提取环境样本所有遗
传物质并进行测序的技术得到了广泛的应用。
元基因组学研究在很大程度上拓展了人类对微
生物和它们生活环境的认识,并且创造出许多重要
的应用价值[3-6]。例如在医学领域,对人体微生物
基因组的研究和许多疾病机理联系在一起。其中,
Marshall BJ 和 Warren JR 发现幽门螺旋杆菌和胃溃疡
有密切联系,因此获得了 2005 年的诺贝尔生理学或
医学奖。由美国国立卫生研究院启动的人类微生物
组计划(Human microbiome project,HMP)[7]从 300
多个项目中,取自人体 15 个不同部位的 690 个样本
中测定了约 350 亿的短序列片段(Reads)。通过详
细分析这些测序数据,研究者得以认识人体不同部
位的微生物在群体结构上存在巨大的差异,并且发
现若干疾病和人体微生物群体组成存在关联性,这
些研究将有助于建立新的诊断和治疗方法。在深海
热泉环境的微生物群落中,研究者找到了一类特殊
的耐热聚合酶,可能在有关的工业生产中存在重要
的应用价值[8]。
在这篇综述中,我们首先介绍目前对元基因组
数据进行处理分析的生物信息方法和流程,并回顾
在一些重要的元基因组计划推动下,依据元基因组
学方法在人体环境、海洋和土壤等自然环境有关的
元基因组学研究中所取得的重要成果。
1 元基因组有关的生物信息学分析方法
环境微生物样本中所包含的微生物种类繁多
且彼此之间的丰度差异很大,为获得较为完整的物
种谱系的覆盖率,通常需要对环境微生物基因组进
行深度测序,海量数据的分析对生物信息学算法的
准确性和计算效率同时提出了较高的要求。例如,
HMP 测定发布的肠道基因组原始序列中,一个样本
的数据量通常可以达到数十 G,超过了人类基因组
的大小。所以对这些数据进行处理和分析需要使用
合适的生物信息方法在大型计算机上完成。通过二
代测序平台得到的原始序列中存在测序错误,从而
影响到后续分析结果的准确性,所以需要对原始数
据进行预处理以过滤一部分低质量(高错误率)的
序列,通常使用的方法包括 FastQC[9]、PRINSEQ[10]等。
二代测序平台产生的 reads 长度比较短,所以
通常会使用一些序列拼接软件将经过预先处理后的
reads 拼接成更长的 contigs。常见的用于基因组高
通量测序拼接的软件有 Velvet[11]、SOAPdenovo[12]
等,但是将这些软件应用到元基因组数据组装时遇
到困难。这些方法都是针对单一物种的基因组序列
拼接的,而元基因组数据中包含不同种类的微生
物,在物种丰度和亲缘关系的远近方面存在较大区
别。近缘微生物的基因组之间存在序列高度相似的
区域,因此有一定概率被拼接成一个整体,从而会
产生不同微生物基因组的序列嵌合或者拼接结果的
碎片化等问题。为解决这些困难,研究人员在元基
因组拼接方法的研究上做出了大量的努力,开发了
如 MetaVelvet[13]、MetaIDBA[14] 和 IDBA-UD[15] 等
软件。这些软件提高了元基因组序列拼接的准确性,
有效延长了 contigs 的拼接长度,降低了不同微生物
基因组序列嵌合的发生频率。最后,在获得了有效
的基因组拼接结果后,可以进一步使用 FragGene-
Scan[16]、GLIMMER[17,18]、GeneMark[19,20]等软件
从 contigs 中进行基因预测,在基因组中识别可能的
编码区域,从而进行后续的基因注释和功能分析等
研究。
由于序列拼接需要的计算量很大,并且通常会
损失一部分丰度较低的微生物基因组信息,因此也
有一些能够绕过拼接直接对 reads 进行分类的方法被
开发出来,这类方法称为对 reads 的分箱(Binning)
方法 :将 reads 分成若干个类群,每个类群称为操
作分类单元(Operational taxonomic unit,OTU);按
照是否依赖于相对参考数据库的同源序列比对,可
以进一步分为有监督分箱方法和无监督分箱方法两
类。有监督分箱方法使用 BLAST、BLAT[21]等序列
2015,31(11) 53刘捷孟等 :元基因组学方法在环境微生物中的研究进展
联配算法将 reads 比对到参考蛋白质或核苷酸序列
上,再通过目标序列的物种来源确定 reads 本身的
分类学位置。基于此策略的算法包括 MG-RAST[22]、
MEGAN[23]等,它们从比对结果中选择出匹配较好
的参考序列,然后将 reads 定位到这些目标序列所
在物种的最小共同祖先上。除此以外,Carma[24]和
Amphora[25]选择使用隐马可夫模型(Hidden Markov
Model,HMM)方法将 reads 分到相应的基因家族
中。除了基于序列比对的方法外,另一类方法使用
序列核苷酸 / 蛋白质组分进行分箱 :如 Phymm[26]
使用寡核苷酸偏好性比较 reads 和参考序列相似
性,然后使用贝叶斯方法推断 reads 的分类位置 ;
Phylopythia[27] 使 用 支 持 向 量 机(support machine
vector)框架对 reads 进行分箱 ;MetaCV[28]使用蛋
白质组分矢量方法进行分箱,对 100-200 bp 长度的
reads 的物种定位效果最佳,可以达到与 BLAST 等
基于序列比对方法相近的准确度,因此在元基因组
的高通量测序分析中具备实用性。无监督方法没有
参考数据库,而是使用 reads 序列自身的特性(如核
苷酸偏好、物种丰度等)对 reads 进行分类,常用方
法有 TETRA[29]、CompostBin[30]、MetaCluster[31]等。
由于已发表全基因组的原核生物大多与人类健康有
关,在研究海洋、土壤环境中的微生物群落结构时,
数据库中常常缺乏合适的参照,因此无监督方法在
这种情况下具有一定的优势。
元基因组的进一步分析和研究可以结合样本所
在环境的地理位置、气候条件、理化性质等因素,
通过比较相同或不同条件下的元基因组数据获得物
种结构、功能基因的共性和差异。例如,Arumugam
等[32]分析比较了来自 4 个国家的 22 个人类肠道
微生物基因组,发现这些样本按照微生物物种谱
系可以分为 3 个稳定的肠道类型(Enterotype)。在
MetaHit[33]计划中,Qin 等[34]将全基因组关联研究
(GWAS)分析方法进一步扩展到元基因组数据分
析中,发展出元基因组关联研究(Metagenome wide
association studies,MGWAS)方法,用于比较健康
人群与二型糖尿病人的肠道菌群,对二型糖尿病与
肠道菌群的关系进行深入的分析。
2 元基因组测序计划及主要研究进展
2.1 元基因组学方法在人体微生物群落与健康研
究中的应用
越来越多的研究表明一些人类疾病不仅与人体
自身基因组的调控转录有关,也受到生活在人体的
大量菌群的影响。由这些菌群构成的元基因组又被
称为“人体第二基因组”,编码基因数量可以达到
100 万以上,它们与人体基因组相互协调,维持人
类的生理代谢平衡。因此在各种环境微生物的研究
中,对人体相关的微生物的研究最为细致深入。
许多研究集中在微生物群体变化与某种特定疾
病的联系。例如,幽门螺旋杆菌感染会引起胃炎、
胃溃疡甚至胃癌,对于其相关病理学的研究改变了
人们对胃病起因的认识,从而在根源上能够对胃病
进行有效地治疗[35,36]。在肠道菌群的研究中,有专
家发现克罗恩氏疾病(Crohn’s disease,一种肠溃疡)
患者肠道菌群的物种多样性相比于健康人群有着显
著的下降[37];肥胖人群的肠道内硬壁菌门相对丰度
比较高,拟杆菌门相对丰度较低[38-41];还有关于二
型糖尿病的一项研究报道患者肠道内梭形菌纲明显
减少[42]。肝脏是人体负责代谢功能的重要器官,由
肠道菌群产生的许多代谢产物最早来到肝脏,所以
肠道菌群与肝脏疾病也有一定的关联。肝硬化病人
的肠道微生物的种类与丰度有明显的改变,包括变
形菌门和梭杆菌门[43]。同样,人类皮肤组织中的微
生物也与一些皮肤疾病有联系。研究发现牛皮癣病
人被感染出的皮肤组织上的微生物同未感染皮肤相
比拥有更多的硬壁菌门,而放线菌门要少很多[44]。
美国国立卫生研究院(NIH)在 2007 年推动
的 人 类 微 生 物 组 计 划(Human Microbiome Project,
HMP)是人类基因组计划(Human Genome Project,
HGP)的延续,由美国主导,中国、日本和数个
欧盟国家共同参加,并且由国际人类微生物组联
盟(International Human Microbiome Consortium,
IHMC)协调管理。在该计划为期 5 年的第一个阶
段中,耗资 1.15 亿美金,总共测定了 4 788 个样本
的 16S rRNA 和 681 个样本的全基因组。几乎在同
生物技术通报 Biotechnology Bulletin 2015,Vol.31,No.1154
时,欧洲委员会(EC)也启动了人类肠道元基因
组 计 划(Metagenomics of the Human Intestinal Tract,
MetaHit),该计划耗资 2 770 万美元,测定了 124 个
欧洲人肠道菌群的元基因组序列。这些元基因组数
据为人类微生物后续的深入研究奠定了基础。
2.1.1 人体不同部位的微生物多样性 对不同人群
不同部位的微生物多样性的分析研究表明,人类微
生物群落的组成在人体不同部位的差异明显大于不
同个体在同一部位上的差异,因此人体部位被认为
是造成人类微生物群落结构的首要因素[45,46]。对
于固定的身体部位,微生物群落通常呈现出短时期
内的稳定性,其物种相对丰度变化较不同位置的差
异小很多[46],这可能是微生物与其生活的人体环境
通过相互作用达到了生态平衡,有学者认为这种平
衡有可能与纳什均衡相对应[47]。此外,考虑到人类
个体、环境以及健康状态的不同,同一部位的菌群
结构在不同个体之间也可能存在较大的差异,这就
为研究菌群结构的差异与健康状态之间的关联提供
了可能。例如,一些学者使用人体的肠道基因组[32]
或是女性阴道微生物基因组[48]作为研究对象,综
合生理生化和组学数据将研究个体划分为不同类群。
当生活在人体某个部位的微生物形成稳定的群
落结构以后,面对外部环境变化的影响扰动时,具
有一定的自我恢复能力。在一些关于食用益生素
(Probiotic)能否改变人体微生物群落结构的研究中,
人们发现仅服用较短时间(如 7-12 周)的益生素
并不能对使用者口腔[49]、肠道[50]等部位的菌群结
构产生明显的变化。进一步的研究还发现栖息于这
些部位的菌群在转录组表达谱上显示出明显的差异,
表明菌群可能通过调控自身基因的表达来改变整个
微生物代谢网络以适应环境的改变,从而维持菌群
之间的生态平衡,保持菌群结构的稳定。与此同时,
许多菌群还会分泌出各种细菌素,能够有效地阻止
外来菌群的侵入,同时加强已有菌群的能力[51]。这
类物质是人体菌群自我恢复的重要机制,也帮助人
体抵御许多外来有害细菌的入侵。然而也有一些研
究表明微生物群落结构的这种恢复能力有限,在面
对较大的环境扰动时微生物群落结构平衡有可能被
打破。例如,一个人在饮食习惯上的长期改变会引
起肠道菌群发生较大的变化[52]。当一个人服用抗生
素的情况下,其肠道内一些菌种可能被消灭进而相
应的菌群结构平衡在短时间内遭到破坏,最后转变
成为另外一种稳定的菌群结构[53]。所以,尽管微生
物群落有一定的恢复力,在持续的破坏下有可能损
失部分对人体健康有重要价值的组分[54]。这些研究
也同时表明经常服用抗生素有可能破坏体内肠道微
生物的生态平衡,对人体健康造成不良影响。
在更高的分类学层次上比较人类和其它哺乳动
物的微生物群落结构,研究人员发现这些微生物在
门等较高的分类层次上的种类与丰度是保守的,而
分类层次越低则物种差异越大[55]。例如,在属的层
次上,小鼠肠道菌群中有 85% 序列的代表物种不存
在于人类肠道微生物中[38]。
2.1.2 影响人体微生物群落结构的先天和后天因
素 基于系统发生学的研究结果表明,依据各类哺
乳动物肠道微生物结构推断得到的演化关系同这些
哺乳动物自身的亲缘关系呈现出一致的关系,显示
微生物群落具有一定的物种继承性[56]。事实上,作
为哺乳动物,人类母亲对其婴儿身上的微生物群落
组成有着非常重要的影响,具体体现在婴儿在母体
子宫内孕育和从阴道出生时对这些部位菌群的残留,
哺育婴儿时母乳所含益生素等成分对婴儿肠道菌群
的促进作用以及在成长过程中母亲对孩子饮食习惯
方面的影响等[57,58]。例如,有研究者对刚出生的婴
儿身上的微生物进行测定发现,其群落结构与母亲
阴道内的微生物群落结构非常相似[59]。由于人类缺
乏能够降解寡糖复合物的糖解酶,母乳中蕴含的寡
糖促使一些拥有糖解酶的菌群在婴儿肠道中生长起
来,形成相应的共生菌群(如双歧杆菌等)[60]。此外,
也有研究报道乳酸菌(Lactobacilli)出现在人类早期
的肠道菌群中[61],可能是在母乳哺育过程中进入到
婴儿肠道内,这些初始菌群随着人类婴儿的成长一
起协同进化,形成稳定的肠道菌群,在人类的各种
生理代谢[61]、免疫能力[62]等方面扮演者重要的角
色。相比之下,通过剖腹产生下的婴儿有着明显不
同的微生物菌群成分[59],表明现代人选择不同的生
产方式可能会影响到婴儿对微生物的继承。
尽管人体的微生物具有继承性,但是在人类漫
长的一生中微生物大约可以繁殖 10 万到 100 万代,
微生物在繁殖过程中不断演化改变形成群落结构,
2015,31(11) 55刘捷孟等 :元基因组学方法在环境微生物中的研究进展
期间受到各种因素的影响。例如,一个人的饮食习
惯对他肠道菌群结构形成有着重要的作用,在 2-4
岁时的饮食习惯是决定一个人肠道菌群稳定结构的
重要因素[63],而且在以后饮食习惯上的改变诸如开
始长期频繁食用高热量食物也会造成肠道菌群的明
显改变[64];位于女性阴道的微生物在生产期和绝经
期有着明显的不同[65,66];对抗生素的使用也会显著
影响肠道等部位的菌群[54]。
2.1.3 人体微生物功能基因类群变化 尽管在较
低的分类学层次上不同个体之间微生物群落的结
构存在很大的差异,但是这些元基因组在 KEGG、
COG 等功能基因类群的相对丰度上呈现出很强的
保守性[28,45,67]。在一项健康人群微生物样本分析
中,研究者发现来自不同人体不同部位的微生物样
本具有一些稳定的核心代谢途径(Core pathway),
其中丰度最高的一些分别属于核苷酸、蛋白质合
成、基础代谢等有关的核心功能基因[51]。核心功
能基因类群在健康人群所表现出的这种稳定性显示
它们在数量和结构上的变化很有可能与一些疾病相
关。这种相关性已经被一些人类疾病相关的研究所
报道[68,69]。
除了这些核心功能基因以外,有更多的基因属
于功能尚未可知的类群,这些认知的缺乏限制了我
们进一步了解微生物与宿主之间的相互作用方式。
目前有研究通过生物芯片功能基因探测的方法分析
元基因组中所包含的特定功能(如酶活性、抗生素
抗性检验等)[70],但这些研究目前为止还比较局限。
2.2 海洋微生物的探测与研究
相比于人体相关微生物研究的深入性和广泛
性,对海洋微生物的研究主要集中在不同海洋环境
下的微生物的物种多样性和功能基因探测方面。由
美 国 伍 兹 霍 尔 海 洋 生 物 实 验 室(Marine Biological
Laboratory,MBL) 在 2003 年 12 月 提 出 的 国 际 海
洋 微 生 物 普 查 计 划(International Census of Marine
Microbes,ICoMM)使用标准化的流程完成对浅海和
深海环境微生物群落样本的采集、测定以及后续的
数据分析与整合,目标在于建立高精度的海洋微生
物多样性数据库并理解海洋微生物群落如何在全球
范围进行演化和分布[71]。全球海洋抽样考察(Global
oceans sampling expedition,GOS)是由生物学家和企
业家 Craig 于 2003 年发起的一项测序计划。该项目
从马尾藻海(Sargasso Sea)开始,对北美沿海地区
进行考察取样,研究结果将有助于了解这些地区海
洋环境微生物的群落组成。
由于阳光只能透过海洋的表层,位于表面阳光
充足的地方微生物可以进行高效的光合作用,而在
海洋深层则需要依靠其它方式提供生物所需的能量,
所以海洋不同深度的微生物群落结构具有很大的差
异。Venter 等[72]对马尾藻海表层海面进行物种勘探,
从海水中提取微生物样本并通过 16S rRNA 分析发现
了 1 800 多个物种,它们大部分属于 α 和 γ 变形菌门。
对爱奥尼亚海深水区域的样本分析则显示位于这里
的微生物主要来自变形菌门、浮霉菌门、酸杆菌门
和绿弯菌门等细菌以及奇古菌门等古菌[73]。在最近
一个关于西南大西洋微生物群落研究中,研究者报
告说通过元基因组测序方法对不同深度海洋的物种
和元基因组功能类群进行了细致研究[74]。他们发现
不同深度位置上细菌的丰度均超过了古菌 ;在细菌
中,α 变形菌门和蓝藻菌门占据了海洋表面,而随
着深度的增加,这些门的丰度减少,转而被 γ 变形
菌门占据 ;在古菌中,广古菌门占据了浅层海水,
而奇古菌门占据了深层海水。相似的物种分布也被
关于中国南海的微生物物种研究报道,研究者发现
浅层海水的微生物主要属于 α 变形菌门,伴随着不
同季节也会有 β 变形菌门,而在深层海水相对丰度
最高的是 γ 变形菌门[75]。这些不同海洋发现的相似
分布反映了海水深度是影响海洋微生物分布的重要
因素,并且海洋微生物随着海水深度分布变化在不
同海域具有一定的普遍性。
由于在海洋中各处环境的差异极大,如海底黑
暗而高压的环境、南北两极冰点以下的低温水体、
深海热泉超过 100℃的高温环境还有各种海洋微生
物体内环境等,这些环境中栖息着许多人类过去未
尝了解的未知物种,可以提供关于物种起源和演化
的重要信息。例如,最近在海底热泉找到的一种“洛
基古菌”(Lokiarchaeota)同时具备一些古菌和真核
生物的特征,很可能是古菌演化为早期真核生物的
过渡生物的一个分支,为真核生物的起源提供了极
为重要的线索[76]。与此同时为了适应上述各种海洋
生物技术通报 Biotechnology Bulletin 2015,Vol.31,No.1156
环境,微生物还演化出了许多特有的功能基因,有
很重要的应用价值。通过元基因组方法对不同微生
物样本进行功能筛选,寻找并研究相应的功能基因,
可以为研究人员带来有用的线索。乌贼发光器官内
存在一种费氏弧菌(Vibrio fischeri)构成了微生物
的发光系统。在这种弧菌细胞内,研究者找到用于
发出荧光的荧光素酶,并将这种荧光素酶作为一种
报道分子系统而广泛应用到生物细胞内的探测过程
中[77]。生活于深海热泉的古细菌含有一种耐高温和
强酸的 α 淀粉酶,这种酶现在被用于从玉米提取乙
醇的过程中[78]。
2.3 其它环境的微生物研究
除了人体微生物和海洋微生物以外,生活在各
类土壤环境中的微生物也是元基因组学重要的研究
对象。由于土壤环境特征的复杂性更高,如 pH 值、
含水量、土壤结构等理化因素的差异,导致从不同
土壤中提取和纯化微生物 DNA 的方法差异较大且
缺乏普遍性[79]。一些研究表明土壤微生物群落可以
作为理解抗性基因的起源、分化、丰度等性质的源
泉[80-82]。土壤微生物蕴含了大量的新基因,其中有
许多特定功能,如抗生素、催化剂相关的基因对人
类健康、社会生产有着很大的价值,如 Courtois[83]
找到的聚酮合成酶、Uchiyama[84]找到的琼脂水解
酶和一些生物催化剂编码基因等。
元基因组方法还有助于环境整治、生物燃料等
方面的研究,在农业生产方面,通过研究农作物、
牲畜与它们共生的微生物可以帮助预防治疗病害、
提高产量。
3 结语
元基因组学方法的进步为人们研究难于培养的
微生物打开了方便之门,使得从整体角度理解各类
环境条件下微生物群落的复杂性成为可能。伴随着
元基因组方法的发展和普及,HMP、IcoMM 等各类
元基因组测序计划开始启动,提供了大量关于环境
微生物的数据。通过对这些数据的分析和整合,研
究人员揭示了微生物和环境之间存在复杂的相互作
用,并在人类疾病与健康、海洋与土壤微生物功能
基因等方面获得了重要的成果。同时,测序技术的
进步和生物信息学算法的发展也将在元基因组学更
为细致和广泛的研究中发挥重要的作用。
参 考 文 献
[1] Amann RI, Ludwig W, Schleifer KH. Phylogenetic identification
and in situ detection of individual microbial cells without
cultivation[J]. Microbiological Reviews, 1995, 59(1):143-
169.
[2] Handelsman J, Rondon MR, Brady SF, et al. Molecular biological
access to the chemistry of unknown soil microbes :a new frontier for
natural products[J]. Chem Biol, 1998, 5(10):R245-R249.
[3] Nelson KE, White BA. Metagenomics and Its Applications to the
Study of the Human Microbiome[M]//Marco D. Metagenomics :
Theory, Methods and Applications, Caister Academic Press, 2010.
[4] Li LL, McCorkle SR, Monchy S, et al. Bioprospecting metagenomes :
glycosyl hydrolases for converting biomass[J]. Biotechnology for
Biofuels, 2009, 2 :10.
[5] George I. Application of Metagenomics to Bioremediation, in
Metagenomics :Theory, Methods and Applications[M]. Caister
Academic Press, 2010.
[6] Raes J, Letunic I, Yamada T, et al. Toward molecular trait-based
ecology through integration of biogeochemical, geographical and
metagenomic data[J]. Molecular Systems Biology, 2011, 7 :473.
[7] Human Microbiome Jumpstart Reference Strains Consortium, Nelson
KE, Weinstock GM, et al. A catalog of reference genomes from the
human microbiome[J]. Science, 2010, 328(5981):994-999.
[8] Mathur EJ, Toledo G, Green BD, et al. A biodiversity-based approach
to develo-pment of performance enzymes :Applied metagenomics
and directed evolution[J]. Genetic Engineering News, 2006, 26
(4):16-19.
[9] FastQC A quality control tool for high throughput sequence data,
(Babraham Bioinformatics Web site).
[10] Schmieder R, Edwards R. Quality control and preprocessing of
metagenomic datasets[J]. Bioinformatics, 2011, 27(6):863-
864.
[11] Zerbino DR, Birney E. Velvet :Algorithms for de novo short read
assembly using de Bruijn graphs[J]. Genome Research, 2008,
18(5):821-829.
[12] Luo RB, Liu BH, Xie YL, et al. SOAPdenovo2 :an empirically
improved memory-efficient short-read de novo assembler[J].
Giga Science, 2012, 1 :18.
2015,31(11) 57刘捷孟等 :元基因组学方法在环境微生物中的研究进展
[13] Namiki T, Hachiya T, Tanaka H, et al. MetaVelvet :an extension
of Velvet assembler to de novo metagenome assembly from short
sequence reads[J]. Nucleic Acids Research, 2012, 40(20):
e155.
[14] Peng Y, Leung HCM, Yiu SM, et al. Meta-IDBA :a de Novo asse-
mbler for metagenomic data[J]. Bioinformatics, 2011, 27(13):
i94-i101.
[15] Peng Y, Leung HCM, Yiu SM, et al. IDBA-UD :a de novo
assembler for single-cell and metagenomic sequencing data with
highly uneven depth[J]. Bioinformatics, 2012, 28(11):1420-
1428.
[16] Rho M, Tang H, Ye Y. FragGeneScan :predicting genes in short
and error-prone reads[J]. Nucleic Acids Research, 2010, 38(20):
e191.
[17] Delcher AL, Bratke KA, Powers EC, et al. Identifying bacterial
genes and endosymbiont DNA with Glimmer[J]. Bioinformatics,
2007, 23(6):673-679.
[18] Salzberg SL, Pertea M, Delcher AL, et al. Interpolated Markov
models for eukaryotic gene finding[J]. Genomics, 1999, 59(1):
24-31.
[19] Besemer J, Borodovsky M. GeneMark :web software for gene
finding in prokaryotes, eukaryotes and viruses[J]. Nucleic Acids
Research, 2005, 33(Web Server issue):W451-W454.
[20] Lukashin AV, Borodovsky M. GeneMark. hmm :New solutions for
gene finding[J]. Nucleic Acids Research, 1998, 26(4):1107-
1115.
[21] Kent WJ. BLAT—The BLAST-Like Alignment Tool[J]. Genome
Research, 2002, 12(4):656-664.
[22] Meyer F, Paarmann D, DSouza M, et al. The metagenomics RAST
server - a public resource for the automatic phylogenetic and
functional analysis of metagenomes[J]. BMC Bioinformatics,
2008, 9(1):386.
[23] Huson DH, Auch AF, Qi J, et al. MEGAN analysis of metagenomic
data[J]. Genome Research, 2007, 17(3):377-386.
[24] Krause L, Diaz NN, Goesmann A, et al. Phylogenetic classification
of short environmental DNA fragments[J]. Nucleic Acids
Research, 2008, 36(7):2230-2239.
[25] Wu M, Eisen J. A simple, fast, and accurate method of phylogeno-
mic inference[J]. Genome Biology, 2008, 9(10):R151.
[26] Brady A, Salzberg SL. Phymm and PhymmBL :metagenomic
phylogenetic classification with interpolated Markov models[J].
Nat Meth, 2009, 6(9):673-676.
[27] McHardy AC, Martin HG, Tsirigos A, et al. Accurate phylogenetic
classification of variable-length DNA fragments[J]. Nat Meth,
2007, 4(1):63-72.
[28] Liu JM, Wang HF, Yang HX, et al. Composition-based classification
of short metagenomic sequences elucidates the landscapes of
taxonomic and functional enrichment of microorganisms[J].
Nucleic Acids Research, 2013, 41(1):e3.
[29] Teeling H, Waldmann J, Lombardot T, et al. TETRA :a web-
service and a stand-alone program for the analysis and comparison
of tetranucleotide usage patterns in DNA sequences[J]. BMC
Bioinformatics, 2004, 5 :163.
[30] Chatterji S, Yamazaki I, Bai ZJ, et al. CompostBin :A DNA
Composition-Based Algorithm for Binning Environmental Shotgun
Reads[M]//Vingron M, Wong L. Research in Computational
Molecular Biology, Springer Berlin Heidelberg, 2008 :17-28.
[31] Wang Y, Leung HCM, Yiu SM, et al. MetaCluster 5. 0 :a two-
round binning approach for metagenomic data for low-abundance
species in a noisy sample[J]. Bioinformatics, 2012, 28(18):
i356-i362.
[32] Arumugam M, Raes J, Pelletier E, et al. Enterotypes of the human
gut microbiome[J]. Nature, 2011, 473(7346):174-180.
[33] Qin JJ, Li RQ, Raes J, et al. A human gut microbial gene catalog
established by metagenomic sequencing[J]. Nature, 2010, 464
(7285):59-65.
[34] Qin J. A metagenome-wide association study of gut microbiota in
type 2 diabetes[J]. Nature, 2012, 490(7418):55-60.
[35] Marshall BJ, Warren JR. Unidentified curved bacilli in the stomach
of patients with gastritis and peptic ulceration[J]. Lancet, 1984,
1(8390):1311-1315.
[36] Borody TJ, Cole P, Noonan S, et al. Recurrence of duodenal ulcer
and Campylobacter pylori infection after eradication[J]. The
Medical journal of Australia, 1989, 151(8):431-435.
[37] Manichanh C, Rigottier-Gois L, Bonnaud E, et al. Reduced diversity
of faecal microbiota in Crohns disease revealed by a metagenomic
approach[J]. Gut, 2006, 55(2):205-211.
[38] Ley RE, Bäckhed F, Turnbaugh P, et al. Obesity alters gut
microbial ecology[J]. Proceedings of the National Academy
of Sciences of the United States of America, 2005, 102(31):
生物技术通报 Biotechnology Bulletin 2015,Vol.31,No.1158
11070-11075.
[39] Turnbaugh PJ, Hamady M, Yatsunenko T, et al. A core gut microb-
iome in obese and lean twins[J]. Nature, 2009, 457(7228):
480-484.
[40] Bäckhed F, Ding H, Wang T, et al. The gut microbiota as an
environmental factor that regulates fat storage[J]. Proceedings of
the National Academy of Sciences of the United States of America,
2004, 101(44):15718-15723.
[41] Turnbaugh PJ, Ley RE, Mahowald MA, et al. An obesity-associated
gut microbiome with increased capacity for energy harvest[J].
Nature, 2006, 444(7122):1027-1131.
[42] Larsen N, Vogensen FK, van den Berg FWJ, et al. Gut microbiota
in human adults with type 2 diabetes differs from non-diabetic
Adults[J]. PLoS One, 2010, 5(2):e9085.
[43] Chen YF, Yang FL, Lu HF, et al. Characterization of fecal microbial
communities in patients with liver cirrhosis[J]. Hepatology,
2011, 54(2):562-572.
[44] Gao Z, Tseng CH, Strober BE, et al. Substantial alterations of the
cutaneous bacterial biota in psoriatic lesions[J]. PLoS One,
2008, 3(7):e2719.
[45] Cho I, Blaser MJ. The Human Microbiome :at the interface of
health and disease[J]. Nature Reviews Genetics, 2012, 13(4):
260-270.
[46] Costello EK, Lauber CL, Hamady M, et al. Bacterial community
variation in human body habitats across space and time[J].
Science, 2009, 326(5960):1694-1697.
[47] Blaser MJ, Kirschner D. The equilibria that allow bacterial
persistence in human hosts[J]. Nature, 2007, 449(7164):
843-849.
[48] Ravel J, Gajer P, Abdo Z, et al. Vaginal microbiome of reproductive-
age women[J]. Proceedings of the National Academy of Sciences
of the United States of America, 2011, 108(Suppl. 1):4680-
4687.
[49] Vestman NR, Chen T, Lif Holgerson P, et al. Oral microbiota shift
after 12-week supplementation with Lactobacillus reuteri DSM
17938 and PTA 5289 ;A randomized control trial[J]. PLoS
One, 2015, 10(5):e0125812.
[50] Eloe-Fadrosh EA, Brady A, Crabtree J, et al. Functional
dynamics of the gut microbiome in elderly people during probiotic
consumption[J]. MBio, 2015, 6(2):e00231-15.
[51] Lee YK, Mazmanian SK. Has the microbiota played a critical role
in the evolution of the adaptive immune system?[J]. Science,
2010, 330(6012):1768-1773.
[52] Wu GD, Chen J, Hoffmann C, et al. Linking long-term dietary
patterns with gut microbial enterotypes[J]. Science, 2011, 334
(6052):105-108.
[53] Dethlefsen L, Relman DA. Incomplete recovery and individualized
responses of the human distal gut microbiota to repeated antibiotic
perturbation[J]. Proceedings of the National Academy of
Sciences of the United States of America, 2011, 108(Suppl. 1):
4554-4561.
[54] Martin Blaser. Antibiotic overuse :Stop the killing of beneficial
bacteria[J]. Nature, 2011, 476(7361):393-394.
[55] Huse SM, Dethlefsen L, Huber JA, et al. Exploring microbial
diversity and taxonomy using SSU rRNA hypervariable tag
sequencing[J]. PLoS Genetics, 2008, 4(11):e1000255.
[56] Ochman H, Worobey M, Kuo CH, et al. Evolutionary relationships
of wild hominids recapitulated by gut microbial communities[J].
PLoS Biology, 2010, 8(11):e1000546.
[57] Thum C, Cookson AL, Otter DE, et al. Can nutritional modulation
of maternal intestinal microbiota influence the development of the
infant gastrointestinal tract?[J]. The Journal of Nutrition, 2012,
142(11):1921-1928.
[58] Sanz Y. Gut microbiota and probiotics in maternal and infant
health[J]. The American journal of clinical Nutrition, 2011, 94(6
Suppl. ):2000S-2005S.
[59] Dominguez-Bello MG, Costello EK, Contreras M, et al. Delivery
mode shapes the acquisition and structure of the initial microbiota
across multiple body habitats in newborns[J]. Proceedings of
the National Academy of Sciences of the United States of America,
2010, 107(26):11971-11975.
[60] German JB, Freeman SL, Lebrilla CB, et al. Human milk
oligosaccharides :evolution, structures and bioselectivity as
substrates for intestinal bacteria[J]. Nestle Nutrition Workshop
Series Paediatric Programme, 2008, 62 :205-218 ;discussion
218-222.
[61] Palmer C, Bik EM, DiGiulio DB, et al. Development of the Human
Infant Intestinal Microbiota[J]. PLoS Biology, 2007, 5(7):
e177.
[62] Hill DA, Artis D. Intestinal bacteria and the regulation of immune
2015,31(11) 59刘捷孟等 :元基因组学方法在环境微生物中的研究进展
cell homeostasis[J]. Annual Review of Immunology, 2010, 28 :
623-667.
[63] Lozupone CA, Stombaugh JI, Gordon JI, et al. Diversity, stability
and resilience of the human gut microbiota[J]. Nature, 2012,
489(7415):220-230.
[64] Kant AK. Consumption of energy-dense, nutrient-poor foods by adult
Americans :nutritional and health implications. The third National
Health and Nutrition Examination Survey, 1988-1994[J]. The
American Journal of Clinical Nutrition, 2000, 72(4):929-936.
[65] Cauci S, Driussi S, De Santo D, et al. Prevalence of bacterial
vaginosis and vaginal flora changes in peri- and postmenopausal
women[J]. Journal of Clinical Microbiology, 2002, 40(6):
2147-2152.
[66] Osborne NG, Wright RC, Grubin L. Genital bacteriology :a
comparative study of premenopausal women with postmenopausal
women[J]. American Journal of Obstetrics & Gynecology, 1979,
135(2):195-198.
[67] The Human Microbiome Project Consortium. Structure, function
and diversity of the healthy human microbiome[J]. Nature,
2012, 486(7402):207-214.
[68] Kostic AD, Xavier RJ, Gevers D. The microbiome in inflammatory
bowel disease :current status and the future ahead[J].
Gastroenterology, 2014, 146(6):1489-1499.
[69] Schnabl B, Brenner DA. Interactions between the intestinal
microbiome and liver diseases[J]. Gastroenterology, 2014, 146
(6):1513-1524.
[70] Uchiyama T, Miyazaki K. Functional metagenomics for enzyme
discovery :challenges to efficient screening[J]. Current Opinion
in Biotechnology, 2009, 20(6):616-622.
[71] Sogin ML, Morrison HG, Huber JA, et al. Microbial diversity
in the deep sea and the underexplored “rare biosphere”[J].
Proceedings of the National Academy of Sciences of the United
States of America, 2006, 103(32):12115-12120.
[72] Venter JC, Remington K, Heidelberg JF, et al. Environmental
genome shotgun sequencing of the Sargasso Sea[J]. Science,
2004, 304(5667):66-74.
[73] Martín-Cuadrado AB, López-García P, Alba JC, et al. Metagenomics
of the deep mediterranean, a warm bathypelagic habitat[J].
PLoS One, 2007, 2(9):e914.
[74] Junior NA, Meirelles PM, de Oliveira Santos E, et al. Microbial
community diversity and physical-chemical features of the
Southwestern Atlantic Ocean[J]. Archives of Microbiology,
2015, 197(2):165-179.
[75] Tseng CH, Chiang PW, Lai HC, et al. Prokaryotic assemblages and
metagenomes in pelagic zones of the South China Sea[J]. BMC
Genomics, 2015, 16 :219.
[76] Spang A, Saw JH, Jorgensen SL, et al. Complex archaea that bridge
the gap between prokaryotes and eukaryotes[J]. Nature, 2015,
521(7551):173-179.
[77] Engebrecht J, Simon M, Silverman M. Measuring gene expression
with light[J]. Science, 1985, 227(4692):1345-1347.
[78] Kulwiec M, Richardson TH, Chang WH, et al. A biodiversity-
based approach to development of performance enzymes :Applied
metagenomics and directed evolution[J]. Genetic Engineering
News, 2006, 26(4):16-19.
[79] Rajendhran J, Gunasekaran P. Strategies for accessing soil
metagenome for desired applications[J]. Biotechnology
Advances, 2008, 26(6):576-590.
[80] Knapp CW, Dolfing J, Ehlert PA, et al. Evidence of increasing
antibiotic resistance gene abundances in archived soils since
1940[J]. Environmental Science & Technology, 2010, 44(2):
580-587.
[81] Ma L, Li B, Zhang T. Abundant rifampin resistance genes and
significant correlations of antibiotic resistance genes and plasmids
in various environments revealed by metagenomic analysis[J].
Applied Microbiology and Biotechnology, 2014, 98(11):5195-
5204.
[82] Su JQ, Wei B, Xu CY, et al. Functional metagenomic characteriza-
tion of antibiotic resistance genes in agricultural soils from China
[J]. Environment International, 2014, 65 :9-15.
[83] Courtois S, Cappellano CM, Ball M, et al. Recombinant environm-
ental libraries provide access to microbial diversity for drug disco-
very from natural products[J]. Applied and Environmental Micr-
obiology, 2003, 69(1):49-55.
[84] Uchiyama T, Abe T, Ikemura T, et al. Substrate-induced gene-
expression screening of environmental metagenome libraries for
isolation of catabolic genes[J]. Nature Biotechnology, 2005, 23
(1):88-93.
(责任编辑 李楠)