全 文 :·特约综述· 2015, 31(4):99-104
生物技术通报
BIOTECHNOLOGY BULLETIN
非编码 RNA 指不编码蛋白质,对基因表达等
生理过程或核酸、蛋白质等物质活性起调控作用
的 RNA。 真 核 生 物 中 的 非 编 码 RNA, 如 miRNA、
piRNA、lncRNA 等已经得到了深入的研究。相比
而言,原核生物非编码 RNA 的研究还处于初级阶
段。 细 菌 中 的 非 编 码 RNA 通 常 统 称 为 non-coding
RNA(ncRNA)或 small RNA(sRNA),但也有些研
究者以 sRNA 表示反式调控作用的非编码 RNA,以
区 分 反 义 RNA(antisense RNA,asRNA)、 核 糖 开
关(Riboswitch)、长重叠非编码区(long overlapping
UTR)等顺式调控元件,本文倾向于使用后一种表
述方式。
虽然细菌在进化中比较低等,但其所处环境复
杂多变,决定了它们必须具有一套反应迅速的调控
系统[1],因此非编码 RNA 的调控作用对细菌来说
至关重要。已知的细菌非编码 RNA 调控机制包括顺
式互补配对调控基因表达、反式互补配对调控基因
表达、调控蛋白质活性、聚簇规律间隔短回文重复
收稿日期 : 2015-03-29
基金项目 :国家高技术研究发展计划(“863”计划,2012AA101606),北京市科技新星计划(XX2014B069)
作者简介 :郭明璋,男,博士研究生 ;E-mail :guomingzhang126@126.com
通讯作者 :许文涛,男,副教授,博士生导师,研究方向 :食品病原微生物的检测技术和致毒机制研究、转基因生物检测和食用安全性评
价研究、食品源风险因子对肠道微生物健康的影响等 ;E-mail :xuwentao1111@sina.com
基于高通量测序技术的细菌非编码 RNA 研究方法进展
郭明璋 许文涛
(中国农业大学食品科学与营养工程学院 食品安全与分子生物学实验室,北京 100083)
摘 要 : 细菌非编码 RNA 指细菌中不编码蛋白质,而以 RNA 的分子形式起调控作用的一类核酸分子。高通量测序技术的
应用极大地推进了多种细菌中非编码 RNA 的发现工作,但由于现阶段对细菌非编码 RNA 特征的认识尚不够深入,该领域测序
数据的生物信息学分析还存在许多不足。介绍了应用高通量测序技术研究细菌非编码 RNA 的两种主要技术——RNA-seq 技术和
dRNA-seq 技术,对现行的筛选非编码 RNA 的生物信息学分析方法进行综述,并对该领域生物信息学分析策略的改进提出设想。
关键词 : 细菌 ;非编码 RNA ;高通量测序 ;生物信息学
DOI :10.13560/j.cnki.biotech.bull.1985.2015.03.015
Progress in Methodology of Bacterial Noncoding RNA Research Based
on High-throughput Sequencing
Guo Mingzhang Xu Wentao
(Laboratory of Food Safety and Molecular Biology,College of Food Science and Nutritional Engineering,
China Agricultural University,Beijing 100083)
Abstract: Bacterial noncoding RNA refers to the nucleic acid molecules that do not encode proteins, but play roles in the regulation
in the form of RNA in bacteria. Application of high-throughput sequencing technology has greatly advanced the discovery of non-coding
RNA in a variety of bacterial species. However, due to the lack of enough knowledge on the characteristics of non-coding RNA in bacteria,
the bioinformatics analysis of the sequencing data are still defective. This article describes two main techniquesthat applied high-throughput
sequencing to be used in the researches on bacterial non-coding RNA :RNA-seq and dRNA-seq. The existing bioinformatics methods for
screening of non-coding RNA are reviewed, and the recommendations for improving the bioinformatics strategy in this field are proposed.
Key words: bacteria ;non-coding RNA ;high-throughput sequencing ;bioinformatics
生物技术通报 Biotechnology Bulletin 2015,Vol.31,No.4100
序列(CRISPR)等类型[2]。非编码 RNA 调控涉及
细菌碳代谢、氨基酸代谢、铁元素调控、群体效应
和生物膜形成、对各种不良环境的耐受性以及病原
微生物的致病性等各个方面[3]。非编码 RNA 与转录
因子等传统的调控元件构成了复杂的调控网络,成
为介导环境和细菌生理状态的重要桥梁。
近 10 年来,研究者对细菌非编码 RNA 认识的
逐步深入有赖于研究技术的快速发展,其中细菌非
编码 RNA 大规模发现技术经历了 Hfq 蛋白免疫共
沉淀技术、基于基因组数据进行计算机预测技术、
Tiling 芯片技术和高通量测序技术。高通量测序技术
因其高通量性、无偏性和广泛适用性,现在已成为
发现新非编码 RNA 的主流方法。在某些菌种中,利
用高通量测序技术发现的非编码 RNA 已经超过以往
所有方法发现的非编码 RNA 的总和[4]。
测序可以产生大量 RNA 序列数据,如何从这些
海量数据中高效准确地筛选出非编码 RNA,是基于
高通量测序细菌研究非编码 RNA 的关键。与真核生
物相比,细菌非编码 RNA 具有长度不一致、二级结
构不一致、在基因组中的位置不一致等特点[5],导
致进行生物信息学分析难度较高。目前利用高通量
测序技术发现非编码 RNA 已在多种细菌中有所应
用,但是不同的研究者往往采用不同的测序和生物
信息学分析策略,尚未形成统一的标准方案和流程。
本文将对基于高通量测序技术的细菌非编码 RNA 研
究进行综述,旨在能为相关研究者提供参考。
1 测序策略 :RNA-seq 和 dRNA-seq
2008 年德国马克斯普朗克传染病生物学研究
所的 Jörg Vogel 研究团队最早发表论文报道了应用
高通量测序技术对细菌非编码 RNA 进行的研究[6]。
该研究首先通过免疫共沉淀技术分离出了鼠伤寒沙
门 氏 菌(Salmonella entericaserovar Typhimurium) 中
与 Hfq 蛋 白 相 结 合 的 非 编 码 RNA, 再 对 RNA 进
行 RNA-seq 测序。虽然 Hfq 蛋白是重要的非编码
RNA 结合蛋白,但并非所有的非编码 RNA 都通过
与 Hfq 蛋白结合发挥作用,并且在一些细菌中并
不存在 Hfq 蛋白[7],因此这种 Hfq 蛋白免疫共沉
淀依赖的 RNA-seq 技术存在一定的局限性。直接
对细菌总 RNA 进行克隆测序的方法可以更广谱地
发 现 新 的 非 编 码 RNA, 然 而 由 于 细 菌 总 RNA 中
95% 以上的都是 tRNA 和 rRNA[8],因此直接对总
RNA 进行克隆测序难以高效地得到非编码 RNA 的
信息。2009 年 Liu 等[9]首次报道了原核生物中稳
定 的 rRNA 和 tRNA 去 除 方 法, 从 而 实 现 了 直 接
克 隆(direct cloning) 的 非 编 码 RNA-seq 研 究。 该
研 究 提 取 霍 乱 弧 菌(Vibrio cholerae) 总 RNA 并 分
离出 14-200 nt 长度范围的转录本,去除 rRNA 和
tRNA 后直接进行高通量测序的研究,发现了大量
的非编码 RNA。随后类似的直接克隆 RNA-seq 技
术被应用到大肠杆菌(Escherichia coli)[10,11]、单
增李斯特菌(Listeria monocytogenes)[4,12]、结核分
枝杆菌(Mycobacterium tuberculosis)[13]、金黄色葡
萄球菌(Staphylococcus aureus)[14,15]、肺炎链球菌
(Streptococcus pneumoniae)[16]、鼠疫耶尔森菌[17]等
菌种的非编码 RNA 研究中。
2009 年 Jörg Vogel 团队又开发了一种新的细菌
非 编 码 RNA 测 序 策 略, 即 dRNA-seq(differential
RNA-seq)技术,用以研究幽门螺杆菌(Helicobacter
pylori) 的 初 级 转 录 本 和 非 编 码 RNA[18]。 该 技 术
将总 RNA 分成两份,其中一份直接进行测序,另
一 份 中 加 入 5 单 磷 酸 依 赖 的 外 切 酶(Terminator
5-phosphate-dependent exonuclease,TEX)处理,选
择性地降解 5 端具有单磷酸的加工过的转录本,包
括 rRNA、tRNA 以及部分降解的 RNA 片段,只保
留 5 端具有三磷酸的初级转录本,即未经加工的
mRNA 及非编码 RNA,再进行建库测序。通过比较
两份样品的测序结果,dRNA-seq 技术可以有效地
确定非编码 RNA 的转录起始位点(Transcriptional
start sites,TSS) 以 及 mRNA 的 非 编 码 区(UTR),
对于研究顺式调控的核糖开关和长非编码区是非
常 有 利 的。 通 过 dRNA-seq 技 术, 研 究 者 已 在 根
癌 农 杆 菌(Agrobacterium tumefaciens)[19]、 枯 草
芽孢杆菌(Bacillus subtilis)[20]、谷氨酸棒状杆菌
(Corynebacteriumg lutamicum)[21]、单增李斯特菌[22]、
结核分枝杆菌[23]、鼠伤寒沙门氏菌[24]、天蓝色链
霉菌(Streptomyces coelicolor)[25]等菌株中发现了大
量的非编码 RNA。dRNA-seq 技术比传统的 RNA-seq
技术得到的信息更加丰富和准确,今后很有可能成
为高通量测序依赖的非编码 RNA 研究技术的主流。
2015,31(4) 101郭明璋等:基于高通量测序技术的细菌非编码 RNA研究方法进展
2 非编码 RNA 的筛选与分析策略
细菌非编码 RNA 的筛选指标很多,但适用于所
有非编码 RNA 的共有特征却较少。表达丰度是细菌
非编码 RNA 筛选的先决指标,但由于不同研究中测
序数据量的不同,表达丰度阈值只能依据研究对象
具体情况而设定。序列对应在基因组中的位置是比
较通用的细菌非编码 RNA 筛选指标。当此指标筛选
出来的潜在非编码 RNA 过多时,研究者会利用转录
信号、序列保守性等特征进一步筛选,以缩小非编
码 RNA 的范围。由于研究者对于非编码 RNA 的二
级结构、Hfq 结合性等特征的认识还不够深入,因
此目前还难以通过这些特征对非编码 RNA 进行筛
选,只能对筛选出来的这些非编码 RNA 特征进行
分析。
2.1 序列对应在基因组上位置的筛选
无论是 RNA-seq 还是 dRNA-seq 研究,序列对
应在基因组上的位置都是首要的非编码 RNA 筛选的
指标 :sRNA 来源于基因间区,asRNA 来源于基因
的互补链对应序列。Integrated Genome Browser[26],
Integrative Genomics Viewer[27]等软件可以形象化地
展示测序数据在基因组上的位置,供研究者人工筛
选非编码 RNA。
关于基因间区的定义在不同研究中有所差异。
Irnov 等[20]将基因组上距离上下游注释基因编码区
距离大于 25 nt 的区域定义为基因间区,在其他的研
究中也有将此最小距离设置为 30 nt[28]、60 nt[25]、
80 nt[13] 和 100 nt[22]。基因区间定义的不同主要
是由于研究者对细菌基因 UTR 区长度的认识不同。
dRNA-seq 技术研究表明细菌的 5 UTR 区通常较短,
大 部 分 mRNA 的 5 UTR 为 20-40 nt, 但 也 有 某 些
mRNA 的 5 UTR 可以长达几百个碱基[18,20,22,24],
因此不同基因间区的定义体现了对非编码 RNA 筛
选的准确度和灵敏度的不同要求,难以形成统一的
标准。另外,不同研究者对 asRNA 在基因组中位置
的筛选条件也不同。有的研究要求 asRNA 必须与基
因的编码区有重叠区域[22],也有的研究中考虑到
asRNA 可能作用于 mRNA 的非编码区,因此将与基
因编码区上下游一定长度范围有重叠的非编码 RNA
也定义为 asRNA[21]。
2.2 转录信号分析
在原核生物非编码 RNA 的生物信息学分析中,
转录起始位点、启动子和终止子是主要的转录信号。
应用 dRNA-seq 技术可以有效地确定转录起始位点,
而应用 RNA-seq 技术得到的非编码 RNA 的转录起始
位点可能不准确。Shinhara 等[10]应用 RNA-seq 技术
研究大肠杆菌中的非编码 RNA 时,在筛选条件中加
入了转录起始的预测证据和实验证据,即以预测的
sigma70 结合位点为预测证据,以文献中报道的大肠
杆菌转录起始位点为实验证据,对测序获得的非编
码 RNA 进行筛选和起始位点的校正。
启动子和终止子分析在 RNA-seq 测序和 dRNA-
seq 测序的生物信息学分析中都很常见。启动子的
预测通常需先将非编码 RNA 转录起始位点前一定长
度的序列提取出来,在应用 dRNA-seq 测序的研究
中通常取转录起始位点前的 40-50 nt 的序列进行启
动子分析,而在应用 RNA-seq 测序的研究中,由于
转录起始位点的相对不准确性,通常取更长的 50-
100 nt 长 度 的 序 列 进 行 分 析。BPROM[29]、HMM-
ER[30]等软件可以进行启动子的预测。非 Rho 因子
依赖的终止子预测通常在非编码 RNA 的 3 端进行,
TransTermHP[31]是最为常用的非 Rho 因子依赖的终
止子预测软件。
虽然启动子和终止子分析在非编码 RNA 的研究
中很常见,但是只有少数研究以启动子和终止子的
存在与否作为筛选非编码 RNA 的必要条件,主要原
因是许多非编码 RNA 在特殊环境条件下表达,它们
的启动子往往是未知的稀有启动子,而是否所有非
编码 RNA 都有非 Rho 因子依赖的终止子也尚未明
确。Mentz 等[21]以 5 端上游存在启动子作为筛选条
件,Yan 等[17]以 5 端上游存在启动子或 3 端具有
非 Rho 因子依赖的终止子作为筛选条件,他们筛选
非编码 RNA 的策略准确度比较高,假阳性较少,但
可能灵敏度较低,会遗漏某些由未知的稀有启动子
介导转录起始的非编码 RNA。
2.3 序列保守性分析
非编码 RNA 一级序列在远亲基因组(Distantly
related genomes)中的保守性很低[5],但在同一属或
同一种的不同菌株存在一定的保守性。在鉴定出新
生物技术通报 Biotechnology Bulletin 2015,Vol.31,No.4102
非编码 RNA 后,研究者通常会利用 BLAST、BLAT
等工具在近缘物种的基因组中检测这些非编码 RNA
的保守性。通过比较发现的不保守的非编码序列,
经常是在病原细菌中起关键作用的非编码 RNA[22]。
2.4 二级结构分析
非编码 RNA 的二级结构分析主要包括结构聚
类分析、结构保守性分析和结构稳定性分析。结构
聚类分析和结构保守性分析具有类似的原理,但侧
重点有所不同。大部分 RNA 家族是由相似二级结
构来定义的,而家族内通常没有很强的序列同源
性[18]。结构聚类分析通过对非编码 RNA 进行结构
分析,将这些非编码 RNA 进行分类,以加深对其进
化关系的认识和理解[18]。LocARNA 软件[32]是完
成二级结构聚类分析的重要工具。结构保守性分析
是利用基因组数据进行计算机预测发现非编码 RNA
的重要原理[5]。研究者认为编码蛋白的 mRNA 具
有较强的一级序列保守性,而不编码蛋白的非编码
RNA 应该具有较强的二级结构保守性,通过研究近
缘物种基因组序列的一级序列保守性和二级结构保
守性,可以区分编码 RNA 和非编码 RNA。依据此
原理,RNAz[33]等软件被开发出来用以非编码 RNA
的预测。Mentz 等[21]利用 RNAz 软件对谷氨酸棒状
杆菌基因组上的非编码 RNA 进行预测,以寻找预测
结果与 dRNA-seq 测序结果发现的非编码 RNA 的交
集。此外,因为非编码 RNA 通常具有稳定的二级结
构,有研究者从能量的角度分析非编码 RNA 的结
构稳定性,如 Miotto 等[13]分析了非编码 RNA 的最
小折叠能(Minimum Folding Energy,MFE),Perkins
等[34]分析了非编码 RNA 的最小自由能(Minimum
Free-Energy MFE)。由于目前还未发现普适性的非编
码 RNA 二级结构特点,因此还难以通过二级结构对
测序发现的非编码 RNA 进行筛选。
2.5 开放阅读框分析
测序实验鉴定出的非编码 RNA 也有可能编码
未知短肽链,因此有必要对鉴定出的 sRNA 进行
开 放 阅 读 框 分 析[18,21]。 起 始 密 码 子、 终 止 密 码
子和核糖体结合序列是开放阅读框分析的主要依
据[18]。GenDB[35]、ORFfinder[36]、Glimmer[37] 和
GeneMarkHMM[38]等软件可以帮助研究者对非编码
RNA 中的开放阅读框进行分析。
2.6 非编码RNA的表达验证实验
目前对非编码 RNA 表达的验证以 Northern 印记
杂交和实时定量 PCR 验证为主,Northern 印记杂交
结果比较直观,而实时定量 PCR 验证可快速大批量
地对非编码 RNA 进行表达量验证。在测序实验中,
对重点非编码 RNA 的实验方法验证是必不可少的。
2.7 非编码RNA靶标或靶功能预测和验证
靶标分析可以帮助研究者找到在某一生理过程
中起重要作用的非编码 RNA,从而确定后续研究的
重点对象。靶标的预测主要依据非编码 RNA 与靶标
的互补配对的特点,目前已有许多非编码 RNA 的
靶基因预测软件可以应用,其中 TargetRNA[39]的
应用最为广泛。真核生物非编码 RNA,如 miRNA
的靶标预测往往采用多种不同预测原理的软件预测
后,取结果的交集,而现阶段细菌中非编码 RNA 靶
标的预测多以单一软件预测结果为准,在这方面应
该借鉴真核生物非编码 RNA 研究的经验。对非编码
RNA 功能的验证以定点突变和敲除实验为主。定点
突变可验证非编码 RNA 与靶标基因的结合性与结合
位点。敲除实验则可验证非编码 RNA 在某一生理过
程中的调控作用。
3 问题与展望
在 RNA-seq 和 dRNA-seq 等技术的帮助下,人
类在细菌中发现的非编码 RNA 的数量迅速增长,
相比之下,经过功能验证的非编码 RNA 却极为稀
少。以单增李斯特菌为例,目前发现的 sRNA 已有
147 个( 包 括 LhrA-LhrC、RliA-RliI、RnpB、SsrA、
SsrS、SbrA、Rli22-Rli147, 不 计 asRNA)[4], 但
目前有文章报道的经过功能验证的只有 LhrA[40]、
LhrC[41] 和 Rli27[42]。 大 量 经 测 序 发 现 的 非 编 码
RNA 主要是通过“来源于基因组上的基因间区或基
因互补链的对应序列”这一位置标准筛选出来的,
这些非编码 RNA 是否真正能在细菌中起到调控作用
尚不得而知。
目前除了“在基因组上的位置”这一非编码
RNA 筛选条件外,难以发现非编码 RNA 的其他普
适特征,这一瓶颈可能与细菌非编码 RNA 的分类不
清有关。解决这一问题可采用分而治之的思想。随
2015,31(4) 103郭明璋等:基于高通量测序技术的细菌非编码 RNA研究方法进展
着人类对细菌非编码 RNA 认识的不断加深,可能找
到某一种类型的非编码 RNA 的统一特征,将其特征
用于测序实验结果的非编码 RNA 筛选,可以更好地
筛选出有特定功能的某一类非编码 RNA。例如,随
着人类对 Hfq 蛋白与非编码 RNA 相互作用的认识不
断加深,可以总结出能与 Hfq 蛋白结合的 RNA 的序
列或结构特征,以此特征为筛选条件,便可从测序
数据中筛选出依赖 Hfq 蛋白的非编码 RNA。
对细菌非编码 RNA 的研究只是研究细菌生理调
控的一个方面,单独的非编码 RNA 研究难以对细菌
为适应环境而进行的复杂调控有全面的认识,今后
的研究应将非编码 RNA 测序与单株菌的全基因组重
头测序、转录组学、蛋白组学、代谢组学以及典型
特征环境因素相结合,实现多层次多因素的综合分
析,才能更客观地分析非编码 RNA 的特点及功能。
多组学综合分析在真核生物非编码 RNA 介导的生理
调控的研究中已有应用,在相关领域提出了更完善
的生理调控网络[43]。在原核生物中,研究者往往只
将非编码 RNA 测序与转录组学联用[18,22],至于非
编码 RNA 是否导致蛋白水平、代谢水平的变化还没
有应用组学方法的全面研究。因此,虽然微生物非
编码 RNA 研究较多地关注了多种环境因素对非编码
RNA 表达图谱的影响,但因缺少蛋白组、代谢组数
据的支持,并未真正找到非编码 RNA 介导的细菌对
环境因素的适应性调控网络。多组学研究将为探索
微生物奥秘的旅程打开崭新的一扇门。
参 考 文 献
[1]Papenfort K, Vogel J. Regulatory RNA in bacterial pathogens[J].
Cell Host & Microbe, 2010, 8(1):116-127.
[2]Storz G, Vogel J, Wassarman KM. Regulation by small RNAs in
bacteria :expanding frontiers[J]. Molecular Cell, 2011, 43(6):
880-891.
[3]Michaux C, Verneuil N, Hartke A, et al. Physiological roles of small
RNA molecules[J]. Microbiology, 2014, 160(6):1007-1019.
[4]Behrens S, Widder S, Mannala GK, et al. Ultra deep sequencing of
Listeria monocytogenes sRNA transcriptome revealed new antisense
RNAs[J]. PloS One, 2014, 9(2):e83979.
[5]Sridhar J, Gunasekaran P. Computational small RNA prediction in
bacteria[J]. Bioinformatics and Biology Insights, 2013, 7 :83.
[6]Sittka A, Lucchini S, Papenfort K, et al. Deep sequencing analysis
of small noncoding RNA and mRNA targets of the global post-
transcriptional regulator, Hfq[J]. PLoS Genetics, 2008, 4(8):
e1000163.
[7]Gottesman S, Storz G. RNA reflections :converging on Hfq[J].
RNA, 2015, 21(4):511-512.
[8]Sorek R, Cossart P. Prokaryotic transcriptomics :a new view on
regulation, physiology and pathogenicity[J]. Nature Reviews
Genetics, 2010, 11(1):9-16.
[9] Liu JM, Livny J, Lawrence MS, et al. Experimental discovery of
sRNAs in Vibrio cholerae by direct cloning, 5S/tRNA depletion and
parallel sequencing[J]. Nucleic Acids Res, 2009, 37(6):e46.
[10]Shinhara A, Matsui M, Hiraoka K, et al. Deep sequencing reveals
as-yet-undiscovered small RNAs in Escherichia coli[J]. BMC
Genomics, 2011, 12(1):428.
[11]Raghavan R, Groisman EA, Ochman H. Genome-wide detection of
novel regulatory RNAs in E. coli[J]. Genome Research, 2011,
21(9):1487-1497.
[12]Mraheil MA, Billion A, Mohamed W, et al. The intracellular
sRNA transcriptome of Listeria monocytogenes during growth in
macrophages[J]. Nucleic Acids Research, 2011 :gkr033.
[13]Miotto P, Forti F, et al. Genome-wide discovery of small RNAs in
Mycobacterium tuberculosis[J]. PLoS One, 2012, 7(12):e51950.
[14]Bohn C, Rigoulay C, Chabelskaya S, et al. Experimental discovery
of small RNAs in Staphylococcus aureus reveals a riboregulator of
central metabolism[J]. Nucleic Acids Research, 2010 :gkq462.
[15]Howden BP, Beaume M, Harrison PF, et al. Analysis of the small
RNA transcriptional response in multidrug-resistant Staphylococcus
aureus after antimicrobial exposure[J]. Antimicrobial Agents
and Chemotherapy, 2013, 57(8):3864-3874.
[16]Acebo P, Martin-Galiano AJ, Navarro S, et al. Identification of 88
regulatory small RNAs in the TIGR4 strain of the human pathogen
Streptococcus pneumoniae[J]. RNA, 2012, 18(3):530-546.
[17]Yan Y, Su S, Meng X, et al. Determination of sRNA expressions
by RNA-seq in Yersinia pestis grown in vitro and during
infection[J]. PLoS One, 2013, 8(9):e74495.
[18]Sharma CM, Hoffmann S, Darfeuille F, et al. The primary transcrip-
tome of the major human pathogen Helicobacter pylori[J]. Nature,
2010, 464(7286):250-255.
[19]Wilms I, Overlöper A, Nowrousian M, et al. Deep sequencing
生物技术通报 Biotechnology Bulletin 2015,Vol.31,No.4104
uncovers numerous small RNAs on all four replicons of the plant
pathogen Agrobacterium tumefaciens[J]. RNA Biology, 2012, 9
(4):446-457.
[20] Irnov I, Sharma CM, Vogel J, et al. Identification of regulatory RNAs
in Bacillus subtilis[J]. Nucleic Acids Res, 2010 :gkq454.
[21] Mentz A, Neshat A, Pfeifer-Sancar K, et al. Comprehensive disco-
very and characterization of small RNAs in Corynebacteriumgluta-
micum ATCC 13032[J]. BMC Genomics, 2013, 14(1):714.
[22]Wurtzel O, Sesto N, Mellin JR, et al. Comparative transcriptomics
of pathogenic and non pathogenic Listeria species[J]. Molecular
Systems Biology, 2012, 8(1):583.
[23]Dinan AM, Tong P, Lohan AJ, et al. Relaxed selection drives a
noisy noncoding transcriptome in members of the Mycobacterium
tuberculosis complex[J]. mBio, 2014, 5(4):e01169-14.
[24]Kröger C, Dillon SC, Cameron ADS, et al. The transcriptional
landscape and small RNAs of Salmonella entericaserovar
Typhimurium[J]. Proceedings of the National Academy of
Sciences, 2012, 109(20):E1277-E1286.
[25]Vockenhuber MP, Sharma CM, Statt MG, et al. Deep sequencing-
based identification of small non-coding RNAs in Streptomyces
coelicolor[J]. RNA Biology, 2011, 8(3):468-477.
[26]Nicol JW, Helt GA, Blanchard SG, et al. The Integrated Genome
Browser :free software for distribution and exploration of genome-
scale datasets[J]. Bioinformatics, 2009, 25(20):2730-2731.
[27]Robinson JT, Thorvaldsdóttir H, Winckler W, et al. Integrative
genomics viewer[J]. Nat Biotechnol, 2011, 29(1):24-26.
[28]Toffano-Nioche C, Nguyen AN, Kuchly C, et al. Transcriptomic
profiling of the oyster pathogen Vibrio splendidus opens a window on
the evolutionary dynamics of the small RNA repertoire in the Vibrio
genus[J]. RNA, 2012, 18(12):2201-2219.
[29] Solovyev V, Salamov A. Automatic annotation of microbial genomes
and metagenomicsequences[M]// Robert W Li Metagenomics and
Its Applica-tions in Agriculture, Biomedicine and Environmental
Studies. Nova Science Publishers Inc, 2011 :61-78.
[30] Eddy SR. A new generation of homology search tools based on
probabilistic inference[C]. Genome Inform, 2009, 23(1):
205-211.
[31]Kingsford CL, Ayanbule K, Salzberg SL. Rapid, accurate, computa-
tional discovery of Rho-independent transcription terminators illu-
minates their relationship to DNA uptake[J]. Genome Biology,
2007, 8(2):R22.
[32] Will S, Reiche K, Hofacker IL, et al. Inferring noncoding RNA
families and classes by means of genome-scale structure-based
clustering[J]. PLoS Computational Biology, 2007, 3(4):e65.
[33] Washietl S, Hofacker IL, Stadler PF. Fast and reliable prediction of
noncoding RNAs[J]. PNAS, 2005, 102(7):2454-2459.
[34]Perkins TT, Kingsley RA, Fookes MC, et al. A strand-specific RN-
Seq analysis of the transcriptome of the typhoid bacillus salmonella
typhi[J]. PLoS Genetics, 2009, 5(7):e1000569.
[35]Meyer F, Goesmann A, McHardy AC, et al. GenDB-an open source
genome annotation system for prokaryote genomes[J]. Nucleic
Acids Research, 2003, 31(8):2187-2195.
[36]Rombel IT, Sykes KF, Rayner S, et al. ORF-FINDER :a vector for
high-throughput gene identification[J]. Gene, 2002, 282(1):
33-41.
[37]Delcher AL, Harmon D, Kasif S, et al. Improved microbial gene
identification with GLIMMER[J]. Nucleic Acids Research,
1999, 27(23):4636-4641.
[38]Lukashin AV, Borodovsky M. GeneMark. hmm :new solutions for
gene finding[J]. Nucleic Acids Res, 1998, 26(4):1107-1115.
[39]Tjaden B. TargetRNA :a tool for predicting targets of small RNA
action in bacteria[J]. Nucleic Acids Research, 2008, 36(suppl.
2):W109-W113.
[40]Nielsen JS, Larsen MH, Lillebæk EMS, et al. A small RNA controls
expression of the chitinase ChiA in Listeria monocytogenes[J].
PLoS One, 2011, 6(4):e19019.
[41]Sievers S, Lillebæk EMS, Jacobsen K, et al. A multicopy sRNA
of Listeria monocytogenes regulates expression of the virulence
adhesin LapB[J]. Nucleic Acids Research, 2014, 42(14):
9383-9398.
[42]Quereda JJ, Ortega ÁD, Pucciarelli MG, et al. The Listeria small
RNA Rli27 regulates a cell wall protein inside eukaryotic cells by
targeting a long 5-UTR variant[J]. PLoS Genetics, 2014, 10
(10):e1004765.
[43]Qi X, Yang X, Chen S, et al. Ochratoxin A induced early
hepatotoxicity :new mechanistic insights from microRNA, mRNA
and proteomic profiling studies[J]. Scientific Reports, 2014, 4 :
5163.