The progress of genome and transcriptome analysis of Bemisia tabaci and its future perspectives


王书平1   郭殿豪2   李  飞3
(1.上海出入境检验检疫局动植物与食品检验检疫技术中心, 上海 200135; 2.南京农业大学植物保护学院
昆虫学系, 南京 210095; 3.浙江大学昆虫科学研究所, 杭州 310058)
摘要: 烟粉虱 Bemisia tabaci (Gennadius)是世界性的重要害虫,为物种复合体,其中少数隐种近 30
年来入侵世界各国,并暴发成灾。 在我国,最近几年 MED隐种已经逐渐替代了之前入侵的 MEAM1
隐种,成为我国农田生态系统中的主要致害隐种。 基因组和转录组研究的不断深入极大地推动了
菌互作等领域的研究。 本文简要综述了烟粉虱基因组和转录组测序的研究进展,介绍了转录组数
关键词: 烟粉虱; 基因组; 转录组
The progress of genome and transcriptome analysis of Bemisia tabaci
and its future perspectives
Wang Shuping1   Guo Dianhao2   Li Fei3∗
(1. Technical Center for Animal Plant and Food Inspection and Quarantine, Shanghai Entry⁃Exit Inspection and
Quarantine Bureau, Shanghai 200135, China; 2. Department of Entomology, Nanjing Agricultural
University, Nanjing 210095, Jiangsu Province, China; 3. MOA Lab of Agricultural Entomology and
Institute of Insect Sciences, Zhejiang University, Hangzhou 310058, Zhejiang Province, China)
Abstract: The tobacco whitefly, Bemisia tabaci (Gennadius), is a worldwide distributed agricultural
pest, which is considered as a complex species. Some cryptic species have invaded many countries in the
last three decades, causing huge economic and yield loss in agriculture. Mediterranean cryptic species
(MED) entered into China and has replaced middle East⁃Asia minor 1 cryptic species (MEAM1).
Genome and transcriptome analysis would greatly facilitate the researches on invasion mechanism, species
complex, identification of cryptic species or geographical population, insecticide resistance mechanism,
interaction between host and endosymbiont. Here, the progress of genome and transcriptome researches of
B. tabaci were briefly summarized. The applications and future perspectives of omics studies in the
whitefly field were also presented.
Key words: Bemisia tabaci; genome; transcriptome
借助于 2 代测序、基因芯片、质谱和双向电泳等技
术。 基因决定性状,但性状的决定往往涉及多个基
因的共同参与。 基因与基因的相互作用,形成信号
通路或基因调控网络。 传统的分子生物学研究主要
而组学研究有效地克服了这一弊端。 利用组学研究
络层次系统全面地阐明性状调控的分子机制。 因
是 21 世纪生物学最伟大的革命。
烟粉虱 Bemisia tabaci (Gennadius) 是一个遗传
多样性丰富、全球分布的物种复合体 ( Liu et al.
2012),其中少数隐种近 30 年来在多个国家和地区
入侵机制,研发行之有效的防控技术。 因此,本文对
1 高通量测序技术进步推动组学研究
因素。 测序技术的进步可追溯到人类基因组测序计
划。 在人类基因组测序计划实施过程中,传统 San⁃
一。 完成人类基因组测序花费了几十年的时间,需
要耗资 30 多亿美元。 为此,美国 NIH提出了“1 000
(revolutionary genome sequencing technologies)”项目
基金,其设定目标为将 1 个人的全基因组测序费用
降到 1 000 美元,测序时间为 3 个月内 (Mardis,
2006)。 在巨大利益的驱动下,跨国生物技术公司和
3个成熟的 2 代测序技术:Illumina 公司的 Solexa 技
术、ABI公司的 SoLiD技术和 Roche公司的 454技术。
3 种技术各有优缺点,Illumina Solexa 技术测序快、成
本低,但读长较短;ABI SoLiD技术通量高,但其基于
“双碱基编码原理”,依赖于参考序列,不适合于 de
novo测序;Roche 454 技术读长较长,但其通量低,费
用较高。 Illumina Solexa 技术以其优势,很快占据大
部分市场。 因此,目前昆虫基因组和转录组数据主要
由 Illumina Solexa平台测序获得。
测序技术仍然在持续发展中。 近年来,陆续推
出了第 3 代测序技术,主要包括 Helicos 公司的
Heliscope 技术、Pacific Biosciences 公司的 SMRT 技
术、Oxford Nanopore公司的纳米孔单分子测序技术。
其中,Oxford Nanopore公司推出的MinION测序仪只
有移动 U 盘的大小。 基因组测序“飞入寻常百姓
2 烟粉虱基因组测序犹抱琵琶半遮面
目前,近 200 种昆虫的基因组被测序,其序列已
公开发布在 NCBI genome 等基因组数据库中。 In⁃
sectBase数据库(http: / / www. insect⁃genome. com)收
录了 138 个拼接及注释结果较好的昆虫基因组,作
因家族或信号通路分析(Yin et al. ,2015)。
在 Stansly和 Naranjo 主编的烟粉虱专著中,Czosnek
& Brown(2010)从隐种和近缘种的分化、繁殖、昆虫
研究的模型。 依据比较基因组学分析,他们预测
MEAM1 隐种烟粉虱基因数量可能为 15 000 个左
右,与黑腹果蝇 Drosophila melanogaster 等昆虫相
似;基因组大小预测为 1 G 左右,比黑腹果蝇、西方
蜜蜂 Apis mellifera 等昆虫的基因组大,因此推论烟
RNA。 最近,来自美国和中国的 2 个研究团队相继
采用流式细胞仪和 K⁃mer分析方法更为精确地预测
了烟粉虱的基因组大小(表 1)。 2 个团队的研究结
果相似,基因组大小预测为 680 Mb 左右,MEAM1
隐种烟粉虱基因组略大于 MED 隐种;K⁃mer 分析结
碍(Chen et al. ,2015;Guo et al. ,2015)。 随着第 3
开发表(表 1)。 Thao & Baumann(2004)测定了多个
昆虫的线粒体基因,其中包括烟粉虱 New World 隐
种,其线粒体基因组大小为 15 322 bp。 之后,Wang
et al􀆰 (2013)报道了烟粉虱 MED隐种的线粒体基因
大小为 15 632 bp,编码 13 个蛋白编码基因、22 个
tRNA、2 个 rRNA。 Tay et al􀆰 (2014)随后报道了烟
粉虱 Asia I隐种的线粒体基因组,其大小与 MED隐
种相似,为 15 210 bp,也编码 13 个蛋白编码基因、
22 个 tRNA、2 个 rRNA 和 1 个 467 bp 的调控区域。
重排现象,较为保守。 但不同的线粒体基因在若虫、
蛹和成虫阶段的表达有所差异(Wang et al. ,2013)。
表 1 烟粉虱核基因组和线粒体基因组的基本信息
Table 1 The basic information of nuclear genome and mitochondrial genome of Bemisia tabaci
Cryptic species
Estimation method
Accession number
Gene number
Nuclear genome
680 - 690 Mb
640 - 682 Mb
Flow cytometry and
K⁃mer analysis
— ≈15 000 -
20 000
Chen et al. ,2015
Guo et al. ,2015
New World
Asia I
15 632 bp
15 322 bp
15 210 bp
Wang et al. ,2013
Thao & Baumann,2004
Tay et al. ,2014
3 烟粉虱转录组测序方兴未艾
达差异,开展系统研究。 虽然烟粉虱基因组测序举
步维艰,但转录组测序却如火如荼,发展迅速。 NC⁃
BI SRA数据库中已经收录了 37 个 RNA⁃Seq数据及
18 个代谢组数据。 36 个转录组数据利用 Illumina
测序平台获得,1 个转录组由 454 平台测序。 对这
37 个转录组数据进行统计分析,发现 19 个来自于
烟粉虱 MEAM1 隐种,14 个来自于烟粉虱 MED 隐
种,2 个来自于 Asia II 3 隐种。 成虫的转录组有 21
个,不同发育阶段的混合样本有 7 个,中肠转录组 2
个,唾液腺转录组 1 个(图 1)。
2006 年,来自以色列、美国和意大利的科学家
采用 ABI Prism 3700 的测序平台对不感染病毒的
MEAM1 隐种烟粉虱卵、若虫和成虫,以及感染番茄
黄化曲叶病毒(Tomato yellow leaf curl virus, TYL⁃
CV) 或番茄斑萎病毒 ( Tomato spotted wilt virus,
的 cDNA进行建库测序,分别获得了 3 843 个 single⁃
tons 和 1 017 个 contigs ( Leshkowitz et al. ,2006)。
2010 年以来,针对烟粉虱的转录组测序开始增多,
图 1 已报道的烟粉虱转录组种类
Fig. 1 The reported transcriptome data of Bemisia tabaci complex
    利用 Illumina 平台,测序获得了 MED 隐种的
168 900 条序列,其中 27 290 条注释为蛋白编码基
因(Wang et al. ,2010)。 随后进一步获得了 MEAM1
隐种的 57 741 条转录组序列,其中 15 922 条被注释
为蛋白基因(Wang et al. ,2011)。 对中国本地隐种
Asia II 3 的转录组测序,获得了 52 535 条序列,其中
16 596 条为蛋白编码基因(Wang et al. ,2012)。 对
5′非翻译区和 3′非翻译区的差异度比较大,显示其
为不同的种,而 3 个隐种间的基因序列差异度与物
种的进化关系密切相关 (Wang et al. ,2011;2012)。
与成虫相比,烟粉虱伪蛹有 822 个基因高表达
和 2 496 个基因低表达,其差异表达基因的数量要
多于伪蛹和卵之间、以及伪蛹和若虫之间。 伪蛹和
基因,主要与能量或脂类物质的代谢相关(Wang et
al. ,2010)。 对噻虫嗪抗性品系和敏感品系的烟粉
虱卵、若虫和成虫进行转录组测序,分别发现 434、
553 和 360 个发育阶段特异性差异表达的基因(李
玲玲等,2009;Yang et al. ,2013)。
对烟粉虱及其原生内共生菌变形菌纲的 Candi⁃
datus Portiera aleyrodidarum 的转录组数据分析发
等多个氨基酸的合成通路基因。 烟粉虱高表达氨基
共生菌中的运输。 而这种代谢通路的相互补偿关系
(Upadhyay et al. ,2015),在烟粉虱初级共生菌 P.
aleyrodidarum和次级共生菌 Candidatus Hamiltonella
defensa中也有报道(Rao et al. ,2015)。 携带中国番
茄黄化曲叶病毒(Tomato yellow leaf curl China virus,
TYLCCNV)的烟粉虱中,124 个基因被诱导高表达,
112 个基因低表达。 而在感染番茄黄化曲叶病毒
后,表达量降低的基因数量更多(Gotz et al. ,2012)。
转录组分析表明,在烟粉虱取食感染或不感染 TYL⁃
CCNV的植株后,共有 1 606 个基因差异表达,TYL⁃
发了免疫反应过程(Luan et al. ,2011;2013)。
的偏好性和适应性(林克剑等,2008)。 将烟粉虱
MEAM1 隐种分别取食 4 种不同的寄主作物,建立不
表明在雌、雄虫之间共有 1 351 个差异表达基因,其
中 1 070 个为雌虫特异性基因,281 个为雄虫特异性
基因(Xie et al. ,2014a)。 温度对烟粉虱生长发育、
的适应性也明显不同 (崔旭红等,2009;从林等,
2010)。 为了阐明雌、雄虫间差异的分子机制,Lü &
雌、雄虫在 25℃和 44℃下的差异表达,分别发现了
50 个和 83 个差异表达的 EST与温度适应性有关。
Xie et al. (2014b)还发现,寄主对转录组表达
论相一致(张凯等,2014)。 烟粉虱个体很小,其唾
液腺则更小。 Su et al. (2012)测定了烟粉虱 MED
隐种唾液腺的基因表达谱,鉴定了 13 615 个 uni⁃
集,其中还发现了 295 个分泌蛋白。
达变化情况。 Xie et al. (2012)利用 Roche 454 平台
测定了烟粉虱 MEAM1 隐种的转录组,共获得了
30 980个 unigenes,其中 P450 基因在噻虫嗪抗性品
系中明显高表达。 Yang et al. (2013)对噻虫嗪抗性
品系进行了转录组水平的分析,发现 ATP 结合转运
蛋白和解毒代谢酶基因如 P450、GST 等在抗性品系
4 展望
公共数据库中的原始数据量仍不足 200 Gb,远未达
到大数据分析的层次。 但随着测序技术的持续发展
和进步,研究人员产生数据的能力将不断提高。 预
计在未来 2 ~ 3 年内,烟粉虱基因组测序将正式完成
并公开。 在此基础上,针对不同隐种或不同地理种
合种的分化机制研究具有重要的推动作用(de Barro
et al. ,2011)。 而随着测序费用的显著降低,烟粉虱
转录组测序将发展为类似于 PCR的常规实验技术,
功能基因组学研究将成为研究的重点。 例如,烟粉
菌互作的分子机制等。 组学数据将帮助研究人员采
给全世界生物学家。 事实证明,这并没有影响人类
