全 文 :第34卷 第2期 海 洋 学 报 Vol.34,No.2
2012年3月 ACTA OCEANOLOGICA SINICA March 2012
应用新一代测序技术测定大室别藻苔虫
线粒体基因组全序列
申欣1,2,田美1,朱长保1,刘会莲3,赵方庆2
(1.淮海工学院 海洋学院,江苏 连云港222005;2.中国科学院 北京生命科学研究院,北京100101;3.中国科学
院 海洋研究所,山东 青岛266071)
收稿日期:2011-06-26;修订日期:2011-09-26。
基金项目:国家自然科学基金(40906067);中国科学院基金(Y064021BJ1;0869011BJ5);江苏省“青蓝工程”人才基金(苏教师[2010]27号)。
作者简介:申欣(1981—),男,副教授,博士,研究方向为线粒体基因组学。E-mail:shenthin@163.com
摘要:线粒体基因组的获得传统上通常是采取长PCR结合鸟枪法或步移法测序。近年来新一代测序
技术蓬勃发展,以454,Solexa和SOLiD测序平台为代表。应用新一代高通量测序技术(Solexa)并结
合巢式PCR扩增,完成了大室别藻苔虫(Membranipora grandicella)的线粒体基因组全序列。大室别
藻苔虫线粒体基因组是目前国际上获得的第一条苔藓动物软壁亚目线粒体基因组全序列,基因组全
长为15 861bp,比已完成的4种苔藓动物线粒体基因组略大。大室别藻苔虫线粒体基因组包含13个
蛋白质编码基因、2个核糖体RNA基因和20个转运RNA基因。通过与已测得的苔藓动物进行比
较,发现目前已完成的5个苔藓动物线粒体基因组的基因排列顺序显著不同。苔藓动物线粒体基因
组基因排列的比较,今后可能会成为探讨该类群系统演化关系的重要信息来源。
关键词:大室别藻苔虫;线粒体基因组;新一代测序技术;巢式PCR;基因排列
中图分类号:Q915.815 文献标志码:A 文章编号:0253-4193(2012)02-0136-07
1 引言
诞生于20世纪70年代的Sanger法是最早被
广泛使用的DNA测序技术,也是完成人类基因组
计划的基础,但是由于它测序通量低、费时费力,科
学家们一直在努力寻求通量更高、速度更快、价格更
便宜的测序技术。自2005年以来,以 Roche公司
的454技术、Ilumina公司的Solexa技术和ABI公
司的SOLiD技术为代表的新一代测序技术相继诞
生。新一代测序技术又称高通量测序技术,主要特
点是测序通量高,测序时间和成本显著降低[1]。
与单个基因相比,线粒体基因组是一个完整的
体系,具有信息量丰富和系统发育树结构稳定等优
点。由于线粒体基因组具有众多优势,使其成为研
究后生动物关键类群的起源、进化、系统发育关系及
群体遗传分化的理想材料[2-4]。线粒体基因组的获
得传统上通常是采取长PCR结合鸟枪法或步移法
测序。虽然PCR方法操作简单,对样品需求量少,
但是花费时间较长、工作量较大等问题,并且利用长
PCR扩增有时成功率不高,难以获得目的片段[5]。
苔藓动物(bryozoans)作为重要的海洋无脊椎
动物门类,现存6000余种。目前国际上对苔藓动物
线粒体基因组的研究还比较少,仅完成4个苔藓动
物物种的线粒体全基因组,包括多室草苔虫Bugula
neritina、栉口目苔虫Flustrellidra hispida、颈链血
苔虫Watersipora subtorquata和扇形管孔苔虫Tu-
bulipora flabellaris[6-9]。大室别藻苔虫 Membra-
nipora grandicella 属于裸唇纲 Gymnolaemata,唇
口目Cheilostomida,软壁亚目 Malacostegina、膜孔
苔虫超科 Membraniporoidea,膜孔苔虫科 Membra-
niporidae。本研究利用Ilumina Genome Analyzer
(Solexa)新一代测序平台获得大室别藻苔虫线粒体
基因组的部分序列。根据获得的部分序列设计引
物,进行巢式PCR和测序,最终获得大室别藻苔虫
的线粒体基因组全序列。本实验流程避开了长
PCR扩增等技术的限制,为其他海洋动物线粒体基
因组的获得提供重要的参考价值。
2 材料和方法
2.1 样品
大室别藻苔虫采自于江苏连云港,样品清理后,
用95%乙醇固定备用。
2.2 基因组DNA的提取
称取50mg大室别藻苔虫样品放入培养皿中,
用蒸馏水洗涤,浸泡过夜。研磨后置于Eppendorf
管中,加入600μL的裂解液(40mmol/dm
3 Tris-
HCl,20mmol/dm3醋酸钠、1mmol/dm3 EDTA,
1%SDS;pH=8.0)和5μL的蛋白酶 K(20mg/
cm3),充分混匀后,置于55℃水浴锅中硝化4h。
4 000r/min离心5min去除钙质沉淀,小心将上清
液转入新的Eppendorf管中。加入等体积的酚∶氯
仿∶异戊醇(25∶24∶1)抽提2次,等体积的氯仿:
异戊醇抽提1次。将上清液转入新的Eppendorf管
中,加入2倍体积的无水乙醇,充分混匀后置于
-20℃冰箱30min。12 000r/min离心10min沉
淀DNA,70%乙醇洗涤2次后置于室温下干燥。
50μL TE(含20mg/cm
3 RNase)溶解 DNA,用
0.6%的琼脂糖凝胶电泳检测其质量。
2.3 Solexa高通量测序和序列拼接
Ilumina Genome Analyzer是一种基于单分子
簇的边合成边测序技术,它基于专有的可逆终止化
学反应原理,具体步骤包括文库制备、产生 DNA
簇、上机测序和数据分析。高纯度的大室别藻苔虫
DNA经Ilumina Genome Analyzer测序平台获得
序列,使用Abyss软件[10]进行序列拼接。
2.4 组合PCR和巢式PCR扩增
拼接后得到的contigs在GenBank数据库中进
行BLAST比对,从中得到线粒体基因组序列信息,
设计本物种线粒体基因组的特异引物(引物名称及
序列见表1),进行组合PCR扩增(反应体系和反应
条件见表2,3)。PCR产物通过1%琼脂糖凝胶电
泳检测质量。
表1 大室别藻苔虫线粒体基因组的特异引物
引物名称 引物序列(5′-3′)
Mgr-cg1-F12231 TTCGAGCAGTAGCCCAGACAATTT
Mgr-cg1-F12415 CTTTGACTTAGCAGAGGGAGAATC
Mgr-cg1-R136 TTAGTAGGGATGGAAGGGAAAATA
Mgr-cg1-R266 AAGAGGGTATGTGAGAATTTTTAG
Mgr-cg2-F2709 CTAACACACCCAAAGAACACCTGC
Mgr-cg2-F2838 AACCAATAACCGCACAACTTACAT
Mgr-cg2-R101 GTTGATCATATCGTAGGCGAGGGT
Mgr-cg2-R258 AGGTACATGTGATAGCCGCAACTC
表2 组合PCR的反应体系
组分 体积/μL
ddH2O 17.3
10×LA PCR buffer II(Mg2+plus) 2.5
dNTP(2.5mmol·dm-3 each) 2.0
引物1(10mmol·dm-3) 1.0
引物2(10mmol·dm-3) 1.0
模板 1.0
Taq酶(5U·mm-3) 0.2
表3 组合PCR的反应条件
步骤 温度/℃ 时间
1 预变性 94 5min
2 变性 94 45s
3 退火 50 45s
4 延伸 72 2min
步骤2~4,35次循环
5 再延伸 72 10min
6 保存 12 ∞
由于组合PCR的扩增效率低或者产生了非特
异扩增产物,而巢式PCR则能消除非特异扩增产
物、增加扩增效率,所以以组合PCR的反应产物为
模板来进行巢式PCR扩增(巢式PCR的反应体系
和反应条件见表4,5)。用1%琼脂糖凝胶电泳检测
巢式PCR产物质量,纯化后用 ABI 3730型测序
仪测序。
7312期 申欣等:应用新一代测序技术测定大室别藻苔虫线粒体基因组全序列
表4 巢式PCR的反应体系
组分 体积/μL
ddH2O 18.2l
10×LA PCR buffer II(Mg2+plus) 2.5
dNTP(2.5mmol·dm-3 each) 2.0
引物1(10mmol·dm-3) 1.0
引物2(10mmol·dm-3) 1.0
模板 0.1
Taq酶(5U·mm-3) 0.2
表5 巢式PCR的反应条件
步骤 温度/℃ 时间
1 预变性 94 5min
2 变性 94 45s
3 退火 56 45s
4 延伸 72 1min
步骤2~4,35次循环
5 再延伸 72 10min
6 保存 12 ∞
2.5 序列拼接及基因注释
用DNASTAR软件对测得的序列进行碱基识
别和序列拼接,从而获得线粒体基因组的全序列。
通过线粒体基因组的基因预测工具DOGMA[11]对
蛋白质编码基因及2个rRNA基因进行预测。tR-
NA基因是通过tRNAscan-SE 1.21[12]进行基因
预测。
3 结果与讨论
3.1 Solexa测序和BLAST比对
使用 Abyss[5]软件对Ilumina Genome Analyzer
测序结果进行拼接所获得的contigs,在GenBank数
据库中与苔藓动物线粒体基因组进行BLAST相似
性比对,得到大室别藻苔虫线粒体基因组的部分序列
(2个contigs,长度分别为12 540和2 983bp)。将其
在GenBank上与已测得大室别藻苔虫线粒体lrRNA
序列进行两两比对,发现与lrRNA吻合(图1)。从图
1可以看出,其序列相似性达到99.33%,因此Solexa
测序后获得的两个contigs为大室别藻苔虫线粒体基
因组部分序列。
图1 BLAST两两比对的结果
3.2 组合PCR和巢式PCR扩增结果
根据已获得的线粒体基因组部分序列设计特异
引物,引物名称和序列如表1所示。将这些引物随
机组合进行PCR扩增,其中只有2种组合可以得到
目的条带(见图2,3)。
由于在使用引物组合 Mgr-cg1-F12415/Mgr-
cg2-R258进行PCR扩增时出现了非特异性条带
(见图2),因此使用引物组合 Mgr-cg1-F12415/
Mgr-cg2-R101进行巢式PCR,扩增得到特异性条
带(见图4)。
831 海洋学报 34卷
图2 大室别藻苔虫线粒体基因
组的组合PCR扩增产物(一)
1.Mgr-cg1-F12415/Mgr-cg2-
R258,M1.DL2000标示物
图3 大室别藻苔虫线粒体基因
组的组合PCR扩增产物(二)
1.Mgr-cg2-F2709/Mgr-cg1-
R136,M1.DL2000标示物
图4 大室别藻苔虫线粒体基因
组的巢式PCR产物(一)
M1.DL2000标示物
在使用引物组合 Mgr-cg2-F2709/Mgr-cg1-
R136进行PCR扩增时,扩增效率低(图3),因此使
用引物组合 Mgr-cg2-F2838/Mgr-cg1-R136进行巢
式PCR,提高了扩增效率(见图5)。
图5 大室别藻苔虫线粒体基因
组的巢式PCR产物(二)
M1.DL2000标示物
3.3 大室别藻苔虫线粒体基因组的基本特征
大室别藻苔虫线粒体基因组为闭合双链环状分
子,全长为15 861bp,与已完成的苔藓动物线粒体
基因组相比较大(表6)。在大室别藻苔虫的线粒体
基因组中没有出现基因重叠现象,这与其他4个苔
藓动物物种的线粒体基因组不同[6-9]。发现了27
个非编码区,共有1 771个碱基,其中nad4与tRNA-
Gln间的非编码区最大,包含1057个碱基(见表2)。α
链的碱基组成:A=5 572(35.13%),T=5 651
(35.63%),C=2 636(16.62%),G=2 002(12.62%),
A+T含量为70.8%。大室别藻苔虫线粒体基因组
的A+T 含量(70.0%)与栉口目苔虫F.hispida
(70.0%)、扇形管孔苔虫(73.4%)与颈链血苔虫
(70.6%)较接近,均比多室草苔虫(58.9%)高。
3.4 蛋白质编码基因
大室别藻苔虫线粒体基因组包含13个蛋白质
编码基因,并且这13个蛋白质编码基因都在同一链
上编码(α链)。对大室别藻苔虫线粒体基因组中的
2个基因(cox1和nad3)使用了 ATG起始密码子,
对7个基因(atp8,atp6,nad2,nad1,cox2,cox3和
cob)使用了 ATA 起始密码子,对其余4个基因
(nad4L,nad4,nad5和nad6)使用了 ATT起始密
码子(表6)。对大室别藻苔虫线粒体基因组的13
个蛋白质编码基因都使用了完全终止密码子TAA
9312期 申欣等:应用新一代测序技术测定大室别藻苔虫线粒体基因组全序列
(表6),这与已完成的4个苔藓动物线粒体基因组
存在差异[6-9]。
大室别藻苔虫线粒体基因组的蛋白质编码基因
共有3 357个氨基酸。蛋白质编码基因总体的A+
T含量为68.9%,如果仅统计密码子的第三位,则
其A+T含量上升至77.6%。
表6 大室别藻苔虫线粒体基因组的基因分布特征
基因名称 编码链 起始位置 长度/bp 起始密码子 终止密码子 基因间隔
cox1 + 1~1 527 1 527 ATG TAA 3
tRNAPro + 1 531~1 597 67 8
tRNATrp + 1 606~1 671 66 0
atp8 + 1 672~1 782 111 ATA TAA 6
tRNAThr + 1 789~1 856 68 1
nad3 + 1 858~2 205 348 ATG TAA 2
tRNAGly + 2 208~2 272 65 3
atp6 + 2 276~2 929 654 ATA TAA 41
nad2 + 2 971~3 924 954 ATA TAA 6
tRNALeu + 3 931~3 997 67 2
nad4L + 4 000~4 281 282 ATT TAA 25
tRNAHis + 4 307~4 370 64 3
nad1 + 4 374~5 279 906 ATA TAA 48
cox2 + 5 328~5 957 630 ATA TAA 15
tRNALeu + 5 973~6 030 58 17
nad4 + 6 048~7 376 1 329 ATT TAA 1 057
tRNAGln + 8 434~8 489 56 180
nad5 + 8 670~10 379 1 710 ATT TAA 20
tRNAAsp + 10 400~10 463 64 0
nad6 + 10 464~10 907 444 ATT TAA 0
tRNAGlu + 10 908~10 972 65 5
tRNAArg + 10 978~11 042 65 22
tRNAVal - 11 065~11 131 67 24
tRNASer + 11 156~11 211 56 0
lrRNA + 11 212~12 484 1 273 0
tRNAMet + 12 485~12 551 67 0
srRNA + 12 552~13 422 871 0
tRNAPhe + 13 423~13 493 71 1
tRNAIle + 13 495~13 561 67 68
cox3 + 13 630~14 409 780 ATA TAA 6
tRNAAla + 14 416~14 480 65 74
tRNALys + 14 490~14 554 65 0
cob + 14 555~15 610 1 056 ATA TAA 8
tRNASer + 15 619~15 679 61 4
tRNACys + 15 684~15 738 55 122
041 海洋学报 34卷
3.5 核糖体RNA与转运RNA
大室别藻苔虫线粒体基因组的两个rRNA基
因都编码在α链上,lrRNA 位于tRNASer与tR-
NAMet之间,srRNA位于tRNAMet与tRNAPhe之间,2
个核糖体之间只间隔了 1 个tRNA 基因 (tR-
NAMet)。大室别藻苔虫lrRNA 基因的长度为
1 273bp,其srRNA 基因的长度为871bp。大室别
藻苔虫的线粒体基因组共编码20个tRNA基因,总
长度为1 279bp;与后生动物线粒体基因组的标准
组成相比,缺少tRNAAsn和tRNATyr基因。
3.6 基因排列
目前已经完成的苔藓动物线粒体基因组共有4
条,即多室草苔虫(接收号:NC_010197;裸唇纲、唇
口目)、颈链血苔虫(接收号:NC_011820;裸唇纲、唇
口目)、栉 口 目 苔 虫 F.hispida(接 收 号:NC_
008192;裸唇纲、栉口目)和扇形管孔苔虫(接收号:
EU563927;狭唇纲、管孔目),而且基因排列顺序显
著不同,说明在苔藓动物线粒体基因组的内部经历
了大规模的基因重排过程(图6)[6-9]。
图6 苔藓动物线粒体基因组的基因排列
下划线标注的基因在β链上编码
4 结论
本论文基于Ilumina Genome Analyzer(Sol-
exa)新一代测序平台并结合巢式PCR扩增方法,
获得了大室别藻苔虫的线粒体基因组全序列。大
室别藻苔虫线粒体基因组是目前国际上获得的第
一条软壁亚目的线粒体基因组全序列。通过对其
基本结构特征的分析,发现了与其他苔藓动物线
粒体基因组相比,大室别藻苔虫线粒体基因组具
有一些显著的特点:大室别藻苔虫线粒体基因组
的长度为15 861bp,与其他苔藓动物相比较大;控
制区也较大,长度为1 057bp;没有出现基因重叠
现象;对13个蛋白质编码基因都使用了完全终止
密码子TAA;与后生动物线粒体基因组的标准组
成相比,缺少tRNAAsn和tRNATyr基因;具有独特的
基因排列顺序。
本文测定的大室别藻苔虫线粒体基因组及与目
前已完成的4个苔藓动物的线粒体基因组相比,大
室别藻苔虫具有独特的基因排列顺序;5个苔藓动
物线粒体基因组的基因排列顺序显著不同,说明在
苔藓动物线粒体基因组的内部经历了大规模的基因
重排过程。苔藓动物线粒体基因组基因排列的比
较,今后可能会成为探讨该类群系统演化关系的重
要信息来源。
参考文献:
[1] 王曦,汪小我,王立坤,等 .新一代高通量测序数据的处理与分析[J].生物化学与生物物理进展,2010,37(8):834-846.
1412期 申欣等:应用新一代测序技术测定大室别藻苔虫线粒体基因组全序列
[2] HELFENBEIN K G,FOURCADE H M,VANJANI R G,et al.The mitochondrial genome of Paraspadella gotoi is highly reduced and
reveals that chaetognaths are a sister group to protostomes[J].Proc Natl Acad Sci USA,2004,101(29):10639-10643.
[3] DELLAPORTA S L,XU A,SAGASSER S,et al.Mitochondrial genome of Trichoplax adhaerens supports placozoa asthe basal lower
metazoan phylum[J].Proc Natl Acad Sci USA,2006,103(23):8751-8756.
[4] SHEN X,MA XY,REN JF,et al.A close phylogeneticrelationship between Sipuncula and Annelida evidenced from the complete mito-
chondrial genome sequence of Phascolosoma esculenta[J].BMC Genomics,2009(10):136-146.
[5] 申欣,吴志刚 .单环刺螠线粒体基因组全序列的获得———长PCR结合鸟枪法测序[J].海洋科学,2010,34(12):26-29.
[6] WAESCHENBACH A M,TELFORD J,PORTER J S,et al.The complete mitochondrial genome of Flustrellidra hispidaand the phy-
logenetic position of Bryozoa among the Metazoa[J].Mol Phylogenet Evol,2006,40(1):195-207.
[7] JANG KH,HWANG U W.Complete mitochondrial genome of Bugula neritina(Bryozoa,Gymnolaemata,Cheilostomata):phylogenetic
position of Bryozoa and phylogeny of lophophorates within the Lophotrochozoa[J].BMC Genomics,2009,10:167.
[8] SUN MA,WU ZG,SHEN X,et al.The complete mitochondrial genome of Watersipora subtorquata(Bryozoa,Gymnolaemata,Cheilos-
tomida)with poylogentic consideration of Bryozoa[J].Gene,2009,439(1-2):17-24.
[9] SUN MA,SHEN X,LIU HL,et al.Complete mitochondrial genome of Tubulipora flabellaris(Bryozoa:Stenolaemata):the first rep-
resentative from the class Stenolaemata with unique gene order[J].Marine Genomics,2011,doi:10.1016/j.margen.2011.03.006.
[10] SIMPSON J T,WONG K,JACKMAN S D,et al.ABySS:aparalel assembler for short read sequence data[J].Genome Res.2009,19
(6):1117-1123.
[11] WYMAN S K,JANSEN R K,BOORE J L.Automatic annotation of organelar genomes with DOGMA[J].Bioinformatics,2004,20
(17):3252-3255.
[12] LOWE T M,EDDY S R.tRNAscan-SE:aprogram for improved detection of transfer RNA genes in genomic sequence[J].Nucleic
Acids Res,1997,25(5):955-964.
Determination of Membranipora grandicella complete mitochondrial
genome sequence based on next-generation sequencing technology
SHEN Xin1,2,TIAN Mei 1,ZHU Changbao1,LIU Huilian3,ZHAO Fangqing2
(1.College of Marine Science,Huaihai Institute of Technology,Lianyungang222005,China;2.Beijing Institutes of Life
Science,Chinese Academy of Sciences,Beijing100101,China;3.Institute of Oceanology,Chinese Academy of Sciences,
Qingdao 266071,China)
Abstract:Traditionaly,the mitochondrial genome sequences were usualy obtained by shotgun or primers-
walking combination with long PCR.The next-generation sequencing technologies are developing fastly in re-
cent years,such as 454,Solexa and SOLiD sequencing platform.Membranipora grandicella complete mito-
chondrial genome sequence was determined based on next-generation high-throughput sequencing technology
(Solexa)and nested PCR amplification.The complete mitochondrial genome of M.grandicellais 15,861bp
in length,which is the first representative from the suborder Malacostegina(Bryozoa),and is relatively larger
when compared with mtDNAs of other study bryozoans.The mitochondrial genome contains 13protein-coding
genes,two ribosomal RNAs and 20transfer RNAs.Compared with other study bryozoans,gene arrange-
ments of five bryozoans mitochondrial genomes are significantly different.Comparison of bryozoans mitochon-
drial gene arrangements can be important information sources for exploring the phylogenetic relationships with-
in the group.
Key words:Membranipora grandicella;mitochondrial genome;next-generation sequencing;nested PCR;
gene arrangement
241 海洋学报 34卷