免费文献传递   相关文献

Transcriptome and RNA-Seq Technology

转录组与RNA-Seq 技术



全 文 :·技术与方法·
生物技术通报
BIOTECHNOLOGY BULLETIN 2012年第12期
在人类基因组项目后,转录组学、蛋白组学和
代谢组学等组学不断涌现,生命科学的研究已经跨
入后基因组时代。其中,转录组学作为一个率先发
展起来的学科是研究细胞表型和功能的一个重要手
段,是研究基因表达、基因结构和功能的一个新型
的研究方向。
所谓转录组广义上是指生物体细胞或组织在特
定状态下所转录出来的所有 RNA 的总和。RNA 包
括编码蛋白质的 RNA(即 mRNA)和非编码蛋白质
的 RNA(ncRNA, 如 rRNA、tRNA、microRNA 等 )
而 mRNA 似乎更引人关注,所以狭义上的转录组通
收稿日期 : 2012-06-04
基金项目 : 山东省农业良种工程重大课题(2011186)
作者简介 : 张春兰 , 女 , 博士研究生 , 研究方向 : 动物遗传育种与繁殖 ; E-mail: lanchunzhang@126.com
通迅作者 : 王建民 , 男 , 博士生导师 , 研究方向 : 羊品种资源保护 ; E-mail: wangjm@sdau.edu.cn
转录组与 RNA-Seq 技术
张春兰1,2  秦孜娟2  王桂芝2  纪志宾2  王建民2
(1 潍坊学院生物与农业工程学院,潍坊 261061 ;2 山东农业大学动物科技学院,泰安 271018)
摘 要 : 转录组是特定细胞或组织在特定时间或状态下转录出来的所有 RNA 的集合。通过对转录组的研究可以揭示生物体
的基因表达、研究结构变异及发现新基因等。转录组分析的研究方法、研究平台发生着日新月异的变化,同时生物信息学分析的
内容也在逐渐完善。RNA-Seq 作为一种新的转录组研究手段,利用新一代测序技术能够更为快速、准确地为人们提供更多的生物
体转录信息。主要比较近年来转录组研究的几种方法和几种 RNA-Seq 的研究平台,并着重介绍 RNA-Seq 的原理、用途、步骤和生
物信息学分析等及在相关领域的应用等内容,为相关的研究和应用提供参考。
关键词 : 转录组 RNA-Seq 新一代测序技术
Transcriptome and RNA-Seq Technology
Zhang Chunlan1,2 Qin Zijuan2 Wang Guizhi2 Ji Zhibin2 Wang Jianmin2
(1Biology and Agriculture Institute of Weifang University,Weifang 261061 ;2Animal Science Institute of Shandong
Agricultural University,Taian 271018)
Abstract:  The transcriptome is the complete set of transcripts for certain type of cells or tissues in a specific developmental stage or
physiological condition. Transcriptome analysis can reveal the organisms gene expressing level, structural variation, discovery of new genes. The
research methods and platforms of transcriptome are undergoing rapid changes. And bioinformatics analysis is also improved gradually. RNA-
Seq as a new research method, it can be more quickly and afford more accurate transcriptome’s information while using the Next-generation
Sequencing(NGS)technology. This article compares several main methods and platforms of transcriptome in recent years, and review the
principle, purpose, steps, bioinformatics’ analysis and applications in related fields of RNA-Seq. This will be afford useful reference for related
research.
Key words:  Transcriptome RNA-Seq Next-generation Sequencing(NGS)technology
常指所有 mRNA 的总和[1]。本文以下的说明以狭义
RNA-Seq 为主。
与基因组不同,转录组更具有时间性和空间性。
例如,人体大部分细胞具有一模一样的基因,而即
使同一细胞在不同的生长时期及生长环境下,其基
因表达情况也是不完全相同的。所以,除了异常的
mRNA 降解现象(如转录衰减)以外,转录组反映
的是特定条件下活跃表达的基因。
1 研究转录组的基本方法
目前研究转录组的方法主要有 :(1)基于杂交
技术,如 cDNA 芯片和寡聚核苷酸芯片 ;(2)基于
生物技术通报 Biotechnology Bulletin 2012年第12期52
测序技术,如早先基于 Sanger 测序的 SAGE(Serial
Analysis of Gene Expression)和 MPSS(Massively Para-
llel Signature Sequencing)、全长 cDNA 文库和 EST 文
库的测序分析。
现在对 cDNA、EST 等的测序工作已升级为第二
代测序技术。新一代测序技术较 Sanger 测序技术通
量更高、运行时间更短、测序片段更长。现在通常
将基于第二代测序技术的转录组测序分析称为 RNA-
Seq。3 种主要的转录组研究方法的比较,见表 1。
其中 RNA-Seq 具有以下优势 :(1)通量高。运
表 1 三种转录组研究方法的比较[2]
技术 芯片 SAGE/MPSS/cDNA/EST RNA-Seq
原理 杂交 Sanger 测序 高通量测序
信号 荧光模拟信号 数字化信号 数字化信号
分辨率 数个 -100 bp 单碱基 单碱基
通量 高 低 高
背景噪声 高 低 低
分析成本 高 高 低
起始 RNA 用量 多 多 少
同时映射转录区域和基因表达 是 有限的基因表达 是
能够区分不同的亚型 有限 是 是
能够区别等位基因表达 有限 是 是
表 2 几种主要测序平台的比较[5]
平台 Illumina/Solexa GA Ⅱ x Rohce/454 GS FLX ABI/SOLiD SOLiD3 Helicos HeliScope
测序原理 可逆染料终结合成测序 焦磷酸合成测序 连续测序 单分子合成测序
平均读长(bp) 100 500 50 35
每 Mb 费用($) -2 -60 -2 -1
准确率(%) ≥ 98.99 ≥ 99 ≥ 99.94 97-99.8
主要错误类型 替换 插入、缺失 替换 缺失
运行时间(d) 4 0.35 7 8
优点 性价比高 ;目前应用最广泛 读长最长 ;运行速度快 准确率最高
产量高 ;文库制备简单,不需要 DNA 扩
增或连接
缺点 读长短 费用最高 读长短 ;运行时间长 失误率高
用第二代测序平台可得到几个到几百亿个碱基序列,
可以达到覆盖整个基因组或转录组的要求 ;(2)灵
敏度高。可以检测细胞中少至几个拷贝的稀有转录
本 ;(3)分辨率高。RNA-Seq 的分辨率能达到单个
碱基,准确度好,同时不存在传统微阵列杂交的荧
光模拟信号带来的交叉反应和背景噪音问题 ;(4)
不受限制性。可以对任意物种进行全转录组分析,
无需预先设计特异性探针,能够直接对任何物种进
行转录组分析。同时能够检测未知基因,发现新的
转录本,并准确地识别可变剪切位点及 SNP、UTR
区域[3,4]。
2 RNA-Seq 测序平台
Sanger 等于 20 世纪 70 年代发明的双脱氧测序
法在过去的 30 多年中一直在 DNA 测序领域占据着
主要地位。虽然技术在不断改进,但要进行大规模
测序其价格还是比较昂贵。同时传统方法测序的速
度慢,获取的信息量小,远远满足不了目前研究的
需要。而 RNA-Seq 测序平台突破传统测序技术,为
基因组和基因的测序研究提供了有效手段。表 2 为
近年来发展的几种主要测序平台比较。
现在 Illumina 公司生产 MiSeq、HiSeq 2000 测序
平台在国内也广泛被应用,现将其各种测序平台比
较,见表 3。其中 MiSeq 因其售价便宜、占地面积
小、测序速度快而被称为个人型测序系统,实现了
2012年第12期 53张春兰等 :转录组与 RNA-Seq 技术
许多普通实验室的测序梦想,让新一代测序触手可
及。而 HiSeq 系列测序系统由于其一次测序数据量
大,通道多,更适合于多个样品同时测序。
3 RNA-Seq 的主要用途
RNA-Seq 技术能够在单核苷酸水平对特定物种
的整体转录活动进行检测,从而全面快速地获得该
物种在某一状态下的几乎所有转录本信息。由于转
录组测序可以得到全部 RNA 转录本的丰度信息,加
之准确度又高,使得它具有十分广泛的应用领域。
主要应用于 :(1)检测新的转录本[7,8],包括未知
转录本和稀有转录本 ;(2)基因转录水平研究,如
基因表达量、不同样本间差异表达[9,10];(3)非编
码区域功能研究,如 microRNA[11]、非编码长 RNA
(lncRNA)[12]、RNA 编辑[13];(4)转录本结构变异
研究,如可变剪接[14,15]、基因融合[16,17];(5)开
发 SNPs 和 SSR 等[18,19]。
4 RNA-Seq 的原理及基本步骤
提取样本总 RNA 后,根据所测 RNA 种类进行
分离纯化。再进而片段化为所用测序平台所需的长
度(或反转录后片段化),反转录后连接测序接头。
接着利用 PCR 扩增达到一定丰度上机测序,直到获
得足够的序列。所得序列通过与参考基因组比对或
从头组装(de novo assembling)形成全基因组范围的
转录谱。试验流程,如图 1 所示。
5 生物信息学分析及在相关领域的应用
由测序仪产生的图像信息经过 base calling 处理
转换成碱基序列。对原始测序数据进行初步处理(去
除污染序列)后,然后将低质量 reads 去掉(如果一
个 reads 中存在 5 个以上不能识别的碱基则认为其为
低质量的 reads)。对于 mRNA 的生物信息学分析接
下来如下有两种处理办法。
5.1 有参考基因组的比对分析及应用
选择已经公布的相同或相近物种的基因组和基
因信息为参考,将所测数据 mapping 至参考基因组
的数据中,进行比对分析。
5.1.1 基因的结构优化分析 通过 reads 在基因组上
的分布、末端配对信息以及现有基因注释结果,对
基因结构进行延伸优化、5/3 边界鉴定及 UTRs 区
域鉴定。Chen 等[20]利用 Illumina 测序平台对白色
表 3 Illumina 公司几种测序平台的比较[6]
平台 Genome Analyze Ⅱ x HiSeq 2000 HiSeq 1000 HiScan SQ MiSeq
最大产量 95 Gb 600 Gb 300 Gb 150 Gb >1 Gb
单个读取
共 3.2 亿个
4 000 万个 / 通道
共 30 亿个
1.87 亿个 / 通道
共 15 亿个
1.87 亿个 / 通道
共 7.5 亿个
9 400 万个 / 通道
共 340 万个
340 万个 / 通道
末端配对读取
共 6.4 亿个
8 000 亿个 / 通道
共 60 亿个
3.74 亿个 / 通道
共 30 亿个
3.74 亿个 / 通道
共 15 亿个
1.88 亿个 / 通道
共 680 万个
680 万个 / 通道
读长 2×150 bp 2×100 bp 2×100 bp 2×100 bp 2×150 bp
图 1 RNA-Seq 试验流程
AAAAAA
AAAAAA
AAAA
T
A
A
T
T
A
A
T
T
A
A
T
TTTT
TTTTT-boads
RNA⡷⇥ॆ༴⨶
DNA⍻ᒿ᧕ཤ䘎᧕
৽䖜ᖅਸᡀৼ䬮cDNA
PCRᢙ໎⍻ᒿ᮷ᓃ
␡ᓖ⍻ᒿ
mRNAᒿࡇؑ᚟
图像识别
生物技术通报 Biotechnology Bulletin 2012年第12期54
杜洛克与二花脸杂交 F2 代猪的肝脏、背最长肌和腹
脂进行 RNA-Seq 分析,对所得 587-815 个基因的 5
末端延伸至少 50 bp 长,对所得 1 064-1 375 个基因
的 3 端延伸至少 50 bp,并且对其中 411-672 个基
因的两端都作了延伸处理。Zhang 等[21]水稻的 8 种
不同组织利用 Illumina GA 测序平台进行 RNA-Seq 分
析,对所得注释基因的 5 端进行了 UTR 分析,预
测 mRNA 起始密码子上游的开放阅读框架约需 10-
50 bp 长的序列。
5.1.2 预测新基因 现有数据库中对转录本的注释
可能还不全面,通过 reads 的分布以及基因注释集合,
在基因组上发现新基因。Jäger 等[7]比较了绵羊的
正常组和骨延迟愈合组的基因表达谱,与绵羊基因
组比对后发现了 12 431 个新的转录本。Huang 等[8]
比较了不同发育时期牛胚胎的转录本,与牛基因组
比较后发现了 1 785 个新的转录本。
5.1.3 差异表达基因分析 比较不同样品间表达差
异的基因,给出在每个样品中上调或下调基因。李
新建[10]比较了荣昌猪和长白猪的转录本,筛选出 1
596 个差异表达显著的基因。
5.1.4 基因功能注释 将所测 reads 与数据库中已注
释功能的基因相比对进行 GO(Gene Ontology,基因
的分子功能、生物学过程和细胞组件)和 KEGG(kyoto
encyclopedia of genes and genomes,基因和基因产物、
基因编码产物、新陈代谢途径等)分析。Huang 等[8]
对不同发育期牛胚胎利用 Illumina GA Ⅱ测序平台进
行 RNA-Seq 分析,对所得差异基因进行了 GO 富集
性分析。Ajai 等[22]采用 454 测序平台对牛角癌组织
和正常角组织转录本分析,并对 909 345 个转录本
进行了 GO 和 KEGG 分析。
5.1.5 可变剪切分析 可变剪接使一个基因产生多
个 mRNA 转录本,不同 mRNA 可能翻译成不同蛋
白。通过末端配对及接合序列的对比,结合已有的
基因注释鉴定可变剪切形式。Sergei 等[14]对拟南芥
的 RNA-Seq 分析发现至少有约 42% 含有内含子的基
因进行了可变剪切。Wang 等[15]利用 SeqSaw 软件
分析了人已有数据库中的基因,分析了基因发生可
变剪切时会出现的信号。
5.1.6 基因融合分析 如果末端配对的 reads 的两
条来自于不同的基因,并且有足够的 reads 支持两
条基因的连接,则这两个基因将作为基因融合的
候选。目前基因融合现象多见于肿瘤或癌症组织,
Christopher 等[16]对 43 个人前列腺癌组织的转录本
进行高通量测序分析,发现了新的基因融合现象。
Ren 等[17]对 14 个中国汉族人的原发性前列腺癌和
他们的正常组织进行 RNA-Seq 分析,揭示前列腺癌
中存在多个基因融合现象。
5.1.7 SNPs 及 SSR 分析 通过比对转录本和参考基
因组间的序列,寻找潜在的 SNPs 或 SSRs。Montgo-
mery 等[18]对 HapMap 中 60 个欧洲后代进行了转录
组测序分析,开发了 901 个人基因组上的的 cSNP(编
码 SNP)。Cánovas 等[19]对荷斯坦奶牛乳样品进行
转录组分析,开发了 33 045 个具有多态性的 cSNPs。
5.2 无参考基因组组装分析及应用
当无参考基因组时,以 GenBank 中已公布的有
关数据为参考,将测序数据经过软件拼接从头组装
获得 contigs(重叠群)和 unigenes(拼接的非冗余
基因)。
5.2.1 组装情况分析 将测序所得短 reads 利用组装
软件从头组装。首先将具有一定长度重叠的 reads 连
成更长的片段,称之称为 contig。然后将 reads 比对
回 contig,通过末端配对来确定来自同一转录本的
不同 contigs,以及这些 contigs 之间的距离,未知序
列用 N 补充,将这些 contigs 连在一起得到 Scaffold。
进一步利用末端配对对 Scaffold 做补洞处理,最后
得到含 N 最少,两端不能再延长的序列,称之为
unigene。如果同一物种做了多个样品测序,则不同
样品组装得到的 unigene 可通过序列聚类软件做进一
步序列拼接和去冗余处理,得到尽可能长的非冗余
unigene。
5.2.2 Unigene 功能注释 与数据库中已注释功能的
基因比对进行 GO 和 KEGG 功能注释。王斌[23]对
米曲霉菌的转录组分析,利用 InterProScan 工具对所
得基因数据进行了 GO 分析,并利用 Blast2GO 软件
对基因进行了 KEGG 分析。Jäger 等[7]利用 Illumina
GA Ⅱ测序平台对绵羊骨愈合延迟和正常组的腿骨进
行了 RNA-Seq 分析,从头组装 reads 产生了 13 987
个 unigenes,对表达有显著差异的转录本进行了聚
类和 GO 分析。
2012年第12期 55张春兰等 :转录组与 RNA-Seq 技术
5.2.3 SNPs 及 SSR 分 析 通 过 RNA-Seq, 可 以 开
发品种的 SNP 和 SSR,从而为品种先育及疾病诊断
提供支持。Blanca 等[24]利用 454 测序平台对两个
品种西葫芦进行从头组装转录组分析,开发出 9 043
个 cSNPs 和 1 935 个潜在的 SSRs。Zhang 等[25]利用
Illumina HiSeq 2000 测序平台对 3 种不同油含量的
花生种子进行 RNA-Seq,从头组装后得到 59 077 个
unigenes,共开发了 3 919 个 SSRs,并对其中 160 个
SSRs 的多态性进行了实验室证实。
5.2.4 基因差异表达分析 比较不同样品间表达
差异的基因,给出在每个样品中上调或下调基因。
Faulconnier 等[9]比较了禁食 48 h 与正常饮食的奶
山羊间脂肪组织间的基因表达,两组分别有 456 和
199 个表达不同的基因。为了揭示松鼠冬眠中基因
的变化,Hampton 等[26]运用 454 测序平台对全年 6
个时间点松鼠的心肌、骨骼肌和脂肪组织进行 RNA-
Seq 分析,组装后比较发现了多个不同时间点不同
组织间差异表达的基因。
5.2.5 GO 和 KEGG 分析 Nie 等[27] 利用 454 测序
平台对一只长白猪的肌肉和卵巢进行 RNA-Seq 分析,
对所测序列进行了组装,并对 56 589 个显著表达的
转录本进行了 GO 和 KEGG 分析。Blanca 等[24] 对
西葫芦的 60% 以上的 unigenes 进行功能注释和 GO
分析。
6 RNA-Seq 面临的挑战与展望
随着高通量测序技术的发展,以基因组学为代
表的生命科学得到了前所未有的繁荣和飞速发展。
作为一个刚刚起步的新技术,RNA-Seq 已以惊人的
速度应用于各种生物组织中。虽然 RNA-Seq 已经显
示出其他分析技术无可比拟的优势,如能为物种提
供单碱基分辨率的转录组注释、提供全基因组范围
的“数字化”基因表达谱、成本比芯片和 Sanger 测
序低等,但是还存在一些缺陷。RNA-Seq 技术在如
下几个方面还有待于进一步完善 :(1)测序技术的
改进和测序费用的降低。目前虽然利用不同的测序
原理发展了多种技术,如 454 测序平台为焦磷酸合
成测序,Illumina 测序平台为可逆染料终结合成测
序,但测序过程中还存在一定的错误率,使得开发
出来的 SNP、SSR 和可变剪切的假阳性率较高。(2)
生物信息学分析软件的再开发。测序虽然得到了大
量的数据,但基于有限的生物信息学分析软件,经
常导致人们所对要分析的东西不能得到很好的结果,
造成测序数据的浪费。(3)读长更长,通量更高。
读长越长,越需要更少的 reads 去拼接形成一个基
因,因而错误率越低。或者更长的读长意味着可以
在一次测序过程中完成一个基因甚至几个基因的测
定。目前虽然发展起来的 454 FLX 测序平台测序长
度能达到 700 bp 以上,但测序费用的昂贵使得许多
科研工作者望而却步。综上所述,虽然 RNA-Seq 技
术还面临着种种困难,相信随着相关学科的进一步
发展和测序成本的进一步降低,RNA-Seq 必将为基
因的研究提供强有力的手段,并在转录组学研究领
域占据主导地位。也相信随着测序技术的不断进步,
人们能够对转录组开展更为深入的测序工作,能够
发现更多、更可靠、更有用的转录本。
参 考 文 献
[1] Costa V, Angelini C, De Feis I, Ciccodicola A. Uncovering the
complexity of transcriptomes with RNA-Seq. J Biomed Biotechnol,
2010 :853916.
[2] Wang Z, Gerstein M, Snyder M. RNA-Seq :a revolutionary tool for
transcriptomics. Nat Rev Genet, 2009, 10(1):57-63.
[3] 梁烨 , 陈双燕 , 刘公社 . 新一代测序技术在植物转录组研究中
的应用 . 遗传 , 2011, 33(12):1317-1326.
[4] Wilhelm BT, Marguerat S, Watt S, et al. Dynamic repertoire of a
eukaryotic transcriptome surveyed at single nucleotide resolution.
Nature, 2008, 453(7199):1239-1243.
[5] 祁云霞 , 刘永斌 , 荣威恒 . 转录组研究新技术 :RNA-Seq 及其
应用 . 遗传 , 2011, 33(11):1191-1202.
[6] http ://www.illumina.com.cn/company.asp
[7] Jäger M, Ott CE, Grünhagen J, et al. Composite transcriptome asse-
mbly of RNA-Seq data in a sheep model for delayed bone healing.
BMC Genomics, 2011, 12 :158.
[8] Huang W, Has an Khatib. Comparison of transcriptomic landscapes
of bovine embryos using RNA-Seq. BMC Genomics, 2010, 11 :711,
http ://www.biomedcentral.com/1471-2164/11/711.
[9] Faulconnier Y, Chilliard Y, Torbati MB, Leroux C. The transcriptomic
profiles of adipose tissues are modified by feed deprivation in lactating
goats. Comparative Biochemi stry and Physiology Part D Geomics
生物技术通报 Biotechnology Bulletin 2012年第12期56
Proteomics, 2011, 6(2):139-149.
[10] 李 新 建 . 猪 脂 肪 沉 积 关 键 基 因 筛 选 及 TCTP 基 因 功 能 研
究[D]. 杨凌 :西北农林科技大学 , 2011.
[11] Dai C, Zhang YM, Zhang Q, et al. A microRNA catalog of swine
umbilical vein endothelial cells identified by deep sequencing.
Agricultural Sciences in China, 2011, 10(9):1467-1474.
[12] Li TT, Wang SY, Wu RM, et al. Identification of long non-protein
coding RNAs in chicken skeletal muscle using next generation
sequencing. Genomics, 2012, 99(5):292-298.
[13] Peng ZY, Cheng YB, Tan BC, et al. Comprehensive analysis of
RNA-Seq data reveals extensive RNA editing in a human transcrip-
tome. Nature Biotechnology, 2012, 30(3):253-262.
[14] Filichkin SA, Priest HD, Givan SA, et al. Genome-wide mapping
of alternative splicing in Arabidopsis thaliana. Genome Research,
2010, 20(1):45-58.
[15] Wang LK, Wang XW, Wang X, et al. Observations on novel splice
junctions from RNA sequencing data. Biochem Biophys Res Comm-
un, 2011, 409(2):299-303.
[16] Maher CA, Kumar-Sinha C, Cao XH, et al. Transcriptome Sequen-
cing to detect gene fusions in cancer. Nature, 2009, 458(7234):
97-101.
[17] Ren SC, Peng ZY, Mao JH, et al. RNA-Seq analysis of prostate
cancer in the Chinese population identifies recurrent gene fusions,
cancer-associated long noncoding RNAs and aberrant alternative
splicings. Cell Res, 2012, 22(5):806-821.
[18] Montgomery SB, Sammeth M, Gutierrez-Arcelus M, et al. Transcri-
ptome genetics using second generation sequencing in a Caucasian
population. Nature, 2010, 464(7289):773-777.
[19] Cánovas A, Rincon G, Islas-Trejo A, et al. SNP discovery in the
bovine milk transcriptome using RNA-Seq technology. Mamm Ge-
nome, 2010, 21(11-12):592-598.
[20] Chen CY, Ai HS, Ren J, et al. A global view of porcine transcriptome
in three tissues from a full-sib pair with extreme phenotypes in gro-
wth and fat deposition by paired-end RNA sequencing. BMC Geno-
mics, 2011, 12(1):448.
[21] Zhang GJ, Guo GW, Hu XD, et al. Deep RNA Sequencing at
single base-pair resolution reveals high complexity of the rice
transcriptome. Genome Res, 2010, 20(5):646-654.
[22] Tripathi AK, Koringa PG, Jakhesara SJ, et al. A preliminary sketch
of horn cancer transcriptome in Indian zebu cattle. Gene, 2012,
493 :124-131.
[23] 王斌 . 米曲霉 RIB40 转录组学研究[D]. 广州:华南理工大学 ,
2010.
[24] Blanca J, Cañizares J, Roig C, et al. Transcriptome characterization
and high throughput SSRs and SNPs discovery in Cucurbita pepo
(Cucurbitaceae). BMC Genomics, 2011, 12 :104.
[25] Zhang JA, Liang S, Duan JL, et al. De novo assembly and
characterisation of the transcriptome during seed development, and
generation of gentic-SSR markers in peanut(Arachis hypogaea L.).
BMC Genomics, 2012, 13 :90.
[26] Hampton M, Melvin RG, Kendall AH, et al. Deep sequencing
the transcriptome reveals seasonal adaptive mechanisms in a
hibernating mammal. PLoS ONE, 2011, 6(10):e27021.
[27] Nie QH, Fang MX, Jia XZ, et al. Analysis of muscle and ovary
transcriptome of Sus scrofa :assembly, annotation and marker
discovery. DNA Res, 2011, 18(5):343-351.
(责任编辑 狄艳红)