全 文 :第23卷 第4期
2011年4月
生命科学
Chinese Bulletin of Life Sciences
Vol. 23, No. 4
Apr., 2011
文章编号:1004-0374(2011)04-0390-04
猪的全基因组水平SNP研究现状
陈慧勇1,罗赛群1,吴珍芳2*
(1 中南大学生物科学与技术学院分子生物学研究中心,长沙 410078;2 华南农业大学动物科技系,广州 510640)
摘 要:SNP(single nucleotide polymorphism,单核苷酸多态 )在猪基因组中的分布极其广泛,平均分布间
隔为 300~400 bp,相关数据库收录已达 55万条。猪基因组测序已取得实质性进展,大规模搜索发现基因组
及 EST(expressed sequence tag)序列中的 SNP已展开,应用于猪全基因组水平的 SNP芯片已建立。在此基
础上,基于猪 SNP标记的遗传图谱绘制、QTL(quantitative trait loci)定位、遗传多样性检测及全基因组关联
分析等也都相继出现。
关键词:猪;SNP;全基因组关联分析
中图分类号:Q959.842; Q78 文献标识码:A
Progresses of SNP in pig genome-wide studies
CHEN Hui-Yong1, LUO Sai-Qun1, WU Zhen-Fang2*
(1 Molecular Biology Research Center, College of Biological Science and Technology, Central South University,
Changsha 410078, China; 2 Department of Animal Science, South China Agricultural University, Guangzhou 510640,
China)
Abstract: Single nucleotide polymorphisms (SNPs) are abundant and widespread throughout the pig genome,
occurring typically on average every 300-400 bps. About 557 k SNPs have been deposited in NCBIs SNP
repository dbSNP. The pig whole genome is currently being sequenced with billions of sequences completed.
Hundreds of thousands of porcine SNPs are discovered in genome sequence data and expressed sequence tag (EST)
collections. High density SNP genotyping assays are designed for porcine genome. Therefore, the extensive
applications of porcine SNP are developed, some of which include constructing of genetic linkage map, mapping of
quantitative trait loci (QTL), detection of genetic diversity, genome-wide association study.
Key words: pig; SNP; genome wide association study
收稿日期:2010-09-30; 修回日期:2010-12-02
基金项目:国家高技术研究发展计划(“863”计划)
(2008AA101008);高等学校博士学科点专项科研基金/
新教师基金项目(20090162120026)
*通讯作者:E-mail: wzfemail5000@163.com; Tel: 0766-
2986523
单核苷酸多态 (single nucleotide polymorphism,
SNP),是基因组水平的单个核苷酸变异所引起的
DNA序列多态性,主要指单个碱基的替换,包括
转换和颠换。由于分布的广泛性和稳定性及检测手
段的自动化,SNP逐渐成为基因组连锁作图、精细
定位及构建单倍型的最佳遗传标记。利用 SNP进
行的人类复杂疾病全基因组关联分析 (genome-wide
association studies)于 2005年开始,至今已有上万
篇的科研论文发表,这些庞杂的研究结果将给相关
疾病的预防、诊断和治疗带来新的期望和挑战 [1]。
在此背景下,各种动物和植物的全基因组关联研究
也相继开始。猪在农业和医学领域有着独特而重要
的地位,它的基因组数据积累已有很大的突破。作
为全基因组关联研究的基础,猪的 SNP发现和利
用研究进展目前尤为迅速。
1 猪SNP数据的积累
据估计,猪的 SNP 覆盖密度可以达到每
陈慧勇,等:猪的全基因组水平SNP研究现状第4期 391
300~400 bp即有 1个 [2]。截至 2010年 9月 17日,
NCBI 的 SNP 数据库 (http://www.ncbi.nlm.nih.gov/
SNP)收录的猪 SNP已近 55.7万条。大规模的猪
SNP发现工作始于 2002年,由美国农业部发起,
他们通过对可以表达的基因进行体外 PCR扩增、
比较测序等实验手段共发现了 1 650个 SNP[3]。近
几年,猪 SNP数据的积累尤其迅速。
猪的基因组约 2.7 Gb。中国—丹麦合作 (Sino-
Danish initiative)完成的草图覆盖度达 0.66[4],可以
从 NCBI网站 (http://www.ncbi.nlm.nih.gov/sites/entrez)
下载,这些数据来自 5个不同的猪种 (杜洛克、二
花脸、汉普夏、长白和大白猪 )。Sanger研究所 (SGSC
pig genome sequencing project)公布的基于克隆测序
的基因组数据则处于一种实时更新状态 (http://www.
sanger.ac.uk/Projects/S_scrofa/)[5]。同时,美国农业
部和爱荷华州立大学为首的相关组织也开展了相关
的工作,其第 10版的猪基因组数据 (Build 10)也于
2010 年 9 月 22 日公布 (ftp://ftp.tgac.bbsrc.ac.uk 或
http://www.animalgenome.org/blast/)。另外,还有法国
INRA(INRA-Genescope)的数据 (http://www.piggenome.
org),包含了伊比利亚猪、长白猪、眉山猪、小型猪、
皮特兰、野猪及大白猪等 7个猪种的信息。
伴随着猪基因组数据库的充实、新的生物信息
学分析手段及测序技术的出现,全基因组范围内快
速搜索 SNP工作几乎同步进行。这方面荷兰瓦格
宁根大学做的工作比较多:2009年,他们利用公开
的前两个猪基因组数据库进行比对,发现了近 10
万个 SNP[6];利用 Illumina及 454测序技术分析了
不同品种猪 (杜洛克、皮特兰、大白、长白及野猪 )
的 19个基因组文库及 2个 DNA池样品,参照猪基
因组数据 Build 7作比对分析,共发现了 37万多个
SNP[7];利用 5头长白与皮特兰的杂交后代构建基
因组DNA池,结合 Illumina测序技术共发现了 17 489
个 SNP[8]。2008年,美国农业部利用焦磷酸测序技
术分析了 26个个体 DNA池,共发现了 11万多个
SNP[9]。
而伴随 Pig EST database(http://pigest.geome.iastatae.
edu) 和 Pig EST(http://pigest.kvl.dk) 等猪 EST 数据
库资源的丰富,寻找 EST中 SNP的工作也在开展。
2007年,丹麦奥胡斯大学 Panitz等 [10]在 EST序列
的编码区发现了 7 900个 SNP。另外,Hayes等 [11]
利用 EST数据库中的冗余数据找到 676个经得起反
复验证的 SNP。这些编码区的 SNP(coding SNP,
cSNP)功能明确,分析利用起来相对容易和经济。
2 高通量SNP检测技术
SNP检测技术有很多,如对PCR产物直接测序、
质谱或液相色谱分析、对已有的 EST或基因组数据
库进行序列比对、等位基因特异性杂交、等位基因
特异性引物延伸以及与酶连接或酶外切反应相结合
的技术等,原理多种多样。表 1中列了部分 SNP
高通量实验检测技术,在猪的相关研究中已得到应
用。
这些技术有的检测通量突出,如 Affymetrix及
Illumina公司的 SNP芯片,在现代全基因组范围内
搜索或研究猪的 SNP有着重要意义。2008年,
Bischoff 等 [12]设计了独特 Affymetrix 寡核苷酸微阵
列,分析比较出眉山猪种中分布独特的 cDNA序列
SNP。而 Illumina公司 2009年的 PorcineSNP60一
共包含了 6万多个 SNP位点,每个包装含有 4~96
张芯片,检测的样品数从 48到 1 152不等 [7]。有的则
可以根据实验者的研究内容,随意确定待测的 SNP
位点,如 SNPlex检测的 SNP可由研究者自身来设
计特定探针 [13,14],而 Affymetrix芯片检测 SNP位点
则是由芯片事先设计好的。有的一次性可以完成多
个样本的多个位点的检测,如 SNPstream若借助于
384孔板,目前至少可以一次性检测 384个样品的
12个 SNP位点 [15],而 SNPlex技术的一个泳道可
以完成 48个 SNP的检测,毛细管泳道数越多检测
的样本数也就越多,如 3730基因分析仪有 384个
表1 高通量SNP实验检测技术
关键原理 代表技术 一次检测SNP数 一次检测样本数 SNP的选择性
ASO Affymetrix SNP芯片 上万个 1个 已固定
ASO-酶外切反应 Taqman技术 1个 96或384(受微量滴定板孔数限制) 任意选择
ASO-酶连接反应 SNPlex技术 48个 96(受毛细管泳道数限制) 任意选择
ASPE-酶连接反应 Illumina SNP芯片 上万个 1个 任意选择
SBE-酶连接反应 SNPstream技术 12或48个 384个 任意选择
ASO(allele-specific oligonuleotide hybridization):等位基因特异性杂交;ASPE(allele-specific primer extension):等位基因特异性引物延伸;SBE(single-base extension):单碱基延伸
生命科学 第23卷392
泳道数,那么就可以一次性完成 384个样品的 48
个位点检测。Taqman技术虽然一个反应只检测一
个 SNP位点,但借助相关的平台一次可以完成多
个样本的检测,而且在检测的 SNP选择上比较灵活。
对此,研究人员要根据自身的实验内容及检测的通
量和成本来选择出最佳的检测方法。
3 猪SNP的应用现状
SNP由于分布的广泛性和检测手段的便捷,被
认为是第三代遗传标记,它正被应用于猪遗传图谱
的绘制、QTL的精细定位、性状的关联分析,乃至
物种进化、遗传多样性或个体身份的分析和鉴定等。
猪最早的遗传图谱绘制于 1995年 [16,17],主要
借助于微卫星或 RFLP标记。网络版的遗传图谱
中又加入了少量的 AFLP和 SNP标记 (http://www.
thearkdb.org)。2009年,丹麦奥胡斯大学成功地利
用 462个 SNP构建了猪 18个常染色体新一代的遗
传图谱,密度是每 3.94 cM一个标记 [18]。这些 SNP
来源于 440个不同的基因,位于基因的编码区或 5
和 3非编码区,与相关的基因呈现一种高度的连锁
不平衡状态,它们的应用将会极大地促进 QTL的
定位研究,乃至关键基因的揭示。所以,丹麦奥胡
斯大学很快便进行了肉质性状的 QTL定位工作,
找到相关连锁的 SNP标记,为下一步的标记辅助
选择做准备 [19]。
SNP与复杂性状的关联分析揭示相关的遗传
机理是其最常见的应用,这方面的报道很多,尤其
是研究特定基因在猪的生长、繁殖、胴体、肉质及
抗病或发病性状中的决定意义,此外还有全基因组
水平的关联分析在近两年也开始了。2010年,荷
兰猪遗传所利用 Illumina公司的 PorcineSNP60进
行了公猪脂肪组织雄烯酮水平的关联分析,结果揭
示了两个重要的染色体控制区域 [20]。由 SNP组成
的单倍型用于复杂性状的关联分析往往包含更多的
信息。一个由 34个 SNP组成的 27 kb染色体区域
的单倍型变化就被用于猪在家养与人工选择下的遗
传变异情况研究 [21]。Meidtner等 [22]利用 PPARD基
因内部的 SNP单倍型进行背膘厚的遗传控制机理
分析,发现了一个关键的单碱基控制位点,并进行
了表达水平的验证。国内,上海交通大学王起山博
士 [23]对中国眉山猪保种群的 ESR基因三个 SNP位
点进行单倍型分析,发现了对产仔数影响较大的一
个单倍型。另外,于 2010年 9月完成验收的中国
农业大学等单位主持的“973”项目“猪、鸡重要
经济性状遗传的分子机制”及广东温氏食品集团等
单位主持的“863”项目“猪分子细胞工程育种技
术创新与优势性状新品系培育”也涉及了部分内容。
随着猪 SNP数据的积累、高通量检测技术的成熟
和高密度 SNP基因组图谱的建立,猪全基因组范
围内的关联研究也势必形成影响。
同时,SNP也是遗传多样性或进化分析及品种
或亲缘关系鉴定的重要基础。SNP标记用于猪个体
身份鉴定的对应计算方法已建立 [24]。Rohrer等 [25]
曾成功地利用 60个 SNP进行商业化猪群中个体身
份的鉴定,它的敏感度高于 10个微卫星标记的联
合使用。全世界最大的一个猪遗传多样调查计划
(European Union pig diodiversity project Ⅱ,Pig-BioDiv
Ⅱ )调查了 100多个中国和欧洲猪种,以期为相关
遗传资源的保护提供参考,目前已进行了十多年,
其中使用的标记除了微卫星外还包括大量的 SNP
标记 [26]。
目前,猪全基因组范围内的 SNP积累已达到
一定的水平,相关的实验技术和统计算法也部分建
立,它的大范围应用即将到来。但我们也要看到猪
的相关研究积累与人的还存在很大的差距,比如人
的 SNP数据收集量相对要庞大许多,更新也异常
及时,SNP的染色体定位信息明确,对应的 SNP
检测芯片也有各种系列以满足不同疾病不同检测规
模研究的需要。猪的 SNP芯片产品目前比较少,其
包含的 SNP许多还没有进行染色体定位,所以利
用目前的 SNP芯片技术还不足以进行猪数量性状
的 QTL定位研究。另外,也必须考虑这样的现实:
基因在发挥作用时,它是多个层次的,有基因组、
转录及翻译等各个水平的调控,每个水平的调控都
与环境存在或多或少的联系,且基因与基因间还存
在复杂的网络联系;基因的变异形式也是多样的,
而不仅仅是单个核苷酸的改变,同时也是动态的,
有的基因在同一个个体的不同组织或不同阶段可能
会有多种结构。所以,在挖掘和利用这些丰富的
SNP标记进行猪的复杂性状关联分析时,我们必须
要谨慎,不能一味地跟踪研究热潮。
[参 考 文 献]
[1] Manolio TA. Genomewide association studies and
assessment of the risk of disease. N Engl J Med, 2010,
363(2): 166-76
[2] Jungerius BJ, Gu J, Crooijmans RP, et al. Estimation of
the extent of linkage disequilibrium in seven regions of
the porcine genome. Anim Biotechnol, 2005, 16(1): 41-54
陈慧勇,等:猪的全基因组水平SNP研究现状第4期 393
[3] Fahrenkrug SC, Freking BA, Smith TP, et al. Single
nucleotide polymorphism (SNP) discovery in porcine
expressed genes. Anim Genet, 2002, 33(3): 186-95
[4] Wernersson R, Schierup MH, Jørgensen FG, et al. Pigs in
sequence space: a 0.66X coverage pig genome survey
based on shotgun sequencing. BMC Genomics, 2005,
6(1): 70
[5] Humphray SJ, Scott CE, Clark R, et al. A high utility
integrated map of the pig genome. Genome Biol, 2007,
8(7): R139
[6] Kerstens HH, Kollers S, Kommadath A, et al. Mining for
single nucleotide polymorphisms in pig genome sequence
data. BMC Genomics, 2009, 10: 4
[7] Ramos AM, Crooijmans RP, Affara NA, et al. Design of a
high density SNP genotyping assay in the pig using SNPs
identified and characterized by next generation sequencing
technology. PLoS One, 2009, 4(8): e6524
[8] Amaral AJ, Megens HJ, Kerstens HH, et al. Application of
massive parallel sequencing to whole genome SNP
discovery in the porcine genome. BMC Genomics, 2009,
10: 374
[9] Wiedmann RT, Smith TP, Nonneman DJ. SNP discovery
in swine by reduced representation and high throughput
pyrosequencing. BMC Genet, 2008, 9: 81
[10] Panitz F, Stengaard H, Hornsh H, et al. SNP mining
porcine ESTs with MAVIANT, a novel tool for SNP
evaluation and annotation. Bioinformatics, 2007, 23(13):
1387-91
[11] Hayes BJ, Nilsen K, Berg PR, et al. SNP detection
exploiting multiple sources of redundancy in large EST
collections improves validation rates. Bioinformatics,
2007, 23(13): 1692-3
[12] Bischoff SR, Tsai S, Hardison NE, et al. Identification of
SNPs and INDELS in swine transcribed sequences using
short oligonucleotide microarrays. BMC Genomics, 2008,
9: 252
[13] Pindo M, Vezzulli S, Coppola G, et al. SNP high-throughput
screening in grapevine using the SNPlex genotyping
system. BMC Plant Biol, 2008, 8: 12
[14] Tobler AR, Short S, Andersen MR, et al. The SNPlex
genotyping system: a flexible and scalable platform for
SNP genotyping. J Biomol Tech, 2005, 16(4): 398-406
[15] Bell PA, Chaturvedi S, Gelfand CA, et al. SNPstream
UHT: ultra-high throughput SNP genotyping for
pharmacogenomics and drug discovery. Biotechniques,
2002, Suppl: 70-2, 74, 76-7
[16] Archibald AL, Haley CS, Brown JF, et al. The PiGMaP
consortium linkage map of the pig (Sus scrofa). Mamm
Genome, 1995, 6(3): 157-75
[17] Rohrer GA, Alexander LJ, Hu Z, et al. A comprehensive
map of the porcine genome. Genome Res, 1996, 6: 371-91
[18] Vingborg RK, Gregersen VR, Zhan B, et al. A robust
linkage map of the porcine autosomes based on gene-
associated SNPs. BMC Genomics, 2009, 10: 134
[19] Li HD, Lund MS, Christensen OF, et al. Quantitative trait
loci analysis of swine meat quality traits. J Anim Sci,
2010, 88(9): 2904-12
[20] Duijvesteijn N, Knol EF, Merks JW, et al. A genome-wide
association study on androstenone levels in pigs reveals a
cluster of candidate genes on chromosome 6. BMC Genet,
2010, 11: 42
[21] Ojeda A, Huang LS, Ren J, et al. Selection in the making:
a worldwide survey of haplotypic diversity around a
causative mutation in porcine IGF2. Genetics, 2008,
178(3): 1639-52
[22] Meidtner K, Schwarzenbacher H, Scharfe M, et al.
Haplotypes of the porcine peroxisome proliferator-
activated receptor δ gene are associated with backfat
thickness. BMC Genet, 2009, 10: 76
[23] 王起山. 动物数量性状候选基因的单体型分析方法研
究[D]. 上海交通大学, 2007: 44-53
[24] Hill WG, Salisbury BA, Webb AJ. Parentage identification
using single nucleotide polymorphism genotypes:
application to product tracing. J Anim Sci, 2008, 86(10):
2508-17
[25] Rohrer GA, Freking BA, Nonneman D. Single nucleotide
polymorphisms for pig identification and parentage
exclusion. Anim Genet, 2007, 38: 253-8
[26] Chen K, Baxter T, Muir WM, et al. Genetic resources,
genome mapping and evolutionary genomics of the pig
(Sus scrofa). Int J Biol Sci, 2007, 3(3): 153-65