免费文献传递   相关文献

基于转录组的疏花软紫草低拷贝核基因引物开发



全 文 :第 36卷 第 3期 西 南 林 业 大 学 学 报 Vol. 36 No. 3
2016年 6月 JOURNAL OF SOUTHWEST FORESTRY UNIVERSITY Jun. 2016
doi:10. 11929 / j. issn. 2095-1914. 2016. 03. 015
基于转录组的疏花软紫草低拷贝核基因引物开发
付 义1,2 何承忠1,2 巨苗苗1,2 田 斌1,2,3
(1. 西南林业大学云南省云南省高校林木遗传改良与繁育重点实验室,云南 昆明 650224;
2. 国家林业局西南地区生物多样性保育重点实验室,云南 昆明 650224;
3. 中国科学院昆明植物研究所中国科学院东亚植物多样性与生物地理学重点实验室,云南 昆明 650201)
摘要:基于高通量的转录组测序,为大量并快速的开发分子标记提供契机。本研究对紫草科植物
疏花软紫草进行转录组测序,共得到 92 042 086 条 reads,从疏花软紫草 158 446 个 Unigene 中搜
索到 332个低拷贝核基因。为进行多态性验证,从中随机挑选 30 个设计引物,并对 3 个疏花软
紫草种群共 9个个体进行 PCR扩增,结果发现其中 16 对引物能够扩增出单一稳定的目的条带,
从中随机挑选 7个片段进行群体测序并计算 DNA 多态性。结果表明,7 对引物的多态性位点平
均值为 6. 57,单倍型平均值为 5. 14,单倍型多态性 (HD)在 0. 389~0. 944 之间,核苷酸多态性
(Pi)为 0. 001 48~0. 017 23。通过转录组测序技术开发的低拷贝核基因有较高的多态性,且可以
有效地运用于群体遗传学和谱系地理学研究中。另外,这些低拷贝核基因能够被运用于软紫草属
植物系统发育重建以及物种形成等研究工作中。
关键词:疏花软紫草;转录组;低拷贝核基因;引物
中图分类号:S718.46 文献标志码:A 文章编号:2095-1914(2016)03-0086-05
The Development of Low-copy Nuclear Gene Primers Based
on Transcriptome for Arnebia szechenyi
Fu Yi1,2,He Chengzhong1,2,Ju Miaomiao1,2,Tian Bin1,2,3
(1. Key Laboratory for Forest Genetic and Tree Improvement & Propagation in Universities of Yunnan Province,Southwest Forestry University,
Kunming Yunnan 650224,China;2. Key Laboratory of Biodiversity Conservation in Southwest China,State Forestry Administration,
Kunming Yunnan 650224,China;3. Key Laboratory for Plant Diversity and Biogeography of East Asia,
Kunming Institute of Botany,Chinese Academy of Sciences,Kunming Yunnan 650201,China)
Abstract:Transcriptome sequencing based on high throughput has provided an opportunity for rapidly develo-
ping more molecular markers. 92 042 086 reads were obtained in this research based on transcriptome sequence of
Arnebia szechenyi,then acquiring 332 low-copy genes by searching 158 446 unigene of A. szechenyi. In order to verify
DNA polymorphism,this research randomly selected 30 low-copy genes as designing primers and 9 individuals in three natu-
ral populations of A. szechenyi were detected by PCR amplification. It was found that 16 pairs of 30 low-copy gene primers
could amplify steadily single target band. After that,7 fragments randomly selected from 16 primers were sequenced and used
to calculate DNA polymorphism,the results showed that mean value of polymorphic sites based on 7 primers is 6. 57,hyplo-
type is 5. 14,hyplotype diversity (HD)was from 0. 389 to 0. 944,nucleotide diversity (Pi)was from 0. 001 48 to 0. 017 23.
Our findings indicated that low-copy nuclear genes developed in this study based on transcriptome sequencing have relatively
high polymorphism,and it could be validly used for the study of populations genetic and phylogeography. Furthermore,
收稿日期:2015-12-15
基金项目:云南省高校林木遗传改良与繁育重点实验室研究生开放基金 (YNGB201507)资助;西南地区生物多样性保育国家林业局重
点实验室开放基金资助。
第 1作者:付义 (1991—),男,硕士生。研究方向:植物学 /植物生物技术。Email:2367772079@ qq.com。
通信作者:田斌 (1983—),男,副教授。研究方向:林木遗传育种及植物种群遗传学。Email:tianbinlzu@ 163.com。
these low-copy nuclear genes could be applied to the fields of phylogeny reconstruction and speciation of Arnebia.
Key words:Arnebia szechenyi,transcriptome,low-copy nuclear gene,primer
长久以来,植物系统进化研究主要依赖于细胞
质 DNA,但是由于自然杂交现象在植物中的普遍存
在,和细胞质 DNA单亲遗传的限制,其包含的遗传
信息并不能很好的反应物种的进化历史。然而,用
基于双亲遗传的核基因能很好地解决物种之间和物
种内不同种群间的亲缘关系。如李建华利用低拷贝
核基因对桦木科铁木属和鹅耳枥属进行研究,结果
表明铁木属为单系鹅耳枥属为并系[1]。利用低拷贝
核基因在金丝桃科植物系统发育重建方面的研究,
也取得了很好的效果[2]。刘勉等人利用低拷贝核基
因重建了菊科紫菀亚科族间的系统发育关系,研究
结果显示低拷贝核基因可以更好地解决菊科科以下
分类阶元的系统发育关系[3]。随着高通量测序技术
的快速发展,利用其进行转录组测序分析能更全面
快速地了解真核生物复杂的转录组,且对于无参考
基因组的的物种也能通过转录组测序分析,从而获
得该物种的单一基因序列集 (Unigene)数据[4]。基
于这些数据,可以进行多种遗传多样性分析以及分
子标记开发。目前,转录组测序分析在分子标记的
开发中应用比较广泛。如黄海燕等人基于杜仲 (Eu-
commia ulmoides)转录组序列进行了 SSR 分子标记
的开发,结果发现,设计 SSR引物时,扩增片段长
度控制在 100~250 bp,多态性会比较高,扩增效果
也会较好[5]。张振等完成了红松 (Pinus koraiensis)
转录组 SSR分析,印证了利用红松转录组数据开发
SSR标记的可行性[6]。近年来的研究发现,基于转
录组测序技术也能开发植物的低拷贝核基因引物[7]。
然而对非模式植物的研究报道较少。
疏花软紫草 (Arnebia szechenyi)是紫草科 (Bor-
aginaceae)软紫草属 (Arnebia)的多年生草本植物。
该植物茎高 20~30 cm,有疏分枝,密生灰白色短柔
毛。花黄色,喉部有黑色的蜜导,雄蕊着生花冠筒
中部(长柱花)或喉部(短柱花),花药长约1. 6 mm;
子房 4裂,花柱丝状,稍伸出喉部 (长柱花)或仅
达花冠筒中部,先端浅 2 裂。小坚果三角状卵形,
长约 2. 7 mm,有疣状突起和短伏毛,花果期 6—9
月。在我国主要分布于内蒙古西部、宁夏、甘肃
西北部及青海东部和南部的山坡向阳处[8]。由于
该植物为二型花柱,花较大,并且花喉部有明显
的蜜导[9],因此是繁殖生态学研究的合适材料;
此外,其分布在西北干旱地区,对其种群遗传结
构的研究能很好地解释我国北方地区荒漠化的形
成时间和机理。然而目前能用于该物种的分子标
记较少。因此,本研究拟基于高通量转录组测序
技术对疏花软紫草的低拷贝核基因引物进行筛选,
以期为疏花软紫草乃至软紫草属植物在植物系统
进化以及繁殖机理等方面的研究提供参考。
1 材料与方法
1. 1 研究材料
用于提取总 RNA 的疏花软紫草采自青海省循
化孟达乡 (N 35°50. 664,E 102°35. 729)。在采
摘分子材料的时候尽可能采摘新鲜没有病虫害的幼
嫩叶片,然后立即置于液氮中,之后转置于-80 ℃
低温保存。用于低拷贝核基因引物验证的疏花软
紫草样本分别采自甘肃省张掖北山、甘肃省皋兰
什川十字沟、宁夏中卫沙坡头等 3 个地方 (表 1),
样本采集原则也是主要采集新鲜没有病虫害的幼
嫩叶片,然后置于硅胶中干燥,用于提取总 DNA
进行低拷贝核基因验证。
表 1 疏花软紫草样本的地理分布位置
Table 1 Geographic location of sample population of Arnebia szechenyi
种群编号 分布地
种群
个体数
地理坐标
纬度 经度 海波 /m
ZY 甘肃省张掖北山 3 38°87. 320 100°29. 244 1 780
DT013 甘肃省皋兰县什川镇 3 36°12. 140 104°01. 068 1 499
DT015 宁夏中卫县沙坡头 3 37°26. 422 104°55. 450 1 378
1. 2 研究方法
1. 2. 1 样本 DNA提取
在每个地点采集的疏花软紫草种群中各挑选 3
个个体,然后用上海生工生物工程股份有限公司
的 Ezup柱式植物基因组 DNA抽提试剂盒提取 3 个
种群共 9个个体的总 DNA,DNA 的质量和浓度用
1%琼脂糖凝胶电泳及 Nanodrop 2000检测,质量和
浓度均达到要求的 DNA置于-80 ℃冰箱中备用。
78第 3期 付 义等:基于转录组的疏花软紫草低拷贝核基因引物开发
1. 2. 2 样本 RNA的提取及转录组测序
样品采集后,用 CTAB法提取疏花软紫草叶片
的总 RNA,并用 1%琼脂糖凝胶电泳及 Nanodrop
2000检测其浓度和质量。在此基础上,采用 Oligo-
dT磁珠试剂盒分离纯化出 mRNA。纯化后,加入
缓冲液将 mRNA 打断,并以其为模板,以 6 碱基
随机序列为引物合成单链 cDNA。之后,加入
dNTPs、缓冲液和 DNA聚合酶合成双链 cDNA,并
利用 AMPure XP beads将其纯化。最后,将已纯化
的双链 cDNA进行末端修复、加多聚腺嘌呤尾,连
接测序接头,片段大小选择及 PCR 富集等过程后
构建 cDNA 文库,并采用高通量测序平台 Illumina
HiSeqTM2500对其进行测序 (武汉未来组生物科技
有限公司)。
1. 2. 3 数据过滤及拼接
获得转录组测序的原始数据后,利用自行编
写的 perl脚本过滤原始数据。整个过程包含 4个步
骤:去除含有测序接头的序列;去除 N% (N为无法
确定碱基信息的碱基)大于 10%的序列;去除低质量
序列以及去除冗余重复的序列。数据过滤后,采用
Trinity[10]软件将所有过滤序列进行拼接,并用 CD-
HIT[11]软件 (http:/ /www. bioinformatics. org /cd-hit /)
对拼接后的序列进行聚类以及冗余序列的去除。
经过拼接和聚类以后,得到的转录本称为 Unigene。
1. 2. 4 低拷贝核基因筛选
以被子植物数据库为参照,将疏花软紫草转
录本序列用 Hamstr[12]算法寻找同源基因,同源比
对的 e值设定为 10-5。将比对结果进行筛选,结果
与被子植物数据库存在同源关系,但与自身其他
序列不存在同源关系的基因为筛选出的疏花软紫
草低拷贝核基因。
1. 2. 5 低拷贝核基因的验证
从筛选的疏花软紫草低拷贝核基因中随机挑选出
30个基因进行引物设计及试验验证。用 Primer3[13]
分别对 30个基因设计 PCR引物,引物设计原则为:
长度为 18 ~ 22 bp,PCR 产物大小为 300 ~ 500 bp。
为了验证这些引物的有效性和多态性,随后,用
所设计的 30 对引物分别对表 1 中的 3 个种群共 9
个个体在 25 μL PCR体系下扩增,扩增条件为:94 ℃
预变性5min;94℃变性30 s,56℃退火45 s,72℃延
伸 1 min 30 s,30 个循环;用 1%琼脂糖凝胶电泳
检测。排除非特异性扩增的情况,电泳结果中,
同一泳道中只出现 1条扩增条带,且扩增条带的大
小位于 300~500 bp之间的基因为低拷贝核基因。
2 结果与分析
2. 1 转录组测序及拼接
基于高通量测序技术对疏忽软紫草进行转
录组测序,共得到 92 042 086 条序列,总长度为
9 112 166 514 bp,经过去除包含测序接头的序列,
去除 N的比例大于 10%的序列,去除低质量序列
和去除冗余序列的 4 个数据过滤过程后,得到
80 406 986 条序列,为原始序列的 87. 36%,过滤
后碱基总长度为 7 960 291 614 bp。采用 Trinity 软件
对过滤数据进行拼接和用 CD-HIT 软件对拼接后
的序列进行聚类分析以后,最终得到了疏花软紫
草的转录组数据 (表 2)。从表 2 中可看出,通过
拼接并聚类后,得到了 158 446 个 contig,总长度
为 183 270 167 bp,contig长度分布在 201~15 803 bp
之间,平均长度为 1 157 bp,N50 (按照长度将拼接
转录本从大到小排序,累加转录本的长度为总长
50%的拼接转录本长度)为 1 987 bp,N90为 454 bp。
表 2 转录组基本数据
Table 2 Basic date of the transcriptome
条目 数量
聚类后的 contig数 158 446
contig的总长度 /bp 183 270 167
contig的平均长度 /bp 1 157
最短 contig的长度 /bp 201
最长 contig的长度 /bp 15 803
累加转录本的长度为总长 50%
的拼接转录本长度 /bp
1 987
累加转录本的长度为总长 90%
的拼接转录本长度 /bp
454
2. 2 低拷贝核基因引物筛选和验证
以被子植物数据库为参照,将疏花软紫草转
录本序列用 Hamstr 算法寻找同源基因,共找到了
与自身其他序列不存在同源关系的基因 332个,即
332个低拷贝核基因。随机挑选 30 个基因设计引
物。为了验证引物的有效性和多态性,随后,用所
设计的 30对引物分别对 ZY、DT013、DT015共 3个
种群 9个个体进行扩增,用 1%琼脂糖凝胶电泳检测
PCR扩增产物,结果显示,有 16对引物能扩增出稳
定且单一的目的条带,且 PCR产物片段大小均与预
测结果相吻合。随后,又对这 16对引物所对应的基
因进行注释,引物编号、序列以及注释结果见表 3。
然后从这 16 对引物中随机挑选 7 对引物计算 DNA
多态性,多态性数据见表 4。由表 4可知,7对引物
的多态性位点平均值为 6. 57,单倍型平均值为
88 西 南 林 业 大 学 学 报 第 36卷
5. 14,单倍型多态性 (HD)在 0. 389 ~ 0. 944 之间, 核苷酸多态性 (Pi)在 0. 00 148~0. 01 723之间。
表 3 低拷贝引物序列信息
Table 3 The primer sequence information of low-copy nuclear genes
引物编号 引物序列 (5→3) 基因注释
38060 F:TCCCCAAGCAACAACAATGG R:TTTTCTTGCACGAACCCTGG zinc finger CCCH domain-containing protein 15 homolog
(CCCH型锌指结构域蛋白)
43265 F:TTACAACCCGGTCTCAGCAT R:TTGCTGTATAGTTGGGGCCA 未知
33938 F:AGGATTTGAAGGCCCTTGGA R:CAACAGCAACTCCAACAGCC L-ascorbate peroxidase 3,peroxisomal-like
(L-抗坏血酸过氧化物酶 3,过氧化物酶类)
38254 F:TTGGATGCTTCTCGGCCATA R:ACACCCTATTTGCCACCAGA probable signal peptidase complex subunit 1
(信号肽酶复合体亚基 1)
40568 F:GAGACCCAGATGAACAGCCT R:ACTACCAATCGCCAGACTGT 未知
42054 F:CTGATCGGCATTTTGGGAGG R:AACCAGAACAGGCGAAACAC uncharacterized protein LOC104088620
(未知蛋白 LOC104088620)
38154 F:CTCAAGGCGAATAAGGTGCC R:GGTCAAGGAAAGCGTGCTAG 未知
7329 F:TGTTTGCTTGCAAATGGGGA R:GTAAGCAGCATGTGACCGAC 未知
33908 F:ACAACAGAACAACACGGGTG R:ACGACAACCCCACCAATTTG Zinc finger protein 706 (锌指蛋白 706)
23504 F:CCAACATCAAAGGCGTGACA R:CCTGTGGCCACTAGACTTCA multifunctional methyltransferase subunit TRM112-like
protein At1g22270
(多功能甲基转移酶亚基 TRM112 类蛋白 At1g22270)
28490 F:AGAGATTGTGTTGCCTCCCA R:CACACACACACCCACCAAAA 未知
40789 F:GGTCGAACCCATGTCTCTGA R:CATCTTTGTGGGCCCATACG putative peptidyl-tRNA hydrolase PTRHD1
(肽-tRNA水解酶 PTRHD1)
48155 F:TGATGATCCAAGGAAGCGGT R:ACATTTTCACAGGTGGGCAA 未知
43409 F:AGAGGTTGTGCAAGTTGACG R:CAAGTGGTGCATTGTTCCCA uncharacterized protein LOC107007224
(未知蛋白 LOC107007224)
43173 F:TGTCCCGAGTGAAGATCGAG R:GGAATCAAAACCGGCCACTT uncharacterized protein LOC101291201
(未知蛋白 LOC107007224)
40947 F:GGAGACGACACGAAACACAG R:AGAGAGGTTTTGGGGTCGAC unnamed protein product (未命名蛋白产物)
表 4 基于 7对低拷贝核基因引物的 DNA多态性数据
Table 4 DNA polymorphism data based on 7 pairs of low-copy nuclear gene primers
引物编号 多态性位点数目 基因型 (n) 基因型多样性 核苷酸多样性
28490 1 2 0. 500 0. 003 03
33938 11 6 0. 833 0. 005 70
38060 8 7 0. 944 0. 010 27
40789 6 7 0. 944 0. 006 66
40947 7 5 0. 833 0. 010 57
43173 1 2 0. 389 0. 001 48
43265 12 7 0. 944 0. 017 23
3 结论与讨论
本研究通过高通量的转录组测序技术对疏花
软紫草的低拷贝核基因进行了初步筛选,得到了
16对可以有效扩增的引物。并对其中的 7 对引物
进行了多态性验证。结果表明,7 对引物扩增产物
的多态性位点平均值为 6. 57,单倍型平均值为
98第 3期 付 义等:基于转录组的疏花软紫草低拷贝核基因引物开发
5. 14,单倍型多态性 (HD)在 0. 389~0. 944 之间,
对其做方差分析,发现不同引物对 HD具有极显著
差异 (P= 0. 000 < 0. 01)。核苷酸多态性 (Pi)在
0. 001 48~0. 017 23之间,对其做方差分析,发现不
同引物对 Pi也存在极显著差异 (P= 0. 008 < 0. 01)。
微卫星标记是当下科研工作者应用比较广泛的一
种分子标记,其具有多态性高、重复性好、易于
分析等显著特点[14]。但是近年来大量关于微卫星
标记的研究显示,微卫星标记虽然能较好地反应
物种内的遗传多样性,但是在物种间的通用性还
是存在一定的局限性。熊敏等人对濒危植物华木
莲 (Sinomanglietia glauca)的基因组微卫星以及通
用性的研究显示,华木莲微卫星引物在近缘种中
扩增效率较低,最低达到了 28. 5%[15]。此外,SSR
分子标记不能很好地反应物种的自然选择历史。
因此,如果要更高效的对种间的进化历史、遗传
结构等进行研究,有必要开发在多态性更高,并
且在物种间通用性比较高的分子标记。研究表明,
通过转录组测序技术开发的低拷贝核基因有较高
的多态性,并可以有效地运用于群体遗传学和谱
系地理学研究中。另外,这些低拷贝核基因能够
被运用于软紫草属植物系统发育重建以及物种形
成等研究工作中。
[参 考 文 献]
[1] Li J H. Sequences of low-copy nuclear gene support the
monophyly of Ostrya and paraphyly of Carpinus (Betu-
laceae)[J]. Journal of Systematics and Evolution,
2008,46(3) :333-340.
[2] Andrea S M,Isabel S,Thomas M,et al. Utility of low-
copy nuclear markers in phylogenetic reconstruction of
Hypericum L. (Hypericaceae) [J]. Plant Systematics
and Evolution,2014,300(6) :1503-1514.
[3] 刘勉,张彩飞,黄建勋,等. 利用低拷贝核基因重建
菊科紫菀亚科族间系统发育关系 [J]. 植物学报,
2015,50(5):549-564.
[4] 岳桂东,高强,罗龙海,等. 高通量测序技术在动植
物研究领域中的应用 [J]. 中国科学 (生命科学),
2012,42(2) :107-124.
[5] 黄海燕,杜红岩,乌云塔娜,等. 基于杜仲转录组序
列的 SSR分子标记的开发 [J]. 林业科学,2013,49
(5):176-181.
[6] 张振,张含国,莫迟,等. 红松转录组 SSR 分析及
EST-SSR标记开发 [J]. 林业科学,2015,51(8):
114-120.
[7] Zeng L P,Zhang Q,Sun R R,et al. Resolution of deep
angiospermphylogeny using conserved nuclear genes and
estimates of early divergencetimes [J]. Nature Commu-
nications,2014,5:4956.
[8] 中国科学院中国植物志编辑委员会. 中国植物志:
第 64卷 [M]. 北京:科学出版社,1989.
[9] Zhang C,Wang L L,Lan D,et al. Pollination ecology
of Arnebia szechenyi (Boraginaceae),a Chinese endemic
perennial characterized by distyly and heteromorphic
self-incompatibility [J]. Annales Botanici Fennici,2014,
51(5) :297-304.
[10] Grabherr M G,Haas B J,Yassour M,et al. Full-length
transcriptome assembly from RNA-Seq data without a
reference genome [J]. Nature Biotechnology,2011,
29(7) :644-652.
[11] Fu L M,Niu B F,Zhu Z W,et al. CD-HIT:Acceler-
ated for clustering the next-generation sequencing data
[J]. Bioinformatics,2012,28(23) :3150-3152.
[12] Ebersberger I,Strauss S,von Haeseler A. HaMStR:
Profile hidden markov model based search for orthologs
in ESTs [J]. BMC evolutionary biology,2009,9(9) :
157-165.
[13] Koressaar T,Remm M. Enhancements and modifications
of primer design program Primer 3[J]. Bioinformatics,
2007,23(10) :1289-1291.
[14] 邹喻苹,葛颂,王晓东. 系统与进化植物学中的分子
标记生命科学专论 [M]. 北京:科学出版社,2001.
[15] 熊敏,王静,张志荣,等. 濒危植物华木莲核基因
组微卫星引物开发研究 [J]. 植物分类与资源学
报,2011,33(5):535-539.
(责任编辑 张 坤)
09 西 南 林 业 大 学 学 报 第 36卷