[目的] 红松已开发的分子标记缺乏共显性的遗传标记,尚不能满足分子标记辅助育种的需要。利用转录组数据开发SSR标记目前仍然是较为经济高效的DNA分子标记开发策略,本研究利用高通量测序技术开发红松EST-SSR标记,掌握其在转录组序列中的分布类型及特征,为红松的SSR多样性分析及变异分析提供基础。[方法] 利用SSR检索程序从红松转录组41 476条Unigenes中筛选得到1 757个SSR位点,并对SSR位点的数量、分布特征进行统计分析。设计合成101对SSR引物,采用琼脂糖电泳初步检查和聚丙烯酰胺凝胶电泳分离检测方法确定引物的多态性,并收集扩增产物,送测序验证,最终开发出16对SSR引物。合成6对荧光引物,采用荧光标记技术对来自黑龙江省鹤岗、林口、铁力、苇河4个种子园的53份自由授粉子代进行遗传多样性分析。[结果] 基于转录组序列开发出的EST-SSR的分布频率(SSR的个数与总Unigene的数量比)为4.24%。单、二、三核苷酸重复单元分别占总SSR的46.90%,17.12%和34.66%; SSR重复单元的重复次数分布在5~24次之间。参试的101对引物中有21对引物扩增可检测出多态性位点,占引物总数的20.8%; 重测序验证,有16对引物能够扩增出目标序列。6对荧光引物共检测出18个等位基因,多态性信息量(PIC)为0.036 3~0.667 4,平均为0.325。[结论] 红松属于基因组序列比较庞大的裸子植物,本研究可扩增出多态性位点的引物重复单元以二、三核苷酸重复为主。所研究红松种子园子代属于中等多态性水平。本研究印证了利用红松转录组数据开发SSR标记的可行性,同时采用荧光标记技术检测红松自由授粉子代材料,为红松种质资源的多样性水平分析及变异水平的研究提供基础。
[Objective] In Korean pine(Pinus koraiensis) breeding programs, lack of co-dominant genetic markers constrained the development of molecular marker assisted breeding. At present, development of SSR markers based on transcriptome data is still an economic and efficient development strategy of DNA molecular markers. In this study, we used high-throughput sequencing technology to develop EST-SSR markers for Korean pine. Distribution patterns of the markers in the transcriptome sequences and their characteristics were analyzed, in order to provide a basis for analysis of SSR diversity and mutation of Korean pine. [Method] A total of 1 757 SSR sites were identified from 41 476 unigenes in Korean pine transcriptome by using SSR searching program. Statistical analyses were conducted for number, distribution and characteristics of the SSR loci. And 101 pairs of SSR primers were designed and synthesized. Agarose electrophoresis was used for initial check and polyacrylamide gel electrophoresis for separation and detection of the polymorphisms of primers. Then amplification products were collected and sequenced for validation. Finally, 16 pairs of SSR primers and 6 pairs of fluorescence primers were identified. To study the genetic variation, 53 samples of open-pollinated progeny were collected from four seed orchards respectively in Hegang, Linkou, Tieli and Weihe. [Result] The distribution frequency of EST-SSRs (ratio of the number of SSRs to the total number of unigenes) was 4.24%, based on the transcriptome sequences. Mononucleotide dinucleotide and trinucleotide repeats were 46.90%, 17.12% and 34.66% of total SSR, respectively. The SSR repeat number of SSR repeat units was between 5 and 24. Twenty-one pairs of primers showed polymorphism among 101 pairs of primer, which accounting for 20.8% of the total number of primer pairs. By sequencing validation, 16 pairs of primers amplified the target sequence. Eighteen alleles were tested from 6 pairs of fluorescence primers. Polymorphic information content (PIC) was 0.036 3-0.667 4 and the mean was 0.325 0. [Conclusion] Korean pine has a relatively large genome in gymnosperms. The amplified primers of the polymorphism loci were mainly dinucleotide and trinucleotide repeats. The progeny of the Korean pine seed orchard revealed a medium level of polymorphism. This study demonstrated that using Korean pine transcriptome data to develop SSR markers was feasible. The technique of using fluorescent markers to analyze the progeny materials provided a basis for studies of genetic diversity and variation of the Korean pine germplasm resources.
全 文 :第 51 卷 第 8 期
2 0 1 5 年 8 月
林 业 科 学
SCIENTIA SILVAE SINICAE
Vol. 51,No. 8
Aug.,2 0 1 5
doi:10.11707 / j.1001-7488.20150815
收稿日期: 2014 - 10 - 09; 修回日期: 2014 - 12 - 05。
基金项目: 林业公益性行业科研专项“红松果材兼用林良种选育与定向培育技术研究”(201204320)。
* 张含国为通讯作者。
红松转录组 SSR分析及 EST-SSR标记开发*
张 振1,2 张含国1 莫 迟1 张 磊1
(1.东北林业大学 林木遗传育种国家重点实验室 哈尔滨 150040;
2.中国林业科学研究院亚热带林业研究所 杭州 311400)
摘 要: 【目的】红松已开发的分子标记缺乏共显性的遗传标记,尚不能满足分子标记辅助育种的需要。利用转
录组数据开发 SSR 标记目前仍然是较为经济高效的 DNA 分子标记开发策略,本研究利用高通量测序技术开发红
松 EST-SSR 标记,掌握其在转录组序列中的分布类型及特征,为红松的 SSR 多样性分析及变异分析提供基础。【方
法】利用 SSR 检索程序从红松转录组 41 476 条 Unigenes 中筛选得到 1 757 个 SSR 位点,并对 SSR 位点的数量、分
布特征进行统计分析。设计合成 101 对 SSR 引物,采用琼脂糖电泳初步检查和聚丙烯酰胺凝胶电泳分离检测方法
确定引物的多态性,并收集扩增产物,送测序验证,最终开发出 16 对 SSR 引物。合成 6 对荧光引物,采用荧光标记
技术对来自黑龙江省鹤岗、林口、铁力、苇河 4 个种子园的 53 份自由授粉子代进行遗传多样性分析。【结果】基于
转录组序列开发出的 EST-SSR 的分布频率( SSR 的个数与总 Unigene 的数量比)为 4. 24%。单、二、三核苷酸重复
单元分别占总 SSR 的 46. 90%,17. 12%和 34. 66% ; SSR 重复单元的重复次数分布在 5 ~ 24 次之间。参试的 101 对
引物中有 21 对引物扩增可检测出多态性位点,占引物总数的 20. 8% ; 重测序验证,有 16 对引物能够扩增出目标序
列。6 对荧光引物共检测出 18 个等位基因,多态性信息量(PIC)为 0. 036 3 ~ 0. 667 4,平均为 0. 325。【结论】红松
属于基因组序列比较庞大的裸子植物,本研究可扩增出多态性位点的引物重复单元以二、三核苷酸重复为主。所
研究红松种子园子代属于中等多态性水平。本研究印证了利用红松转录组数据开发 SSR 标记的可行性,同时采用
荧光标记技术检测红松自由授粉子代材料,为红松种质资源的多样性水平分析及变异水平的研究提供基础。
关键词: 红松; 转录组; EST-SSR; 遗传多样性
中图分类号: S718. 46 文献标识码: A 文章编号: 1001 - 7488(2015)08 - 0114 - 07
Transcriptome Sequencing Analysis and Development of
EST-SSR Markers for Pinus koraiensis
Zhang Zhen1,2 Zhang Hanguo1 Mo Chi1 Zhang Lei1
(1 . State Key Laboratory of Tree Genetics and Breeding Northeast Forestry University Harbin 150040;
2 . Research Institute of Subtropical Forestry,CAF Hangzhou 311400)
Abstract: 【Objective】 In Korean pine ( Pinus koraiensis) breeding programs,lack of co-dominant genetic markers
constrained the development of molecular marker assisted breeding. At present,development of SSR markers based on
transcriptome data is still an economic and efficient development strategy of DNA molecular markers. In this study,we
used high-throughput sequencing technology to develop EST-SSR markers for Korean pine. Distribution patterns of the
markers in the transcriptome sequences and their characteristics were analyzed,in order to provide a basis for analysis of
SSR diversity and mutation of Korean pine. 【Method】A total of 1 757 SSR sites were identified from 41 476 unigenes in
Korean pine transcriptome by using SSR searching program. Statistical analyses were conducted for number,distribution
and characteristics of the SSR loci. And 101 pairs of SSR primers were designed and synthesized. Agarose electrophoresis
was used for initial check and polyacrylamide gel electrophoresis for separation and detection of the polymorphisms of
primers. Then amplification products were collected and sequenced for validation. Finally,16 pairs of SSR primers and 6
pairs of fluorescence primers were identified. To study the genetic variation,53 samples of open-pollinated progeny were
collected from four seed orchards respectively in Hegang,Linkou,Tieli and Weihe. 【Result】The distribution frequency
of EST-SSRs ( ratio of the number of SSRs to the total number of unigenes) was 4. 24%,based on the transcriptome
第 8 期 张 振等: 红松转录组 SSR 分析及 EST-SSR 标记开发
sequences. Mononucleotide dinucleotide and trinucleotide repeats were 46. 90%,17. 12% and 34. 66% of total SSR,
respectively. The SSR repeat number of SSR repeat units was between 5 and 24. Twenty-one pairs of primers showed
polymorphism among 101 pairs of primer,which accounting for 20. 8% of the total number of primer pairs. By sequencing
validation,16 pairs of primers amplified the target sequence. Eighteen alleles were tested from 6 pairs of fluorescence
primers. Polymorphic information content ( PIC) was 0. 036 3 - 0. 667 4 and the mean was 0. 325 0. 【Conclusion】
Korean pine has a relatively large genome in gymnosperms. The amplified primers of the polymorphism loci were mainly
dinucleotide and trinucleotide repeats. The progeny of the Korean pine seed orchard revealed a medium level of
polymorphism. This study demonstrated that using Korean pine transcriptome data to develop SSR markers was feasible.
The technique of using fluorescent markers to analyze the progeny materials provided a basis for studies of genetic diversity
and variation of the Korean pine germplasm resources.
Key words: Pinus koraiensis; transcriptome; EST-SSR; genetic diversity
红松(Pinus koraiensis)在我国主要分布于长白
山及其北部的张广才岭、老爷岭、完达山和小兴安岭
(马建路等,1992),既是优良的用材树种,也是珍贵
的食用干果和油料树种。红松为二倍体 (2n = 24)
裸子植物; 球果圆锥状卵形,花期 6 月,雌雄同株,
风媒传粉,球果生长期 2 年,于翌年 9—10 月成熟。
我国具有丰富的红松资源,自 20 世纪 80 年代开展
红松的遗传改良工作,在分布区内陆续营建初级种
子园、子代测定林及改良代种子园,但前期的遗传改
良工作主要依据表型选择,生长发育、生态习性等,
育种周期较长(张振等,2014; 施季森,2012)。遗
传标记手段在杂交育种、种质资源保存、新种质挖掘
等方面优势明显(Milee et al.,2008),在红松的育种
工作中围绕现代分子育种技术已开发出来的分子标
记,缺乏共显性的遗传标记,尚不能满足红松分子标
记辅助育种的需要。
鉴定试验材料的遗传多样性是研究物种起源进
化、发现新的基因资源、改良现有育种材料的基础工
作。随着高通量测序技术的发展,EST 数据不断增
加,不少研究者基于转录组或公共数据库挖掘 EST-
SSR,在品种鉴定及改良、资源分析、遗传图谱构建、
功能基因发掘等方面得到了广泛应用 ( Yi et al.,
2006; Portis et al.,2007; Zhang et al.,2013; 杨秀艳
等,2011)。简单序列重复( simple sequence repeats,
SSRs),又称为微卫星 DNA (microsatellite DNA),是
一类由 1 ~ 6 个核苷酸串联重复组成的 DNA 序列
(Kalia et al.,2011)。SSR 标记具有多态性高、重复
性好、共显性、易检测、操作简单等优点,在 DNA 指
纹图谱的构建、遗传多样性分析、基因定位、分子标
记辅助育种等方面得到广泛应用(罗冉等,2010)。
SSR 荧光标记毛细管电泳法是基于 DNA 测序仪为
平台的检测方法,具有高效自动化等技术优势,冯锦
霞等(2011)、李雄伟等(2013)、陈雅琼等(2011)、程
本义等(2011)分别于杨树 (Populus)、桃树 (Prunus
persica)、烟 草 ( Nicotiana tabacum )、水 稻 ( Oryza
sativa)中比较得出,在同一检测成本上,荧光标记技
术检测效率高于银染法,结果更为精确灵敏。SSR
标记主要包括基因组( gSSR)和表达序列标签 SSR
(EST-SSR)。表达序列标签直接反映基因的表达信
息,EST 数据来源于基因的转录区域,其多态性可能
与基因功能直接相关,因此,比 gSSR 标记具有更高
通用性(Eujayl et al.,2002; Nicolai et al.,2012)。本
实验室利用获得的红松转录组数据,开发 EST-SSR
标记,同时对其组成、分布及特征进行分析,进一步
开发出适用于红松的 SSR 标记,并以 4 个种子园的
53 个自由授粉子代为材料进行 EST-SSR 遗传变异
分析。
1 材料与方法
1. 1 材料 转录组测序样本为黑龙江省林口县青
山林场红松种子园内无性系‘LK15’与无性系
‘LK20’的针叶、嫩梢、雌花和球果,液氮速冻后送百
迈克基因公司(北京)进行全转录组的 Illumina 高通
量深度测序,共包含 41 476 条 Unigenes。
SSR 扩增用的 53 份红松样本分别来自 1979 年
于黑龙江省苇河、铁力、鹤岗和林口营建的嫁接种子
园(表 1),种子园亲本来源: 苇河青山为鹤北优树,
鹤岗为五营优树,林口青山为当地人工林优树,铁力
为五营优树。造林株行距为 4 m × 6 m,无性系错位
排列。每个无性系将采集后的球果晾干、制种,于
2013 年冬进行催芽处理。
511
林 业 科 学 51 卷
表 1 红松试验材料
Tab. 1 Pinus koraiensis accessions used in this study
种子园 Seed orchard 无性系编号 Clone No.
鹤岗 Hegang 1,10,12,14,17,2,21,23,39,41,43,44,49,6,8
林口 Linkou 11,13,15,16,18,19,20,24,26,27,3,32,6,79-36,8
铁力 Tieli 1024,1048,1061,1104,1112,1131,1185,1209,1357,1383,3083,3101
苇河 Weihe 008,019,028,042,056,063,065,067,071,117,162
1. 2 方法 1) 样本 DNA 提取 每个无性系选取 1
个无病虫害的单株嫩苗,采用世阳生物公司新型植
物基因组提取试剂盒提取红松基因组 DNA,用 1%
的琼脂糖凝胶电泳检测 DNA 的质量,- 20 ℃保存
备用。
2) 红松转录组 SSR 位点的鉴别及 SSR 引物设
计 对红松的针叶、嫩梢、雌花和球果的 41 476 条
Unigenes,利用 MISA 软件 (Guo et al.,2010)查找
SSR 位点。查找标准: 二、三、四、五、六核苷酸的最
小重复次数分别为 6,5,5,5,5 次。用 Primer5 软件
进行引物设计。
3) 引物筛选与 PCR 扩增 按照 SSR 引物设计
原则,对含 1 757 个 SSR 位点的 EST 序列进行引物设
计,舍去引物合成不理想的序列,最终合成 101 对
SSR 引物(北京鼎国昌盛生物技术公司),SSR 位点包
括 2 ~ 5 个核苷酸重复单元。PCR 反应体系为 25 μL:
模板 DNA ( 25 ng·μL - 1 ) 2. 0 μL,10 × PCR buffer
2. 5 μL,1 U Taq 酶 0. 5 μL,引物(10 μmol·L - 1 )各
0. 5 μL,dNTPs 0. 5 μL,ddH2O 18. 5 μL。PCR 扩增程
序: 95 ℃预变性 5 min; 95 ℃变性 30 s,最佳退火温
度30 s,72 ℃延伸 30 s,35 个循环; 72 ℃延伸 10 min。
每个种子园选用 1 个 DNA 模板对 101 对引物进行扩
增检验。PCR 产物首先采用 2%琼脂糖凝胶电泳进
行初步检测,舍去无扩增产物的引物,之后在 6%变
性聚丙烯酰胺凝胶上电泳分离检测。收集扩增产物,
送测序验证(上海生工生物工程有限公司)。选择出
扩增反应稳定、条带清晰、具有多态性位点的 6 对引
物,进而合成荧光标记引物。PCR 扩增后,取 1 μL
PCR 产物,加入 8. 5 μL 去离子甲酰胺、0. 5 μL
ROX-500 分子量内标,95 ℃变性 5 min,于4 ℃保温
10 min,3 000 r·min - 1 离心 1 min,于 ABI3730
DNA 分析仪上进行毛细管电泳,并收集数据。
4) 数据分析 用 GeneMapper 4. 0 软件对收集
的原始数据进行分析,系统将各峰值的位置与其泳
道中的 Rox-500 分子质量内标予以比较,读取 SSR
标记片段大小,按照大写英文字母顺序记录等位基
因,即同一位点最大的等位基因记为 A,其余等位基
因则依次记为 B,C,D 等,若只有 1 条峰值,则按照
纯合基因型处理。用 POPgene1. 31 软件(Yeh et al.,
1999; Nei,1973 ) 统计分析等位基因数 ( N a )、
Shannon 信息指数( I),利用 PowerMarkerV3. 25 软件
(Liu et al.,2005)计算多态性信息量(PIC)。
2 结果与分析
2. 1 红松转录组中 SSR 位点的数量与分布 从红
松转录组的 41 476 条 Unigene 序列中发现 1 757 个
SSR 位点,分布在 1 549 个 Unigene 中,发生频率(含
有 SSR 的 Unigene 数量与总 Unigene 数量之比) 为
3. 74%,其中,含 2 个及 2 个以上的 SSR 位点的
Unigene 序列有 56 条,1 493 条序列含 1 个 SSR 位
点,SSR 的分布频率( SSR 的个数与总 Unigene 的数
量比)为 4. 24%,红松转录组序列中平均 17. 38 kb
发现 1 个 SSR 位点。红松转录组中 SSR 种类包括
一至五核苷酸重复类型,主要集中在一至三核苷酸
重复类型上,占 SSR 总量的 98. 68% (表 2)。
红松转录组 SSR 位点的序列平均长度为 13. 94
bp,二、三、四、五核苷酸重复的平均长度分别为
11. 81,14. 34,16. 37,21. 11,20 bp。如图 1 所示,重
复序列长度 10 ~ 14 bp 最多,达到 52. 82%,其次为
15 ~ 18 bp(37. 56% ),19 ~ 22 bp(7. 63% ),> 23 bp
(1. 94% )。SSR 重复单元的重复次数分布在 5 ~ 24
次之 间,如 图 2 所 示,5 ~ 10 次 重 复 的 最 多,
占 75. 41%。
2. 2 红松转录组 SSR 分布特征 1 757 个 SSR 位
点共包含 31 种重复基元,其中,一、二、三、四、五核
苷酸重复基元分别有 4,4,10,9,4 种。从出现频率
来看,频率较高的前 5 种重复基元分别为 A /T,AT /
AT,AGC /CTG,AGG /CCT,AAG /CTT,分别占总 SSR
位点数的 46. 1%,10. 76%,7. 63%,6. 66%,6. 55%,
共占总 SSR 位点数的 77. 7%。
2. 3 EST-SSR 引物筛选与验证 参试的 101 对引
物中有 21 对引物扩增可检测出多态性位点,占引物
总数的 20. 8%。然后利用检测出多态性位点的 21
对引物,进行 PCR 扩增,收集扩增产物,测序验证。
通过测序验证表明,21 对引物扩增出的特异条带中
有 16 对引物(表 3)能够扩增出目标序列,成功率
为 76. 19%。
611
第 8 期 张 振等: 红松转录组 SSR 分析及 EST-SSR 标记开发
表 2 红松转录组中 SSR 重复单元的分布特征
Tab. 2 Distribution of the SSR motifs in Pinus koraiensis transcriptome
重复类型
Type of repeat
数目
Number
各类型比例
Proportion of
each type (% )
频率
Frequency
(% )
平均距离
Average
distance / kb
平均长度
Average
length / bp
主要重复单元
Main repeat
motif
单核苷酸
Mononucleotide
824 46. 90 1. 99 37. 07 11. 81 A /T,C /G
二核苷酸
Dinucleotide
302 17. 12 0. 73 101. 14 14. 34 AC /GT,AG /CT,AT /AT,CG /CG
三核苷酸
Trinucleotide
609 34. 66 1. 47 50. 16 16. 37
AAC /GTT, AAG /CTT, AAT /ATT,
ACC /GGT, ACG /CGT, ACT /AGT,
AGC /CTG, AGG /CCT, ATC /ATG,
CCG /CGG
四核苷酸
Tetranucleotide
18 1. 02 0. 04 1 696. 96 21. 11
AAAC /GTTT, AAAG /CTTT, AAAT /
ATTT, AAGC /CTTG, AAGG /CCTT,
AATC /ATTG, AATG /ATTC, ACTC /
AGTG,AGGC /CCTG
五核苷酸
Pentanucleotide
4 0. 23 0. 01 7 636. 31 20
AAAAC /GTTTT,AATTC /AATTG,
ACACT /AGTGT,AGCCC /CTGGG
总计 Total 1 757 100 4. 24 17. 38 13. 94
图 1 SSR 重复长度分布
Fig. 1 Distribution of the length of repeats in SSR loci
图 2 SSR 重复次数分布
Fig. 2 Distribution of the number of repeats in SSR loci
表 3 SSR 引物序列与重复类型
Tab. 3 SSR primer sequences and repeat types
引物编号 No. 引物序列 Primer sequence(5—3) SSR 类型 SSR motif Tm /℃
P11 F: TGAGAATGAGGCGAACTG R: GAAGGAAAGGTAAGGTGGA (CT) 9 53
P25 F: AAAGTTCACATTGGCACATC R: TCAGTCCAGCGACAACAG (CTC) 7 55
P44 F: TTTCGGTTCTCAGGCTCT R: CCCTGGTGGTACAATGAC (ATG) 5 acgatgaag(ATG) 6 53
P47 F: GTTTCCGAGATTCCCAGAC R: CAGTAGTAATATCCCGTTT (AT) 9 51
P49 F: GAGATGAGCGAATCTGGG R: TACAAGTTCCACCTACGG (AAG) 7 52
P60 F: AAACGCAGAGTGGAGGAA R: AACTCGGAGCATTTGGTG (CTG) 6 52
P62 F: AGTGGTCTACGCTGGAGT R: AACATTTAGGTCTTGGAGG (GCA) 7 51
P63 F: GCAGCAGATCAGAGGGAG R: CAGCCAACAACTGGTCATAC (CAG) 7 56
P67 F: TGAACGCACAGGCAAGTT R: GCGAAGGCAATGGTGAAA (ACAA) 5 52
P70 F: CAACATCGCCAATGACTC R: CCTACCTACGCTCTGCTC (CTCA) 6 54
P72 F: TGGGTTACCACCTTTAGC R: CAATCAGAGTCTGGAGCA (GCT) 6 52
P74 F: ACGCTACCGATTCTTACC R: GTGTTCGCCTACAACTCAT (GAA) 6 52
P79 F: CCACCGCCAAGTCCATTA R: GCTTTGTTAGCCGTCCAG (CAA) 7 55
P82 F: GGAAGATGAATCGCAAACC R: ACACCCGCCTGAAGAGCA (GCG) 6 54
P90 F: CCGCAAATCCGAGCAATG R: GCAGCAGACGATAATGAACCC (CCA) 7 56
P92 F: ACTTTGCGTGAATCAGACC R: AAAGTAAGGCTGCTTGCATGA (CAG) 7 53
2. 4 SSR 位点多态性检测 选取具有多态性的
6 对引物,合成荧光标记引物,对 53 个红松无性
系 DNA 进行 PCR 扩增,用以检测红松种子园无
性系的遗传多样性,图 3、图 4 为引物 P92、P79 分
别 扩 增 4 个 模 板 的 毛 细 管 电 泳 图。 采 用
GeneMapper4. 0 软件进行数据分析,53 个样本在
6 个 SSR 位点检测到的遗传变异见表 4,6 对引物
共检测到 18 个等位基因,平均每对引物检测到 3
711
林 业 科 学 51 卷
个等位基因,多态性信息量( PIC ) 为 0. 036 3 ~
0. 667 4,平均为 0. 325。根据 Botstein 等 ( 1980 )
的理论,有 2 个标记为低度多态位点( 0 < PIC <
0. 25),3 个标记为中度多态位点( 0. 25 < PIC <
0. 5),剩余 1 个为高度多态位点 ( PIC > 0. 5 ),
P63 位点 PIC 最高(0. 667 4)。
图 3 HG2,LK19,TL1048 和 WH056 的 P92 号 SSR 位点的基因型
Fig. 3 No. P92 SSR locus genotype of HG2,LK19,TL1048 and WH056
图 4 HG2,LK19,TL1048 和 WH056 的 P79 号 SSR 位点的基因型
Fig. 4 No. P79 SSR locus genotype of HG2,LK19,TL1048 and WH056
表 4 SSR 引物的扩增产物及其多态性分析
Tab. 4 The SSR primers amplified products and their polymorphism
SSR 引物
SSR primer
扩增片段大小
Size / bp
等位基因频率
Overall allele frequency
Shannon 信息指数
Shannon’s information index ( I)
多态性信息量 Polymorphism
information content(PIC)
P92 240 ~ 272 0. 084 9 ~ 0. 641 5 0. 848 8 0. 437 8
P60 140 ~ 242 0. 047 2 ~ 0. 792 5 0. 719 1 0. 332 9
P63 234 ~ 248 0. 037 7 ~ 0. 320 8 1. 367 3 0. 667 4
P74 134 ~ 139 0. 019 8 ~ 0. 980 2 0. 093 6 0. 036 3
P79 190 ~ 196 0. 217 0 ~ 0. 783 0 0. 523 1 0. 282 1
P90 234 ~ 238 0. 122 6 ~ 0. 877 4 0. 372 2 0. 192 0
平均 Mean 0. 654 0 0. 325 0
811
第 8 期 张 振等: 红松转录组 SSR 分析及 EST-SSR 标记开发
3 结论与讨论
红松属于基因组序列比较庞大的裸子植物,本
研究从红松 41 476 条 Unigene 序列发掘出 1 757 个
SSR 位点,平均 17. 38 kb 发现 1 个 SSR 位点,SSR
的分布频率(SSR 的个数与总 Unigene 的数量比)为
4. 24%,小于杨树(Populus) (14. 83% ) (张新叶等,
2009)、油茶(Camellia) (6. 7% ) (温强等,2013)等
树种,与火炬松(Pinus taeda) (4. 32% ) (林元震等,
2009)、马尾松(Pinus massoniana)(3. 62% )(刘公秉
等,2009)、日本落叶松 ( Larix kaempferi) (3. 85% )
(杨秀艳等,2011)相当。参试的 101 对引物中有
21 对引物扩增可检测出多态性位点,占引物总数的
20. 8%。在对不同树种的研究中,EST 中含有 SSR
重复序列的比例及类型有差异,本研究可扩增出多
态性位点的引物重复单元以二、三核苷酸重复为主。
由于密码子以三核苷酸为一个功能单位,因此,三核
苷酸位移对一个表达基因的阅读框不会造成太大影
响,所以在 EST 序列中发现三核苷酸重复的 SSR 类
型最多,在大多数物种中均以二核苷酸和三核苷酸
是最常见的转录组 SSR 重复单位类型(Varshoey et
al.,2002),本研究结果印证了这一点; 本研究以三
核苷酸重复较多,占 SSR 总数的 34. 66%,二核苷酸
重复占 SSR 总数的 17. 12%。同时验证了低级单元
SSR 的多态性普遍高于高级单元 ( Dreisigacker et
al.,2004)的推断,因此在设计 SSR 引物时应侧重于
含低级单元的序列。
开发出 6 对引物用于 53 个红松子代家系的多
态性检测分析,结果表明平均等位基因数为 3. 0,
Shannon 信息指数为 0. 654,多态性信息量( PIC)平
均值为 0. 325,检测基因多样性水平的结果与张悦
等(2013)研究红松微卫星标记相似。这些结果说
明基于红松转录组序列开发和筛选出的 EST-SSR
引物可用于红松育种资源的遗传多样性评价。
EST-SSR 在构建种质资源遗传多样性评价与保
护等研究中具有很大优势,但同时它也存在一定的
缺陷,由于 EST-SSR 来自相对保守的功能基因序
列,因此与 Genomic SSR 标记相比较,EST-SSR 标记
的多态性较低(Eujayl et al.,2001); SSR 分子标记
多态性是基于扩增片段中不同的微卫星重复数目产
生的,但对于长度相同而由不同碱基重复序列组成
的 SSR 或者长度相近的 SSR 不能有效加以区分。
随着公共数据库中不断增加的 EST 序列开发新的
EST-SSR 标记,及基于高通量测序技术更为有效地
获得 EST 序列,有助于增加多态性 SSR 引物的数
量,从而弥补 EST-SSR 标记本身多态性较低的问
题; 同时,结合其他分子标记如 AFLP,SNP 等进行
比较研究,可以提高试验的可靠性和准确性。本研
究采用 ABI3730 DNA 分析仪对6 对荧光 SSR 引物
所扩增的 PCR 产物进行毛细管电泳片段分析,克服
了聚丙烯酰胺凝胶电泳方法中人工估算片段大小所
造成的误差,试验结果更加客观。然而更多了解红
松资源之间的遗传信息和遗传关系,还需要使用更
多的 SSR 标记。本项研究印证了利用红松转录组
数据开发 SSR 标记的可行性,同时采用荧光标记技
术检测红松自由授粉子代材料,为红松种质资源遗
传多样性分析、分子标记辅助育种、遗传图谱构建和
功能基因的挖掘等奠定了基础。
参 考 文 献
陈雅琼,李凤霞,李锡坤,等 . 2011. 烟草 SSR 荧光标记与毛细管电泳
检测技术研究 .中国烟草科学,32(2) : 66 - 80.
(Chen Y Q,Li F X,Li X K,et al. 2011. Fluorescent detection and
capillary electrophoresis in tobacco SSR. Chinese Tobacco Science,
32(2) : 66 - 80.[in Chinese])
程本义,夏俊辉,龚俊义,等 . 2011. SSR 荧光标记毛细管电泳检测法
在水稻 DNA 指纹鉴定中的应用 . 中国水稻科学,25 ( 6 ) :
672 - 676.
(Chen B Y,Xia J H,Gong J Y,et al. 2011. Application of capillary
electrophoresis detection with fluorescent SSR makers in rice DNA
fingerprint identification. Chin J Rice Sci,25 (6 ) : 672 - 676.[in
Chinese])
冯锦霞,张川红,郑勇奇,等 . 2011. 利用荧光 SSR 标记鉴别杨树品
种 . 林业科学,47(6) :167 - 174.
(Feng J X,Zhang C H,Zheng Y Q,et al. 2011. Identification of poplar
varieties by SSR markers using capillary electrophoresis with
fluorescence detection. Scientia Silvae Sinicae,47(6) : 167 - 174.
[in Chinese])
李雄伟,孟宪桥,贾惠娟,等 . 2013. 桃品种特异性荧光 SSR 分子标
记数据库构建 . 果蔬学报,30(6) : 924 - 932.
( Li X W,Meng X Q,Jia H J,et al. 2013. Construction of peach
genotype database with fluorescent-labeled SSR markers. Journal of
Fruit Science,30(6) : 924 - 932. [in Chinese])
林元震,郭 海,刘纯鑫,等 . 2009. 火炬松热胁迫 cDNA 文库的 EST-
SSR 预测 . 华南农业大学学报,30(3) :41 - 44.
(Lin Y Z,Guo H,Liu C X,et al. 2009. EST-SSR prediction of heat
induced cDNA library of Pinus teada. Journal o f South China
Agricultural University,30(3) :41 - 44. [in Chinese])
刘公秉,季孔庶 . 2009. 基于松树 EST 序列的马尾松 SSR 引物开发 .
分子植物育种,7(4) : 833 - 838.
(Liu G B,Ji K S. 2009. Designing Pinus massoniana SSR primers from
Pinus EST sequences. Molecular Plant Breeding,7 ( 4 ) : 833 -
838. [in Chinese])
罗 冉,吴委林,张 旸,等 . 2010. SSR 分子标记在作物遗传育种中
的应用 .基因组学与应用生物学,29(1) : 137 - 143.
(Luo R,Wu W L,Zhang Y,et al. 2010. SSR marker and its application
911
林 业 科 学 51 卷
to crop genetics and breeding. Genomics and Applied Biology,29
(1) : 137 - 143.[in Chinese])
马建路,庄丽文,陈 动,等 . 1992. 红松的地理分布 . 东北林业大学
学报,20(5) : 40 - 47.
(Ma J L,Zhuang L W,Chen D,et al. 1992. Geographic distribution of
Pinus koraiensis in the world. Journal of Northeast Forestry
University,20(5) :40 - 47. [in Chinese])
施季森 . 2012. 林木生物技术育种未来 10 年若干科学问题 . 南京林
业大学学报:自然科学版,36(5) : 1 - 13.
( Shi J S. 2012. Prospection on some topics of forest genetic improvement
through modern biotechnology for the next-ten-years in China.
Journal of Nanjing Forestry University: Natural Science Edition,36
(5) : 1 - 13. [in Chinese])
温 强,徐林初,江香梅,等 . 2013. 基于 454 测序的油茶 DNA 序列
微卫星观察与分析 . 林业科学,49(8) : 43 - 50.
(Wen Q,Xu L C,Jiang X M,et al. 2013. Survey and analysis of
microsatellites from DNA sequences in Camellia species using 454
pyrosequencing. Scientia Silvae Sinicae,49 ( 8 ) : 43 - 50. [in
Chinese])
杨秀艳,孙晓梅,张守攻,等 . 2011. 日本落叶松 EST-SSR 标记开发
及二代优树遗传多样性分析 . 林业科学,47(11) :52 - 58.
(Yang X Y,Sun X M,Zhang S G,et al. 2011. Development of EST-SSR
markers and genetic diversity analysis of the second cycle elite
population in Larix kaempferi. Scientia Silvae Sinicae,47 ( 11 ) :
52 - 58.[in Chinese])
张新叶,宋丛文,张亚东,等 . 2009. 杨树 EST-SSR 标记的开发 . 林业
科学,45(9) :53 - 59.
(Zhang X Y,Song C W,Zhang Y D,et al. 2009. Development of EST-
SSR in Populus deltoides and P. euramericana. Scientia Silvae
Sinicae,45(9) :53 - 59. [in Chinese])
张 悦,易雪梅,姬兰柱 . 2013. 从松属相关物种筛选红松微卫星标
记及其种群遗传多样性分析 . 生态学杂志,32 ( 9 ) : 2307 -
2313.
(Zhang Y,Yi X M,Ji L Z. 2013. Screening of Pinus koraiensis
microsatellite makers from relative species of Pinus and analysis of
population genetic diversity. Chinese Journal of Ecology,32 ( 9 ) :
2307 - 2313. [in Chinese])
张 振,张含国,张 磊,等 . 2014. 铁力红松种子园无性系种子形
态及营养成分变异研究 . 植物研究,34 (3) : 356 - 363.
(Zhang Z,Zhang H G,Zhang L,et al. 2014. Variation in nutrition and
morphology characters of pine-nut in Korean pine (Pinus koraiensis)
seed orchard of Tieli. Bulletin of Botanical Research,34 ( 3 ) :
356 - 363.[in Chinese])
Botstein D,White R L,Skolnick M,et al. 1980. Construction of a genetic
linkage maps in man using restriction fragment length
polymorphisms. The American Journal of Human Genetics,32(3) :
314 - 331.
Dreisigacker S,Zhang P,Warburton M L,et al. 2004. SSR and pedigree
analyses of genetic diversity among CIMMYT wheat lines targeted to
different mega-environments. Crop Science,44(2) : 381 - 388.
Eujayl I,Sorrells M,Baum M,et al. 2001. Assessment of genotypic
variation among cultivated durum wheat based on EST-SSRs and
genomic SSRs. Euphytica,119(12) : 39 - 43.
Eujayl I,Sorrells M,Banm M,et al. 2002 . Isolation of EST-derived
microsatellite markers for genotyping the A and B genomes of wheat.
Theor Appl Genet,104(2) : 399 - 407.
Guo S,Zheng Y,Joung J G,et al. 2010. Transcriptome sequencing and
comparative analysis of cucumber flowers with different sex types.
BMC Genomic,11: 384 - 391.
Kalia R,Rai M,Kalia S,et al. 2011. Microsatellite markers: an overview
of the recent progress in plants. Euphytica,177(3) : 309 - 334.
Liu K J,Muse S V. 2005. Powermarker: Integrated analysis environment
for genetic marker data. Bioinformatics,21(9) : 2121 - 2129.
Milee A,Neeta S,Harish P. 2008. Advances in molecular marker
techniques and their applications in plant sciences. Plant Cell Rep,
27(4) : 617 - 631.
Nei M. 1973. Analysis of gene diversity in subdivided populations.
Proceedings of the National Academy of Sciences of the United States
of America,70(12) : 3321 - 3323.
Nicolai M,Pisani C,Bouchet J P,et al. 2012. Discovery of a large set of
SNP and SSR genetic markers by high-throughput sequencing of
pepper (Capsicum annuum) . Genetics and Molecular Research,11
(3) : 2295 - 2300.
Portis E,Nagy I,Sasvri Z,et al. 2007. The design of Capsicum spp. SSR
assays via analysis of in silico DNA sequence,and their potential
utility for genetic mapping. Plant Science,172(3) : 640 - 648.
Varshoey R K,Thiel T,Stein N,et al. 2002. In silico analysis on
frequency and distribution of microsatellites in ESTs of some cereal
species. Cell Mol Biol Lett,7(2A) : 537 - 546.
Yeh F C,Yang R C,Boyle T. 1999. POPGENE ( Version 1. 31 ) :
Microsoft Window-based freeware for population genetic analysis.
University of Alberta and the Centre for International Forestry
Research.
Yi G,Lee J M,Lee S,et al. 2006. Exploitation of pepper EST-SSRs and
an SSR-based linkage map. TAG Theoretical and Applied Genetics,
114(1) : 113 - 130.
Zhang Z,Zhang H G,Du J,et al. 2013. RAPD and SSR analysis of genetic
diversity of natural Larix gmelinii populations. Biotechnology &
Biotechnological Equipment,27(4) : 3959 - 3965.
(责任编辑 徐 红)
021