全 文 :坛紫菜 EST-SSR筛选及其在遗传多
样性分析中的实用性
杨 惠1 , 茅云翔1 , 孔凡娜1 , 王 莉1 , 严兴洪2
(1.中国海洋大学海洋生命学院海洋生物遗传与种质工程实验室 , 山东 青岛 266003;
2.上海海洋大学农业部水产种质资源与养殖生态重点开放实验室 , 上海 200090)
摘 要: 微卫星标记作为 1 种重要的分子标记 , 在分子标记辅助育种及遗传图谱构建中都起到重要的作用。 EST 文库
搜索法是获得微卫星标记的途径之一 , 本研究对坛紫菜 EST 数据库中 6 035 条序列进行搜索 , 发现 340 条 EST 包含 SSR
序列 ,其中三碱基重复最多 , 占总数 45.95%;其次是两碱基重复 ,占总数的 45.38%;再次是六碱基和五碱基 , 分别占总数
的 5.78%和 2.02%;四碱基最少 , 仅占总数的 0.87%。在两碱基中 AG , GA , TC , CT 类型数量最多 ,占所有两碱基 SSR 的
82.8%;在三碱基中 CCG , CGC , GCC , GGC , GCG , CGG类型数量最多 ,占所有三碱基 SSR的 52.83%;其它重复次数中 , 各
种类型所占比例相差不大。进一步比较坛紫菜与条斑紫菜 EST-SSR序列 , 发现 2 种紫菜 SSR类型及比例存在明显差异。
根据 EST-SSR序列设计合成了 10对引物 ,其中 4 个位点在 8 个不同来源坛紫菜叶状体间存在多态性 , 说明从坛紫菜 EST
中筛选的 SSR 标记可以用于进行坛紫菜遗传多样性分析。
关键词: 坛紫菜;微卫星序列;EST-SSR;多样性分析
中图法分类号: Q943.2 文献标识码: A 文章编号: 1672-5174(2009)02-265-06
坛紫菜(Porphyra haitanensis)是我国特有的海藻物
种 ,主要分布在我国浙江 、福建等南方海域。坛紫菜营
养丰富 、经济价值高 ,其养殖产业发展迅速 ,至2006年底
养殖面积近 1.7万 hm2 ,年产干品紫菜超过 4万 t ,产量
已占全国紫菜产量的 80%以上 。近年来 ,坛紫菜遗传育
种研究和良种选育日益受到重视[ 1] 。坛紫菜分子遗传
标记的筛选和开发 ,对其遗传多样性分析 、遗传连锁图
谱的构建及分子标记辅助育种将起到重要作用。
微卫星序列(microsatellite sequences),又称简单重
复序列(simple sequence repeats , SSRs),是指基因组中
由2 ~ 6个核苷酸基本单位重复多次构成的一段 DNA
序列 。微卫星标记具有共显性 、可靠性 、高信息量和高
多态性 ,广泛分布于基因组不同位置等特点 ,成为继
RFLP 之后的第二代分子标记[ 2] 。传统的开发 SSR标
记的方法是通过构建小片段基因组文库 ,然后与重复
序列探针进行杂交或用重复序列作为引物进行 PCR
扩增等方法进行筛选 ,这种方法耗时长 、操作烦琐 、资
金消耗大 。
表达序列标签(expressed sequence tag , ES T)是指
从不同组织来源的 cDNA文库中随机挑选克隆进行 5
或 3 端测序后得到的长约 150 ~ 500 bp的基因表达序
列片段 ,1条 EST 可代表 1个表达基因 。随着 EST 技
术的发展 ,公共数据库 dbEST 中的信息量与日俱增 ,
为从 EST 数据库中筛选 SSR标记提供了丰富的数据。
与文库筛选法相比 ,数据库搜索法可免费获得序列 ,省
略了建库等实验过程 ,大大节省了人力财力。截止到
2008年4月 ,在GenBank数据库中的坛紫菜 EST 数据
库中共有 6 035 条序列 ,本研究从坛紫菜 EST 数据库
中筛选微卫星序列 ,开发微卫星标记 ,并对不同来源的
坛紫菜进行了多样性分析。
1 材料方法
1.1 实验材料
表 1 不同来源的坛紫菜叶状体
Table 1 Summary of different source of P.haitanensis thallus
材料编号
Samples accession
来源
Source
状态
State
Ph-1 上海 1 野生
Ph-2 上海 2 栽培
Ph-3 上海 3 栽培
Ph-4 上海 4 栽培
Ph-5 宁波象山 1 野生
Ph-6 宁波象山 2 野生
Ph-7 宁波象山 3 野生
Ph-8 宁波象山 4 野生
通讯作者:E-mail:yxmao@ouc.edu.cn
基金项目:国家自然科学基金项目(30700621);国家高技术研究发展规划项目(2006AA10A402 , 2006AA10A413);教育部新世纪人才计划
(NCET-06-0596);教育部科学研究重点项目(107070);国家自然科技资源共享平台(2004DKA30470-016)资助
收稿日期:2008-08-04;修订日期:2008-09-25
作者简介:杨 惠(1982-),女 ,博士生 ,主要从事藻类分子遗传学方面研究。 E-mail:yanghui1124@t om.com
第 39卷 第 2期
2009年 3月
中 国 海 洋 大 学 学 报
PERIODICAL OF OCEAN UNIVERSIT Y OF CHINA
39(2):265~ 270
Mar., 2009
1.2 坛紫菜 ES T-SSR序列的筛选
从GenBank数据库(http://www .ncbi.nlm.nih.gov/
dbEST)下载坛紫菜 EST 序列 ,利用在线工具 SSRIT-
Simple Sequence Repeat Identification Tool(ht tp://www.
g ramene.org/db/searches/ ssrtool)和软件 SSRhunter 进行
微卫星序列筛选 ,原则为两碱基重复 7次以上(包括 7
次),三碱基重复 5次以上(包括 5次),四碱基重复 4次
以上(包括 4次),五碱基及六碱基重复 3次以上(包括 3
次)。
1.3 ES T-SSR引物的设计
选取 EST-SSRs中侧翼序列长度和 GC 含量合适
的序列 , 利用引物设计软件 Primer Premier 5.0 和
DNAStar设计引物 ,采用以下严谨度:1)引物长度为
18 ~ 25 mer;2)GC 含量 40%~ 60%;3)Tm 值>50
℃;4)预期 PCR产物长度为 100 ~ 300 bp。引物由上
海英骏公司(Invi trogen)合成 。
1.4 不同来源坛紫菜叶状体遗传多样性分析
坛紫菜配子体基因组 DNA 的提取参照 Wattier
等[ 3]方法并稍有改动 ,利用设计的引物对 8 个不同来
源的坛紫菜叶状体进行多样性分析(见表 1)。PCR反
应体系为 25 μL ,反应各成分终浓度为:1×PCR缓冲
液 ,dNTP 各 200 μmol/L , 1.2 mmol/L 的 Mg2+ ,微卫
星正向引物和反向引物各 0.2μmmol/ L ,模板 DNA 20
~ 40 ng , 1 U Taq DNA 聚合酶 ,用水补足到 25 μL。
PCR反应在 Thermo Elect ron公司的 P×2TM PCR仪上
进行 ,94 ℃预变性 5 min , 94 ℃变性 30 s ,退火 30 s ,退
火温度依引物而异 , 72 ℃延伸 50 s , 30个循环 ,最后 72
℃延伸5 min 。扩增产物在 3%琼脂糖凝胶上进行电泳
分离 ,EB染色。
2 结果与分析
2.1 坛紫菜 ES T 中微卫星序列数量和分布
截止到2008年 4月 ,在 GenBank中的坛紫菜 EST
数据库中共有 6 035条序列 ,对其微卫星序列进行搜索
发现 ,有 340条 EST 含有 SSR序列 ,其中 6条 EST 包
含 2种以上SSR类型。采用 Vector NTI Suite 8软件
中的 Contigexpress对所有 SSR-containing ES T 进行聚
类 ,270条 EST 可以归到 49个 Contig 中 ,另外 70条为
Sing leton ,其中 119个 unique gene(见表 2)。
对筛查到的 EST-SSR进行序列特征分析 ,发现三
碱基(Trinucleo tide)重复最多 ,占总数 45.95%;其次是
两碱基(Dinucleotide)重复 ,占总数的 45.38%;再次是
六碱基(Hexanucleo tide)和五碱基(Pentanucleo tide)重
复 ,分别占总数的 5.78%和 2.02%;四碱基(Tetranu-
cleo tide)重复最少 ,仅占总数的 0.87%(见表 3)。在两
碱基重复类型中 AG ,GA , TC ,CT 亚型的数量最多 ,达
130条 ,占该类型总数的 82.8%。在三碱基重复类型
中CCG , CGC , GCC ,GGC ,GCG , CGG 亚型最多 ,为 84
条 ,占该类型总数的 52.83%;而在其它重复次数中 ,各
种类型所占比例相差不大(见表 3)。
表 2 含有微卫星序列的 ES T 分析
Table 2 Characterization of EST containing simple sequence repeats
统计项目 I tem 数目 Number
数据库中 EST 总数 6 035
包含 SSR序列的 EST 数 340
EST 中 SS R序列总数 346
包含 2 种以上类型 SSR的 EST 数 6
归为 Contig中的 EST 数 270
归为 Singleton 的 ES T 数 70
Contig 总数 49
Unique Gene总数 119
2.2 坛紫菜与条斑紫菜的 EST-SSR的组成比较及特征
分析
对坛紫菜和条斑紫菜 EST 序列所含有的微卫星
序列进行比较后发现 ,坛紫菜 SSR类型中数量由多至
少为三碱基>两碱基>六碱基>五碱基>四碱基;在
条斑紫菜中则是三碱基>六碱基>五碱基>四碱基>
两碱基[ 4] 。2个物种中都是三碱基 SSR 类型数量最
多 ,分别占总 SSR数量的 45.9%和 73.13%;坛紫菜中
两碱基 SSR数量位居第二 ,占总数的 45.38%,条斑紫
菜中两碱基 SSR数量则最少 ,仅占总数的 4.65%(见
图1)。图 2(a ,b)中把 2种紫菜的两碱基和三碱基类型
中的各亚类占所属类型的百分比进行了比较 ,发现坛
紫菜各种亚类均有出现 ,但条斑紫菜并非包含各个亚
类。在坛紫菜所有 EST-SSR中 ,重复次数在 10 次以
上的有 168 条(多为两碱基重复), 占全部 EST-SSR
(346条)的 48.55%,占数据库中所有坛紫菜 EST 的
2.78%。在条斑紫菜中的22 070条EST 中 ,有1 162条
含有 SSR ,其中有 317条重复超过 10次 ,占总 EST 的
1.4%,比坛紫菜要少。
图 1 坛紫菜与条斑紫菜的 EST-SSRs 组成
F ig.1 The differences of EST-SSRs betw een
P.haitanensis and P.yezoensis
266 中 国 海 洋 大 学 学 报 2 0 0 9 年
表 3 坛紫菜 EST 中微卫星序列数量 、类型及分布
Table 3 Summary of quantity , type and distribution of P.haitanensis ES T containing simple sequence repeats
SSR类型
Type o f SSRs
基序
Motif
SSR数目
Number of SSRs
SSR亚类数目
Subtotal of SSRs
频率 1*
Frequency 1/ %
频率 2*
Frequency 2/ %
两碱基
Dinucleotide
GC , CG
AT , TA
AC , CA , TG , GT
AG , GA , TC , CT
15
1
11
130
157
9.55
0.64
7.01
82.80
45.38
三碱基
T rinucleo tide
AAG , AGA , GAA , TTC , TCT , CTT
AAC , ACA , CAA , TTG , TGT , GTT
AAT , ATA , TAA , TTA , TAT , ATT
CCA , CAC , ACC-GGT , GTG , TGG
GAG , AGG , GGA , CTC , TCC , CCT
CTA , TAC , ACT , AGT , GTA , TAG
ATG , TGA , GAT , ATC , TCA , CAT
ACG , CGA , GAC , GTC , TCG , CGT
CCG , CGC , GCC , GGC , GCG , CGG
CAG , AGC , GCA , TGC , GCT , CTG
7
1
34
2
4
1
2
7
84
17
159
4.40
0.63
21.38
1.26
0.63
1.26
4.40
52.83
10.69
45.95
四碱基
Tetranucleo tide
TAAA , TTTA 3 3 100.00 0.87
五碱基
Pentanucleotide
ATCGA
CGCGG
GTCGT
TGC TG
TT TGG
CCTCC/GGAGG
1
1
1
1
1
2
7
14.29
14.29
14.29
14.29
14.29
28.57
2.02
六碱基
Hexanucleotide
AGCAAG
CGACCC
CGTGGC
GAAAAA
GACTCG
GAGGAC
GCCT TC
GCGCCG
GCGGCA
GCGGTC
GCGTCG
GCGT TT
GCTCCC
GGGCGA
GGTGGG
TCCCCC
TGTTCC
1
1
1
1
3
1
1
1
1
2
1
1
1
1
1
1
1
20
5.00
5.00
5.00
5.00
15.00
5.00
5.00
5.00
5.00
10.00
5.00
5.00
5.00
5.00
5.00
5.00
5.00
5.78
总计 Total 346 346
*注:频率 1表示每种重复序列的数量占所属重复类型的百分比;频率 2表示每种重复类型的数量占全部 EST-SSR的百分比
Note:Frquency 1 indicates the percentage of each motif in it s own SSR type;Frequency 2 indicates the percentage of each SSR type in all EST-SSR
2.3 ES T-SSR标记开发及实用性分析
按照引物设计原则挑选 10 条含有微卫星序列的
EST 序列 ,分别设计 EST-SSR引物对 ,编号为:PHE1
~ PHE10 ,其中 9对能扩增出目的条带 ,利用合成的引
物对 8个不同地理来源的坛紫菜叶状体进行了多样性
分析 ,其中 4个位点在不同叶状体间存在多样性 ,各产
生 2个等位基因 ,共获得 8个等位基因(见图 3)。
2672期 杨 惠 ,等:坛紫菜 EST-SSR筛选及其在遗传多样性分析中的实用性
图 2 坛紫菜与条斑紫菜的 ES T-SSR亚类组成比较
Fig.2 Comparison of subtype of SSRs between P.haitanensis and P.yezoensis
图 3 引物 PHE5(a), PHE6(b), PHE7(c), PHE9(d)对坛紫菜的多样性分析
Fig.3 Polymo rphic analysis using primer PHE5(a), PHE6(b), PHE7(c), PHE9(d)
坛紫菜作为遗传分析材料有其特殊性 。坛紫菜生
活史分为孢子体(丝状体 2 n)和配子体(叶状体 n)2个
世代。本文所采用的实验材料为坛紫菜叶状体 ,它是
由 1个合子经过减数分裂发育成四细胞藻体 ,即四分
子 ,再经有丝分裂发育成叶状单倍嵌合体[ 5] 。这个嵌
合体相当于 1 个细胞发育来的 4 个未分离的单倍体 ,
因此 1个坛紫菜个体可以扩增出 1 ~ 2 个等位基因。
本研究目的在于检测所开发的 SSR引物是否能够检测
不同材料的基因型差异 ,通过 3%琼脂糖可以看出带型
差别 ,证明所开发的 EST-SSR引物是可以用于坛紫菜
遗传多样性分析。
表 4 多态性 SSR标记及引物信息
Table 4 Characterization of four polymorphic SSR primers in P.haitanensis
SSR位点
Locus
核心序列
Motif
引物序列
Primer sequence
(F:fo rward;R:reverse)
预期扩增长度/bp
Expected length
Tm/ ℃
PHE5 (ACA)10AT(AAC)13 F CTACTACGGCTACAAGGAGG
R CGT TGCCGAACTTGTCCT 164 59
PHE6 (CAA)8T(AAC)14 F CGCTCAACCAGGTGTCT
R CAGAACTTGCGGTCCTT 205 59
PHE7 (ACA)18AT(AAC)7 F ACCCACGCTCCCTAC TCAA
R GCGGCTGACGTAGTGGTTCT 285 55
PHE9 (GGC)7GGT(GGC)3 F TAACTTCCGTGCCCTTGG
R GGCTTGTTGTCCTTTTGG 292 55
3 讨论
从表达序列标签数据库筛查含有重复序列的
ES T ,然后开发微卫星标记 ,可以充分利用已有资源 ,
实现资源共享 ,是 1种简单快捷的方法 。但利用该方
法开发微卫星标记能否成功主要取决于 3方面因素:
一是该物种 ES T 数据库的规模;二是 EST 数据本身的
268 中 国 海 洋 大 学 学 报 2 0 0 9 年
质量;三是物种的特异性。目前 GenBank 的坛紫菜
EST 数据库中有 6 035 条 EST 序列 , 与条斑紫菜近
20 000多条 EST 相比 ,坛紫菜 EST 数量相对较少 ,信
息量比较有限 ,但已为微卫星标记的开发提供了基础。
EST 数据本身的质量 ,如序列的位置和长度 ,也影响到
是否能够成功开发微卫星标记 。对拟南芥和水稻的 5
非翻译区 、3 非翻译区 、外显子和内含子区的微卫星序
列出现的频率进行比较后发现 , 5 非翻译区 SSR的密
度要明显高于其它区[ 6] ,因此通过构建全长 cDNA 文
库 ,测序获得长片段的 5 EST 有助于提高标记开发效
率。另外 ,研究发现不同物种 EST-SSR分布的频率差
异很大 ,例如水稻 EST 序列中平均每 3.4 kb出现 1个
SSR;大麦 EST 中每 6.3 kb 有 1个 SSR;棉花 EST 中
出现的频率则较低 ,每 20 kb序列中才有 1个 SSR分
布[ 7] 。
微卫星标记被广泛地应用于种间遗传多样性的分
析 ,本研究通过比较坛紫菜与条斑紫菜 EST-SSR ,发现
在碱基重复类型和各亚型的数量和比例上两者存在很
大不同 。一方面可能反映出坛紫菜基因组组成与条斑
紫菜有很大差异;另一方面由于坛紫菜 ES T 数量较
少 ,可能也不足以反映其全部基因组的真实情况 ,但可
以从一定侧面反映出其组成特点上的差异 。一般认为
在 EST 中的重复序列比较短[ 8] ,在坛紫菜 dbEST 中的
EST-SSR重复次数在 10次以上的有 168条(多为两碱
基重复),占全部 EST-SSR(346条)的 48.55%,占数据
库中现有所有坛紫菜 EST 的 2.78%;而在条斑紫菜中
的22 070条EST 中 ,有 1 162条含有SSRs ,其中有 317
条重复超过 10次 ,占总 ES T 的 1.4%;另外在番茄中
研究发现数据库中的 27 000条 EST 中 ,有 250条含有
SSRs ,其中有 55条 SSRs重复 10次以上 ,占总 EST 的
0.2%[ 9] ;可见坛紫菜 ES T 序列中 SSR的重复序列相
对较长。
有研究认为来自基因转录区域的 SSR标记 ,它们
有更高的保守性和可转移比率[ 10] ,但另一方面 , EST-
SSR的保守性也会限制标记的多态性[ 11] 。本研究利
用 10对坛紫菜 EST-SSR引物进行多态性分析发现有
4对能扩增出多态性条带 ,说明从坛紫菜 EST 中筛选
的 SSR序列可以用于不同来源坛紫菜的多态性分析等
研究 。大量标记的开发将为坛紫菜分子标记辅助育种
及分子标记遗传连锁图谱的构建打下良好的基础 。
参考文献:
[ 1] 严兴洪 , 马少玉.坛紫菜抗高温品系的筛选 [ J] .水产学报 ,
2007 , 31(1):112-119.
[ 2] 白玉.DNA分子标记技术及其应用 [ J] .安徽农业科学 , 2007 , 35
(24):7422-7424.
[ 3] Wattier R A , Prodohl P A , Maggs C A.DNA isolat ion protocol for
red seaw eed(Rhodophyta)[ J] .Plant Molecular Biology Reporter ,
2000 , 18:275-281.
[ 4] 张学成 , 秦松 , 马家海 , 等.海藻遗传学 [ M] .北京:中国农业出
版社 , 2005.218-223.
[ 5] Wang M Q , Hu J J , Zhuang Y Y , et al.In sili co screening for mi-
crosatelli te markers from expressed sequence tag of Porphy ra yezoensi s
(Bangiales , Rhodophyta)[ J] .Jou rnal of Ocean University of China ,
2007 , 6(2):161-166.
[ 6] Law son M J , Zhang L Q.Dist inct pat terns of S SR dist ribution in the
Arabidopsis thal iana and rice genomes [ J] .Genome Biol, 2006 , 7
(2):R14.
[ 7] 李永强 , 李宏伟 , 高丽锋 , 等.基于表达序列标签的微卫星标记
(EST-SSRs)研究进展 [ J] .植物遗传资源学报 , 2004 , 5(1):91-
95.
[ 8] 谢皓 , 陈学珍 , 杨柳 , 等.EST-SSR标记的发展和在植物遗传研
究中的应用 [ J] .北京农学院学报 , 2005 , 20(4):73-76.
[ 9] Aresh chenkova T , Ganal M.Comparat ive analysis of polymorphism
and chromosomal location of tomato microsatellit e markers isolated
f rom dif ferent sources [ J] .Theor Appl Genet , 2002 , 104:229-235.
[ 10] S cott K D , Eggler P , S eaton G , et al.Analysi s of S SRs derived
from grape EST [ J] .Theor Appl Genet , 2000 , 100:723-726.
[ 11] Morgante M , Hanafey M , Pow ell W.Microsatellites are preferen-
tially associated w ith nonrepet itive DNA in plant genomes [ J] .Nat
Genet , 2000 , 30:194-200.
2692期 杨 惠 ,等:坛紫菜 EST-SSR筛选及其在遗传多样性分析中的实用性
Development and Practicability of EST-SSRMarkers in Porphyra haitanensis
YANG Hui1 , MAO Yun-Xiang 1 , KONG Fan-Na1 , WANG Li1 , YAN Xing-Hong2
(1.Labo rato ry of Marine Genetics and Breeding , Colleg e of Marine Life Science , Ocean University of China , Qingdao 266003 ,
China;2.Ministry of Ag riculture Key Labo rato ry of Aquatic Genetic Resources and Aquacultural Ecosystem , Shanghai Ocean Uni-
versity , Shanghai 200090 , China)
Abstract: Simple sequence repeats(SSRs)or microsatelli tes are important molecular markers , which have
been applied to marker-assisted selection and construction of genetic mapping.Microsatellite markers can be de-
veloped from expressed sequence tag(EST)in public databases di rectly.In this paper we analyzed 6 035 EST
sequences of the Porphyra hai tanensis dbEST from NCBI database , in w hich 340 EST w ere found to contain
SSRs.The length of repeat motif s ranged from 2 bp to 6 bp , among which t rinucleotide and dinucleotide repeat
mo tifs w ere most common w ith abundance of 45.95% and 45.38%, respectively;follow ed by hexanucleotide
and pentanucleotide(respectively 5.81% and 2.03%)and tet ranucleotide(0.87%).AG , GA , TC , CT uni ts
w ere found to be the most abundant in dinucleotide(82.8%), so did CCG , CGC , GCC , GGC , GCG , CGG u-
ni ts in t rinucleotide(52.83%), how ever there were no significant differences among other types.Furthermore ,
EST-SSRs from P .yezoensis were compared to that of P.haitanensis and the dif ference existed not only in
SSR types but also in quantity of repeat motifs.Ten ES T-SSR primers were designed to analy ze the genet ic
polymo rphisms of eight different sources thallus and four loci showed polymorphisms , which indicated that
SSRs from P.haitanensis dbEST are feasible in polymorphism analy sis.
Key words: Porphyra haitanensis;microsatellite sequence;ES T-SSRs;polymorphism analy sis
责任编辑 于 卫
270 中 国 海 洋 大 学 学 报 2 0 0 9 年