免费文献传递   相关文献

Characterization of Micorsatellites in Tea (Camellia sinensis) Floral Transcriptome

茶树花转录组微卫星分布特征


利用Perl语言,对茶树花转录组序列进行大通量SSR位点的发掘,发现含SSRs的序列10 290, 12 582SSRs,平均2.41 kb出现一个SSR。在茶树花的转录组中共发现340种碱基重复模式,所占比例最高的是(AG/CT)n (44.99%)。在49 586条注释成功的茶树花Unigene中,共发现10 490SSR位点,其中位于编码区的1917个,其出现频率仅为0.102 SSR/1000 bp,而非编码区为3.072 SSR/1000 bp。在基因编码区中出现频率最高的是三碱基微卫星(1140 59.5%),其次是六碱基微卫星(524, 27.3%)。茶树花转录组所含微卫星以重复长度小于20 bp的序列最多,大于20 bp的仅为25.22%。茶树花转录组中,含微卫星基因的平均表达水平显著低于不含微卫星基因,其中含复杂微卫星基因的平均基因表达水平最低。


全 文 :作物学报 ACTA AGRONOMICA SINICA 2014, 40(1): 80−85 http://zwxb.chinacrops.org/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn

本研究由国家现代农业产业技术体系建设专项(nycytx-23), 浙江省自然科学基金项目(LY13C160004)和浙江省茶产业技术创新战略联
盟项目资助。
* 通讯作者(Corresponding author): 成浩, E-mail: chenghao@mail.tricaas.com
第一作者联系方式: E-mail: wangly@mail.tricaas.com
Received(收稿日期): 2013-05-21; Accepted(接受日期): 2013-07-25; Published online(网络出版日期): 2013-09-29.
URL: http://www.cnki.net/kcms/detail/11.1809.S.20130929.1538.014.html
DOI: 10.3724/SP.J.1006.2014.00080
茶树花转录组微卫星分布特征
王丽鸳 韦 康 张成才 成 浩*
中国农业科学院茶叶研究所 / 国家茶树改良中心, 浙江杭州 310008
摘 要: 利用 Perl语言, 对茶树花转录组序列进行大通量 SSR位点的发掘, 发现含 SSR的序列 10 290条, 共 12 582
个 SSR, 平均 2.41 kb出现一个 SSR。在茶树花的转录组中共发现 340种碱基重复模式, 所占比例最高的是(AG/CT)n
(44.99%)。在 49 586条注释成功的茶树花 Unigene中, 共发现 10 490个 SSR位点, 其中位于编码区的 1917个, 其出
现频率仅为 0.102 SSR/1000 bp, 而非编码区为 3.072 SSR/1000 bp。在基因编码区中出现频率最高的是三碱基微卫星
(1140, 59.5%), 其次是六碱基微卫星(524, 27.3%)。茶树花转录组所含微卫星以重复长度小于 20 bp的序列最多, 大于
20 bp的仅为 25.2%。茶树花转录组中, 含微卫星基因的平均表达水平显著低于不含微卫星基因, 其中含复杂微卫星
基因的平均基因表达水平最低。
关键词: 茶树; 微卫星; 花; 转录组
Characterization of Micorsatellites in Tea (Camellia sinensis) Floral Transcriptome
WANG Li-Yuan, WEI Kang, ZHANG Cheng-Cai, and CHENG Hao*
Tea Research Institute, Chinese Academy of Agricultural Sciences / National Center for Tea Improvement, Hangzhou 310008, China
Abstract: The microsatellites or simple sequence repeats (SSRs) in Camellia sinensis floral transcriptome were characterized. A
total of 12 582 SSRs were identified in 10 290 unigenes, with one SSR per 2.41 kb. Among all 340 SSR motifs, (AG/CT)n was the
most frequent repeat motif (44.99%). A total of 10 409 SSRs occurred in 49586 unigenes with Blast matches to annotated proteins
in four databases, only 1917 of which occurred in protein-coding regions of these sequences. The density of SSRs was much
higher in non-coding regions than in coding regions (0.102 SSRs per 1000 base pairs in coding regions vs. 3.072 in non-coding
regions). In the six repeat motifs, tri-nucleotide repeats were the most abundant in coding regions (1140), followed by
hexa-nucleotide (524) repeats. The microsatellites with length below 20 bp were in maximum proportion, while the microsatellites
over 20 bp were only 25.22%. The expression level of genes containing microsatellites was significantly lower than that not con-
taining microsatellites. The overall expression levels of genes containing compound microsatellites were lowest.
Keywords: Camellia sinensis, Microsatellites; Flower; Transcriptome
微卫星(microsatellite)又称SSR (simple sequence
repeat, 简单重复序列), 是真核生物基因组中的高度
重复序列, 是由少数几个核苷酸组成的串联重复序
列[1]。具有高多态性、多等位性、共显性、高可重复
性、数量丰富和对基因组有很好覆盖性等特点[2], 已
成为不同物种遗传研究中使用最广泛的分子标记。
在真核生物基因组中, 微卫星通常出现于内含
子和基因间隔区, 但也出现在DNA编码区。由于微
卫星序列容易发生变异, 编码区中微卫星突变会导
致基因表达产物的改变, 在选择作用下, 编码区微
卫星发生频率比其他基因组区域低。如杨树基因组
中编码区微卫星的发生频率仅为非编码区的1/3, 以
三碱基重复微卫星高度富集, 而非编码区中, 微卫
星则以二碱基重复为主[3]。
有关茶树微卫星分布特征研究, 之前主要针对
通过Sanger测序获得的NCBI公共数据库中茶树EST
序列的微卫星分布情况, 不仅序列数量少, 而且主
要来源于营养器官(主要是叶和根)[4-6]。2011年, 杨
第 1期 王丽鸳等: 茶树花转录组微卫星分布特征 81


华等 [7]利用高通量测序获得的127 094条Unigenes,
分析了茶树转录组中SSR位点情况。但是有关茶树
基因编码区与非编码区中微卫星密度、微卫星分布
情况的差异, 还未见报道。
本研究对通过Illumina转录组测序(RNA-Seq)获
得的75 331条茶树花转录组序列, 进行微卫星位点
的搜索, 并对找出的微卫星重复序列进行分析, 比
较转录组序列中基因编码区和基因非编码区中微卫
星的发生频率和组成差异, 了解茶树花转录组序列
所含微卫星重复序列的特征和组成情况, 比较分析
含有微卫星基因和不含有微卫星基因的总体表达水
平, 并明确前者是否偏低。本研究可为茶树基因表
达调控研究、微卫星标记开发、茶树基因组遗传进
化提供研究基础。
1 材料与方法
1.1 材料及数据来源
10月下旬到11月中旬, 于下午采集福鼎大白茶
大蕾期的花朵和雌蕊组织 , 经液氮瞬时冷冻后于
–86℃低温保存备用。
从福鼎大白茶的雌蕊、花瓣和雄蕊3部分提取的
mRNA, 等量混合后 , 进行Illumina转录组测序 , 共
得到26 874 116个clean reads, 其测序碱基数量为
2.418 Gbp, 拼接获得的茶树Unigene 75331个。茶树
花的转录组平均测序深度(Depth, 等于reads碱基数
/Unigene序列长度 )为 23.45, 测序平均覆盖度
(Coverage, 等于Unigene中有 reads覆盖的碱基数
/Unigene序列长度)为0.895。测序原始数据已经上传
至美国国家生物技术信息中心(National Center for
Biotechnology Information, NCBI) 的Short Read Ar-
chive (http://www.ncbi.nlm.nih.gov/sra/), 登录号为
SRA053025。长度大于200 bp组装序列已经上传至
NCBI, 登录号为GAAC01000001-GAAC01052919。
1.2 基于 perl 语言的简单重复序列(SSR)分析
搜索
利用Perl操作平台下的MISA软件(MISA-Micro
SAtellite identification tool, MISA) (http:// pgrc.ipk-
gatersleben.de/misa/)在Unigene中搜索SSR位点 , 设
置单核苷酸、二核苷酸、三核苷酸、四核苷酸、五
核苷酸和六核苷酸最少重复次数分别为15、6、5、4、
4和3。复合SSR两个位点间最大间隔碱基数(Maximal
number of bases interrupting 2 SSRs in a compound
microsatellite)∶100。
1.3 基因表达量计算方法
使用RPKM法(Reads Per kb per Million reads)[8],
RPKM = (1 000 000 × C)/(N × L × 1000)。设RPKM为
Unigene A的表达量, 则C为比对到Unigene A的reads
数, N为比对到所有Unigene的总reads数, L为Unigene
A的碱基数。RPKM法能消除基因长度和测序量差异
对计算基因表达的影响, 计算得到的基因表达量可
直接用于比较不同样品间的基因表达差异。
1.4 编码蛋白框预测
下载Windows下使用的32位版的本地比对软件
blast-2.2.23-ia32-win32.exe (ftp://ftp.ncbi.nlm.nih.gov/
blast/executables/release/LATEST/blast-x.x.x-ia32-wi
n32.exe), 并按照操作说明安装。再通过本地化的
Blast比对 , 将茶树花的Unigene序列与蛋白数据库
nr、Swiss-Prot、KEGG和COG做BlastX比对, 比对参
数为E-value<0.00001, 取比对结果最好的蛋白作为
Unigene的序列方向。如果不同库之间的比对结果有
矛盾, 则按nr、Swiss-Prot、KEGG和COG的优先级
确定Unigene的序列方向; 对于跟以上4个库皆比不
上的Unigene, 用软件ESTScan[9]预测其编码区并确
定序列的方向。
2 结果与分析
2.1 茶树花转录组序列中 SSR重复基元分布
利 用 Perl 操 作 平 台 下 的 MISA 软 件 (Micro
SAtellite Identification Tool) (http://pgrc.ipkgatersle
ben.de/misa/), 分析75 531条茶树(Camellia sinensis)
花Unigene序列的SSRs特征 , 序列拼接总长度为
30 326 kb, 含不同重复基元SSRs的序列有10 290条,
共12 582个SSRs, 包含SSR的一致序列出现频率为
16.66%, SSR的出现频率为0.415 SSR/1 kb, 平均相
隔2.41 kb出现一个SSR序列。SSR序列总长度约为
278.55 kb (0.92%), 说明在茶树花转录组中SSR序列
约占整个转录组序列的百分之一。
在12 582个SSR中共有340种重复基元(motif)。
其中, 单、二、三、四、五和六碱基重复基元出现频
率最多的分别是(A/T) n、(AG/CT) n、(AAG/CTT) n、
(AAAG/CTTT) n、 (AAAAT/ATTTT) n和 (AAAAAC/
GTTTTT) n。它们在各自重复基元类型中的比例分别
是92.24%、85.60%、27.35%、21.61%、20.55%和
4.71%。在所有类型的重复基元中, 二核苷酸重复基
元出现的频率最高, 为52.52%, 其次分别为三、六、
一、四和五核苷酸重复基元(表1), 与之前的研究结
果一致[4-7]。
82 作 物 学 报 第 40卷


表 1 茶树花转录中不同微卫星重复基元(motif)出现的频率
Table 1 Occurrence frequency of different microsatellites motifs of C. sinensis floral transcriptome
重复基元类型
Repeat type
数量
Number
频率
Frequency (%)
最多的重复基元(数量和百分比)
Maximum repeat motif (number and percentage)
单核苷酸 Nucleotide 825 6.56 A/T (761, 92.24%)
二核苷酸 Binucleotide repeat 6611 52.54 AG/CT (5661, 85.60%)
三核苷酸 Trinucleotide repeat 2848 22.64 AAG/CTT (779, 27.35 %)
四核苷酸 Tetranucleotide repeat 393 3.12 AAAT/ATTT (85, 21.63%)
五核苷酸 Pentanucleotide repeat 292 2.32 AAAAG/CTTTT (60, 20.55%)
六核苷酸 Hexnucleotide repeat 1613 12.82 AAAAAC/GTTTTT (76, 4.71%)

在发现的340种碱基重复模式中 , 所占比例最
高的是 (AG/CT)n (44.99%), 其次是 (AAG/CTT)n
(6.19%)、 (A/T)n (6.05%)和 (ACC/GGT)n (4.12%)、
(AT/TA)n (4.12%)等。不同类型重复基元的SSRs分布
见图 1。还发现少量的 (CG/GC)的二核苷酸重复
(0.08%)。

图 1 基于重复基元(motif)类型的微卫星分布(考虑到碱基互补
作用)
Fig. 1 Microsatellites distribution on different repeat motifs
(considering sequence complementary)
Other motifs 表示频率小于 0.50%的重复基元类型。
Other motifs denote the repeat motifs with frequency below 0.50%.
2.2 微卫星在茶树花转录组编码区中的分布特征
茶树花转录组中, 有49 586条茶树unigene序列
功能注释成功 , 序列总长度为21 628 894 bp, 其中
蛋白编码区 (CDS)序列长度为 18 864 363 bp, 占
87.22%。在49 586条注释成功的茶树Unigene中, 共
发现10 490个SSR位点, 其中位于编码区的SSR位点
数仅为1917个。在茶树花转录组的基因编码区 ,
SSR的出现频率仅为0.102 SSR/1 kb, 而在非编码区,
为3.072 SSR/1 kb。这说明非编码区微卫星出现频率
是编码区的数十倍。在基因编码区中出现频率最高
的是三碱基重复类型的微卫星(1140, 59.5%), 其次
是六碱基重复(524, 27.3%)。而SSR位点在茶树花转
录组的非蛋白编码区中以二碱基重复为主 (5068,
47.52%), 其次是三碱基重复(1414,13.26%)。
2.3 茶树花转录组序列中微卫星的长度分布
茶树花转录组中所发现的12 582个微卫星长度
存在极显著变异, 从10~90个碱基不等, 平均长度为
16.8个碱基(单碱基重复10次以上的结果)。如图2显
示, 茶树微卫星以重复长度小于20 bp的短重复序列
最多, 长度大于20 bp的长序列重复仅占微卫星总数
的25.22%。进而, 利用SPSS软件进行Person相关性

表 2 茶树花转录组中蛋白编码区和非编码区中微卫星的分布频率
Table 2 Occurrence frequency of microsatellites in protein coding regions and non-coding regions in C. sinensis floral transcriptome
编码区 Protein-coding region 非编码区 Non-coding region 重复基元类型
Unit size 微卫星数量
Number of microsatellites
百分比
Percentage (%)
微卫星数量
Number of microsatellites
百分比
Percentage (%)
单核苷酸 Nucleotides repeat 33 1.72 756 7.09
二核苷酸 Binucleotide repeat 209 10.90 5068 47.52
三核苷酸 Trinucleotide repeat 1140 59.47 1414 13.26
四核苷酸 Tetranucleotide repeat 10 0.52 225 2.11
五核苷酸 Pentanucleotide repeat 1 0.05 209 1.96
六核苷酸 Hexnucleotide repeat 524 27.33 820 7.69
总计 Total 1917 8492
SSR出现频率 Density of SSR (per 1000 bp) 0.102 3.072
第 1期 王丽鸳等: 茶树花转录组微卫星分布特征 83



图 2 茶树花转录组中微卫星的长度分布
Fig. 2 Length distribution of microsatellites in C. sinensis
floral transcriptome

分析, 表明茶树微卫星的出现频率和微卫星的长度
呈极显著负相关, 相关系数为–0.582。
图3表明, 茶树SSR数量随着重复次数增加呈明
显下降趋势, 而且碱基重复次数越少, SSR数量下降
的速率就越快。仅当二碱基重复从10次增加到11次
时, 茶树SSR数量出现了增加的情况。单碱基重复次
数达到25次、二碱基重复次数达到15、其他碱基重
复次数达到10的时候, SSR的下降速率降低, 进入平
台期。


图 3 茶树花转录组中 SSR数量随重复次数的变化曲线
Fig. 3 Influence of repeat times on number of microsatellites
in C. sinensis floral transcriptome
Others表示三、四、五、六碱基重复 SSR的总和。
Others denote the total number of Tri-, Tetra-, Penta-, and
Hex- nucleotides repeats.

2.4 茶树花转录组中 SSR 序列对基因表达水平
的影响
茶树75 331条花转录组的序列中 , 含微卫星的
表达序列占序列总数的比例为13.66%。为了研究微
卫星对基因表达水平的影响, 将10 290条含微卫星
的基因的平均RPKM值与65 241条不含微卫星基因
的平均表达水平比较。计算结果表明, 不含微卫星
基因的平均RPKM值为31.49, 是含微卫星重复基因
的平均RPKM值(24.66)的1.28倍(表3)。方差分析的结
果也表明, 两组数据间存在极显著差异。
Weber 将微卫星分为3, 即单纯(pure) SSR、复
合(compound) SSR, 和间隔(interrupted) SSR[10]。本
研究发现含有复合SSR (compound repeats)和间隔
SSR (Interrupted SSR) Unigene序列的平均RPKM值
分别为18.20、17.49, 显著低于仅含有单纯型SSR
(Pure SSR) 的 Uningene 序 列 的 平 均 RPKM 值
(>22.73)(表3)。
相关分析表明 , SSR序列长度与基因表达水平
RPKM呈显著负相关, 相关系数为–0.047。复合SSR
和间隔SSR的平均长度分别为82.33 bp与44.85 bp,
分别是平均SSR长度(24.90 bp)的3.30倍和1.80倍。

表 3 茶树花转录组中 SSR类型与长度对基因表达水平 RPKM
值的影响
Table 3 Effect of SSR type and length on the values of RPKM
in C. sinensis floral transcriptome
序列类型
Sequence type
RPKM均值
Mean of RPKM
SSR长度
SSR size (bp)
不含 SSR序列
Without SSR sequence
31.39 —
复合型 SSR
Compound SSR
18.20 82.33
间隔型 SSR
Interrupted SSR
17.49 44.85
单核苷酸
Nucleotides
22.73 19.28
二核苷酸
Binucleotide repeats
25.76 17.87
三核苷酸
Trinucleotide repeats
25.94 18.13
四核苷酸
Tetranucleotide repeats
24.20 17.88
五核苷酸
Pentanucleotide repeats
22.91 22.00
六核苷酸
Hexnucleotide repeats
25.43 20.15
总计 Total 24.66 24.90

3 讨论
3.1 茶树花转录组中 SSR微卫星分布特征
本文对 75 531条茶树 (Camellia sinensis)花的
Unigene序列进行微卫星分布特征分析 , 共发现
12 582个微卫星, 分布在10 290条序列中, 包含SSR
的序列出现频率为16.66%, SSR的出现频率为0.415
SSR/1 kb, 平均相隔2.41 kb出现一个SSR序列, 与金
基强等[4] (2.16 kb)、王丽鸳等[5](2.10 kb)的研究结果
84 作 物 学 报 第 40卷


基本一致, 但高于Sharma等 [6] (3.55 kb)和杨华等 [7]
(3.68 kb)的报道。这或许与SSR搜索标准、序列数量
等不一致有关。茶树微卫星出现频率与桉树[11-12]、
杏[13]、杨树[14]等相近, 约在15%~20%左右的表达序
列中含有微卫星序列。茶树长序列微卫星出现的频
率为4.20%左右, 高于小麦中2.38%的长序列微卫星
出现频率[15], 这可能与物种差异有关。本研究发现,
茶树以小于20 bp的短微卫星重复序列最多 , 大于
20 bp的长微卫星占微卫星总数的25.22%, 高于杨树
中的16.63% [14]。根据这一分析, 我们判断茶树表达
基因所含的微卫星可能受到强烈趋同选择的压力 ,
而使其富集在较短的序列范围内。在水稻、小麦、
大麦等作物中 , 微卫星重复以三碱基重复为主 [16],
而茶树是以二碱基重复为主。
3.2 三、六碱基重复在茶树蛋白编码区中的富集
本研究发现 , 茶树(C. sinensis) 花转录组微卫
星序列主要分布在非编码区, 转录组编码区序列所
含微卫星数量远低于基因非编码区, 编码区微卫星
分布频率仅为非编码区的1/30, 说明基因上游调控
区域富含微卫星; 基因编码区序列中的微卫星以三
碱基重复为主, 而非编码区以二碱基重复为主。
许多研究都表明基因编码区中发现最多的微卫
星类型是三碱基重复微卫星[17-18], 这可能是三联体
密码子选择作用的结果, 因为其他几种类型的重复
单元(六碱基重复除外)重复次数的改变会导致阅读
框的改变, 导致移码突变, 使基因表达产物产生完
全不同的蛋白或变短。由于三碱基和六碱基重复单
元重复次数的变化不改变基因读码框, 对基因表达
产物的影响相对较小, 所以编码区序列对三碱基及
六碱基微卫星重复有更好的容受性, 在选择作用下,
会导致三碱基及六碱基微卫星的富集。本研究结果
显示, 在茶树基因编码区中, 三碱基和六碱基微卫
星显著富集, 分别占微卫星总数的59.47%和27.33%,
三、六碱基重复占全部碱基重复的86.90%, 这与杨
树中的研究结果一致[14]。这一现象也说明三、六碱
基重复微卫星富集是基因编码区微卫星在基因组中
得以保存的重要机制。
3.3 茶树花转录组序列中 SSR 长度分布及其对
基因表达水平的影响
由重复单元的重复次数不同所造成的多态性常
常表现为复等位性, 在不同的基因型间存在广泛的
多态性。多数研究者认为这种多态性起因于复制过
程中的滑动[19]。因此, 微卫星长度的变化反映微卫
星位点获得(或失去)重复单元的活跃程度。基因序列
中的微卫星增加了基因的不稳定性, 但同时为基因
的变异提供了动力。由于微卫星序列越长, 其DNA
序列稳定性越差, 尤其是在基因区, 微卫星序列越
长或重复次数越多则该基因就越不稳定。越来越多
的研究显示, 微卫星并不是通常人们所认为的中性
遗传标记。拟南芥中的研究发现, 微卫星可以在基
因转录及转录后水平影响基因的表达 [20]。而
Streelman等[21]在罗非鱼中研究表明, 微卫星长度与
基因表达强度相关, 在无环境胁迫的条件下微卫星
长度越长, 基因表达水平越低, 在有环境胁迫的条
件下则反之。本文研究发现, 茶树花转录组中, 含微
卫星序列基因的整体表达水平显著低于不含有微卫
星序列基因的整体表达水平, 其中含复杂微卫星序
列的基因整体表达水平最低, 且基因表达水平与微
卫星的长度呈负相关。杨树中的研究也表明, 基因
组中含有微卫星的基因可能总体表达水平偏低[16]。
含微卫星的基因表达水平偏低会规避部分选择压力,
有利于相应基因在基因组中的保存。
4 结论
在茶树(C. sinensis)花转录组中, 微卫星序列主
要分布在非编码区。基因编码区序列中的微卫星以
三碱基重复为主, 而非编码区以二碱基重复为主。
茶树微卫星以重复长度小于 20 bp 的短微卫星重复
序列最多, 大于 20 bp 的长微卫星占微卫星总数的
25.22%。茶树 SSR出现频率与 SSR长度呈显著负相
关, SSR频率随着重复次数增加呈明显下降趋势, 而
且碱基重复次数越少, SSR数量的下降越快。茶树花
转录组中, 含微卫星基因的平均表达水平显著低于
不含微卫星基因的平均表达水平, 其中含复杂微卫
星基因的平均基因表达水平最低。
References
[1] 何平 . 真核生物中的微卫星及其应用 . 遗传 , 1998, 20(4):
42–47
He P. Abundance, polymorphism and applications of microsatel-
lite in eukaryote. Hereditas, 1998, 20(4): 42–47 (in Chinese)
[2] Powell W, Machray G C, Provan J. Polymorphism revealed by
simple sequence repeats. Trends Plant Sci, 1996, 1(7): 215–222
[3] Li S X, Yin T M. Map and analysis of microsatellites in the ge-
nome of Populus: the first sequenced perennial plant. Sci China,
Ser C: Life Sci, 2007, 50: 690–699
[4] 金基强, 崔海瑞, 陈文岳, 卢美贞, 姚艳玲, 忻雅, 龚晓春. 茶
树 EST-SSR 的信息分析与标记建立. 茶叶科学, 2006, 26:
17–23
Jin J Q, Cui H R, Chen W Y, Lu M Z, Yao L Y, Xin Y, Gong X C.
Data mining for SSRs in ESTs and development of EST-SSR
第 1期 王丽鸳等: 茶树花转录组微卫星分布特征 85


marker in tea plant (Camellia sinensis). J Tea Sci, 2006, 26:
17–23 (in Chinese with English abstract)
[5] 王丽鸳 , 姜燕华 , 段云裳 , 成浩 , 周健 , 曾建明 . 茶树
EST-SSRs分布特征及引物开发. 植物遗传资源学报, 2009, 10:
511–516
Wang L Y, Jiang Y H, Duan Y S, Cheng H, Zhou J, Zeng J M.
Characterization of EST-derived microsatellites and development
of SSR-markers in tea (Camellia sinensis). Plant Genet Resour,
2009, 10: 511–516 (in Chinese with English abstract)
[6] Sharma R K, Bhardwaj P, Negi R, Trilochan M, Ahuja P S. Iden-
tification, characterization and utilization of unigene derived mi-
crosatellite markers in tea (Camellia sinensis L.). BMC Plant
Biol, 2009, 9: 53
[7] 杨华, 陈琪, 韦朝领, 史成颖, 方从兵, 宛晓春. 茶树转录组
中 SSR 位点的信息分析 . 安徽农业大学学报 , 2011, 38:
882–886
Yang H, Chen Q, Wei C L, Shi C Y, Fang C B, Wan X C. Analysis
on SSR information in Camellia sinensis transcriptome. J Anhui
Agric Univ, 2011, 38: 882–886 (in Chinese with English abstract)
[8] Iseli C, Jongeneel C V, Bucher P. EST Scan: a program for de-
tecting, evaluating, and reconstructing potential coding regions in
EST sequences. International Conference on Intelligent Systems
for Molecular Biology, 1999. pp 138–148
[9] Mortazavi A, Williams B A, McCue K, Schaeffer L, Wold B.
Mapping and quantifying mammalian transcriptomes by
RNA-Seq. Nat Methods, 2008, 5: 621–628
[10] Weber J L. Informativeness of human (dC-dA)n•(dG-dT)n poly-
morphisms. Genomics, 1990, 7: 524–530
[11] Rota L R, Kantety R V, Yu J K. Nonrandom distribution and
frequencies of genomic and EST-derived microsatellite markers
in rice, wheat, and barley. BMC Genom, 2005, 6: 23
[12] Katti M V, Ranjekar P K, Gupta V S. Differential distribution of
simple sequence repeats in eukaryotic genome sequences. Mol
Biol Evol, 2001, 18: 1161–1167
[13] Morgante M, Hanafey M, Powell W. Microsatellites are prefer-
entially associated with nonrepetitive DNA in plant genonmes.
Nat Genet, 2002, 30: 194–200
[14] 张晓红. 桉树 EST-SNP的开发及 EST图谱构建. 南京林业大
学硕士论文. 2009. pp 31–47
Zhang X H. Development of SNPs in EST of Eucalyptus and
Construction of EST Linkage Maps for Eucalyptus. MS Thesis of
Nanjing Forestry University, 2009. pp 31–47 (in Chinese with
English abstract)
[15] 李淑娴, 张新叶, 王英亚, 尹佟明. 桉树 EST序列中微卫星含
量及相关特征. 植物学报, 2010, 45: 363–371
Li S X, Zhang X Y, Wang Y Y, Yin T M. Content and characteris-
tics of microsatellites detected in expressed sequence tag se-
quences in eucalyptus. Chin Bull Bot, 2010, 45: 363–371 (in
Chinese with English abstract)
[16] Li X, Shangguan L, Song C, Wang C, Gao Z, Yu H, Fang J.
Analysis of expressed sequence tags from Prunus mume flower
and fruit and development of simple sequence repeat markers.
BMC Genet, 2010, 11: 66
[17] 潘海涛, 汪俊君, 王盈盈, 齐照良, 李斯深. 小麦 EST-SSR 标
记的开发和遗传作图. 中国农业科学, 2010, 43: 452–461
Pan H T, Wang J J, Wang Y Y, Qi Z L, Li S S. Development and
mapping of EST-SSR markers in wheat. Sci Agric Sin, 2010, 43:
452–461 (in Chinese with English abstract)
[18] Schlotterer C, Tautz D. Slippage synthesis of simple sequence
DNA. Nucl Acids Res, 1992, 20, 211–215
[19] Sharopova N. Plant simple sequence repeats: distribution, varia-
tion, and effects on gene expression. Genome, 2008, 51: 79–90
[20] Streelman J. Kocher Microsatellite variation associated with
prolactin expression and growth of salt challenged Tilapia.
Physiol Genom, 2002, 9: 1–4
[21] 刘菁菁, 戴晓港, 王洁, 李淑娴, 尹佟明. 杨树微卫星序列
对基因表达频率的影响及表达序列中微卫星特征的分析 .
南京林业大学学报(自然科学版), 2011, 35(1): 11–14
Liu J J, Dai X G, Wang J, Li S X, Yin T M. Effect of microsatel-
lites on gene expression level and characteristics of expressed
SSRs in poplars. J Nanjing For Univ (Nat Sci Edn), 2011, 35(1):
11–14 (in Chinese with English abstract)