免费文献传递   相关文献

细叶桉(Eucalyptustereticornis)早期生长的SSR标记关联分析



全 文 :分子植物育种,2016年,第 14卷,第 1期,第 195-203页
Molecular Plant Breeding, 2016, Vol.14, No.1, 195-203
研究报告
Research Report
细叶桉(Eucalyptus tereticornis)早期生长的 SSR标记关联分析
宋志姣 1,2 翁启杰 2 周长品 2 李发根 2 李梅 2 杨合宇 2 卢万鸿 3 罗建中 3* 甘四明 1,2*
1林木遗传育种国家重点实验室,北京, 100093; 2 热带林业研究实验室,中国林业科学研究院热带林业研究所, 广州, 510520; 3 国家林业局桉
树研究开发中心,湛江, 524022
*通讯作者, luojz69@hotmail.com; siming.gan@ritf.ac.cn
摘 要 本研究基于巨桉全基因组的 108 个 SSR 标记(44 个基因 SSRs 和 64 个 EST-SSRs),通过对细叶桉
9个群体的 78株样品的初步关联分析和 242株样品的关联验证,利用一般线性模型和混合线性模型共检测
到与细叶桉 9 月生树高(H9)、30 月生树高(H30)和 30 月生胸径(D30)显著关联的标记分别为 2 个、3 个和 4 个。
除 1个标记(Embra227)同时与 H30 和 D30 显著关联外,不同性状的关联标记均不相同。单个标记对表型变异
的解释率为 10.3%~34.6%。与 H9、H30 和 D30 关联的最大增效等位片段的效应值分别为 0.67 m、1.64 m 和
1.97 cm,最大减效等位片段的效应值分别为 -0.72 m、-1.94 m和 -1.87 cm。H9、H30 和 D30 的平均增效效应最
大的关联标记分别为 EUCeSSR1070 (0.41 m, 26.8%)、EUCeSSR1136 (0.73 cm, 12.3%)和 EUCeSSR906 (1.48 cm,
25.3%),平均减效效应最大的关联标记分别为 EUCeSSR1070 (-0.25 m, 16.3%)、Embra227 (-1.06 m, 17.2%)和
Embra227 (-1.15 cm, 17.7%)。这为桉树分子育种提供了有潜力的标记资源。
关键词 细叶桉(Eucalyptus tereticornis), SSR标记,早期生长,关联分析
SSR Markers Associated with Early Growth in Eucalyptus tereticornis
Song Zhijiao 1,2 Weng Qijie 2 Zhou Changpin 2 Li Fagen 2 Li Mei 2 Yang Heyu 2 Lu Wanhong 3 Luo
Jianzhong 3* Gan Siming 1,2*
1 State Key Laboratory of Tree Genetics and Breeding, CAF, Beijing, 100093; 2 Research Institute of Tropical Forestry, CAF, Guangzhou, 510520; 3
China Eucalypt Research Centre, Zhanjiang, 524022
* Corresponding authors, luojz69@hotmail.com; siming.gan@ritf.ac.cn
DOI: 10.13271/j.mpb.014.000195
Abstract Based on 108 SSR markers including 44 genomic SSRs and 64 EST-SSRs spanning the genome of
Eucalyptus grandis, preliminary association analysis (9 populations with 78 samples) and association verification
(9 populations of 242 samples) were carried out by using general and mixed linear models to detect markers
associated significantly with nine-month-old height (H9), 30-month-old height (H30) and 30-month-old breast-high
diameter (D30) in E. tereticornis. The total numbers of significantly associated markers with H9, H30 and D30 were
two, three and four, respectively. All the significant markers were different among traits with an exception of
marker Embra227 which associated with both H30 and D30. The phenotypic variation explained per significant
marker ranged from 10.3% to 34.6%. The maximum values of allelic plus effect in H9, H30 and D30 were 0.67 m,
1.64 m and 1.97 cm, respectively, while the maximum values of allelic minus effect were -0.72 m, -1.94 m and
-1.87 cm, respectively. The markers with the highest mean of allelic plus effects in H9, H30 and D30 was
EUCeSSR1070 (0.41 m, 26.8%), EUCeSSR1136 (0.73 cm, 12.3%) and EUCeSSR906 (1.48 cm, 25.3%), respectively,
while those of the highest mean of allelic minus effects were EUCeSSR1070 (-0.25 m, 16.3%), Embra227(-1.06m,
17.2%) and Embra227 (-1.15 cm, 17.7%), respectively. All these significant markers will have great potentials for
molecular breeding in Eucalyptus.
Keywords Eucalyptus tereticornis, SSR marker, Early growth, Association analysis
基金项目:本研究由国家高技术研究发展计划(2013AA102705)和国家自然科学基金(31270702)共同资助
分子植物育种
Molecular Plant Breeding
图 1细叶桉 9个群体的群体结构分析
注: A,B: ΔK值随 K值的变化; C,D:参试样品分为 2个亚群;
A,C:初步关联分析 78个样品; B,D:关联验证 242个样品
Figure 1 Population structure of E. tereticornis
Note: A,B: Relationship between ΔK and K values; C,D: Division
of two sub-populations; A,C: Preliminary association analysis with
78 samples; B,D: Association verification with 242 samples
细叶桉(Eucalyptus tereticornis)是桃金娘科(Myr-
taceae)桉属(Eucalyptus)树种,其天然林主要分布于
巴布亚新几内亚南部以及澳大利亚东海岸(9~38°S)
至内陆 100 km的广大区域(Eldridge et al., 1993)。细
叶桉具有速生、高产和适应性强等特点,是优良的纸
浆和人造板工业用材树种(Eldridge et al., 1993; Luo et
al., 2014)。细叶桉也是优良的杂交亲本树种,在杂交
育种和优良杂种培育中潜力较大 (Potts and Dungey,
2004; Weng et al., 2014)。
关联分析也称关联作图、连锁不平衡(linkage
disequilibrium, LD)作图或者关联遗传学,利用天然
群体或品种资源进行个体基因型与表型性状的统计
学关联的检测(Neale and Savolainen, 2004; Nordborg
and Weigel, 2008; Ingvarsson and Street, 2011),具有
无需构建作图群体、可检测同一位点的多个等位基
因和检测精度高等优点(杨小红等, 2007)。林木群体
的遗传多样性丰富、基因组上 LD水平低,尤其适于
关联分析(Neale and Savolainen, 2004; Thumma et al.,
2005)。林木中,自 Thumma等(2005)首次鉴定出蓝桉
(E. globulus)和亮果桉(E. nitens)与木材纤维的微纤
丝角显著关联的单核苷酸多态性(single nucleotide pol-
ymorphism, SNP)标记以来,已报道了多个树种的关
联分析研究,这为相关性状的分子育种提供了极具
潜力的标记资源,如火炬松(Pinus taeda)木材性质
(González-Martínez et al., 2007)、欧洲山杨 (Populus
tremula)芽休眠(Ingvarsson et al., 2008)、柠檬桉(Cory-
mbia citriodora)胸径和纸浆得率(Dillon et al., 2012)、
毛白杨(Po. tomentosa)生长和材性(Du et al., 2013)等。
生长是林木育种的重要性状,但生长性状(尤其是早
期生长)的关联分析却不多。并且,林木关联分析主
要利用候选基因的 SNP标记,尚无基于全基因组的
SSR标记的报道。
虽然林木表型易受环境影响、导致早晚期差异
较大,但早期性状仍是林木育种研究的重要内容,因
其有助于探索早期发育的遗传机理以及建立早晚期
相关和开展早期选择。比如,巨桉(E. grandis)无性系
生长(树高和年均材积)的增长在 3年生之后即较稳
定,早期选择可在 3年生时进行(Osorio et al., 2003)。
因此,早期性状的关联分析可为早期表型提供关联
的基因组位点,也对早晚期关联位点的比较和稳定
位点的鉴定有积极作用。本研究利用覆盖巨桉全基因
组的 44个基因组 SSRs和 64个表达序列标签(expre-
ssed sequence tag, EST)的 SSRs,分析了 SSR 标记与
细叶桉 9月生树高以及 30月生树高和胸径的关联,
旨在探索细叶桉早期生长相关的基因组位点、增强
桉树生长相关的标记资源的积累、促进林木分子标
记辅助育种的发展。
1结果与分析
1.1群体结构分析
基于覆盖巨桉全基因组的 108个 SSR标记(表 1),
选择了 10个基因组 SSRs (表 1)分析细叶桉 9个群
体用于初步关联分析的 78株样品和用于关联验证
的 242株样品(包括前面 78株)的群体结构。对于初
步关联和关联验证的两个群体,ΔK均在 K=2 时出
现拐点(图 1),表明均可分为 2个亚群(图 1)。初步关
联的亚群 1和亚群 2分别包括 28和 50株,关联验
证的亚群 1和亚群 2分别包括 102和 140株。
1.2初步关联的标记
利用 108个 SSR标记对细叶桉 9个群体 78株
样品的早期生长进行了初步关联分析。基于一般线
性模型(general linear model, GLM)检测到 8 个显著
关联的标记(表 2),包括与 9月生树高(nine-month-old
height, H9)、30月生树高(30-month-old height, H30)和
30 月生胸径(30-month-old breast-high diameter, D30)
分别显著关联的 4个、2个和 4个标记,其中 2个标记
(Embra269和 Embra227)与 2个性状显著关联。标记
对表型变异的解释率介于 31.2% (Embra269 对 H30)
与 68.0% (EUCeSSR906对 D30)之间。
基于混合线性模型(mixed linear model, MLM),
196
检测到与早期生长显著关联标记 11个(表 2),包括与
H9显著关联的 4 个、H30 的 4 个和 D30 的 5 个(Em-
bra269和 Embra321与 2个性状显著关联),与 GLM
检测的相同标记数量分别为 3 个、2 个和 2 个。标
记对表型变异的解释率介于 21.6% (Embra321对 H30)
与 76.6% (Embra233对H9)之间。
1.3关联标记的验证
利用初步关联的标记对细叶桉 9个群体 242株
的早期生长进行了关联验证。基于 GLM验证了 7个
标记与早期生长显著关联(表 3),包括与 H9、H30和
D30分别显著关联的 2个、2个和 3个标记,没有标记
与 2个性状显著关联。标记对表型变异的解释率介
细叶桉(Eucalyptus tereticornis)早期生长的 SSR标记关联分析
SSRMarkers Associated with Early Growth in Eucalyptus tereticornis
表 1本研究所用的 108个 SSR标记及其在巨桉基因组上的位置
Table 1 The 108 SSR markers used in this study and their genomic positions in E. grandis genome sequence
SSR标记
SSR marker
EUCeSSR1061
EUCeSSR1039
Embra180
Embra366
EUCeSSR485
Embra100
EUCeSSR0333
EUCeSSR347
EUCeSSR1136
Embra98
EUCeSSR0502
EUCeSSR0224
EUCeSSR0276
Embra333*
Embra201
EUCeSSR0930
EUCeSSR410
EUCeSSR0979
Embra115
Embra227
EUCeSSR1060
Embra280
Embra377
Embra321
EUCeSSR313
EUCeSSR0857
EUCeSSR384
Embra125*
EUCeSSR0599
Embra130*
EUCeSSR0035
EUCeSSR0803
EUCeSSR151
EUCeSSR686
EUCeSSR0862
序列骨架
Scaffold
1
1
1
1
5
1
1
1
1
2
2
2
2
2
2
2
2
5
2
3
3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
起始位置
Start pos.
8 690 373
10 253 398
16 237 395
28 485 149
20 388 443
28 493 543
31 237 609
34 568 399
39 170 916
6 868 216
12 452 178
19 852 092
31 569 263
37 569 214
44 098 015
49 421 201
52 914 039
17 599 471
60 757 654
7 090 509
11 491 555
13 582 421
13 597 010
25 904 848
29 789 569
39 424 661
40 581 763
42 700 560
52 236 288
52 337 372
7 631 897
12 276 418
17 497 132
23 911 715
35 595 018
36 831 665
37 785 686
SSR标记
SSR marker
Embra242
EUCeSSR840
Embra120*
Embra41
EUCeSSR626
Embra64*
Embra111
Embra370
EUCeSSR0455
Embra358
Embra304
EUCeSSR0103
Embra188
EUCeSSR0906
Embra37
EUCeSSR1134
Embra187
EUCeSSR346
EUCeSSR0755
EUCeSSR0705
Embra196
Embra233
EUCeSSR338
EUCeSSR231
EUCeSSR0959
EUCeSSR739
EUCeSSR0620
Embra135
Embra345*
EUCeSSR0776
EUCeSSR880
Embra81
EUCeSSR1042
Embra7
Embra83
EUCeSSR0875
Embra369
序列骨架
Scaffold
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
7
7
7
7
7
起始位置
Start pos.
915 509
2 602 306
3 395 332
4 524 839
6 125 193
12 244 555
32 787 727
41 971 188
44 544 967
47 099 301
48 126 124
54 687 233
58 140 803
60 339 030
68 798 617
73 814 771
7 689 616
9 407 858
14 024 833
15 308 410
19 255 449
24 277 671
34 000 528
35 460 737
36 372 826
39 222 673
42 424 251
45 979 595
46 302 395
47 938 769
48 283 428
53 264 142
9 980 448
27 204 059
47 970 364
48 997 063
49 475 352
SSR标记
SSR marker
EUCeSSR1087
EUCeSSR683
EUCeSSR522
Embra197*
Embra150*
EUCeSSR0163
EUCeSSR1070
Embra88
Embra53
EUCeSSR0226
EUCeSSR0497
EUCeSSR0845
EUCeSSR1125
EUCeSSR0592
EUCeSSR0909
Embra217*
EUCeSSR0679
EUCeSSR596
Embra40
EUCeSSR1044
EUCeSSR0568
EUCeSSR0126
Embra394
Embra87*
Embra165
Embra326
EUCeSSR1117
EUCeSSR0893
Embra269
EUCeSSR1021
EUCeSSR292
EUCeSSR349
EUCeSSR209
EUCeSSR0849
Embra258
EUCeSSR1145
序列骨架
Scaffold
8
8
8
8
8
8
8
8
8
8
8
9
9
9
9
9
10
10
10
10
10
10
10
11
11
11
11
11
11
11
11
11
11
11
11
14
起始位置
Start pos.
631 971
11 862 587
15 487 717
33 444 065
40 661 762
44 710 190
45 480 459
49 475 797
56 361 679
64 788 519
66 205 158
961 917
3 873 376
25 296 628
27 543 468
38 397 371
466 663
1 657 928
10 043 414
22 822 844
26 059 346
31 255 535
37 285 686
3 914 954
4 343 680
6 199 457
9 172 710
18 351 676
20 369 552
30 521 569
38 058 752
40 253 366
41 279 073
41 365 756
45 979 595
855 263
注:前缀为 EUCeSSR的标记为 EST-SSR标记;末位 3位数字的参考 He等(2012);末位 4位数字的参考 Zhou等(2013);前缀为
Embra的标记为基因组 SSR标记(Brondani et al., 2006); *:用于群体结构分析的 10个基因 SSRs
Note: An EST-SSR marker is prefixed with EUCeSSR following with three (He et al., 2012) or four (Zhou et al., 2013) numerals; A ge-
nomic SSR marker is prefixed with Embra (Brondani et al., 2006); *: 10 genomic SSRs used for population structure analysis
197
分子植物育种
Molecular Plant Breeding
表 2初步关联分析的显著性标记
Table 2 Markers significantly associated with early growth in pre-
liminary association analysis
性状
Trait
9月生树高
H9
30月生树高
H30
30月生胸径
D30
一般线性模型
General linear model
标记
Marker
EUCeSSR1070*
Embra233*
Embra269*
EUCeSSR683*
-
Embra269*
Embra227**
-
-
Embra321*
EUCeSSR906*
Embra188*
Embra227**
-
-
R2
0.416
0.345
0.325
0.509
-
0.312
0.423
-
-
0.354
0.680
0.535
0.401
-
-
-
混合线性模型
Mixed linear model
标记
Marker
EUCeSSR1070*
Embra233*
Embra269*
-
Embra188*
Embra269*
Embra227*
Embra321*
EUCeSSR1136*
Embra321*
EUCeSSR906*
-
-
Embra98**
Embra358*
Embra41**
R2
0.417
0.766
0.337
-
0.539
0.358
0.443
0.216
0.269
0.354
0.680
-
-
0.511
0.351
0.396
注: *: p<0.05; **: p<0.01;-:在一般线性模型或混合线性模型
中不显著关联
Note: *: p<0.05; **: p<0.01; -: Non-significant in general linear
model or mixed linear model
表 3验证的显著性关联标记
Table 3 Verified significant trait-marker associations
性状
Trait
9月生树高
H9
30月生树高
H30
30月生胸径
D30
一般线性模型
General linear model
混合线性模型
Mixed linear model
标记
Marker
EUCeSSR1070*
EUCeSSR683*
Embra269*
Embra227**
-
EUCeSSR906*
Embra321*
Embra188*
-
R2
0.346
0.195
0.212
0.209
-
0.186
0.138
0.254
-
标记
Marker
EUCeSSR1070*
-
Embra269*
-
EUCeSSR1136*
EUCeSSR906*
-
-
Embra227*
R2
0.220
-
0.238
-
0.103
0.230
-
-
0.130
注: *: p<0.05; **: p<0.01;-:在一般线性模型或混合线性模型
中不显著关联
Note: *: p<0.05; **: p<0.01; -: Non-significant in general linear
model or mixed linear model
于 13.8% (Embra321对 D30)与 34.6% (EUCeSSR1070
对 H9)之间。
基于 MLM验证了 5个标记与早期生长显著关
联(表 3),包括与 H9、H30和 D30分别关联显著的 1个、
2个和 2个标记,没有标记与 2个性状显著关联。3
个性状各有 1 个标记在前面 GLM 模型中亦检测
到。标记对表型变异的解释率介于 10.3% (EU-
CeSSR1136对 H30)与 23.8% (Embra269对 H30)之间。
1.4关联标记的等位效应
对于 GLM和MLM模型验证的所有显著性关联
标记,各等位片段具有不同的表型效应值。表 4列出
了各性状上不同关联标记最大增效和减效的等位片
段及其效应值。对 H9,最大增效和减效的等位片段分
别为 EUCeSSR1070的 266 bp和 248 bp,效应分别
为 0.67 m和-0.72 m。对 H30,最大增效和减效的等位
片段分别为 EUCeSSR1136的 450 bp和 Embra227的
316 bp,效应分别为 1.64 m和-1.94 m。对 D30,最大
增效和减效的等位片段分别为 Embra321的 224 bp
和 EUCeSSR906的 224 bp,效应分别为 1.97 cm 和
-1.87 cm。
表 5列出了各性状上不同关联标记的平均等位
增效和减效效应值。EUCeSSR1070对 H9的平均增
效和减效效应值分别为 0.41 m (26.8%)和 -0.25 m
(16.3%),均大于另一关联标记 EUCeSSR683。与 H30
关联的 3 个标记中,平均增效效应和平均减效效
应最大的分别为 EUCeSSR1136 (0.73 cm, 12.3%)和
Embra227 (-1.06 cm, 17.2%)。与 D30关联的 4个标
记中,平均增效效应和平均减效效应最大的分别为
EUCeSSR906 (1.48 cm, 25.3%)和 Embra227 (-1.15 cm,
17.7%)。
2讨论
关联分析可有效检测与性状相关的基因组位
点,对 LD水平低的林木尤其重要。林木一般异交,
处于野生状态,有效群体大,因此基因组的重组率
高、LD水平低(Ingvarsson, 2005; Krutovsky and Neale,
2005)。比如,本文研究的细叶桉基于 SSR标记的 LD
衰减 (R2)平均低至 0.012 (Arumugasundaram et al.,
2011)。LD水平越低,获得标记-性状关联的精度越
高(Thumma et al., 2005),关联标记与目的基因之间
LD包含的基因组区域越小(Khan and Korban, 2012)。
另一方面,针对 LD水平低的林木,关联分析宜
用候选基因的策略,而全基因组关联所需的位点太
198
表 4各性状上不同关联标记的最大增效和减效的等位片段
Table 4 The alleles with maximal plus and minus effects for each of the markers significantly associated with early growth
性状
Trait
9月生树高
H9
30月生树高
H30
30月生胸径
D30
标记
Marker
EUCeSSR1070
EUCeSSR683
Embra269
EUCeSSR1136
Embra227
Embra321
EUCeSSR906
Embra188
Embra227
最大等位增效
The maximum of allelic plus effect
最大等位减效
The maximum of allelic minus effect
等位片段(bp)
Allele (bp)
266
145
188
450
286
224
232
169
290
表型效应
Phenotypic effect
0.67
0.48
0.96
1.64
1.53
1.97
1.48
1.61
1.07
等位片段(bp)
Allele (bp)
248
147
198
478
316
220
224
139
298
表型效应
Phenotypic effect
-0.72
-0.47
-1.27
-0.91
-1.94
-0.52
-1.87
-1.54
-1.38
细叶桉(Eucalyptus tereticornis)早期生长的 SSR标记关联分析
SSRMarkers Associated with Early Growth in Eucalyptus tereticornis
表 5各性状上不同关联标记的平均等位增效和减效效应值
Table 5 The mean plus and minus effects for each of the markers significantly associated with early growth
性状
Trait
9月生树高
H9
30月生树高
H30
30月生胸径
D30
标记
Marker
EUCeSSR1070
EUCeSSR683
Embra269
EUCeSSR1136
Embra227
Embra321
EUCeSSR906
Embra188
Embra227
平均等位增效
Mean of allelic plus effects
平均等位减效
Mean of allelic minus effects
均值
Mean
0.41
0.25
0.49
0.73
0.61
1.24
1.48
0.97
0.70
百分比(%)
Percentage (%)
26.8
14.8
8.1
12.3
9.9
19.6
25.3
14.8
10.9
均值
Mean
-0.25
-0.25
-0.59
-0.48
-1.06
-0.42
-0.97
-0.82
-1.15
百分比(%)
Percentage (%)
16.3
14.5
9.7
8.1
17.2
6.7
16.5
12.6
17.7
多、可行性不高(Thumma et al., 2005; Khan and Korban,
2012)。此前林木关联遗传学研究基本都是采用候选
基因的策略(Du et al., 2013)。然而,候选基因的选择
须非常谨慎,最好通过基因表达、EST搜索和数量
性状位点(quantitative trait locus, QTL)定位等途径
(Thumma et al., 2005),这对基因资源缺乏的一些树
种或性状比较困难。近年来,已在一些 LD水平低的
异交植物中尝试基于全基因组的低密度 SSR位点进
行关联分析,如高粱(Sorghum bicolor; Upadhyaya et
al., 2012; Wang et al., 2012)和毛花猕猴桃(Actinidia
eriantha; 汤佳乐等, 2014),并检测到一批重要经济性
状的关联标记,而林木中尚无报道。因此,本文是率
先在林木中利用全基因组 SSR标记的策略进行关联
分析的研究,研究结果也表明该策略的有效性。
综合GLM和MLM的结果,本研究检测到与细叶
桉H9、H30和D30显著关联的 SSR标记分别为 2个、3个
和 4个。对于各标记,增效与减效等位片段的表型效
应差别较大。考虑 30月林龄接近半个轮伐期,可较
好地预测成熟龄的生长性状(Osorio et al., 2003),H30
和 D30关联标记的增效等位片段可用于生长性状的
分子育种,在优良基因型中尽量聚合多个标记的最
大增效等位片段、而剔除减效等位片段。因此,这些
关联 SSRs对桉树分子育种的潜力巨大。
对于不同林龄的树高,H9与 H30没有相同的关
联标记,表明控制两个生长期树高的主效位点可能
不同,这也与蓝桉 1年生与 2年生树高 QTL不同的
结果(Bundock et al., 2008)相似。即使是对同一林龄
两个相关性较高的性状,H30与 D30仅有 1个关联标
记(Embra227)是相同的,表明控制两个性状的主效位
点既有共同的、也有特有的;类似地,巨桉中定位的 1个
QTL 同时影响 10 月生树高和胸径,而尾叶桉(E.
urophylla)中定位的 10月生或 18月生的树高与胸径
199
分子植物育种
Molecular Plant Breeding
图 2细叶桉 9个天然群体的原产地
注:括号内数字表示原产地海拔和各群体的自由授粉家系数量
Figure 2 Geographic origins of the nine E. tereticornis popula-
tions used in this study
Note: The numbers in the brackets show the original elevation
and the number of open-pollinated families for each population
QTL不同(Bartholomé et al., 2015)。
比较初步关联与关联验证的结果,无论是 GLM
还是 MLM模型,各性状关联验证的标记数均少于
初步关联,关联验证的标记对表型变异的解释率也
明显低于初步关联,表明较小的(初步关联)群体可能
产生假阳性或者伪关联,这与少量样品导致的 LD水
平偏差(Hedrick, 1987)和表型取样误差有关(Breseghel-
lo and Sorrells, 2006a)。但是,Embra227虽在初步关
联和关联验证中均与 D30显著关联,但前者为 GLM
模型、后者为 MLM模型,这表明少量样品仍会遗漏
关联标记,另一方面也表明 GLM和 MLM两种模型
最好结合使用,虽然一些报道认为 MLM更为有效
(汤佳乐等, 2014)。
一些与细叶桉 H9、H30和 D30显著关联的标记具有
明确的功能注释。与H9关联的EUCeSSR1070和EUCe-
SSR683两个标记中,前者与胱天蛋白酶(cysteinyl as-
partate-specific proteinase, CASP)基因同源,可能参与
林木木质部细胞发育过程中细胞程序性死亡过程(韩
小娇, 2011);后者与脯氨酸受体蛋白激酶(prolinerich
receptor-like protein kinase, PERK)基因同源,在植物
生长发育信号传递中有重要作用(Nakhamehik et al,
2004)。与H30和D30关联的标记中,EUCeSSR1136与捕
光叶绿素A/B结合蛋白Ⅰ(light-harvesting complexⅠ
chlorophyll A/B-binding protein, LHCP-Ⅰ)基因同源,
该蛋白位于绿色植物叶绿体类囊体薄膜上,是进行光
能传递、转化和分配的关键蛋白(王猛等, 2010);Em-
bra321 与 U-box 结构域序列相似,辣椒(Capsicum
annuum)的U-box基因CaPUB1转入拟南芥(Arabidopsis
thaliana)可加速生长(Cho et al., 2006);其余关联标记
没有明确的功能注释。
本文只研究了早期生长性状,需要结合一个轮
伐期时的数据进一步分析。林木生长易受环境影
响,基因型与环境的互作也是将来关联分析需要研
究的内容。
3材料与方法
3.1实验材料
本研究所用细叶桉 9个天然群体的嫩叶采自早
期建立的种源 /家系试验林(Luo et al., 2014)。试验林
所用育苗种子由澳大利亚林木种子中心或 Kylisa种
子公司提供,均采自天然林,母树间隔 100 m以上。9
个群体共 77个自由授粉(半同胞)家系(图 2),各群体
5~22个家系,各家系取样 3~4株子代。
3.2大田试验和性状观测
种源 /家系试验见 Luo等(2014),2012年 8月造
林,试验地点为广东省遂溪县(纬度 21°16N, 经度
110°05E,海拔 100 m左右)。试验林 9月生时观测树
高(H9),30月生时观测树高(H30)和胸径(D30)。
3.3 DNA提取和 SSR标记实验
每样品称取 0.3 g嫩叶,液氮冷冻后利用MM400
球磨仪(Retsch GmbH, 德国)粉碎,采用改良 CTAB
法提取 DNA (Gan et al., 2003),利用 NanoDrop 2000
(Thermo Scientific,美国)测定 DNA浓度和纯度。
结合发表的桉树 SSR标记,参考巨桉基因组序列
(version 1.1; http:/ /www.phytozome.net/eucalyptus.php),
利用在基因组上分布较均匀的 108个 SSR标记(包括
44个基因组 SSRs和 64个 EST-SSRs,表 2)。其中,
选择 10个基因组 SSRs进行群体结构和个体间亲缘
关系分析,全部标记用于初步关联分析,初步关联的
标记再进行关联验证。SSR引物由上海英骏生物技
200
术有限公司合成。
SSR 分型方法参考 Li 和 Gan (2011),即 10 μL
PCR反应中加入 10 pmol荧光 dUTP (Fermentas,加拿
大 ),采用降落 PCR 扩增程序,PCR 产物经 ABI
3130xl遗传分析仪(Applied Biosystems, 美国)检测。
PCR 反应的 Mg2+ 浓度和扩增程序的退火温度随
SSR标记而定。
3.4数据分析
基于 10个基因组 SSRs的群体结构检测利用软
件 Structure 2.3.4 (Pritchard et al., 2000)进行,亚群数
(K)设为 1~10、各 K值重复 10次计算各单株变异来
自第 K个亚群的概率(Q值),其中马尔可夫链蒙特
卡洛法(markov chain monte carlo, MCMC)的迭代次
数设为 100 000、重复次数 100 000;利用 Structure
Harvester 0.6 (Earl and vonHoldt, 2012)计算最佳亚群数
量 K。利用软件 SPAGeDi1-5a (Hardy and Vekemans,
2002)计算个体间的亲缘关系系数 K (Ritland, 1996)。
初步关联分析利用 78 个单株和所有 SSRs 进
行。基于 10个基因组 SSRs检测的群体结构的最佳
亚群数量 K,利用 TASSEL 3.0 软件(Bradbury et al.,
2007 )按照 GLM(群体结构 Q值作为协变量)和MLM
(Q值作为协变量,纳入亲缘关系系数 K的矩阵,即
Q+K法)分析标记-性状的关联,显著性通过Bonfe-
rroni多重检验校正。
初步关联标记再对所有样品进行关联验证,方
法同前面的初步关联分析。对于显著关联的标记,频
率小于 5.0%的等位片段作为无效等位变异,参考
Breseghello 和 Sorrells (2006b)确定增效等位片段和
减效等位片段。参考文自翔等(2008)以无效等位变异
的表型均值作为对照、计算各增效或减效等位片段
的表型效应值;将某一标记增效和减效等位片段的
平均效应分别作为该标记的增效和减效效应值,计
算其百分比。
作者贡献
宋志姣是本研究实验工作的具体执行人,完成
数据分析和论文初稿的写作;翁启杰和周长品参与
样品采集和数据分析;李发根、李梅和杨合宇参与实
验和数据分析;卢万鸿参与采样和表型性状的测定;
罗建中指导田间试验,负责表型数据的收集,参与数
据分析和论文修改;甘四明是项目的构思者及负责
人,指导实验设计,数据分析,论文写作与修改。全体
作者都阅读并同意最终的文本。
致谢
本研究由国家高技术研究发展计划(2013AA10-
2705)和国家自然科学基金(31270702)共同资助。
参考文献
Arumugasundaram S., Ghosh M., Veerasamy S., and Ramasamy
Y., 2011, Species discrimination, population structure and
linkage disequilibrium in Eucalyptus camaldulensis and Euc-
alyptus tereticornis using SSR markers, PLoS One, 6 (12):
e28252
Bartholomé J., Mabiala A., Savelli B., Bert D., Brendel O.,
Plomion C., and Gion J.M., 2015, Genetic architecture of
carbon isotope composition and growth in Eucalyptus across
multiple environments, New Phytol., 206(4): 1437-1449
Bradbury P.J., Zhang Z., Kroon D.E., Casstevens T.M., Ramdoss
Y., and Buckler E.S., 2007, TASSEL: software for associa-
tionmapping of complex traits in diverse samples, Bioinform-
atics, 23(19): 2633-2635
Breseghello F., and Sorrells M.E., 2006a, Association analysis as
a strategy for improvement of quantitative traits in plants,
Crop Sci., 46(3): 1323-1330
Breseghello F., and Sorrells M.E., 2006b, Association mapping
of kernel size and milling quality in wheat (Triticum aestivum
L.) cultivars, Genetics, 172(2): 1165-1177
Brondani R.P.V., Williams E.R., Brondani C., and Grattapaglia
D., 2006, A microsatellite-based consensus linkage map for
species of Eucalyptus and a novel set of 230 microsatellite
markers for the genus, BMC Plant Biol., 6: 20
Bundock P.C., Potts B.M., and Vaillancourt R.E., 2008, Detection
and stability of quantitative trait loci (QTL) in Eucalyptus
globulus,Tree Genet. Genomes, 4(1): 85-95
Cho S.K., Chung H.S., Ryu M.Y., Park M.J., Lee M.M., Bahk Y.
Y., Kim J., Pai H.S., and Kim W.T., 2006, Heterologous
expression and molecular and cellular characterization of
CaPUB1 encoding a hot pepper U-box E3 ubiquitin ligase
homolog, Plant Physiol., 142(4): 1664-1682
Dillon S.K., Brawner J.T., Meder R., Lee D.J., and Southerton S.
G., 2012, Association genetics in Corymbia citriodora subsp.
variegate identifies single nucleotide polymorphisms affect-
ing wood growth and cellulosic pulp yield, New Phytol., 195
(3): 596-608
Du Q., Pan W., Xu B., Li B., and Zhang D., 2013, Polymorphic
simple sequence repeat (SSR) loci within cellulose synthase
(PtoCesA) genes are associated with growth and wood prop-
erties in Populus tomentosa, New Phytol., 197(3): 763-776
Earl D.A., and vonHoldt B.M., 2012, STRUCTUREHARVESTER:
a website and program for visualizing STRUCTURE output
细叶桉(Eucalyptus tereticornis)早期生长的 SSR标记关联分析
SSRMarkers Associated with Early Growth in Eucalyptus tereticornis 201
分子植物育种
Molecular Plant Breeding
and implementing the evanno method, Conserv. Genet. Re-
sour., 4(2): 359-361
Eldridge K., Davidson J., Harwood C., and van Wyk G., eds., 1993,
Eucalypt domestication and breeding, Oxford University
Press, New York, pp.139-142
Gan S., Shi J., Li M., Wu K., Wu J., and Bai J., 2003, Moder-
ate-density molecular maps of Eucalyptus urophylla S.T.
Blake and E. tereticornis Smith genomes based on RAPD
markers, Genetica, 118(1): 59-67
González-Martínez S.C., Wheeler N.C., Ersoz E., Nelson C.D.,
and Neale D.B., 2007, Association genetics in Pinus taeda
L. I. Wood property traits, Genetics, 175(1): 399-409
Han X.J., 2011, Caspase-like, PtVPE and PtCDD in relation to
programmed cell death in xylem cell of polar, Dissertation
for Ph.D., Chinese Academy of Forestry, Supervisor: Lu M.
Z., pp.77 (韩小娇, 2011,杨树木质部细胞程序化死亡的类
Caspase、PtVPE与 PtCDD作用研究,博士学位论文,中国
林业科学研究院,导师:卢孟柱, pp.77)
HardyO.J., andVekemansX., 2002, SPAGeDi: a versatile computer
program to analyse spatial genetic structure at the individual
or population levels, Mol. Ecol. Notes, 2(4): 618-620
He X., Wang Y., Li F., Weng Q., Li M., Xu L., Shi J., and Gan S.,
2012, Development of 198 novel EST-derived microsatellites
in Eucalyptus (Myrtaceae), Am. J. Bot., 99(4): e134-e148
Hedrick P.W., 1987, Gametic disequilibrium measures: proceed
with caution, Genetics, 117(2): 331-341
Ingvarsson P.K., Garcia M.V., Luquez V., Hall D., and Jansson S.,
2008, Nucleotide polymorphism and phenotypic associations
within and around the phytochrome B2 locus in european as-
pen (Populus tremula, Salicaceae), Genetics, 178(4): 2217-
2226
Ingvarsson P.K., and Street N.R., 2011, Association genetics of
complex traits in plants, New Phytol., 189(4): 909-922
Ingvarsson P.K., 2005, Nu cleotide polymorphism and linkage
disequilibrium within and among natural populations of
european aspen (Populus tremula L., Salicaceae), Genetics,
169(2): 945-953
Khan M.A., and Korban S.S., 2012, Association mapping in forest
trees and fruit crops, J. Exp. Bot., 63(11): 4045-4060
Krutovsky K.V., and Neale D.B., 2005, Nucleotide diversity and
linkage disequilibrium in cold-hardiness- and wood quality-
related candidate genes in douglas fir, Genetics, 171 (4):
2029-2041
Li F., and Gan S., 2011, An optimised protocol for fluores-
cent-dUTP based SSR genotyping and its application to ge-
netic mapping in Eucalyptus, Silvae Genet., 60(1): 18-25
Luo J., Arnold R., Lu W., and Lin Y., 2014, Genetic variation in
Eucalyptus camaldulensis and E. tereticornis for early
growth and susceptibility to the gall wasp Leptocybe invasa
in China, Euphytica, 196(3): 397-411
Nakhamehik A., Zhao Z.Y., Provart N.J., Shiu S.H., Keatley S.K.,
Cameron R.K., and Goring D.R., 2004, A comprehensive
expression analysis of the Arabidopsis proline-rich extensin-
like receptor kinase gene family using experimental ap-
proaches, Plant Cell Physiol., 45(12): 1875-1881
Neale D.B., and Savolainen O., 2004, Association genetics of
complex traits in conifers, Trends Plant Sci., 9(7): 325-330
Nordborg M., and Weigel D., 2008, Next-generation genetics in
plants, Nature, 456(7223): 720-723
Osorio L.F., White T.L., and Huber D.A., 2003, Age-age and
trait-trait correlations for Eucalyptus grandis Hill ex Maiden
and their implications for optimal selection age and design
of clonal trials, Theor. Appl. Genet., 106(4): 735-743
Pritchard J.K., Stephens M., and Donnelly P., 2000, Inference of
population structure usingmultilocus genotype data, Genetics,
155(2): 945-959
Potts B.M., and Dungey H.S., 2004, Interspecific hybridization of
Eucalyptus: key issues for breeders and geneticists, New
Forest., 27(2): 115-138
RitlandK., 1996, Estimators for pairwise relatedness and individual
inbreeding coefficients, Genet. Res., 67(2): 175-185
Tang J.L., Wu H., Lang B.B., Qu X.Y., Huang C.H., and Xu X.
B., 2014, Association analysis on leaf and fruit AsA content
and SSR markers of wild Actinidia eriantha, Yuanyi Xuebao
(Acta Horticulturae Sinica), 41(5): 833-840 (汤佳乐,吴寒,
郎彬彬,曲雪艳,黄春辉,徐小彪, 2014,野生毛花猕猴桃
叶片和果实 AsA含量的 SSR标记关联分析,园艺学报,
41(5): 833-840)
Thumma B.R., Nolan M.F., Evans R., and Moran G.F., 2005,
Polymorphisms in Cinnamoyl CoA Reductase (CCR) are ass-
ociated with variation in microfibril angle in Eucalyptus spp.,
Genetics, 171(3): 1257-1265
Upadhyaya H.D., Wang Y.H., Sharma S., Singh S., and Hasenstein
K.H., 2012, SSR markers linked to kernel weight and tiller
number in sorghum identified by association mapping, Eup-
hytica, 187(3): 401-410
WangM., Cao F.X., and Long J.X., 2010, Cloning and prokaryotic
expression of the light harvesting chlorophyll a/b binding
protein gene from Pinus massoniana, Linye Kexue (Scientia
Silvae Sinicae), 46(9): 172-177 (王猛,曹福祥,龙绛雪, 2010,
马尾松捕光叶绿素 a/b结合蛋白基因 cab-Pm1的克隆与
原核表达,林业科学, 46(9): 172-177)
Wang Y.H., Bible P., Loganantharaj R., and Upadhyaya H.D.,
2012, Identification of SSR markers associated with height
using pool-based genome-wide association mapping in
sorghum, Mol. Breed., 30(1): 281-290
Wen Z.X., Zhao T.J., Zheng Y.Z., Liu S.H., Wang C.E., Wang F.,
and Gai J.Y., 2008, Association analysis of agronomic and
quality traits with SSR markers in Glycine max and Glycine
202
soja in China:Ⅰ. population structure and associated mark-
ers, Zuowu Xuebao (Acta Agronomica Sinica), 34(7): 1169-
1178 (文自翔,赵团结,郑永战,刘顺湖,王春娥,王芳,盖钧
镒, 2008,中国栽培和野生大豆农艺品质性状与 SSR标记
的关联分析:Ⅰ. 群体结构及关联标记,作物学报, 34(7):
1169-1178)
Weng Q., He X., Li F., Li M., Yu X., Shi J., and Gan S., 2014,
Hybridizing ability and heterosis between Eucalyptus uroph-
ylla and E. tereticornis for growth and wood density over
two environments. Silvae Genet., 63(1-2): 15-24
Yang X.H., Yan J.B., Zheng Y.P., Yu J.M., and Li J.S., 2007,
Reviews of association analysis of quantitative traits in
plants, ZuowuXuebao (Acta Agronomica Sinica), 33(4): 523-
530 (杨小红,严建兵,郑艳萍,余建明,李建生, 2007,植物数
量性状关联分析研究进展,作物学报, 33(4): 523-530)
Zhou C., He X., Li F., Wen Q., Yu X., Wang Y., Li M., Shi J.,
and Gan S., 2013, Development of 240 novel EST-SSRs in
Eucalyptus LHérit, Mol. Breed., 33(1): 221-225
细叶桉(Eucalyptus tereticornis)早期生长的 SSR标记关联分析
SSRMarkers Associated with Early Growth in Eucalyptus tereticornis
Journal of Mosquito Research (JMR)
Journal of Mosquito Research (ISSN 1927-646X) is an open access, peer reviewed
journal published online by BioPublisher. The journal is publishing high quality original
research on all aspects of mosquito and its affecting the living organisms, as well as
environmental risk and public policy relevant to mosquito modified organisms. Topics
include (but are not limited to) the research at molecular or protein level of mosquito,
impact on the ecosystem, containing positive and negative information, natural history
of mosquito, also publishing innovative research findings in the basic and applied fields
of mosquito and novel techniques for improvement, as well as the significant evaluation
of its related application field. Authors from low-income countries and areas or having
financial difficulties can apply the discount for article processing charges (APC) upon
submission, and if the authors are qualified to be waived they dont necessarily pay the APC. We do not want fees
to prevent the publication of worthy work.
Email: edit@jmr.biopublisher.ca
Web: http://jmr.biopublisher.ca
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
203