组合运用分子生物学及生物信息学方法,首次从毛白杨成熟木质部中分离出编码S-腺苷高半胱氨酸水解酶基因PtSAHHA的cDNA克隆。序列分析表明,毛白杨PtSAHHA cDNA片段全长为1 935 bp,其内部含有大小为1 458 bp的完整开放阅读框架,可编码含有485个氨基酸残基的蛋白质。组织特异性Realtime-PCR结果显示,PtSAHHA在木质部中表达丰度最高,在形成层和老叶中表达丰度中等,在嫩叶中表达丰度最低。在此基础上,组合利用MAGE5.0和DnaSP5软件对毛白杨自然群体中45株基因型个体的PtSAHHA序列进行对比和分析,共检测到166个单核苷酸多态性(SNP)位点,SNP频率为1/15 bp,多样性指数πT为0.010 58。在外显子区域共检测到88个SNP位点,其中同义突变位点34个,错义突变位点53个及1个无义突变位点;同义突变的核苷酸多样性πSynonymous= 0.024 91,是非同义突变核苷酸多样性πNonsynonymous=0.002 33的10倍,推测毛白杨PtSAHHA基因编码区在毛白杨物种演化过程中受到较强的纯化选择压力。对PtSAHHA基因内的SNPs连锁不平衡分析结果表明,随着核苷酸序列长度增加至800 bp,即r2 < 0.1,SNPs的连锁不平衡水平已衰退至不明显。在此基础上,在由426株毛白杨基因型个体组成的关联作图群体内,对频率大于10%的42个常见SNP标记位点与6个木材品质性状进行关联分析,检测到3个SNP标记与3个表型性状显著关联。研究结果为基于分子标记的毛白杨优良木材品质性状定向辅助育种提供理论依据。
In this study, a full-length cDNA clone encoding PtSAHHA was isolated from the cDNA library prepared from mature xylem zone of Populus tomentosa by the bioinformatics and molecular biology. The PtSAHHA cDNA had 1 935 bp length with a corresponding open reading frame (ORF) of 1 458 bp that could encode a protein of 485 amino acids. Tissue-specific expression analysis indicated that the PtSAHHA transcripts were the most abundant mRNA products in stem xylem, intermediate in stem cambium and mature leaf, and the lowest abundant in young leaf. By aligning,comparing and analyzing the genomic sequences of PtSAHHA in 45 random individuals of P.tomentosa with the software of MEGA5.0 and DnaSP5, a total of 166 single nucleotide polymorphisms (SNPs) were detected, with the SNP frequency of 1/15 bp and the diversity (πT) of 0.010 58. There were 88 SNPs detected in the coding regions of PtSAHHA, of which 34 were synonymous nucleotide substitutions, and 53 were missense mutations and 1 was nonsense mutation. The diversity level of synonymous nucleotide substitutions (πSynonymous=0.024 91) was tenfold of nonsynonymous nucleotide substitutions (πNonsynonymous=0.002 33), suggesting that the gene might be evolved under purifying selection at the synonoymous sites of the coding region in P. tomentosa. Linkage disequilibrium test in the PtSAHHA showed that LD declined rapidly within the regions of PtSAHHA with the length increase to 800 bp(r2 < 0.1). On this basis, candidate gene-based association analysis of 42 common single-SNPs (frequency > 10%) with six wood traits in an association population of 426 unrelated individuals showed 3 SNPs that were significantly associated with 3 wood traits, respectively. This study provides an important genetic foundation for molecular marker-assisted selection breeding programs with the goals of improving the quality and quantity of wood products of P. tomentosa.
全 文 :第 49 卷 第 11 期
2 0 1 3 年 11 月
林 业 科 学
SCIENTIA SILVAE SINICAE
Vol. 49,No. 11
Nov.,2 0 1 3
doi:10.11707 / j.1001-7488.20131109
收稿日期: 2013 - 06 - 06; 修回日期: 2013 - 08 - 21。
基金项目: 国家林业局 948 引进项目(2009-4-22) ; 国家自然科学基金项目(31170622,30872042)。
* 张德强为通讯作者。
毛白杨 S -腺苷高半胱氨酸水解酶基因 PtSAHHA的
克隆、表达及 SNP关联分析*
巩琛锐 王 璐 杜庆章 张德强
(北京林业大学 林木花卉遗传育种教育部重点实验室 林木育种国家工程实验室 北京 100083)
摘 要: 组合运用分子生物学及生物信息学方法,首次从毛白杨成熟木质部中分离出编码 S - 腺苷高半胱氨酸
水解酶基因 PtSAHHA 的 cDNA 克隆。序列分析表明,毛白杨 PtSAHHA cDNA 片段全长为 1 935 bp,其内部含有大小
为 1 458 bp 的完整开放阅读框架,可编码含有 485 个氨基酸残基的蛋白质。组织特异性 Realtime-PCR 结果显示,
PtSAHHA 在木质部中表达丰度最高,在形成层和老叶中表达丰度中等,在嫩叶中表达丰度最低。在此基础上,组合
利用 MAGE5. 0 和 DnaSP5 软件对毛白杨自然群体中 45 株基因型个体的 PtSAHHA 序列进行对比和分析,共检测到 166
个单核苷酸多态性(SNP)位点,SNP 频率为 1 /15 bp,多样性指数 πT为 0. 010 58。在外显子区域共检测到 88 个 SNP 位
点,其中同义突变位点 34 个,错义突变位点 53 个及 1 个无义突变位点; 同义突变的核苷酸多样性 πSynonymous =
0. 024 91,是非同义突变核苷酸多样性 πNonsynonymous = 0. 002 33 的 10 倍,推测毛白杨 PtSAHHA 基因编码区在毛白杨
物种演化过程中受到较强的纯化选择压力。对 PtSAHHA 基因内的 SNPs 连锁不平衡分析结果表明,随着核苷酸序
列长度增加至 800 bp,即 r2 < 0. 1,SNPs 的连锁不平衡水平已衰退至不明显。在此基础上,在由 426 株毛白杨基因
型个体组成的关联作图群体内,对频率大于 10%的 42 个常见 SNP 标记位点与 6 个木材品质性状进行关联分析,检
测到 3 个 SNP 标记与 3 个表型性状显著关联。研究结果为基于分子标记的毛白杨优良木材品质性状定向辅助育
种提供理论依据。
关键词: 毛白杨; S -腺苷高半胱氨酸水解酶; 单核苷酸多态性; 连锁不平衡; 木材品质性状
中图分类号: S718. 46 文献标识码: A 文章编号: 1001 - 7488(2013)11 - 0067 - 10
Isolation,Expression,and Association Genetics of the S-Adenosyl-L-Homocysteine
Hydrolase Gene A (PtSAHHA) in Populus tomentosa
Gong Chenrui Wang Lu Du Qingzhang Zhang Deqiang
(1 . Key Laboratory of Genetics and Breeding in Forest Trees and Ornamental Plants of Ministry of Education
National Engineering Laboratory for Tree Breeding Beijing Forestry University Beijing 100083)
Abstract: In this study,a full-length cDNA clone encoding PtSAHHA was isolated from the cDNA library prepared
from mature xylem zone of Populus tomentosa by the bioinformatics and molecular biology. The PtSAHHA cDNA had 1 935
bp length with a corresponding open reading frame (ORF) of 1 458 bp that could encode a protein of 485 amino acids.
Tissue-specific expression analysis indicated that the PtSAHHA transcripts were the most abundant mRNA products in stem
xylem,intermediate in stem cambium and mature leaf,and the lowest abundant in young leaf. By aligning,comparing and
analyzing the genomic sequences of PtSAHHA in 45 random individuals of P. tomentosa with the software of MEGA5. 0 and
DnaSP5,a total of 166 single nucleotide polymorphisms (SNPs) were detected,with the SNP frequency of 1 /15 bp and
the diversity (πT) of 0. 010 58. There were 88 SNPs detected in the coding regions of PtSAHHA,of which 34 were
synonymous nucleotide substitutions,and 53 were missense mutations and 1 was nonsense mutation. The diversity level of
synonymous nucleotide substitutions ( π Synonymous = 0. 024 91 ) was tenfold of nonsynonymous nucleotide substitutions
(πNonsynonymous = 0. 002 33),suggesting that the gene might be evolved under purifying selection at the synonoymous sites of
the coding region in P. tomentosa. Linkage disequilibrium test in the PtSAHHA showed that LD declined rapidly within the
regions of PtSAHHA with the length increase to 800 bp ( r2 < 0. 1 ) . On this basis,candidate gene-based association
林 业 科 学 49 卷
analysis of 42 common single-SNPs ( frequency > 10% ) with six wood traits in an association population of 426 unrelated
individuals showed 3 SNPs that were significantly associated with 3 wood traits,respectively. This study provides an
important genetic foundation for molecular marker-assisted selection breeding programs with the goals of improving the
quality and quantity of wood products of P. tomentosa.
Key words: Populus tomentosa; S-adenosyl-L-homocysteine hydrolase ( SAHH); single nucleotide polymorphisms;
linkage disequilibrium (LD); wood property
为解决和改善日益严重的全球性能源危机及温
室效应问题,世界各国已开始重视发展可持续再生
新能源。有研究表明,通过将生物质能源,尤其是含
量最为丰富的木质纤维素转化为乙醇替代石油等化
工原 料 的 途 径 有 望 解 决 上 述 危 机 ( Demirbas,
2005)。此外,纸张消费的增长及现代造纸工业的
迅猛发展导致木质纤维原料缺乏,而木材中纤维素
的含量直接影响到乙醇的转化率和制浆造纸过程中
纸浆的得率,并和造纸所产生的环境污染有密切关
系(Chiang et al.,1988; Sassner et al.,2005)。因此,
对木材纤维素生物合成机制的深入研究,特别是对
木材纤维素的生物合成过程及对参与其中的关键基
因进行遗传学研究,将对林木种质的分子遗传改良
具有深远的意义。为此,先前的研究者利用分子生
物学与分子遗传学手段发现并解析了部分基因的功
能,显著提高了林木分子遗传改良的进程(Déjardin
et al.,2010; Ingvarsson et al.,2011; Li et al.,2006)。
S - 腺苷 高半胱氨酸水 解 酶 ( S-adenosy-L-
homocysteine hydrolase,SAHH)是生物体内广泛存在
的调节细胞内甲基化反应的一个关键酶。其可逆的
催化 S - 腺苷 - L - 高半胱氨酸( SAH)水解生成腺
苷(Ado)和高半胱氨酸(Hcy),是真核生物中水解
AdoHcy 代谢的唯一途径(Lloyd et al.,1993)。通过
该途径,将甲基供体 S - 腺苷甲硫氨酸( SAM)转甲
基之后产生的 SAH 代谢掉。SAHH 的催化活性受
SAM 与 SAH 含量的比率调节,SAH 含量过高会抑
制 SAHH 的催化活性,从而降低基因甲基化的程
度,进而调控基因的表达 (Kloor et al.,2004; Li et
al.,2008)。自 1954 年,Cantoni 和 Scarano(1954)首
次发现 S -腺苷高半胱氨酸以来,已经从人类及多
种微生物如酵母菌 ( Saccharomyces cerevisiae)、枯氏
锥虫(Trypanosoma cruzi)、南极冰藻(Chlamydomonas
sp. ICE-L)等生物体内克隆得到了 SAHH 基因的全
长序列(Parker et al.,2003; Tehlivets et al.,2004; 王
金慧等,2011 )。此外,在植物中已获得陆地棉
(Gossypium hirsutum)、黄瓜(Cucumis sativus)等作物
的 SAHH 基因全长 (佘义斌等,2008; 金晓霞等,
2012)。目前,关于该基因的研究多集中在介导
DNA 甲基化机制方面,尤其是人类医学领域中对各
种病毒及肿瘤的新疗法探究以及以 SAHH 基因作为
靶位点设计药物的研究(Turner et al.,2000; Clercq,
2002; Ji et al.,2005)。S - 腺苷高半胱氨酸水解酶
广泛存在于生物体内,其在植物次生微管组织木质
部发育过程中具有重要的调控作用( Rocha et al.,
2005; 佘义斌等,2008)。鉴于树木纤维素对林产
工业经济价值的重要性,分离 S - 腺苷高半胱氨酸
水解酶基因并对其进行分析,对于探究纤维素的合
成过程以及木材纤维品质的研究具有重要意义。特
别是近几年,基于分子标记辅助育种策略的提出,为
研究基因功能及其遗传变异位点的遗传效应提供了
新方向。基于候选基因内单核苷酸多态性( single
nucleotide polymorphisms,简称 SNPs)的遗传学研究
已成为研究林木育种的一种有效的手段 ( Zhang et
al.,2005); 大量研究表明该方法在挖掘与表型性状
显著关联的功能标记位点,并用于探索候选基因分
子遗传机制方面具有重要意义 ( Andersen et al.,
2005; Gonzalez-Martinez et al.,2007; Tian et al.,
2012)。但在树体高大、生长周期较长且在生态环
境建设中占有重要地位的用材树种中还未见关于该
基因克隆与功能分析的报道。为此,本文以我国北
方地区重要的用材树种毛白杨(Populus tomentosa)
为材料,从该树种的成熟木质部中成功分离出一个
SAHH 基因,并对该基因进行组织特异性分析及单
核苷酸多态性分型。在此基础上,运用连锁不平衡
分析手段研究了该基因内的 SNP 标记位点与木材
品质性状的关系,为选择优良用材种质为目标的毛
白杨 SNP 标记辅助育种奠定了理论基础,具有重要
的应用价值。
1 材料与方法
1. 1 植物材料
20 世纪 80 年代初,全国毛白杨协作组从毛白
杨天然分布区 100 多万 km2 的范围内选取了 1 047
株优良的毛白杨基因型个体,在山东省冠县建立了
毛白杨种质资源基因库。Huang(1992)依据光、热、
水等 16 个气象因子,运用主分量分析,将毛白杨分
86
第 11 期 巩琛锐等: 毛白杨 S -腺苷高半胱氨酸水解酶基因 PtSAHHA 的克隆、表达及 SNP 关联分析
布区划分为 3 个气候区。在上述毛白杨种质资源基
因库中选取能够最大程度反映毛白杨天然分布范围
的 45 株基因型个体用于 SNP 的发现; 用于 SNP 与
木材品质性状关联分析的群体为选自于该基因库的
426 株基因型个体。提取 RNA 的材料为 1 年生的
毛白杨无性系‘鲁毛 50’。
1. 2 总 DNA 的提取
植物材料总 DNA 的提取按照 DNeasy Plant
Mini Kits(Qiagen,Inc.,Valencia,CA,USA)描述的
方法进行。
1. 3 总 RNA 提取以及 cDNA 的合成
毛白杨不同组织材料(顶端分生组织、嫩叶、成
熟叶、韧皮部、形成层、未成熟木质部、成熟木质部及
根部组织 ) 总 RNA 的提取及 cDNA 的合成按照
RNeasy Plant Mini Kits(Qiagen)和 Clonetech 试剂盒
描述的方法进行。
1. 4 设计引物及 PCR 扩增
利用 Affymetrix 表达谱芯片技术构建了插入片
段为 1. 0 ~ 4. 0 kb、大小为 5. 06 × 106 pfu 的毛白杨
木质部 cDNA 转录组数据库,随机选择 5 000 条 EST
片段 进 行 测 序,与 所 有 的 拟 南 芥 ( Arabidopsis
thaliana)AtSAHH 基因比对,最终在毛白杨中确定了
一个与 AtSAHH 序列相似度达 83%的 EST 片段,在
毛白杨 EST 序列两端设计 1 对寡聚核苷酸引物:
PtSAHHAF: 5-CCATGTACACTCCACCAACT
CCCTGAAA-3;
PtSAHHAR: 5-GAGAAAACTCATTCTACTAG
CCGTTACAA-3(Tm = 65 ℃ )。
以毛白杨成熟木质部 cDNA 为模板,采用25 μL
DNA 聚合酶链式反应(PCR)体系,反应体系按照潘
炜等 (2011 )描述的方法进行。最终扩增出长约
2 000 bp的 cDNA 片段。
1. 5 PCR 产物的克隆、测序及生物信息学分析
回收 PCR 扩增后得到目的基因片段,将其与
PMD-18T 载 体 连 接。连 接 产 物 转 化 大 肠 杆 菌
(Escherichia coli) DH5α 并筛选阳性克隆进行 PCR
扩增,将扩增后的阳性克隆进行测序,获取该基因的
cDNA 序列。应用 DNAMAN6. 0 软件推导出该基因
所编码的氨基酸序列,分别估算该蛋白的分子质量
和等电点并进行跨膜结构分析; 同时,对其同源蛋
白序列进行 NCBI 检索,并利用 MAGE5 软件对不同
物种间同源蛋白序列的系统进化进行分析。
1. 6 Realtime PCR 检 测 不 同 组 织 和 器 官 中
PtSAHHA 基因的表达模式
利用 ABI Primer Express3. 0 软件设计 2 条
Realtime PCR 的扩增引物,引物序列如下:
PtSAHHARTF: 5-ATGATCTGCGATCTCGGA
GAA-3;
PtSAHHARTR: 5-CACCCCCATCCAAAACCT
TATTA-3(Tm = 58 ℃ )。
以在杨树不同组织与器官中表达相对稳定的肌
动蛋白基因 Actin 作为内参,引物序列为:
ActRTF:5-CTCCATGAAATGCGATG-3;
ActRTR:5-TTGGGGCTAGTGCTGAGATT-3
(Tm = 58 ℃ )。
定量 PCR 反应操作按照 SYBR Premix Ex
TaqTM (TaKaRa) 试剂盒描述的方法进行。每个样
品和对照分别重复 3 次。反应总体系为: cDNA 2
μL,SYBR Premix Ex TaqTM 12. 5 μL(2 × ),定量
PCR 上游和下游引物各 0. 5 μL(10 μmol·L - 1 ),加
水补足 25 μL。轻微离心,将反应体系收集到管底。
在 MJ Research Opticon 2 荧光检测系统上进行
Real-time PCR 反应,扩增程序为: 94 ℃,5 min→
(94 ℃,30 s→58 ℃,30 s→72 ℃,1 min),40 个循
环→ 72 ℃,10 min。扩增完成后用 MJ Research
Opticon 2 SYSTEM 软件对结果进行分析。
1. 7 PtSAHHA 基因内 SNP 多样性分析
分析已得到的 PtSAHHA 基因核苷酸序列,在其
两端设计基因特异的引物,以 45 株毛白杨个体的总
DNA 为模板分别进行扩增。将扩增产物经琼脂糖
凝胶电泳分离、回收、纯化后与 pMD-18T 载体进行
连接、转化,选取阳性克隆送公司测序。运用
MEGA5 软件对 45 株基因型个体 PtSAHHA 基因片
段的核苷酸序列进行比对,标出 SNP 位点; 在此基
础上,运用 Dnasp5 软件计算 SNP 频率及多样性指
数,对其中存在的同义突变、错义突变和无义突变情
况进行分析,并对 SNP 位点进行连锁不平衡分析。
1. 8 毛白杨关联作图群体 SNP 基因型分型及木材
品质性状的测定
对于 SNP 位点基因型分析,以能够最大程度地
反映毛白杨天然分布范围的 426 株基因型个体作为
关联作图群体,利用锁核酸技术 ( Koshkin et al.,
1998)对 1. 7 中确定的频率大于 5%的常见 SNP 标
记进行 PCR 扩增、基因型分型,建立 SNP 基因型数
据库; 对于木材纤维品质性状,利用 Near Infrared
Reflectance Spectroscopy (NIRS)仪器(MPA 傅里叶
型)测定每个基因型个体的木材化学成分如木质素
含量、综纤维素含量及 α - 纤维素含量; 采用纤维
测定仪测定木材物理性质如纤维长和纤维宽,利用
X -衍射仪测定微纤丝角; 数量性状指标的具体测
96
林 业 科 学 49 卷
定方法见 Du 等(2013b)。
1. 9 PtSAHHA 基因内 SNPs 标记位点与木材品质
性状的关联分析
利用 TASSEL2. 1 软件将 SNP 位点基因型分别
与木材物理及化学性状进行混合线性模型 (MLM)
分析(Yu et al.,2006; Stich et al.,2009)。其中,该
模型以群体结构系数(Q)和亲缘关系系数(K)作为
协变量,其中 Q 矩阵数据来自于 Du 等(2012),K 矩
阵则由 SPAGeDi 软件计算获得(Ritland,1996)。获
取 P≤ 0. 05 的关联结果,随后利用 Q-value 软件进
行 Fasle Discovery Rate ( FDR) 假阳性检验 ( Q <
0. 01)(Storey et al.,2003),最终确定与木材品质性
状显著关联的 PtSAHHA 基因内 SNP 位点。
2 结果与讨论
2. 1 PtSAHHA 基因的克隆与结构特征分析
在毛白杨木质部 cDNA 转录组数据库中随机选
取 5 000 条 EST 片段进行测序并与拟南芥 AtSAHH 基
因进行比对,最终获得一个与 AtSAHH 高度相似的
EST 片段(83% )。以毛白杨成熟木质部的 cDNA 第 1
链作为模板进行 PCR 扩增,产物经 0. 8%琼脂糖凝胶
电泳后,在大约 2 000 bp 处显示出 1 条清晰明亮的特
异性条带(图 1)。将该目标片段经回收、纯化后与
pMD-18T 载体进行连接,选取阳性克隆测序。测序结
果表明,克隆得到的 PtSAHHA 基因的 cDNA 克隆总长
为 1 935 bp,分别包含长度为 248 bp 和 229 bp 的
3UTR ( 3 un-translated region ) 和 5UTR(5 un-
translated region); 分析结果表明,PtSAHHA 基因内含
有大小为 1 458 bp 的完整开放阅读框架,可编码含有
485 个氨基酸残基的蛋白质。将该序列提交 GenBank
数据库,接收序列号为 KF293294。运用 DNAMAN6. 0
软件估算得到 PtSAHHA 蛋白质的分子质量约为
53 171. 4 Da,其等电点为 5. 79。
为分析该基因的结构,以毛白杨基因组总 DNA
为模板进行了 PCR 扩增和测序,获得了长度为
2 445 bp的 PtSAHHA 基因组 DNA 序列。并与 cDNA
比较显示,该基因内仅含有 1 个内含子,长度为 510
bp。将 PtSAHHA 基因序列进行 NCBI 检索,结果初步
表明 SAHHA 在毛白杨中的克隆尚属首次。将其与之
前从模式植物及农作物中克隆的 SAHH 基因的蛋白
质序列进行同源性比较(图 2)。结果显示,PtSAHHA
与模式植物如拟南芥、毛果杨(Populus trichocarpa)、
蓖麻(Ricinus communis)、烟草(Nicotiana tabacum)及
主要农作物如玉米(Zea mays)、水稻(Oryza sativa)的
SAHH 核苷酸序列及氨基酸序列具有很高的相似性,
图 1 PtSAHHA 基因的 cDNA 片段
Fig. 1 The cDNA fragment of PtSAHHA
M: 1 kb DNA 分子量标准; 1: PtSAHHA 的 cDNA 片段。
M: 1 kb DNA ladder marker; 1: The cDNA fragment of PtSAHHA.
同源性在 91. 75% ~ 98. 14% 之间,其中与毛果杨
PtrSAHHA 蛋白的同源性最高,因此将本研究克隆得
到的这一毛白杨 SAHH 基因命名为 PtSAHHA 是合理
的。Rocha 等(2005)的研究也证明,植物 SAHH 基因
编码的蛋白质高度保守,都具有长度相同的 485 个氨
基酸且同源性高于 87%。
蛋白质一级结构分析表明,PtSAHHA 编码的蛋
白与 其 他 植 物 的 SAHH 蛋 白 都 具 有 典 型 的
AdoHcyase_NAD 结构域,表明 SAH 水解酶是一种十
分保守的蛋白质。运用 DNAMAN6. 0 软件对氨基酸
序列进行跨膜结构分析显示,这 7 个物种的 SAHH
基因编码的蛋白两端分别具有 1 个跨膜蛋白结构
域,位于氨基酸序列 63—86 和 251—271 处。运用
在线软件 ExPASy-PROSITE ( http:∥ www. expasy.
org / prosite /)预测到在这 2 个跨膜区域附近分别具
有 1 个 S -腺苷 - L -高半胱氨酸水解酶信号,分别
位于 85—99 和 262—279 氨基酸序列处,推测其具
有催化水解 SAH 的功能。
2. 2 PtSAHHA 基因的组织特异性 Realtime-PCR
检测
为了检测杨树不同组织与器官中 PtSAHHA 基因
的表达模式,以 Actin 基因为内参进行 Realtime-PCR
扩增,获得该基因在杨树不同组织器官内的相对表达
量(图 3)。由图 3 可见,PtSAHHA 基因在杨树的根、
茎、叶等组织中均有表达,但相对表达水平差异较大。
PtSAHHA 基因主要在木质部中表达,其在成熟木质部
中具有最高的表达水平(13. 51),而未成熟木质部中
表达丰度次之(9. 97)。此外,在形成层和成熟叶片中
07
第 11 期 巩琛锐等: 毛白杨 S -腺苷高半胱氨酸水解酶基因 PtSAHHA 的克隆、表达及 SNP 关联分析
图 2 PtSAHHA 与其他物种 SAHH 蛋白质序列比较
Fig. 2 The protein sequences alignment of SAHH from different species
Ptr: 毛果杨 Populus trichocarpa; Rc: 蓖麻 Ricinus communis; Nt: 烟草 Nicotiana tabacum; Os: 水稻 Oryza
sativa; Zm: 玉米 Zea mays; At: 拟南芥 Arabidopsis thaliana。黑色方框表示 2 个跨膜蛋白结构域。下划线
表示 AdoHcyase_NAD 结构域。The two black boxes show the transmembrane domains,and the underline shows
AdoHcyase_NAD domain.
17
林 业 科 学 49 卷
也有中等丰度的表达,而在根、韧皮部、顶端分生组织
中表达量较低,在未成熟叶片中的表达量极低,仅为
0. 114 3。从 PtSAHHA 表达模式可以看出,该基因主
要在杨树的木质部中表达,且成熟木质部的表达量远
远高于其他组织器官。佘义斌等(2008)在陆地棉中
克隆得到的 GhSAHH 基因在根、下胚轴和纤维早期发
育时期较高丰度的表达也证明了该基因具有组织特
异性表达。结合本研究结果,初步推断 PtSAHHA 基
因参与了次生木质部细胞壁的加厚过程,并通过影响
DNA 甲基化水平来调控木材纤维的合成,对木材的
形成过程具有重要的调控作用。
图 3 PtSAHHA 基因在不同组织中的特异性表达水平
Fig. 3 Relative transcript abundance level of PtSAHHA
in different tissues
R: 根; P: 树干韧皮部; C: 树干形成层; DX: 树干未成熟木
质部; MX: 树干成熟木质部; YL: 嫩叶; ML: 成熟叶; A: 顶
端分生组织。R: Root; P: Phloem of stem; C: Cambium of
stem; DX: Developing xylem of stem; MX: Mature xylem of
stem; YL: Young leaf; ML: Mature leaf; A: Apical meristem.
2. 3 PtSAHHA 基因内 SNP 多样性分析
为检测 PtSAHHA 基因在毛白杨自然群体内
SNP 多样性水平,获知该基因在种内演化过程中的
分子进化特点,在全国毛白杨基因库内选取能够最
大范围反映毛白杨生长分布区域的 45 株基因型个
体为试验材料,对全长为 2 445 bp 的 PtSAHHA 基因
组序列的不同区域进行了序列克隆、比对及其 SNP
多态性分析(表 1)。这 45 株毛白杨个体的 SAHHA
序列 已 上 传 至 NCBI,其 GenBank 登 录 号 为
KF467170—KF467214。经序列比对分析,共检测到
166 个 SNPs,出现频率为 1 /15 bp。在该基因的
5UTR、3 UTR、外显子及内含子中分别检测到 18,
15,88 及 45 个 SNPs,其出现频率分别为 1 /13 bp,
1 /17bp,1 /17 bp 和 1 /11 bp(表 1)。其中在内含子
区域 SNP 出现的频率最高,而在外显子及 3UTR 区
域 SNP 出现的频率最低(表 1)。经 Dnasp5 软件推
算得出 PtSAHHA 内具有 8 个相对保守的 DNA 区
域,其中 7 个位于外显子区域,1 个位于 3UTR 区
域。这表明在进化过程中,PtSAHHA 基因的编码区
域受到了较强的选择压力 ( Suh et al.,2005)。此
外,5UTR和 3UTR 也显示出较低的变异程度,推测
是由于 5UTR 区域内存在一些调控基因表达的位
点(赵谨等,2005),且 3UTR 区域具有转录水平上
调节细胞的发育和分化的功能(Moor et al.,2005)。
因此这些区域的保守性有利于维持基因的表达水
平,进而保证个体的生存和种群的繁衍。
表 1 PtSAHHA 内不同区域的 SNP 多态性①
Tab. 1 Nucleotide polymorphisms at the PtSAHHA locus
区域
Region
序列长度
Sequence length / bp
SNP 数量
SNP number
SNP 频率
SNP frequency / bp - 1
核苷酸多样性 Nucleotide diversity
π θW
5非编码区 5UTR 229 18 13 0. 017 66 0. 017 98
外显子 1 Exon 1 711 44 16 0. 007 10 0. 014 47
外显子 2 Exon 2 747 44 17 0. 007 58 0. 013 47
内含子 Intron 510 45 11 0. 014 01 0. 019 87
3非编码区 3UTR 248 15 17 0. 016 20 0. 014 75
同义突变 Synonymous mutation — 34 — 0. 024 91 0. 021 54
非同义突变 Nonsynonymous mutation — 54 — 0. 002 33 0. 012 04
总计 Total 2 445 166 15 0. 010 58 0. 015 62
① π 和 θW为核苷酸多样性指数。π and θW value mean the nucleotide diversity.
运用 Dnasp5 软件对核苷酸多样性指数 π 分析
(表 1 ) 显示,外显子区域的核苷酸多样性指数
(πExon 1 = 0. 007 10 和 πExon 2 = 0. 007 58)明显低于其
他区域,其次是内含子区域(π Intron = 0. 014 01)、3UTR
(π3UTR = 0. 016 20),且在 5UTR 区域表现出最高的
核苷酸多样性指数 ( π5 UTR = 0. 017 66 ) ( Tajima,
1989; Watterson,1975)。编码区域内,同义突变的核
苷酸多样性指数(πSynonymous = 0. 024 91)是非同义突变
核苷酸多样性指数(πNonsynonymous = 0. 002 33)的 10 倍,
说明纯化选择对基因编码区域的非同义位点起了重
要作用(Fu et al.,1993)。对 PtSAHHA 基因内 166 个
SNP 位点进行突变类型分析显示,135 个 SNP 位点发
生转换,31 个位点发生颠换,转换与颠换的比值约为
4. 35 > 0. 5,且其中大部分为 C 突变为 T。该模式与
毛白杨、小叶杨(Populus simonii)部分候选基因的研
究结果一致(潘炜等,2011; 卫尊征等,2009)。
27
第 11 期 巩琛锐等: 毛白杨 S -腺苷高半胱氨酸水解酶基因 PtSAHHA 的克隆、表达及 SNP 关联分析
表 2 PtSAHHA 在毛白杨 3 个群体内的核苷酸变异水平①
Tab. 2 Summary of nucleotide variation in 3 populations for PtSAHHA
群体 Population 个体数 n 位点数 s π tol π sil π s πn Tajima’s D* Fu and Li’s D*
东北 Northeastern region 15 82 0. 010 37 0. 017 21 0. 023 15 0. 002 36 - 0. 057 43 - 0. 971 62
南部 Southern region 15 91 0. 010 73 0. 017 67 0. 022 29 0. 002 62 - 0. 298 63 - 1. 079 51
西北 Northwestern region 15 83 0. 009 47 0. 015 83 0. 021 94 0. 002 02 - 0. 430 50 - 1. 033 71
总和 Total 45 166 0. 010 58 0. 017 63 0. 024 19 0. 002 33 - 1. 206 60 - 4. 153 76
① n: 测序样本数 The number of sequenced samples; s: 分离位点数 The number of segregating sites; π tol: 整个基因区域单核苷酸多样性
Average nucleotide diversity in full gene; π sil: 非编码区和内含子区域的单核苷酸多样性 Average nucleotide diversity in untranslated regions and
introns; π s : 编码区同义突变单核苷酸多样性 Average nucleotide diversity of synonymous mutation in coding region; πn : 编码区内非同义突变单核
苷酸多样性 Average nucleotide diversity of non-synonymous mutation in coding region.
在编码区域检测到的 88 个 SNPs 中包含同义突
变 34 个、错义突变 53 个以及无义突变 1 个。对其
编码的氨基酸变异情况进一步分析发现,外显子 1
中含有 29 个错义突变,其中罕见的 SNP 的密码子
由原来的 TGC 突变为 AGC,导致对应的半胱氨酸
(Cys)突变为丝氨酸(Ser); 外显子 2 中突变的密码
子由原来的 ACC 突变为 ATC,导致编码的相应氨基
酸由苏氨酸(Thr)突变为异亮氨酸( Ile)。中性检测
结果(表 2)显示,这 3 个毛白杨群体在进化的过程
中都受到了相似的选择压力,且均存在过剩的罕见
SNP 位点。在 3 个群体中均显示出非同义突变单核
苷酸多样性指数(πn )与同义突变单核苷酸多样性
指数(π s)的比率 < 1,说明在毛白杨演化过程中,主
要是纯化选择驱动了 PtSAHHA 基因内非同义 SNP
位点的变异。
2. 4 PtSAHHA 基因内 SNP 的连锁不平衡分析
为了解毛白杨自然群体中 PtSAHHA 基因内
SNP 位点间的连锁不平衡的延伸长度及程度,运用
DnaSP5 软件中的 LD 程序分析了 PtSAHHA 基因内
79 个常见 SNP 位点连锁不平衡水平(图 4)。图 4
表明,LD 并没有延伸至 PtSAHHA 基因的整个区域,
其基因内部的 SNPs 连锁不平衡程度随着核苷酸序
列长度的增加而迅速降低,随着核苷酸序列长度增
加至 800 bp,即 r2 < 0. 1,PtSAHHA 基因内 SNPs 的连
锁不平衡水平已衰退至不明显。计算 PtSAHHA 基
因内常见 SNPs 位点间的 LD 值(平均 r2 = 0. 134 5)
表明,PtSAHHA 基因内的 LD 衰减极为迅速。这一
结果表明,在候选基因 PtSAHHA 内进行 SNP 标记位
点与表型变异的关联分析是可行的。
在植物中,LD 延伸范围变异很大。比如,在异
交物种玉米中,LD 水平急剧衰退,在 1 kb 之内已衰
退至不明显(Remington et al.,2001)。但在自交物
种拟南芥中,LD 可延伸至 250 kb ( Nordborg et al.,
2002)。在杨属近缘树种间,LD 的延伸长度也有所
差异。Ingvarsson 等 (2005)在对欧洲山杨( Populus
tremula)的多个基因的研究中发现,LD 的衰退非常
图 4 PtSAHHA 基因内 SNP 的连锁不平衡衰退水平
Fig. 4 Linkage disequilibrium of SNPs in PtSAHHA
r2 : PtSAHHA 基因内 SNP 间连锁不平衡程度
Degree of LD between SNPs within PtSAHHA.
迅速,在 500 bp 以内 LD 就已经衰退消失; Chu 等
(2009)在欧洲黑杨( Populus nigra)中的研究则显
示,不同基因内 LD 的衰减速度差异很大,延伸长度
20 ~ 1 300 bp( r2 < 0. 1)。最近对毛果杨基因组范
围内广泛 LD 的研究表明,LD 的延伸可以达到
3 ~ 6 kb(Slavov et al.,2012),打破了先前研究认为
的林木具有较低的连锁不平衡水平,为进行林木全
基因组水平的关联分析提供了重要的理论依据。
2. 5 SNPs 位点与木材品质性状的关联分析
运用混合线性模型(MLM)共检测到 6 个 SNP
位点与 6 个木材品质性状显著连锁(P < 0. 05),经
Fasle Discovery Rate(FDR)多重检测筛选后,最终获
得 3 个 SNPs 位点分别与 3 个木材性状显著连锁,每
一位点可解释表型遗传变异的 2. 83% ~ 16. 4% (表
3)。本 研 究 获 得 的 3 个 SNPs 位 点 分 别 位 于
PtSAHHA 基因内的不同区域,并与不同木材品质性
状显著关联。SNP1 位于 PtSAHHA 基因的 5UTR 区
域,与纤维长度性状极显著关联,遗传贡献率为
16. 4% ; Guerra 等 (2012)的研究发现,5 UTR 区域
的 SNP 标记与木材化学性状存在关联。有研究表
明,5UTR 区域虽然不直接编码氨基酸序列,但对基
因的表达调控尤其是转录过程具有重要调控作用
(Miyamoto et al.,2007; 赵谨等,2005; Lin et al.,
2012)。mRNA 是指导蛋白质翻译的重要信使,
37
林 业 科 学 49 卷
mRNA 的形成过程有多重因子参与,而 5UTR 区域
含有内部核糖体进入的位点,因此具有介导内部翻
译起始的功能并影响基因的表达 ( Cullen,2000)。
在毛白杨 PtSAHHA 基因 5UTR 区域发现的 SNP1 位
点,可能调控了 PtSAHH 基因的表达,进而影响了纤
维长度的变异。位于 PtSAHHA 基因内含子区域的
SNP15 位点,分别与纤维长度及微纤丝角显著连锁,
分别可解释表型遗传变异的 3. 86% 与 15. 47% (表
3)。内含子区域虽然不参与蛋白质的翻译过程,但
基因组 DNA 转录 mRNA 过程中需将内含子剪切,
从而形成成熟的 mRNA。因此,内含子序列变异会
影响 RNA 翻译前的剪接过程,从而影响蛋白的表达
(Sontheimer et al.,1999; Chalamcharla et al.,2010)。
SNP32 标记位于 PtSAHHA 基因的第 2 个外显子区
域,并与 α - 纤维素含量显著关联,遗传贡献率为
2. 83%。该位点为同义突变位点,虽然没有导致氨
基酸序列的改变,但与纤维素含量显著关联。在
Thumma 等(2009)的研究中也发现同义突变的 SNP
位点与纤维素含量及纸浆得率存在显著关联,并可
顺式作用调控基因的表达。
表 3 SNP 位点基因型分型与表型性状的关联结果
Tab. 3 The SNPs locus associated with phenotypic traits
性状
Trait
SNP 位点
SNP locus
定位
Position
P
遗传贡献率
R2
Q 基因型效应
Genotypic effect
最小等位基因频率
Minor allele frequency
纤维长 Fiber length
SASNP1 5非编码区 5UTR 1. 02E - 15 16. 4% 1. 428E - 13
CC: 1. 166 mm
CT: 1. 170 mm
TT: 1. 276 mm
T: 0. 496 5
SASNP15 内含子 Intron 4. 92E - 4 3. 86% 0. 022 96
AA: 0. 884 mm
AT: 1. 170 mm
TT: 1. 218 mm
A: 0. 491 8
微纤丝角 Microfibril angle SASNP15 内含子 Intron 3. 12E - 14 15. 47% 2. 184E - 12
AA: 51. 78°
AT: 17. 76°
TT: 16. 02°
G: 0. 449 5
α -纤维素 α-cellulose SASNP32 外显子 2 Exon 2 0. 001 7 2. 83% 0. 048 0
CC: 41. 22%
CG: 39. 74%
T: 0. 496 5
在关联分析中发现,SNP1 位点和 SNP15 位点
同时与纤维长度相关联,该模式与目前在林木关
联研究中证明的木材品质由多个 SNP 位点协同调
控的模式相一致 ( Beaulieu et al.,2011; Du et al.,
2013a)。然而 SNP1 位点和 SNP15 位点分别对纤
维长 度 和 微 纤 丝 角 的 遗 传 贡 献 率 ( 16. 4% 和
15. 47% )远远高于一些关联研究中获得的遗传贡
献率(1. 5% ~ 6. 5% ) ( Thumma et al.,2009; Dillon
et al.,2010; 2012)。但是,在毛白杨 PtGA20Ox 基
因和 UDP -葡萄糖醛酸脱羧酶基因与木材品质的
关联 研 究 中 同 样 发 现 了 较 高 的 遗 传 贡 献 率
(14. 47%和 12. 37% ),推测虽然林木性状是由微
效多基因控制的,但其中有主效 SNP 位点,对表型
性状的遗传贡献率较高 ( Tian et al.,2012; Du et
al.,2013a)。为了研究这 3 个 SNP 位点的基因型
效应,将其与所对应的木材品质性状进行方差分
析(表 3)。结果显示,在位于 5 UTR 区域的 SNP1
位点检测到 3 种基因型 CC,CT 和 TT,纤维长度平
均值分别为 1. 166,1. 170,1. 276 mm,但在纤维
长度上 3 种基因型的差异并不显著。而位于内含
子区域的 SNP15 位点同时与微纤丝角和纤维长度
2 个性状相关联,在该位点检测到 3 种基因型 AA,
AT 和 TT,纤维长度平均值分别为 0. 884,1. 170,
1. 218 mm; 微纤丝角则分别为 51. 78°,17. 76°,
16. 02°。在纤维长度和微纤丝角上,该位点的 3
种基因型差异达到显著水平。SNP32 标记位点位
于第 2 个外显子区域,其密码子上的第 3 个碱基发
生改变,由 CCC 突变为 CCG,属于同义突变。该位
点检测到 2 种基因型为 CC 和 CG,未检测到 GG 基
因型。CC 和 CG 基因型的α -纤维素含量分别为
41. 22%和 39. 74%,CC 基因型的 α - 纤维素含量
与 CG 基因型并无显著差异。在对拟南芥突变体
的研究中发现 SAHH 基因的一个突变导致了拟南
芥生长缓慢且生殖力和发芽率都有所降低(Rocha
et al.,2005)。从海岸松(Pinus pinaster)发现,参与
合成 S -腺苷甲硫胺酸的基因在转录水平的上调
会提高木质素的合成量 ( Villalobos et al.,2012 )。
以上研究结论进一步表明 PtSAHHA 基因可以通过
影响甲基化水平进而影响毛白杨纤维素的形成。
本研究在 PtSAHHA 基因中发现的 3 个与木材品质
性状显著关联的 SNP 位点,为基于分子标记的毛
白杨优良木材品质性状定向选择育种奠定了重要
的理论依据。
47
第 11 期 巩琛锐等: 毛白杨 S -腺苷高半胱氨酸水解酶基因 PtSAHHA 的克隆、表达及 SNP 关联分析
3 结论
本研究从毛白杨成熟木质部中分离出 S -腺苷
高半胱氨酸水解酶基因 PtSAHHA 的 cDNA 克隆,其
内部含有大小为 1 458 bp 的完整开放阅读框架,可
编码含有 485 个氨基酸残 基的蛋白质。分析
PtSAHHA 蛋白的一级结构表明,PtSAHHA 的蛋白
质十分保守,且具有跨膜结构及 S -腺苷 - L -高半
胱氨酸水解酶信号。组织特异性 Realtime-PCR 检
测显示,PtSAHHA 基因在杨树不同组织中均有表
达,但在木质部中表达丰度最高,在形成层及老叶中
有中等丰度表达,而在嫩叶中表达丰度最低。依据
其表达模式初步推断 PtSAHHA 基因可能参与次生
木质部细胞壁的加厚过程,并通过影响 DNA 甲基化
水平来调控木材纤维的形成。核苷酸多样性分析表
明,PtSAHHA 基因内的不同区域都存在丰富的 SNP
变异位点,且基因内含子区域 SNP 出现的频率最
高,而在外显子及 3UTR 区域核苷酸的变异程度较
低,表明在进化过程中,该基因的编码区存在较强的
选择压力,其保守性有利于维持基因的蛋白质特性,
进而保证个体的生存和种群的繁衍。基于 PtSAHHA
基因内的 SNPs 连锁不平衡分析推测,在基因内 800
bp 左右 SNPs 的连锁不平衡水平已衰退至不明显;
LD 水平的迅速衰退为开展基于候选基因的关联作
图提供了重要的理论依据。在由 426 株毛白杨基因
型个体组成的关联作图群体内,对 SNPs 位点与木
材品质性状进行关联分析,共检测到 3 个 SNPs 位点
分别与 3 个木材性状显著连锁,分别位于 PtSAHHA
基因的 5UTR、内含子及外显子区域,并与 3 个木材
品质性状如纤维长、微纤丝角及 α - 纤维素含量显
著连锁,每一标记位点可解释表型遗传变异的
2. 83% ~ 16. 4%,研究结果为基于分子标记的毛白
杨优良木材品质性状定向选择育种提供了重要的理
论依据。
参 考 文 献
金晓霞,秦智伟,周秀艳,等 . 2012.黄瓜 S -腺苷 - L 高半胱氨酸水解
酶全长 cDNA 的克隆及表达分析 . 中国农业科学,45 ( 7 ) :
1338 - 1346.
潘 炜,田佳星,杜庆章,等 . 2011.毛白杨蔗糖合酶基因 PtSUS1 的克
隆、表达及单核苷酸多态性分析 .林业科学,47(3) : 52 - 58.
佘义斌,朱一超,张天真,等 . 2008. 棉花腺苷高半胱氨酸水解酶
cDNA 的 克 隆、表 达 及 染 色 体 定 位 . 作 物 学 报,34 ( 6 ) :
958 - 964.
王金慧,丁 燏,简纪常,等 . 2011. 南极冰藻 Chlamydomonas sp.
ICE-L S -腺苷同型半胱氨酸水解酶基因的克隆及其生物信息
学分析 .中国水产科学,18(6) : 1234 - 1242.
卫尊征,郭 琦,李百炼,等 . 2009.小叶杨 GA20 氧化酶基因的克隆、
表达及单核苷酸多态性分析 .林业科学,45(4) : 19 - 27.
赵 谨,杨克恭,张 学 . 2005.一种新发现的基因表达调控机制—核
糖开关 .中国生物化学与分子生物学报,21(2) : 151 - 157.
Andersen J,Schrag T,Melchinger A,et al. 2005. Validation of Dwarf8
polymorphisms associated with flowering time in elite European
inbred lines of maize (Zea mays L. ) . Theor Appl Genet,111(2) :
206 - 217.
Beaulieu J,Doerksen T,Boyle B,et al. 2011. Association genetics of wood
physical traits in the conifer white spruce and relationships with gene
expression. Genetics,188(1) : 197 - 214.
Cantoni G,Scarano E. 1954. The formation of S-adenosylhomocysteine in
enzymeatic transmithylation reactions. Journal of Biological
Chemistry,76(18) : 4744.
Chalamcharla V,Curcio M J,Belfort M. 2010. Nuclear expression of a
group II intron is consistent with spliceosomal intron ancestry. Genes
& Dev,24: 827 - 836.
Chiang V,Puumala R,Takeuchi H,et al. 1988. Comparison of softwood
and hardwood kraft pulping. Tappi Journal,71: 173 - 176.
Chu Y,Su X,Huang Q,et al. 2009. Patterns of DNA sequence variation at
candidate gene loci in black poplar (Populus nigra L. ) as revealed
by single nucleotide polymorphisms. Genetica,137(2) : 141 - 150.
Clercq E. 2002. Highlights in the development of new antiviral agents.
Mini Rev Med Chem,2(2) : 163 - 175.
Cullen B. 2000. Nuclear RNA export pathways. Molecular and Cellular
Biology,20(12) : 4181 - 4187.
Déjardin A,Laurans F,Arnaud D,et al. 2010. Wood formation in
Angiosperms. Am Soc Plant Biol,333(4) : 325 - 334.
Demirbas A. 2005. Bioethanol from cellulosic materials: a renewable
motor fuel from biomass. Energy Sources,27(4) : 327 - 337.
Dillon S,Brawner J,Meder R,et al. 2012. Association genetics in
Corymbia citriodora subsp. variegata identifies single nucleotide
polymorphisms affecting wood growth and cellulosic pulp yield. New
Phytol,195(3) : 596 - 608.
Dillon S,Nolan M,Li W,et al. 2010. Allelic variation in cell wall
candidate genes affecting solid wood properties in association
populations and land races of Pinus radiata. Genetics,185 ( 4 ) :
1477 - 1487.
Du Q,Pan W,Tian J,et al. 2013a. The UDP-Glucuronate decarboxylase
gene family in Populus: structure, expression, and association
genetics. PLoS one,8(4) :e60880.
Du Q,Pan W,Xu B,et al. 2013b. Polymorphic simple sequence repeat
( SSR ) loci within cellulose synthase ( PtoCesA ) genes are
associated with growth and wood properties in Populus tomentosa.
New Phytol,197(3) : 763 - 776.
Du Q,Wang B,Wei Z,et al. 2012. Genetic diversity and population
structure of Populus tomentosa ( Chinese white poplar) revealed by
SSR markers. J Hered,103(6) : 853 - 862.
Fu Y,Li W. 1993. Statistical tests of neutrality of mutatons. Genetics,133
(3) : 693 - 709.
Gonzalez-Martinez S,Wheeler N,Ersoz E,et al. 2007. Association
genetics in Pinus taeda L. I. Wood property traits. Genetics,175
(1) : 399 - 409.
57
林 业 科 学 49 卷
Guerra F,Wegrzyn J,Sykes R,et al. 2012. Association genetics of
chemical wood properties in black poplar ( Populus nigra ) . New
Phytol,197(1) : 162 - 176.
Huang Z. 1992. The study on the climatic regionalization of the
distributional region of Populus tomentosa. Beijing For Univ,14
(3) : 26 - 32.
Ingvarsson P. 2005. Nucleotide polymorphism and linkage disequilibrium
within and among natural populations of European aspen ( Populus
tremula L.,Salicaceae) . Genetics,169(2) : 945 - 953.
Ingvarsson P,Street N. 2011. Association genetics of complex traits in
plants. New Phytol,189(4) : 909 - 922.
Ji Y,Li Z T,Zhu Q,et al. 2005. Current status in research of S-
adenosylhomocysteine hydrolase and its inhibitors. Prog Pharmac
Sci,29(11) : 481 - 486.
Kloor D,Osswald H. 2004. S-Adenosylhomocysteine hydrolase as a target
for intracellular adenosine action. Trends in Pharmacol Sci,25(6) :
294 - 297.
Koshkin A,Singh S,Nielsen P,et al. 1998. LNA ( locked nucleic
acids ) : synthesis of the adenine, cytosine, guanine, 5-
methylcytosine, thymine and uracil bicyclonucleoside monomers,
oligo merisation, and unprecendented nucleic acid recognition.
Tetrahedron,54: 3607 - 3630.
Li C,Yu T,Jiang S,et al. 2008. Down-regulation of S-adenosyl-L-
homocysteine hydrolase reveals a role of cytokinin in promoting
transmethylation reactions. Planta,228(1) : 125 - 136.
Li L,Lu S,Chiang V. 2006. A genomic and molecular view of wood
formation. Crit Rev Plant Sci,25: 213 - 233.
Lin Z,Li W. 2012. Evolution of 5’untranslated region length and gene
expression reprogramming in yeasts. Mol Biol Evol, 299 ( 1 ) :
81 - 89.
Lloyd H,Schrader J. 1993. Adenosine metabolism in the guinea pig heart:
the role of cytosolic S-adenosyl-L-homocysteine hydrolase,
5-nucleotidase and adenosine kinase. European Heart Journal,14
( Suppl I) : 27 - 33.
Miyamoto Y,Mabuchi A,Shi D,et al. 2007. A functional polymorphism in
the 5UTR of GDF5 is associated with susceptibility to osteoarthritis.
Nat Genet,39: 529 - 533.
Moor C,Meijer H,Lissendenet S. 2005. Mechanisms of translational
control by the 3UTR in development and differentiation. Seminars in
Cell & Developmental Biology,16(1) : 49 - 58.
Nordborg M,Borevitz J,Bergelson J,et al. 2002. The extent of linkage
disequilibrium in Arabidopsis thaliana. Nat Genet,30: 190 - 193.
Parker N,Yang X,Hanke J,et al. 2003. Trypanosoma cruzi: molecular
cloning and characterization of the S-adenosylhomocysteine
hydrolase. Exp Parasitol,105(2) : 149 - 158.
Remington D,Thomsberry J,Matsuoka Y,et al. 2001. Structure of linkage
disequilibrium and phenotypic associations in the maize genome.
Proc Natl Acad Sci USA,98(20) : 11479 - 11484.
Ritland K. 1996. Estimators for pairwise relatedness and individual
inbreeding coefcients. Genet Res,67(2) : 175 - 185.
Rocha P,Sheikh M,Melchiorre R,et al. 2005. The Arabidopsis
HOMOLOGY-DEPENDENT GENE SILENCING1 gene codes for an
S-adenosyl-L-homocysteine hydrolase required for DNA methylation-
dependent gene silencing. The Plant Cell,17(2) : 404 - 417.
Sassner P,Galbe M,Zacchi G. 2005. Steam pretreatment of Salix with and
without SO2 impregnation for production of bioethanol. Applied
Biochem Biotech,121 /124: 1101 - 1118.
Slavov G,DiFazio S,Martin J,et al. 2012. Genome resequencing reveals
multiscale geographic structure and extensive linkage disequilibrium
in the forest tree Populus trichocarpa. New Phytol, 196 ( 3 ) :
713 - 725.
Sontheimer E,Gordon P,Piccirilli J. 1999. Metal ion catalysis during
group II intron self-splicing: parallels with the spliceosome. Gene &
Development,13: 1729 - 1741.
Stich B,Melchinger A. 2009. Comparison of mixed-model approaches for
association mapping in rapeseed,potato,sugar beet,maize,and
Arabidopsis. BMC Genomics,10: 94.
Storey J,Tibshirani R. 2003. Statistical signicance for genomewide
studies. Proc Natl Acad Sci USA,100(16) : 9440 - 9445.
Suh Y,Vijg J. 2005. SNP discovery in associating genetic variation with
man disease phenotypes. Mutation Research,573(1 /2) : 41 - 53.
Tajima F. 1989. Statistical method for testing the neutral mutation
hypothesis by DNA polymorphism. Genetics,123(3) : 585 - 595.
Tehlivets O,Hasslacher M,Kohlwein S. 2004. S-adenosyl-L-homocysteine
hydrolase in yeast: key enzyme of methylation metabolism and
coordinated regulation with phospholipid synthesis. FEBS Lett,577
(3) : 501 - 506.
Thumma B,Matheson B,Zhang D,et al. 2009. Identification of a
Cis-acting regulatory polymorphism in a eucalypt COBRA-like gene
affecting cellulose content. Genetics,183(3) : 1153 - 1164.
Tian J,Du Q,Chang M,et al. 2012. Allelic variation in PtGA20Ox
associates with growth and wood properties in Populus spp. PLoS
one,7(12) : e53116.
Turner M,Yang X,Yin D,et al. 2000. Structure and function of
S-adenosylhomocysteine hydrolase. Cell Biochem Biophys,33 ( 2 ) :
101 - 125.
Villalobos D,Díaz-Moreno S,Said E,et al. 2012. Reprogramming of gene
expression during compression wood formation in pine: Coordinated
modulation of S-adenosylmethionine, lignin and lignan related
genes. BMC Plant Biology,12: 100.
Watterson G. 1975. On the number of segregating sites in genetical models
without recombination. Theor Popul Biol,7(2) : 256 - 276.
Yu J,Pressoir G,Briggs W,et al. 2006. A unified mixed-model method for
association mapping that accounts for multiple levels of relatedness.
Nature Genetics,38: 203 - 208.
Zhang D,Zhang Z. 2005. Single nucleotide polymorphisms discovery and
linkage disequilibrium. Forestry Studies in China,7(3) : 1 - 14.
(责任编辑 徐 红)
67