全 文 :作物学报 ACTA AGRONOMICA SINICA 2009, 35(6): 983−991 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn
本研究由国家高技术研究发展计划(863计划)项目(2006AA10Z191), 国家自然科学基金项目(30871535), 中央级公益性科研院所基本科研业务
费专项(082060302-10)资助。
* 通讯作者(Corresponding author): 谢传晓, E-mail: cxxie@caas.net.cn; Tel: 010-82105853
Received(收稿日期): 2008-10-30; Accepted(接受日期): 2009-03-23.
DOI: 10.3724/SP.J.1006.2009.00983
玉米 Gln1-4的 gDNA序列、基因结构、保守功能域与等位变异
吴永升1,2 李新海1 郝转芳1 张世煌1 谢传晓1,*
1 中国农业科学院作物科学研究所 / 国家农作物基因资源与基因改良重大科学工程, 北京 100081; 2 广西玉米研究所, 广西南宁
530227
摘 要: 本研究旨在分离玉米谷氨酰胺合成酶(GS)家族重要成员 Gln1-4 gDNA序列全长, 分析基因结构、保守功能
域与自然等位变异, 为氮利用效率功能位点关联性分析奠定基础。利用 PCR步移(walking)方法分离 Gln1-4基因区域
基因组 DNA序列, 用生物信息学方法分析基因结构与保守功能域, 测序与序列比对法分析重要区域自然等位变异。
结果表明, 分离得到自交系 Mo17 Gln1-4区域 gDNA 3 724 bp, 起始密码子至终止密码子序列长 2 858 bp, 登录到
GenBank (登录号为 EU369651), 并注释。Gln1-4基因含 10个外显子与 9个内含子, 18个剪接位点均为保守的 5供位
GU与 3′受位 AG模式。编码的 GS蛋白由 356个氨基酸组成, 分子量 39.2 kD, 等电点(pI)为 5.202。氨基末端外显子
2到外显子 6 为氨离子结合结构保守功能域; 羧基末端外显子 8 与外显子 9 构成 ATP 酶活性保守功能域。Gln1-4 与
Gln1-3 基因相比, 在 DNA 序列、氨基酸序列、基因结构、保守功能域均很保守, 氨基酸序列一致性达 98.31%。52
个玉米自交系的 Gln1-4等位变异分析中, 共鉴定出 318个等位变异位点, 其中 242个 SNP, 45个 Indels, 占 90%。该
基因氮利用效率功能关联性分析区间应位于氨离子结合功能域与 ATPase活性保守功能域中重要的变异位点, 18个剪
接位点。
关键词: 玉米; Gln1-4基因; 功能域; 自然等位变异; 氮利用效率
Genomic DNA Sequence, Gene Structure, Conserved Domains, and Natural
Alleles of Gln1-4 Gene in Maize
WU Yong-Sheng1,2, LI Xin-Hai1, HAO Zhuan-Fang1, ZHANG Shi-Huang1, and XIE Chuan-Xiao1,*
1 Institute of Crop Sciences, Chinese Academy of Agricultural Sciences / National Key Facilities for Crop Gene Resource and Genetic Improvement,
Beijing 100081, China; 2 Guangxi Maize Research Institute, Nanning 530227, China
Abstract: Maize (Zea mays L.) cultivars with improved nitrogen use efficiency would be beneficial for low-input production
systems and for environment since it would reduce the surface water pollution and the nitrate leaching into underground water.
Glutamine synthetase genes families are the core elements for nitrogen assimilation and metabolism in maize plants. The
objectives of this study were to isolate the genomic DNA sequence of Gln1-4, which is one of the important members of
glutamine synthetase gene family, to analyze the gene structure, conserved domains and natural allelic variations and so that was
to found basis for association analysis of the functional sites related to nitrogen use efficiency in maize. PCR walking strategy was
applied to isolate the gDNA sequence of Gln1-4 and its flanking sequence. The gene structure was analyzed by aligning gDNA
sequence and its mature mRNA sequence. The conserved domains were obtained by searching Conserved Domain Database
(CDD) at NCBI. The natural allelic variations were evaluated by resequencing and aligning DNA sequences among 52 inbreds. A
total of 3 724 bp gDNA sequence of Gln1-4 of Mo17 was assembled. The full length of the coding region was 2 858 bp, which
was comprised of ten exons separated by nine introns. All 18 splicing sites were the conserved sequence of GU at 5′ donor sites
and AG at 3′ acceptor sites. The sequence has been submitted to GenBank (accession No. EU369651) and annotated in details.
Gln1-4 encodes a GS protein with molecular weight of 39.2 kD, which was comprised of 356 amino acids. Its isoelectric point (pI)
was 5.202. Conserved domain searching results showed that the region from exon 2 to exon 6 at amino-terminal was an
984 作 物 学 报 第 35卷
ammonium ion binding domain, and exon 8 to exon 9 at carboxyl terminal consisted of an ATPase activity domain. As compared
with Gln1-3, the DNA sequence, amino acid sequence, gene structure and conserved domains for Gln1-4 were highly conserved
with a 98.31% identity of amino acid sequence. A total of 318 types of natural DNA variation at important and target region of
Gln1-4 gene were identified among 52 maize inbred lines, of which 242 was SNPs and 45 was small indels, comprising 90% of
the total allelic variations. The analysis of the functional sites gene associated with nitrogen use efficiency of Gln1-4 in maize
should focus on binding and catalyzing domains and splicing sites.
Keywords: Maize; Gln1-4; Conserved Functional domain; Natural allelic variation; Nitrogen use efficiency
氮肥是农作物生产上使用最多的大量营养元素
肥料, 禾谷类作物品种高产潜力的发挥极大地决定
于氮肥投入[1]。氮肥利用效率低下是世界农业研究
领域的难题 , 禾谷类作物氮利用效率平均仅约为
33%[2]。玉米是我国种植面积第二大作物, 生物量大,
需氮量高, 是氮肥施用的主要对象之一, 提高玉米
氮肥利用效率具有重要的研究意义[3-4]。因此, 近年
来, 玉米等禾谷类作物氮利用效率遗传与生理学基
础成为研究热点领域之一, 并取得了重要进展[5-7]。
谷氨酰胺合成酶(glutamine synthetase, GS)是玉米等
禾谷类作物氮利用效率相关的氮同化、活化
(remobilization)、转运(transportation)与再同化途径
的代谢中枢酶, 也是解决玉米等禾谷类作物氮利用
效率问题的重要切入点[8-10]。Martin等[11]研究证实,
玉米茎杆与穗部GS同工酶由谷氨酰胺合成酶基因
家族Gln1-3 与Gln1-4 基因编码, 具有穗部氮同化酶
活性, 并分别与籽粒数目与籽粒大小相关, 因而直
接与氮利用效率与产量相关联。研究表明, 一些重
要基因在玉米自然群体的植物体内蕴藏着大量的自
然等位基因变异, 这些基因的多态性可能与基因的
功能相关联, 因此, 通过关联性分析的方法鉴定这
些重要的功能自然等位变异, 是优异基因资源发掘
的重要手段, 分离这些基因的基因组DNA全长并进
行分析是关联性分析的重要基础。谢传晓、吴永升
等[12]报道了Gln1-3 基因gDNA序列分离、基因结构
分析、重要功能域分析及在我国玉米主要类群材料
中的自然等位变异。本研究拟针对谷氨酰胺合成酶
基因家族另外一个重要基因Gln1-4, 用PCR步移
(walking)的方法, 获得基因DNA全长, 对基因结构
与功能域进行分析 , 并初步鉴定多个玉米自交系
Gln1-4 基因自然等位变异, 为基于Gln1-3 与Gln1-4
基因的氮利用效率与产量构成相关因子的关联性分
析奠定基础。
1 材料与方法
1.1 试验材料
2006年春, 52份玉米自交系(表 1)种植于中国农
业科学院东门实验基地。其中 , Mo17 用于分离
Gln1-4 基因的全长, 其余 51 份自交系用于 Gln1-4
等位变异分析。
1.2 基因组 DNA提取及高保真 PCR扩增
于玉米幼苗 6~8 叶期, 取无坏死、无损伤、无
病斑的干净鲜叶约 500 mg, 采用CTAB法[13]提取并
纯化基因组DNA。
根据 Gln1-4 mRNA序列 (GenBank登录号为
x65929)设计PCR扩增引物。设计引物时考虑基因家
族不同等位基因之间的特异性序列, 确保引物结合
位点 3端至少 7 个碱基与Gln1-3 完全不同。为获得
上下游序列, 参照Joses等[14]的方法, 分别设计衔接
头和引物, 对已知序列区间 5′与 3′端分别进行PCR
步移。
PCR扩增体系 25 µL, 含 1×PCR buffer (含 2
mmol L−1 Mg2+)、6.25 µmol L−1 dNTP、10 pmol正向
和反向引物、1 U Taq DNA聚合酶。反应程序为 94℃
预变性 3 min; 94℃变性 30 s, 58~64℃退火 45 s (退火
温度依引物而异), 72℃延伸 1 min, 30个循环; 72℃
终延伸 10 min。以酶活性单位比 1∶5, 在Taq DNA
聚合酶(上海生物工程技术服务有限公司)中加入pfu
DNA聚合酶(Promega公司), 以利用其校对功能活性,
保证DNA扩增序列的保真性。
1.3 PCR扩增产物的克隆、转化与测序
将回收产物连接到pMD18-T载体上(TaKaRa公
司), 16℃连接 3 h, 以连接产物转化大肠杆菌JM109
菌株感受态细胞 , 蓝白斑筛选阳性克隆 [15], 菌落
PCR(以阳性菌落为模板)鉴定重组转化菌。经菌落
PCR鉴定为阳性克隆的菌落被重新挑入 3 mL含Amp
的LB液体培养基中 37℃ 220 r min−1摇菌 12 h, 取 1
mL菌液送中国农业科学院国家农作物基因资源与
遗传改良重大工程楼分析中心用ABI3730 测序仪测
序, 为保证测序结果的可靠性, 每个扩增片段纯化、
连接与转化后 , 采用双样本 , 双向测序 , 测序引物
使用载体通用引物。
1.4 序列拼接、提交
利用 DNAStar 生物软件包 Seqman 程序完成测
第 6期 吴永升等: 玉米 Gln1-4的 gDNA序列、基因结构、保守功能域与等位变异 985
序序列的拼接 , 并通过美国国家生物信息中心
(NCBI)网站 Bankit界面提交, 设置公开时间为 2009
年 2月 1日。
1.5 内含子和保守结构域(conserved domain)分析
通过比较NCBI blast two sequences完成mRNA
序列与基因组DNA比对, 并通过手工仔细核对, 并
人工分析剪接位点供位、受位与识别序列等信息。
于NCBI中的CDD (Conserved Domain Database)库中
搜索和分析保守结构域[16]。
根据本研究的分析结果, 设计引物对 Gln1-4基
因的 ATP酶活性结构域和氨离子结合保守功能域进
行 PCR 扩增, PCR 引物(由北京奥科公司合成)见表
1。PCR体系及扩增程序同前文所述, 退火温度各引
物对略有不同。PCR 产物回收、纯化及测序方法同
上。测序引物采用 PCR 引物, 各样本双向测序, 比
对确认。DNAStar程序 MegAlign对各自交系样本之
间测序结果进行比对, 分析所有供试材料两个保守
功能域自然等位变异。
表 1 Gln1-4基因重要功能域自然等位变异鉴定 PCR引物
Table 1 Primer pairs for identifying natural variations in important conserved domains of Gln1-4 gene
引物
Primer
扩增区域
Amplification region
引物序列
Primer sequence (5–3)
退火温度
Anneal temp.
(℃)
PCR产物
PCR fragment size
(bp)
F: TGGATCTGGCATGGATCTCA Gln1-4_N1 氨离子结合功能域 5端
Ammonium ion binding domain at 5 terminal R: TGTAGGGTATGTACAACTTTTAGTC
58 ~657
F: TTGTCTAATAGTAGTAGTAGGGGC Gln1-4_N2 氨离子结合功能域 3端
Ammonium ion binding domain at 3 terminal R: AGCACGGAACAGTGGACGTCATT
60 ~444
F: ACCTGGCAAAAACCTTGTTC Gln1-4ATP ATP酶活性结构域
ATPase activity structural domain R: GCTTCCAGATGATGGTGGTCT
58 ~773
2 结果与分析
2.1 Gln1-4基因组 DNA全长
通过 PCR 扩增与 PCR 步移策略分别获得扩增
核心区域与该基因上下游侧翼序列, 全长 3 724 bp,
起始密码子至终止密码子序列长 2 858 bp, 提交到
GenBank, 登录号为 EU369651, 并进行了详细注
释。为保证分析序列结果的可靠性 , 比对 Gln1-4
mRNA 多处与 Gln1-4、Gln1-2、Gln2 和 Gln3 等同
源性高的非等位基因序列特征性 SNP 和 Indel 位点
信息, 结果表明上述拼装序列为基因组 Gln1-4 区域
DNA序列。
2.2 基因结构
对 Gln1-4 基因的结构(图 1)分析表明, 编码区
自起始密码子(ATG)至终止密码子(TGA)长 2 858 bp,
由 10个外显子组成, 分别标为 exon 1至 exon 10, 外
显子中间有 9 个内含子。此外, 已注释的序列还包
括 5非翻译区(UTR) 84 bp, 3UTR 148 bp。其余 634
bp 为未注释的序列, 包括 5端启动子及其调控元件
序列等, 有待进一步研究。
图 1 Gln1-4基因结构
Fig. 1 Structure of Gln1-4 gene
2.3 Gln1-4与 Gln1-3序列比较
为了确保能在Gln1-4基因的功能域中得到特异
性的扩增, 对 Gln1-4 (GenBank登录号为 EU369651)
与 Gln1-3 (GenBank 登录号为 EU338535)基因序列
进行比对。Wilbur-Lipman成对序列差异比对结果表
明, 这两个基因 gDNA序列相似性为 85.1%, 主要的
序列差异位于内含子等非编码区, 共有 6个Gap, 平
均 Gap长度为 29 bp, 最大一致序列长度为 410 bp。
因此, 可以针对这两个基因的差异序列区域设计特
异性引物, 扩增这两个基因的功能域序列。
2.4 蛋白质性质与保守功能域分析
Gln1-4 基因编码的 GS 酶蛋白由 356 个氨基酸
组成(图 2)。分子量 39.2 kD, 蛋白质的性质分析表
明, 不存在跨膜域, 可能为细胞质蛋白, 等电点 pI
为 5.31, 当缓冲液 pH值为 7.0时, 带 7.365个负电。
pI、序列信息、氨基酸组成、亲/疏性等性质为该蛋
986 作 物 学 报 第 35卷
图 2 Gln1-4编码的 GS1酶蛋白氨基酸序列、外显子与功能域区域
Fig. 2 Amino acid sequence, regions of exons, and conserved domains of GS1 protein encoded by Gln1-4
行头与行间数据指示氨基酸序列位置, 氨离子结合保守功能域与 ATP酶活性保守功能域部分分别位于框中。
The numbers at the head of the lines and between lines indicates the amino acid positions. The amino ion binding conserved domain and
ATPase activity conserved domain are boxed.
白的生理生化分析奠定了分析基础。
结构域分析表明, Gln1-4 编码蛋白氨末端外显
子 2 至外显子 6 与氨离子结合结构域(beta-Grasp)保
守功能域具有极显著相似性 , 期望值(E值)达 3×E
−22, 推测 Gln1-4 基因具有一个氨离子结合功能的
保守功能域; 外显子 8 和 9与数据库中 ATP结合功
能域具有极显著的相似性(期望值为 2×E−60), 推测
Gln1-4基因具有一个结合 ATP、具有 ATP酶活性和
具有催化功能的保守功能域, 催化氨离子与谷氨酸
生成谷氨酰胺(表 2和图 2)。这两个保守功能域与理
论上 Gln1-4基因应具有的功能相吻合。
2.5 Gln1-4与 Gln1-3氨基酸序列比较
经序列比较 , Gln1-4 与 Gln1-3 的一致性高
达 98.31%, 仅有 6 个氨基酸不同 , 其中 3 个位于
ATPase活性功能域的外显子 8与外显子 9中, 2个位
于氨离子结合结构域中的外显子 2到外显子 6中(图
3)。
Gln1-4与Gln1-3氨基酸残基性质发生较大变化
的有 41位脯氨酸(Gln1-4)到丝氨酸(Gln1-3), 由非极
性氨基酸变为极性; 109 位丝氨酸(Gln1-4)到天冬氨
酸 Gln1-3), 由极性变为带负电荷 ; 245 位甘氨酸
(Gln1-4)到丙氨酸(Gln1-3), 由亲水性变为弱疏水性
氨基酸。这些位点间的差异可能是基因家族两个成
员基因功能差异的主要位点(表 3)。
2.6 Gln1-4 自然等位变异
在 52个玉米自交系中, 对Gln1-4的重要区域进
行了分析, 包括氨离子结合结构域 1 101 bp (分成两
段分别进行分析)和 ATPase 活性结构域 773 bp, 总
长为 1 874 bp。其中, 共检测到稳定的多态性位点
318个, 主要变异类型存在 242个 SNP、45个 Indel、
表 2 玉米自交系 Mo17 Gln1-4序列保守功能域分析
Table 2 Conserved domain analysis of the Gln1-4 sequence of maize inbred Mo17
氨基酸序列位置
Position of amino acid sequence功能域
Functional domain
CD库编码
Codes of conserve
domain database
期望值
E-value
起始 Start 终止 Stop
外显子区间
Interval of exons
gDNA区间
gDNA interval
谷氨酰胺合成酶 ATP酶活性结构域
Glutamine synthetase, ATPase acti-
vity structural domain
pfam00120 2 × E−60 198 306 Exon 8–exon 9 2166–2607
谷氨酰胺合成酶氨离子结合功能域
Glutamine synthetase, beta-Grasp
domain
pfam03951 3 × E−22 26 154 Exon 2–exon 6 615–1852
氨基酸以起始蛋氨酸残基计为第 1号; 基因组 DNA以起始密码子 ATG中 A计为第 1。
The amino acids sequence is numbered from the start methionine. gDNA is numbered from “A” of start codon “ATG”.
第 6期 吴永升等: 玉米 Gln1-4的 gDNA序列、基因结构、保守功能域与等位变异 987
图 3 Gln1-4 与 Gln1-3基因氨基酸序列比对图
Fig. 3 Amino acids sequences alignment between Gln1-4 and Gln1-3
表 3 Gln1-4与 Gln1-3基因与氨基酸比较
Table 3 Comparison of amino acids between Gln1-4 and Gln1-3
位置
Position
Gln1-4 Gln1-3 蛋白功能域
Functional domain
残基性质差异
Difference of residue characteristic
15 苏氨酸 Thr 天冬酰胺 Asn 非
None
极性→极性
Polarity to polarity
41 脯氨酸 Pro 丝氨酸 Ser 氨离子结合域
Ammonium ion binding domain
非极性→极性
Non-polarity to polarity
109 丝氨酸 Ser 天冬氨酸 Asp 氨离子结合域
Ammonium ion binding domain
极性→极性带负电荷
Non-polarity to polarity with negative charged
205 苏氨酸 Thr 丝氨酸 Ser ATP酶活性功能域
ATPase activity domain
极性→极性
Polarity to polarity
245 甘氨酸 Gly 丙氨酸 Ala ATP酶活性功能域
ATPase activity domain
亲水→疏水
Hydrophilic to hydrophobic
278 赖氨酸 Lys 精氨酸 Arg ATP酶活性功能域
ATPase activity domain
碱性→碱性
Alkalinity to alkalinity
9个较长片段(>8 bp)插入与缺失和 22个基因内 SSR,
分别占总变异的 76.0%、14.0%、2.8%和 7.0%。由
于 Indel也可以通过 SNP检测, 因此, SNP可达总变
异的 90%。
这 318个主要多态性位点 (变异 )将作为关联
性分析的主要分析位点。以氨离子结合功能域分
析部分为例(表 4), 发现 10个重要变异位点 , 各自
交系位点的基因型组合 , 也可称为该基因氨离子
结合功能域单体(倍)型。如 671 位单核苷酸“C”
插入或缺失 , 52个自交系中有 2种变异类型 , “+1”
表示比“−1”多 1 个 C 插入 , “−1”则表示比“+1”
缺失 1 个“C”重复单元。同样 , 716 位有 2 种基
因型 , 是一个 Indel, “+1”表示比“−1”多 1 个
“TCGTC”重复单元 ,“−1”则表示比“+1”缺失
1 个“TCGTC”重复单元。808 位则是一个“T/A”
SNP, 也为 2 种基因型 , 或者为“T”, 或者为“A”。
以此类推 , 822 位为“T/C”SNP, 886 位为“G/A”
SNP, 1 629 位为“T/C”SNP, 1748 位为“G/A”SNP,
1 873 位为“T/A”SNP, 1 685 位为“ATCCAC”Indel,
1 886 位为“TGAAGTT”Indel。另外 , 对氨离子
结合功能域 10 个重要变异位点在 52 个自交系中
的分布进行归类 , 结果共发现 13 种单倍型 , 其中
有 7种分别只有 1个自交系与之对应 , 有一种多达
23 个自交系与之对应(表 5)。
988 作 物 学 报 第 35卷
表 4 Gln1-4基因氨离子结合功能域在 52个自交系中的自然等位变异
Table 4 Natural variations of amino ion binding conserved domain of Gln1-4 in 52 maize inbred lines
位置与变异类型 Sites and DNA variation 自交系
Inbred line 671 C
716
TCGTC
808
T/A
822
T/C
886
G/A
1629
T/C
1685
ATCCAC
1748
G/A
1873
T/A
1886
TGAAGTT
32 1 −1 T C G T −1 G T −1
485 1 −1 T T A C −1 G A 1
803 1 −1 T T A T −1 G T −1
5213 1 1 T C G C −1 G A 1
7884 1 1 T C G C −1 A T −1
8415 1 1 T C G C 1 G T −1
698-3 1 −1 T C G T −1 G T −1
706辐 706 Fu 1 −1 T T A C −1 G A 1
B73 1 −1 T C G T −1 G T −1
CA339 1 −1 T T A C −1 G A 1
CML396 1 −1 A T G C −1 G T −1
E28 1 −1 T T A C −1 G A 1
H201 1 −1 T C G T −1 G T −1
J002 1 −1 T T A C −1 G A 1
K12 1 −1 T T A C −1 G A 1
Mo17 1 −1 T T A C −1 G A 1
长 3 Chang 3 1 1 T C G C −1 A T −1
川 273 Chuan 273 1 −1 T C G T −1 G T −1
川 321 Chuan 321 1 −1 T T A C −1 G A 1
丹 599 Dan 599 1 1 A T G C −1 G T −1
东 156 Dong 156 1 1 T C G C 1 G T −1
东 91 Dong 91 1 −1 T T G T −1 G A −1
多黄 29 Duohuang 29 1 −1 T T A C −1 G A 1
旱 21 Han 21 1 −1 T T A C −1 G A 1
旱 23 Han 23 1 −1 T T A C −1 G A 1
黄 C Huang C 1 −1 T T A C −1 G A 1
黄野四 Huangye 4 1 −1 T T A C −1 G A 1
黄早四 Huangzao 4 1 −1 T T A C −1 G A 1
吉 412 Ji 412 1 −1 T T A C −1 G A 1
吉 419 Ji 419 1 −1 T T A C −1 G A 1
吉 465 Ji 465 1 −1 T T A C −1 G A 1
吉 477 Ji 477 1 1 T C G C 1 G T −1
吉 63 Ji 63 1 −1 T T A C −1 G A 1
吉 853 Ji 853 1 −1 T T A C −1 G A 1
辽 2345 Liao 2345 1 −1 T T A T −1 G T −1
辽 3053 Liao 3053 1 −1 T T A T −1 G T −1
辽白 371 Liaobai 371 1 1 T C G C −1 A T −1
龙抗 11 Longkang 11 1 −1 T T A C −1 G A 1
鲁 2548 Lu 2548 −1 −1 T T A T −1 G T −1
鲁原 92 Luyuan 92 1 −1 T T A C −1 G A 1
齐 318 Qi 318 −1 −1 T T A C −1 G A 1
沈 118 Shen 118 1 −1 T C G T −1 G T −1
沈 136 Shen 136 1 1 T C G C −1 G T −1
沈 5003 Shen 5003 1 −1 T T A T −1 G T −1
掖 478 Ye 478 1 −1 T T A T −1 G T −1
英 64 Ying 64 1 −1 T T G C 1 G T −1
豫 12 Yu 12 1 −1 T T A C −1 G A 1
杂 C546 Za C546 1 1 T C G T −1 G T −1
中 451 Zhong 451 1 −1 T C G T −1 G T −1
中黄 204 Zhonghuang 204 −1 −1 T T A C −1 G A 1
中自 01 Zhongzi 01 1 −1 T T A C −1 G A 1
综 31 Zong 31 −1 −1 T T A C −1 G A 1
“+1”表示比“-1”位点多一个序列单元的插入。
“+1” denotes one more insertion sequence unit than “−1”.
第 6期 吴永升等: 玉米 Gln1-4的 gDNA序列、基因结构、保守功能域与等位变异 989
表 5 Gln1-4基因氨离子结合功能域在 52个自交系中的自然等位变异单倍型分类
Table 5 Classification of haplotypes in identified natural variations of amino ion binding conserved domain of Gln1-4 among 52
inbred lines
单倍型
Haplotype
自交系个数
No. of inbred lines
单倍型
Haplotype
自交系个数
No. of inbred lines
单倍型
Haplotype
自交系个数
No. of inbred lines
11ATGC-1GT-1 1 1-1TTGC1GT-1 1 1-1TTAT-1GT-1 5
1-1ATGC-1GT-1 1 1-1TTGT-1GA-1 1 1-1TCGT-1GT-1 7
11TCGC-1GA1 1 11TCGC-1AT-1 3 1-1TTAC-1GA1 23
11TCGT-1GT-1 1 −1-1TTAC-1GA1 3
−1-1TTAT-1GT-1 1 11TCGC1GT-1 4
3 讨论
3.1 PCR与步移技术路线的可行性与结果的可
靠性
本研究利用PCR步移技术路线获得Gln1-4 基因
全长、5′UTR及 3′UTR等序列。该技术利用接头序列
上的PCR特异性引物和由已知序列而设计的PCR引
物相结合, 接头 3′端暴露氨基的存在阻止了接头引
物之间的非特异PCR扩增。这个接头特征具有阻止
接头短链DNA延伸从而导致一个接头引物结合位点
形成的危险, 接头引物结合位点仅在PCR延伸时才
由已知序列特异性引物产生, 保证了扩增结果的正
确性。另外, 在对已知序列引物设计上, 保留 30 bp
左右的末端序列 , 以便于验证 , 确保结果可靠。
Amanda等 [17]通过类似方法获得了插入T-DNA序列
上下游约 1 000 bp的未知序列, 并进行了验证。另外,
Peterman和Goodman[18]证实 , 高等植物谷氨酰胺合
成酶以基因家族的形式组织, 成员较多, 不同非等
位基因成员之间有较高的保守性, 某些成员可能存
在基因冗余, 因此, 从基因组文库分离基因组DNA
全长的可行性不高。Martin等 [11]研究表明 , 玉米
Gln1-4 基因在基因组内是单拷贝的 , 不仅具有
Southern杂交证据 , 而且该基因敲除后在表型上具
有可见的功能缺陷。因此, 只要试验设计得当, 使用
PCR步移的方法是可行的。本研究中Gln1-4 基因测
序的结果用编码区与基因家族其他成员之间有多态
性的数十个特征性的SNP与Indel标记进行了验证 ,
基因结构分析也验证了编码蛋白氨基酸序列结果。
因此, 结果是可靠的。
Gln1-4 与本课题组研究的谷氨酰胺合成酶基因
家族另外一个重要成员Gln1-3[12](GenBank登录号为
EU338535)氨基酸序列一致性高达 98.3%, 但这两个
基因gDNA序列Wilbur-Lipman 成对序列差异比对
结果表明相似性仅 85.1%, 主要的序列差异位于内
含子等非编码区, 本研究所用的 3 对Gln1-4 特异引
物均位于比对的差异区, 引物结合位点 3端至少 7
个碱基与Gln1-3 完全不同。因此能保证其扩增的特
异性。双向测序则保证了序列测序的准确性, 对双
向测序差异大于 2 bp的样本, 进行了重复测序, 进
一步保证了序列结果的准确性。
3.2 剪接(splicing)方式与剪接位点分析
高等植物的可变剪接(alternative splicing)是基
因表达调控的一种方式。已知的高等显花植物有 4
种常见的剪接方式, 即 5供位保守的GU序列, 由U1
小 核 糖 核 蛋 白 颗 粒 (snRNP, U1 small nuclear
ribonucleoprotein particle)识别; 3′端受位保守的AG
序列, 由U2 辅助因子 35 (U2 AF35, U2 auxillary
factor 35)辅助剪接完成 ; 3′端寡嘧啶 , 由U2 AF65
(U2 auxillary factor 65)完成辅助剪接; 3′端剪接位点
17~40 bp上游CURAY序列(其中R为嘌呤, Y为嘧啶),
由U2 snRNP识别[19]。基因的自然等位变异中剪接位
点序列可能揭示其可能存在DNA转录后(剪接)水平
不同的调控方式。因此, 有必要对该基因的剪接位
点与方式进行分析。通过详细比对Gln1-4 DNA与成
熟mRNA序列, 详细分析剪接位点与剪接方式, 9 个
内含子中每个含供位与受位共 18个剪接位点, 均遵
循高等真核生物 5′供位GU(a)与 3′端受位AG(b)模式,
这与我们已报道的GS基因家族另外一个成员Gln1-3
基因[9]不同, 在Gln1-3基因的 9个剪接内含子中, 有
6个遵循 5′供位GU(a)与 3′端受位AG (b)模式, 其余 3
个剪接方式不明。因此, 这 9个内含子的 18个剪接
位点是自然等位变异分析重要位点。
3.3 重点分析区域与关联性分析基础
本研究的最终目标是在大批玉米材料中鉴定
Gln1-4 基因重要区域的自然等位变异, 并结合其表
型, 对突变位点的功能进行关联性分析。功能上有
差异的突变主要有以下三种可能, 一是基因重要功
能域内的非同义突变, 导致酶活性中心重要氨基酸
990 作 物 学 报 第 35卷
取代 , 而影响其功能; 二是剪接位点发生突变 , 产
生了不同的剪接方式, 可能导致产生不同的酶而影
响活性。Reddy[19]总结了近年来高等植物通过剪接
方式实现基因调控的事实, 认为大大低估了植物这
种调控机制; 三是在启动子区或上下游存在其他顺
式元件中发生变异, 从而影响基因对调控信息的响
应与基因的表达。因此, Gln1-4基因两个重要保守功
能域、18个剪接位点等序列将是自然等位变异分析
的重点区域。目前, 我们已完成了中国玉米部分种
质Gln1-4 以及其他重要基因的自然等位变异分析,
结合已获得的中国玉米群体结构分析结果[20]以及即
将完成的表型鉴定结果, 将实现该基因功能关联性
分析。
3.4 Gln1-4基因等位变异与功能标记开发
基于候选基因的关联性分析的目的是对基因的
等位变异进行功能关联性分析, 鉴定优异的等位变
异基因, 最终开发出功能标记对育种材料直接进行
筛选。功能标记被定义为来源于基因内部与基因功
能相关, 能显著影响目的性状的多态性位点开发出
的检测标记。由于这些多态性是来自功能基因内部,
且与基因功能相对应, 因而排除了标记和优良性状
基因被重组与交换的可能, 是一种可靠的分子标记
辅助选择育种(MAS)工具。利用功能标记研究我国
代表性玉米种质, 对玉米的Gln1-4 基因的功能位点
进行分型, 结合自交系低氮条件下的产量表现进行
关联性分析 , 发掘对我国玉米育种有重要意义的
Gln1-4 基因的功能性单体型(functional haplotype),
对我国玉米育种的发展具有重要的意义。目前, 国
际上 , Thornsberry等 [21]通过关联性分析研究表明 ,
玉米D8基因全长中有 9个主要的功能位点与开花期
关联 , 并在欧洲优良玉米自交系中验证了此结果 ,
这些功能位点多态性能够转换成控制开花期的功能
标记(FMs)[22-23]。谢传晓等[24]分析了 160个中国玉米
自交系的开花期与生育期性状, 鉴定与验证了我国
玉米自交系D8基因功能单体型, 成功开发了一个功
能标记, 用于早熟分子育种。Carlos等[25]报道了玉米
类胡萝卜素代谢途径自然等位变异发掘的重要研究
成果, 鉴定出维生素A (VA)复杂的代谢网络中, LcyE
基因座 4个自然等位变异能解释VA前体化合物含量
差异的 58%, 依据这 4 个变异而开发的分子标记可
以应用于高VA前体的玉米品质的分子育种研究。
本研究在排除一些非重要功能域以及部分内含
子区域变异后, 仍然获得了多达 318 个稳定的等位
变异。Thornsberry等 [18]在对玉米开花期转录因子
Dwarf8 基因的关联性分析中, 从数百个多态性位点
中, 选择分析了 123个, 证明有 9个位点与早开花功
能性关联性较强, 其中 3个至关重要。本研究共发
现 318个等位变异, SNP变异占 90%。一些重要功能
域的非同义SNP, 导致氨基酸取代 , 会引起变异蛋
白性质发生重要改变, 此类变异将是结构变异分析
的重点。此外, 变异位点虽然多达数百个, 但单体
(倍)型则相对较为简单, 数目则少得多。本研究分析
Gln1-4基因氨离子结合功能域的 10个重要变异位
点在 52个自交系中的分布 , 鉴定的单体型也就 13
种。待关联性分析后, 功能性的单体型则更少, 可能
只有几种 , 而将来根据这些单体型进行标记开发 ,
也只需要 1个到数个标记就能解决复杂的问题。
4 结论
获得了 Gln1-4 基因全长及 5UTR 及 3UTR 等
序列, 并对该基因结构、保守功能域与自然等位变
异进行了分析。Gln1-4 基因氮利用效率功能关联性
分析区间位于结合与催化保守功能域重要的变异位
点、18个剪接位点。本研究结果为该基因功能关联
性分析、氮利用效率相关的分子育种工具开发与优
异等位基因分离等奠定基础。
References
[1] Cassman K G. Ecological intensification of cereal production
systems: Yield potential, soil quality, and precision agriculture.
Proc Natl Acad Sci USA, 1999, 96: 5952−5959
[2] William R R, Gordon V J. Improving nitrogen use efficiency for
cereal production. Agron J, 1999, 91: 357−363
[3] Zhang W-L(张维理), Wu S-X(武淑霞), Ji H-J(冀宏杰), Kolbe H.
Estimation of agricultural non-point source pollution in China
and the alleviating strategies: I. Estimation of agricultural
non-point source pollution in China in early 21 century. Sci Agric
Sin (中国农业科学), 2004, 37(7): 1008−1017 (in Chinese with
English abstract)
[4] Sun Z-M(孙志梅), Wu Z-J(武志杰), Chen L-J(陈利军), Liu
Y-G(刘永刚). Research advances in nitrogen fertilization and its
environmental effects. Chin J Soil Sci (土壤通报), 2006, 37(4):
782−786 (in Chinese with English abstract)
[5] Hirel B, Berlin P, Quillere I, Bourdoncle W, Attagnant C, Dellay
C, Gouy A, Cadiou S, Retailliau C, Falque M, Gallais A.
Towards a better understanding of the genetic and physiological
basis for nitrogen use efficiency in maize. Plant Physiol, 2001,
125: 1258−1270
[6] Gallais A, Hirel B. An approach of the genetics of nitrogen use
第 6期 吴永升等: 玉米 Gln1-4的 gDNA序列、基因结构、保守功能域与等位变异 991
efficiency in maize. J Exp Bot, 2004, 55: 295−306
[7] Coque M, Gallais A. Genomic regions involved in response to
grain yield selection at high and low nitrogen fertilization in
maize. Theor Appl Genet, 2006, 112: 1205−1220
[8] Li M G, Villemur R, Hussey P J, Silflow C D, Gantt J S, Snustad
D P. Differential expression of six glutamine synthetase genes in
Zea mays. Plant Mol Biol, 1993, 23: 401−440
[9] Miflin B J, Habash D Z. The role of glutamine synthetase and
glutamate dehydrogenase in nitrogen assimilation and
possibilities for improvement in the nitrogen utilization of crops.
J Exp Bot, 2002, 53: 979−987
[10] Gallais A, Coque M. Genetic variation and selection for nitrogen
use efficiency in maize: A synthesis. Maydica, 2005, 50:
531−537
[11] Martin A, Lee J, Kichey T, Gerentes D, Zivy M, Tatout C,
Dubois F, Balliau T, Valot B, Davanture M, Tercé-Laforgue T,
Quilleré I, Coque M, Gallais A, Gonzalez-Moro M, Bethencourt
L, Habash D Z, Lea P J, Charcosset A, Perez P, Murigneux A,
Sakakibara H, Edwards K J, Hirel B. Two cytosolic glutamine
synthetase isoforms of maize are specifically involved in the
control of grain production. Plant Cell, 2006, 18: 3252−3274
[12] Wu Y-S(吴永升), Li X-H(李新海), Zhang Z(张征), Li M-S(李明
顺), Hao Z-F(郝转芳), Zhang S-H(张世煌), Xie C-X(谢传晓).
Genomic DNA sequence, gene structure, conserved domains, and
natural alleles of gln1-3 gene in maize. Acta Agron Sin (作物学
报), 2008, 34(7): 1114−1120 (in Chinese with English abstract)
[13] Saghai-Maroof M A, Soliman K, Jorgensen R A, Allard R W.
Ribosomal DNA spacer-length polymorphisms in barley:
Mendelian inheritance, chromosomal location, and population
dynamics. Proc Natl Acad Sci USA, 1984, 81: 8014−8018
[14] Jones D H, Winistorfer S C. Genome walking with 2 to 4 kb steps
using panhandle PCR. PCR Methods Appl, 1993, 2: 197−203
[15] Sambrook J, Fritsch E F, Maniatis T, eds. Huang P-T(黄培堂)
trans. Molecular Cloning: A Laboratory Manual (分子克隆实验
指南). Beijing: Science Press, 2002. pp 103−105 (in Chinese)
[16] Marchler-Bauer A, Anderson J B, Cherukuri P F, Deweese-Scott
C, Geer L Y, Gwadz M, He S, Hurwitz D I, Jackson J D, Ke Z,
Lanczycki C, Liebert C A, Liu C, Lu F, Marchler G H,
Mullokandov M, Shoemaker B A, Simonyan V, Song J S,
Thiessen P A, Yamashita R A, Yin J J, Zhang D, Bryant S H.
CDD: A conserved domain database for protein classification.
Nucl Acids Res, 2005, 33: 192−196
[17] Amanda C, Yang A P, Heather M, Rosalind C L, Ramsay N A.
Identification of DNA sequences flanking T-DNA insertions by
PCR-Walking. Plant Mol Biol Rep, 2001, 19: 321−327
[18] Peterman T K, Goodman H M. The glutamine synthetase gene
family of Arabidopsis thaliana light-regulation and differential
expression in leaves, roots and seeds. Mol Gen Genet, 1991, 230:
145−154
[19] Reddy A. Alternative splicing of pre-messenger RNAs in plants
in the genomic era. Annu Rev Plant Biol, 2007, 58: 267−294
[20] Xie C X, Warburton M L, Li M S, Li X H, Xiao M J, Hao Z F,
Zhao Q, Zhang S H. An analysis of population structure and
linkage disequilibrium using multilocus data in 187 maize inbred
lines. Mol Breed, 2008, 21: 407−418
[21] Thornsberry J M, Goodman M M, Doebley J, Kresovich S,
Nielsen D, Buckler E S. Dwarf8 polymorphisms associate with
variation in flowering time. Nat Genet, 2001, 28: 286−289
[22] Jeppe R A, Tobias S, Albrecht E, M, Imad Z, Thomas L.
Validation of Dwarf8 polymorphisms associated with flowering
time in elite European inbred lines of maize (Zea mays L.). Theor
Appl Genet, 2005, 111: 206−217
[23] Camus-Kulandaivelu L, Veyrieras J B, Madur D, Combes V,
Fourmann M, Barraud S, Dubreuil P, Gouesnard B, Manicacci D,
Charcosset A. Maize adaptation to temperate climate:
Relationship between population structure and polymorphism in
the Dwarf8 gene. Genetics, 2006, 172: 2449−263
[24] Xie C-X(谢传晓), Wang Z-H(王振华), Yu L( 琍於 ), Zhang W(张
玮), Li M-S(李明顺), Li X-H(李新海), Cheng B-J(程备久),
Zhang S-H(张世煌 ). Characterization of the sensitivity to
photoperoid among 160 maize inbred lines. J Maize Sci (玉米科
学), 2008, 16(3): 15−18 (in Chinese with English abstract)
[25] Carlos E H, Torbert R R, Bai L, Thomas P B, Catherine B K,
Stephen G S, Ann E S, Ratnakar V, Mark W, Eleanore T W, Yan J B,
Edward S B. Natural genetic variation in lycopene epsilon cyclase
tapped for maize biofortification. Science, 2008, 319: 330−333