全 文 :作物学报 ACTA AGRONOMICA SINICA 2010, 36(4): 580−589 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn
本研究由国家自然科学基金重点项目(30830072)和国家重点基础研究计划(973计划)项目(2009CB118303)资助。
* 通讯作者(Corresponding authors): 李雅轩, E-mail: lyx1006@sohu.com; 晏月明, E-mail: yanym@hotmail.com
Received(收稿日期): 2009-10-19; Accepted(接受日期): 2010-01-02.
DOI: 10.3724/SP.J.1006.2010.00580
普通小麦及近缘粗山羊草 α-醇溶蛋白基因的克隆、定位与进化分析
朱西平 李 鑫 李雅轩* 晏月明*
首都师范大学生命科学学院, 北京 100048
摘 要: 通过特异 PCR引物设计, 从普通小麦品种(豫麦 34和烟农 19)和粗山羊草(T9、T197、T48、T176和 T17)中
扩增、克隆了 7个新的 α-醇溶蛋白基因, 分别命名为 Gli-YM34、Gli-YN19、Gli-T9、Gli-T197、Gli-T48、Gli-T176和
Gli-T17, 基因序列长度为 846~891 bp, 编码 282~297 个氨基酸残基, 都具有 α-醇溶蛋白的典型结构特点。其中
Gli-YM34 和 Gli-YN19 基因推导的醇溶蛋白都含有一个额外的半胱氨酸残基, 可能对面筋品质有正向作用。根据 α-
醇溶蛋白氨基酸序列所具有的 4 种 T 细胞抗原表位和多聚谷氨酰胺重复区的平均长度以及中国春缺体四体分析, 将
来自普通小麦品种的 Gli-YM34和 Gli-YN19基因定位在 6D染色体上的 Gli-D2位点, 而且 Gli-YM34和 Gli-YN19与来
自粗山羊草的 α-醇溶蛋白基因具有很高的序列相似性, 进一步证明粗山羊草是普通小麦 D基因组的供体。在克隆的
4个典型 α-醇溶蛋白基因中检测到 21个 SNP和 1个 9 bp的缺失。系统进化分析表明, α-醇溶蛋白基因与低分子量谷
蛋白亚基基因关系较近, 在大约 43.69 百万年时分化, 与 ω-醇溶蛋白和 HMW-GS 基因亲缘关系较远, 它们的分化时
间大约为 79.39百万年。
关键词: α-醇溶蛋白; 普通小麦; 粗山羊草; SNP; 系统进化
Cloning, Chromosomal Location, and Evolutionary Analysis of α-gliadin Genes
from Aegilops tauschii and Common Wheat (Triticum aestivum L.)
ZHU Xi-Ping, LI Xin, LI Ya-Xuan*, and YAN Yue-Ming*
College of Life Science, Capital Normal University, Beijing 100048, China
Abstract: Seven novel α-gliadin genes from common wheat cultivars (Yumai 34 and Yannong 19) and Aegilops tauschii acces-
sions (T9, T197, T48, T176, and T17) were amplified and cloned by using a PCR-based strategy. They were designated as
Gli-YM34, Gli-YN19, Gli-T9, Gli-T197, Gli-T48, Gli-T176, and Gli-T17, respectively. Their length of the open reading frame
(ORF) ranged from 846 to 891 bp, encoding the putative proteins of 282–297 amino acid residues. Comparative analysis showed
that all genes isolated had typical structural characters of α-gliadin genes reported previously. Particularly, Gli-YM34 and
Gli-YN19 α-gliadins from common wheat possessed an additional cysteine residue, suggesting a possible positive effect on dough
quality. Both genes were assigned to Gli-D2 locus on the chromosome 6D by the analysis of four celiac disease toxic epitopes and
glutamine residues in the polyglutamine domain as well as nullisomic-tetrasomic lines of Chinese Spring. A total of twenty-one
single nucleotide polymorphisms (SNPs) and a 9 bp deletion among the four typical α-gliadin genes were identified. Phylogenetic
and evolutionary analysis revealed that the α-gliadin genes are closely related to LMW-GS genes and their divergence occurred
43.69 million year ago. Less homology was found between α-gliadin genes and HMW-GS and ω-gliadin genes, and they diverged
about 79.39 million year.
Keywords: α-gliadins; Common wheat; Aegilops tauschii; SNP (single nucleotide polymorism); Phylogenetics and evolution
醇溶蛋白和谷蛋白(含高、低分子量谷蛋白亚基,
简称 HMW-GS与 LMW-GS)是小麦胚乳中的重要贮
藏蛋白, 它们分别决定面团的延展性和弹性。麦醇
溶蛋白约占小麦种子贮藏蛋白的 40%, 由第 1和第 6
部分同源群染色体短臂上的 Gli-1 (Gli-A1、Gli-B1
和 Gli-D1)和 Gli-2 (Gli-A2、Gli-B2和 Gli-D2)位点编
码 [1], 这些位点均存在广泛的等位基因变异 , 已至
少鉴定并命名了 111个等位基因 [2]。小麦醇溶蛋白
第 4期 朱西平等: 普通小麦及近缘粗山羊草 α-醇溶蛋白基因的克隆、定位与进化分析 581
在结构上为单体蛋白 , 在酸性(pH 3.1)条件下经聚
丙烯酰胺凝胶电泳(A-PA GE)分离后 , 电泳谱带按
分子量大小和迁移率的不同可分为 α、β、γ 和 ω 4
个区, 4种类型分别占醇溶蛋白总量的 25%、30%、
30%和 15%。α、β-和 γ-醇溶蛋白的分子量为 31~33 kD,
N端序列保守, 氨基酸组成相似, 其中脯氨酸、苯丙
氨酸和谷氨酰胺含量较少, 但含硫氨基酸含量较多,
所以将此 3 种麦醇溶蛋白称为富硫醇溶蛋白。富硫
醇溶蛋白分子中的半胱氨酸是形成单肽链内二硫键
的重要因素。ω-醇溶蛋白分子量较大, 为 44~74 kD,
含有大量的脯氨酸、苯丙氨酸和谷氨酰胺, 三者合
计占氨基酸残基总数的 80%左右, 但是缺少半胱氨
酸和甲硫氨酸。因此 ω-醇溶蛋白又称作贫硫醇溶蛋
白[3-4]。ω-和 γ-醇溶蛋白主要由 Gli-1 位点控制, β-
和 α-醇溶蛋白主要由 Gli-2位点控制[1]。不同组分在
分子量和疏水性方面存在差异, 分子量为 α- <β- <γ-
<ω-醇溶蛋白, 疏水性为 ω- <α-<β- <γ-醇溶蛋白[5]。
由于醇溶蛋白存在高度多态性和遗传稳定性 ,与小
麦品质具有密切关系 [6-7], 因此可用于小麦品种鉴
定、种子纯度检测、亲缘关系分析、品质预测, 以
及种质资源遗传多样性分析、物种起源和进化研究
等[8-11]。目前, 有关普通小麦及粗山羊草 HMW-GS
与 LMW-GS基因等位变异、分子克隆与进化方面已
有一些研究报道 [12-13], 而对醇溶蛋白基因研究较
少。本研究采用 AS-PCR 方法从普通小麦品种及其
粗山羊草中克隆 α-醇溶蛋白基因 , 并对其结构特
征、染色体定位、分子进化与普通小麦起源等进行
了分析。
1 材料与方法
1.1 材料
植物普通小麦(Triticum aestivum L., AABBDD,
2n = 6x = 42)豫麦 34和烟农 19由中国农业科学院作
物科学研究所提供; 粗山羊草(Aegilops tauschii, DD,
2n = 2x = 14) T9、T197、T48、T176和 T17以及中
国春缺体-四体材料由德国慕尼黑工业大学生命科
学中心分子遗传研究室提供。
1.2 小麦基因组 DNA 提取及醇溶蛋白基因克隆
测序
取干种子约 30 mg, 砸碎成粉末状, 参照Yan等[12]
提取 DNA。
根据 α-醇溶蛋白基因序列的保守区域设计 1对
兼并性引物 , F: 5-ATGAAGACCTTTCTCATCCTT
G-3, R: 5-TCAGTTRGTACCRAAGATGCC-3。该引
物的扩增范围包括从起始密码子“ATG”到终止密码
子“TGA” 之间的编码序列。PCR 反应液 50 μL 中,
含有DNA模板 100 ng, dNTP混合物(各2.5 mmol L−1)
4 μL, 2×GC buffer I 12.5 µL, 引物 P1和 P2 (52 μmol
L−1)各 1 μL, 5 U μL−1 DNA聚合酶(TaKaRa) 0.25 μL。
PCR的反应条件为 94℃预变性 4 min; 然后 94℃变
性 45 s, 59℃退火 1 min, 72℃延伸 50 s, 共 30个循
环, 最后 72℃延伸 10 min。
PCR 产物经 1.0%琼脂糖凝胶电泳回收目标带,
纯化后与 PGEM-T Easy载体(TaKaRa)连接并进行重
组质粒转化, 蓝白斑筛选后提取质粒, 用 EcoR I 进
行酶切鉴定。DNA序列测定由上海生工生物公司完
成, 每个基因随机选择 3个阳性克隆测序。
1.3 基因序列比较与染色体定位
利用 BioEdit7.0 软件对克隆基因推导的氨基酸
序列和其他 α-醇溶蛋白进行比对和分析。根据推导
氨基酸序列所具有的 4种 T细胞抗原表位、多聚谷
氨酰胺重复区的平均长度及同源性分析, 对普通小
麦品种中克隆的 α-醇溶蛋白基因进行染色体定位[14]。
同时 , 用设计的 PCR 引物对中国春缺体 -四体系
(N6A/T6B、N6B/T6A、N6D/T6B 和 N6A/T6B)进行
PCR扩增, 对克隆基因进行染色体定位和验证。
1.4 基因编码区 SNPs和 InDels鉴定
利用 BioEdit7.0 软件对本试验中所克隆的基因
序列和其他 10个位于 6D染色体上 α-醇溶蛋白基因
进行比对 , 鉴定基因编码区的单核苷酸多态性
(single nucleotide polymorphism, SNP)和插入/缺失
(Insertions/Deletion, InDel)变异[15-16]。
1.5 分子进化分析
利用 DNAMAN 软件构建小麦属中不同醇溶蛋
白和 LMW-GS 基因同源树[15]; 利用 MEGA4.0 软件
构建小麦属中醇溶蛋白、LMW-GS 和 HMW-GS 基
因系统分化的 Neighbour-Joining 树[16], 估算不同基
因间的分化时间, 分析贮藏蛋白分子进化特征以及
普通小麦的起源。
2 结果与分析
2.1 粗山羊草和普通小麦 α-醇溶蛋白基因的
PCR扩增与克隆
利用设计的一对扩增 α-醇溶蛋白基因的兼并性
PCR 引物, 对粗山羊草 T9、T197、T48、T176 和
T17 及普通小麦品种豫麦 34 和烟农 19 的基因组
582 作 物 学 报 第 36卷
DNA进行扩增, 获得一条大小约 900 bp的特异扩增
条带(图 1), 其长度与过去克隆的 α-醇溶蛋白编码基
因相当。
图 1 粗山羊草、普通小麦品种和中国春缺体-四体系 PCR扩增
产物
Fig. 1 1.0% agarose gel electrophoresis of PCR products from
genomic DNA of Ae. tauschii accessions, T. aestivum cultivars
and nullisomic-tetrasomic lines of cv. Chinese Spring
1: T17; 2: T176; 3: T48; 4: N6D/T6B; 5: N6B/T6A; 6: N6A/T6D;
7: N6A/T6B; 8: T197; 9: T9; 10: Yumai 34; 11: Yannong 19.
2.2 α-醇溶蛋白基因比较分析与染色体定位
从粗山羊草 T9、T197、T48、T176和 T17及普
通小麦品种豫麦 34 和烟农 19 扩增得到的 7 个特异
条带进行 DNA测序和序列分析后, 获得 7个全长基
因 , 分别命名为 Gli-YM34、Gli-YN19、Gli-T9、
Gli-T197、Gli-T48、Gli-T176 和 Gli-T17。由于
Gli-T48、Gli-T176 和 Gli-T17 三个基因与 Gli-T9 和
Gli-T197序列相似性很高, 本文只选取有代表性的、
分别来自 T9、T197、豫麦 34和烟农 19的 4个典型
基因(Gli-T9、Gli-T197、Gli-YM34和 Gli-YN19)和其
他已克隆的 α-醇溶蛋白基因的氨基酸序列进行比对
分析(图 2), 结果表明, 4 个基因都具有 α-醇溶蛋白
基因的典型结构特征。与其他已知的醇溶谷蛋白基
因一样没有内含子, 启始密码子后是由 20个氨基酸
图 2 从 T9、T197、豫麦 34和烟农 19中克隆的 4个 α-醇溶蛋白基因推导的氨基酸序列与其他 8个已知序列的比对分析
Fig. 2 Comparison of the deduced amino acid sequences of four α-gliadin genes from Ae. tauschii and other eight genes previously
isolated from common wheat cultivars
第 4期 朱西平等: 普通小麦及近缘粗山羊草 α-醇溶蛋白基因的克隆、定位与进化分析 583
组成的信号肽 (MKTFLILALLAIVATTATTA), 信号
肽之后是 N-端重复区, 分别由一个 5 肽(PQQPY)和
富含谷氨酰胺(Glu, Q)和脯氨酸(Pro, P)残基的 7 肽
(PQPQPFP)重复单元构成。在克隆的 4 个基因中, 2
个来自普通小麦品种的 α-醇溶蛋白比 2 个来自粗山
羊草的 α-醇溶蛋白多了一个 PQLPYPQP单元。同时
还存在多个单碱基的点突变, 这些突变常常发生在
脯氨酸(P)和亮氨酸(L)、亮氨酸(L)和甲硫氨酸(M)
以及脯氨酸(P)和丝氨酸(S)之间的互变。另外, 第 40
位上的谷氨酸(E)在克隆的普通小麦品种中突变为
赖氨酸(K), 而在其他 α-醇溶蛋白中则突变为甘氨酸
(G)或赖氨酸(K)。在 α-醇溶蛋白重复区多富含谷氨
酰胺和脯氨酸残基, 往往包含导致腹泻的有害毒性
氨基酸序列 PSQQ和 QQQP[17]。
在 N-端重复区之后是两个多聚谷氨酰胺区(多
聚谷氨酰胺 I区和多聚谷氨酰胺 II区), 几乎全为谷
氨酰胺残基组成, 它们被两个特殊区域(特征区 I 和
特征区 II)间隔。多聚谷氨酰胺 I区除谷氨酰胺(Q)
在数量上稍有变化之外, 其余没有太大的变化。多
聚谷氨酰胺 II区中谷氨酰胺在数量上有较大的变化,
在粗山羊草 T176 α-醇溶蛋白中, 该区域由于 4个连
续 CAA 突变为 CAC, 产生了 4 个组氨酸(H)。这些
非谷氨酰胺残基的出现, 主要是单个碱基替代的结
果, 如 CAA到 GAA(E)、CAA到 CGA(R)、CAA到
CAC/T(H)或CAA到AAA(K)的突变, 这些突变在所
比对的基因序列中一般都存在。特征区 I 为低脯氨
酸区, 特征区 II为 C-端区。大多数 α-醇溶蛋白在特
征区有 6个保守的半胱氨酸残基(C), 位置比较保守,
其中有 4 个位于特征区 I, 2 个位于特征区 II, 第 1
和第 2、第 3和第 5、第 4和第 6个保守的半胱氨酸
残基可形成 3 个分子内二硫键 [18]。在豫麦 34和烟
农 19 特征区 II 前端存在 1 个额外的半胱氨酸残基,
代替了原来的丝氨酸(S)。半胱氨酸的增加有助于二
硫键的形成 , 从而有可能对面团品质产生有利影
响。
从 T9 和 T197 中克隆的基因来自粗山羊草, 因
此很清楚它们位于 6D 染色体短臂上, 由 Gli-D2 位
点编码。对于来自普通小麦品种的基因, 其编码位
点未知。根据 Van Herpen的染色体定位方法[14]: 存
在 于 不 同 染 色 体 上 的 α-醇 溶 蛋 白 , Gliα-α9
(PFPQPQLPY)、Gliα-α20 (FRPPQQPYPQ)、Gliα-α
(QGSFQPSQQ)和 Gliα-α2 (PQPQLPYPQ)这 4 种 T
细胞抗原表位不同, 位于 6A 染色体上的 α-醇溶蛋
白, 它们总有 Gliα-α9 和 Gliα-α20 这两个抗原表位,
而没有完整的 Gliα-α 和 Gliα-α2; 位于 6B染色体上
的 α-醇溶蛋白没有这 4 个 T 细胞抗原表位; 而位于
6D染色体上的 α-醇溶蛋白, 含有这 4个 T细胞抗原
表位的任意几个。对来自豫麦 34和烟农 19的 α-醇
溶蛋白分析表明, Gliα-α (QGSFQPSQQ)位于特征区
II, 其他 3个位于重复区(图 2)。另外, Van Herpen还
发现, 位于不同染色体上的 α-醇溶蛋白多聚谷氨酰
胺重复区的长度也不同, 位于 6A 染色体上的 α-醇
溶蛋白的多聚谷氨酰胺 I 区(QI)最长, 位于 6B 染色
体上的 α-醇溶蛋白的多聚谷氨酰胺 II区(QII)最长[14]。
统计从普通小麦中得到的 2个基因具有的 4种 T细
胞抗原表位的数量和多聚谷氨酰胺区中的谷氨酰胺
数量如表 1 所示。根据这一方法可将普通小麦中得
到的 2个基因初步定位到 6D染色体上, 与粗山羊草
克隆的 2个基因一样, 也由 Gli-D2位点编码。
利用 4个中国春缺体-四体系(N6A/T6B, N6B/
T6A, N6D/T6B, N6A/T6B)的 DNA, 进行 PCR 扩
增 , 定位结果(图 1)与上述一致 , 证明从普通小麦
品种中克隆的 2 个 α-醇溶蛋白基因也位于 6D 染色
体上。
表 1 来自豫麦 34和烟农 19的 α-醇溶蛋白具有的 4种 T细胞抗原表位的数量以及 2个多聚谷氨酰胺重复区中谷氨酰胺的数量
Table 1 Number of the four T cell stimulatory toxic epitopes and glutamine residues in the ployglutamine domains in the α-gliadins
Gli-YM34 and Gli-YN19
α-醇溶蛋白 α-gliadin Glia-α Glia-α2 Glia-α9 Glia-α20 QI QII
Gli-YM34 1 0 1 2 13 14
Gli-YN19 1 0 1 2 13 8
2.3 基因编码区 SNPs和 InDels分析
对本研究所克隆的 4 个基因和其他 10 个位于
6D 染色体上的 α-醇溶蛋白基因序列 (EF218661,
EF218659, EF218656, EF561270, EF561271,
EF561272, EF561273, EF561276, EF561281,
EF561287)进行比对, 鉴定了 4个编码基因中存在的
SNPs 和 InDels (表 2)。从中可以看出, Gli-T197 的
SNPs 数目最多, 有 17 个 , 其中单个碱基的转换
(A-G和 C-T)有 7个, 占总数的 41%; 颠换(A-T, A-C,
C-G, G-T)有 10个, 占 59%。在编码区中还有一个 9
584 作 物 学 报 第 36卷
个氨基酸残基的缺失(391~399)。而 Gli-T9、Gli-YM34
和 Gli-YN19基因中的 SNPs很少, 分别只有 1、1和
2个, 说明位于 6D染色体上的 α-醇溶蛋白编码基因
相对比较保守。
2.4 基因同源性与分子进化分析
以本研究克隆的 4 个基因和 23 个同源序列的
DNA序列构建的同源树, 27个基因分为两大组, 5个
ω-醇溶蛋白基因为一组, 相似性 77%, 其余 22个基
因为一组, 相似性 57%, 两组之间具有 46%的相似
性。在 24 个基因大组内, 又可分为 3 个亚组, 分别
为 LMW-GS亚基、γ-醇溶蛋白基因和 α-醇溶蛋白基
因, 相似性分别为 78%、86%和 91%。其中 LMW-GS
基因与 α-醇溶蛋白基因具有 60%的相似性, γ-醇溶
蛋白基因与这两个亚组的相似性为 57% (图 3)。另
外, 本研究所克隆的 4 个 α-醇溶蛋白基因相似性都
很高, 相似系数在 96%以上, 这也进一步证明它们
由同一基因位点编码的染色体定位结果, 同时也表
明粗山羊草和普通小麦的 D基因组具有紧密的遗传
进化关系。
利用 MEGA4.0软件对 13个不同类型的醇溶蛋
白、LMW-GS 和 HMW-GS 基因的分化时间进行了
估算, 结果列于表 3。这些基因包括本研究克隆的 4
个 D基因组上的 α-醇溶蛋白基因、2个 B基因组和
2 个 A 基因组上的 α-醇溶蛋白基因、1 个 γ-醇溶蛋
图 3 小麦醇溶蛋白与 LMW-GS基因同源树
Fig. 3 Homology tree showing the relationships among gliadin (α/β-, γ-, ω-) and LMW-GS genes from different Triticum species
表 2 克隆的 4个基因和其他 10个来自 6D上的 α-glidian基因编码区中的 SNPs和 InDels
Table 2 Identification of SNPs and InDels of 4 α-glidian genes cloned from Aegilops tauschii and common wheat
α-glidian基因
α-gliadin genes
29 69 89 111 246 364 391–399 537 624 652 710 771 774 776 824–825 876 891 909–910 941 987
Gli-T9 T T C A G C CAGCAGCAG A A C A A A A TC G C TG A C
Gli-T197 T C T G A T – – – – – – – – – A G G A C C C AG A G CT C G
Gli-YM34 G T C A G T CAGCAGCAG A A C A A A A TC G C TG A C
Gli-YN19 T T C A G T CAGCAGCAG G A C T A A A TC G C TG A C
10 other
α-glidian genes T T C A G/– G/T CAG/ACAG/ACAG/A A A C A A/– A/– A/– TC G/– C/– TG/– – A/– C/–
表 3 13个小麦贮藏蛋白基因间分化时间(百万年)估算
Table 3 Estimation of divergence time (million year) among 13 wheat storage protein genes
贮藏蛋白基因
Storage protein genes
1 2 3 4 5 6 7 8 9 10 11 12
1. Gli-T9 (α-gliadin, D) ―
2. Gli-T197 (α-gliadin, D) 2.46±0.46 ―
3. Gli-YM34 (α-gliadin, D) 1.15±0.31 3.38±0.54 ―
4. Gli-YN19 (α-gliadin, D) 1.31±0.38 3.38±0.54 0.38±0.15 ―
5. EF561274 (α-gliadin, B) 4.31±0.62 5.08±0.69 5.38±0.69 5.38±0.69 ―
6. EF561288 (α-gliadin, B) 4.31±0.62 5.23±0.69 5.38±0.69 5.38±0.69 0.92±0.31 ―
7. EF561283 (α-gliadin, A) 3.46±0.54 4.31±0.62 4.23±0.62 4.38±0.62 5.23±0.69 5.08±0.69 ―
8. DQ401696 (α-gliadin, A) 3.85±0.62 4.77±0.62 4.77±0.62 4.92±0.69 5.54±0.69 5.31±0.69 1.46±0.38 ―
9. M13713 (γ-gliadin) 27.77±1.46 27.38±1.46 28.00±1.46 28.23±1.46 28.15±1.46 27.92±1.46 28.00±1.46 28.62±1.46 ―
10. AY591334 (ω-gliadin) 37.77±1.54 37.62±1.54 38.00±1.54 38.08±1.54 37.54±1.54 37.38±1.54 38.62±1.54 38.85±1.54 36.31±1.54 ―
11. AY841016 (LMW-GS) 30.85±1.46 30.77±1.46 31.00±1.46 31.00±1.46 31.00±1.46 31.08±1.46 30.85±1.46 31.23±1.46 32.08±1.46 39.38±1.54 ―
12. Dx5 (HMW-GS) 43.46±1.46 44.15±1.46 45.54±1.46 43.46±1.46 44.54±1.46 44.54±1.46 43.77±1.46 43.92±1.46 45.69±1.46 46.31±1.46 44.85±1.46 ―
13. Dy12 (HMW-GS) 44.85±1.46 45.23±1.46 44.77±1.46 44.77±1.46 45.46±1.46 45.08±1.46 44.31±1.46 44.31±1.46 45.62±1.46 45.69±1.46 44.85±1.46 14.38±1.15
586 作 物 学 报 第 36卷
白基因、1 个 ω-醇溶蛋白基因、1 个 LMW-GS 和 2
个 HMW-GS基因(x 型和 y 型各 1个)。从估算结果
可看出, A、B、D基因组上的 8个 α-醇溶蛋白基因
分化时间大约在 0.38~5.54 百万年前, 而 Gli-D2 位
点的 4 个 α-醇溶蛋白基因分化较晚(约 0.38~3.38 百
万年), A和 B基因组上的 α-醇溶蛋白基因之间的分化
较早, 大约发生在 5.08~5.54百万年。α-醇溶蛋白基因
与 γ-和 ω-醇溶蛋白基因的分化分别发生大约在 27~28
百万年和 37~38百万年, 与 LMW-GS基因的分化发生
在 31百万年左右, 而与 x-型和 y-型 HMW-GS基因分
化时间最早, 大约发生在 43~45百万年。
在此基础上, 根据基因的核苷酸序列, 采用进
化率 6.5×10−9 [19], 进一步构建了 39个不同基因组编
码的贮藏蛋白基因分子进化树(图 4), 从中可以看出,
α/β-醇溶蛋白和 LMW-GS 基因的分化时间为 43.69
百万年; α/β-醇溶蛋白和 LMW-GS 与 γ-醇溶蛋白基
因的分化时间为 48.74 百万年 ; ω-醇溶蛋白和
HMW-GS基因的分化时间为 73.72百万年; α/β-醇溶
蛋白、LMW-GS和 γ-醇溶蛋白基因与 ω-醇溶蛋白和
HMW-GS基因的分化时间为 79.39百万年。
图 4 小麦属中 39个贮藏蛋白基因的分子进化树
Fig. 4 The Neibour-Joining unrooted phylogene tree of 39 storage protein genes from different Triticum species
从分化时间表可以看出 , 普通小麦 D 基因组
上 的 α- 醇 溶 蛋 白 编 码 基 因 分 化 时 间 最 晚
(0.38±0.15 百万年)。A 基因组上的 α-醇溶蛋白编
码基因分化时间为 1.46±0.38 百万年 , B 基因组上
的基因分化时间为 0.92±0.31 百万年。A、B、D
基因组上 α-醇溶蛋白基因间的分化时间大约为
3~5 百万年 , 表明不同基因组上的 α-醇溶蛋白基
因间分化时间不同。
3 讨论
小麦 α-醇溶蛋白等位变异一般较难鉴定, 主要
原因是其组成具有高度的异质性和复杂性, 一般每
个品种拥有较多的蛋白亚基, 而且大多具有相似的
分子量, 很难分离开。据估计 α-醇溶蛋白基因拷贝
数从 25~35到 100~150不等[18]。所以, α-醇溶蛋白基
因家族中假基因占的比例很高, 据推测约占 50%[20],
第 4期 朱西平等: 普通小麦及近缘粗山羊草 α-醇溶蛋白基因的克隆、定位与进化分析 587
每个编码位点都含有多个假基因, 这可能是由于 α-
醇溶蛋白基因序列中含有丰富的谷氨酰胺密码子
CAA 和 CAG, 碱基替代特别是 C→T 碱基点突变容
易产生终止密码子。本研究从普通小麦及其近缘种
粗山羊草中都克隆到多个假基因(结果未列出)。经
过比对, 发现克隆的 Gli-T48、Gli-T176 和 Gli-T17
与 Gli-T9基因和 Gli-T197相似性很高, 故未再单独
进行分析。克隆的 4 个 α-醇溶蛋白基因经同源性和
染色体定位分析位于第 6 部分同源染色体的 Gli-D2
位点, 该位点可能是由第 1部分同源染色体的 Gli-1
位点通过复制或(和)置换产生, 并导致基因家族的
分化[21-22]。
α-醇溶蛋白一般在特征区含有 6 个保守半胱氨
酸残基(C), 它们形成分子内二硫键, 对面筋多聚体
结构的形成和面团延展性具有重要作用。本研究在
豫麦 34 和烟农 19 中克隆的 2 个基因在这一区域前
端多一个额外的半胱氨酸 , 替代了原来的丝氨酸
(S)。额外的半胱氨酸残基过去在 HMW谷蛋白优质
亚基 1Dx5[23]和 LMW-GS[15]中也有报道。普遍认为
半胱氨酸残基的增加有利于形成分子间二硫键, 从
而参与面筋的聚合, 提高面团品质[15]。两个多聚谷
氨酰胺区是所有 α-醇溶蛋白一级结构的主要特征,
几乎全为谷氨酰胺残基组成。多聚谷氨酰胺重复区
最初产生于 CAA密码子的复制, 后来发现可能存在
另一种机制, 即 CAG 向 CAA 的转变[24]。在小麦基
因组 DNA 中, CG 和 CNG 序列 80%以上是 5-甲基
化胞嘧啶(m5C), 它经过自发脱氨基作用到一定程
度, CAG 就转变成了 CAA。而 Anderson 等[18]则认
为多聚谷氨酰胺重复区是由类似于微卫星序列所编
码的。DNA复制过程中, 重组热点[25]引起谷氨酰胺
密码子 CAG 的扩展[26]和缺失, 从而导致细胞死亡
或损伤, 使蛋白分子大小和等电点出现差异。
单核苷酸多态性(SNP)和插入/缺失(InDel)变异
是小麦基因组进化中最重要的遗传变异标记。基因
编码区 SNPs 和 InDels 可为分子标记辅助选择提供
新的基因标记。近年在粗山羊草和普通小麦的
HMW-GS[12,16]、LMW-GS[27]和醇溶蛋白基因[28]中发
现丰富的 SNP, 这些 SNP标记可用于小麦分子育种,
以提高品质改良效率。本研究鉴定的来自粗山羊草
和普通小麦 4个 α-醇溶蛋白基因(特别是具有 7个半
胱氨酸残基、有可能对面筋品质有潜在利用价值的
2 个基因)的 SNP 和 InDel, 可为小麦品质改良提供
新的候选基因和分子标记。
贮藏蛋白基因等位变异除了点突变导致大量
SNPs和假基因外, 长期以来多认为染色体的重复、
缺失、非均等交换以及滑动错配等是导致遗传变异
的主要机制[12]。然而最近的研究显示, 除了染色体
同源重组外, 链内异常重组(illegitimate recombina-
tion)有可能是贮藏蛋白基因存在广泛等位变异的重
要遗传机制[29-30]。由于贮藏蛋白基因都存在较多的
重复序列, 如在HMW-GS基因中普遍存在直接重复
(direct repeats, DR)序列, 使异常重组发生的几率增
大, 可以导致重复区大片段的缺失或重复[29]以及嵌
合基因的产生[30]。
小麦贮藏蛋白基因广泛的等位变异不但可以为
品质改良提供新的候选优质基因, 还可为研究小麦
起源与分子进化提供重要信息。本研究结果显示 ,
从粗山羊草中分离的 α-醇溶蛋白基因与从普通小麦
中克隆到的基因聚在一起, 相似性很高, 都位于 6D
染色体的 Gli-D2 位点, 这与 HMW-GS 等位变异的
研究结果一致[31], 再次证明普通六倍体小麦 D 基因
组来源于粗山羊草的结论, 过去的研究认为粗山羊
草是普通小麦 D 基因组供体, 本研究为这一结果提
供了新的证据。系统进化分析表明 α-醇溶蛋白与 γ-
醇溶蛋白、大麦 B-醇溶蛋白和 LMW-GS 基因具有
较近的遗传关系, 分化比较晚, 而与 ω-醇溶蛋白和
HMW-GS基因遗传关系较远, 分化较早(约 73.72百
万年)。普通栽培小麦的起源, 即四倍体小麦与粗山
羊草间的杂交大约发生在 1万年前, 而醇溶蛋白基
因位点的分化要早得多, Gli-D1 位点的 α-醇溶蛋白
基因大约在 0.38~3.38百万年前就已分化形成。
4 结论
在粗山羊草和普通小麦品种中克隆的 7个基因中,
4个有代表性的 α-醇溶蛋白基因(Gli-YM34, Gli-YN19,
Gli-T9, GliT-197)都存在不同的 SNP与 InDel变异。其
中 Gli-YM34和 Gli-YN19蛋白在特征区 II前端都存在
一个额外的半胱氨酸残基, 可能有利于面筋多聚体结
构的形成。4个基因都位于 6D染色体上的 Gli-D2为
点, 并具有较高的序列相似性, 再次证明普通小麦 D
基因组来自粗山羊草。α-醇溶蛋白和 LMW-GS基因与
γ-醇溶蛋白基因遗传关系较近, 在大约48.74百万年分
化, 而与ω-醇溶蛋白和HMW-GS基因关系较远, 它们
的分化大约发生在 79.39百万年。
References
[1] Payne P I. Genetics of wheat storage proteins and the effect of
588 作 物 学 报 第 36卷
allelic variation on bread mapping quality. Annu Rev Plant
Physiol, 1987, 38: 141−153
[2] Metakovsky E V. Gliadin allele identification in common wheat:
II. Catalogue of gliandin alleles in common wheat. J Genet Bread,
1991, 45: 325−344
[3] Harberd N P, Bartels D, Thompson R D. Analysis of the gliadin
multigene loci in bread wheat using nullisomic trasomiclines.
Mol Gen Genet, 1985, 198: 234−242
[4] Hao C-Y(郝春燕), Li J-G(李建国), Li Y-X(李雅轩), Yan
Y-M(晏月明). Molecular cloning of genes coding for gliadins in
wheat. J Capital Normal Univ (Nat Sci Edn)(首都师范大学学
报·自然科学版), 2006, 27: 67−70 (in Chinese with English ab-
stract)
[5] Weegels P L, Marseille J P, Bosveld P, Hamer R J. Large-scale
separation of gliadins and their bread-making quality. J Cereal
Sci, 1994, 20: 253−264
[6] Metakovsky E V, Annicchiarico P, Boggini G, Pogna N E. Rela-
tionship between gliadin alleles and dough strength in Italian
wheat cultivars. J Cereal Sci, 1997, 25: 229−236
[7] Wang A L, Gao L Y, Li X H, Zhang Y Z, He Z H, Xia X C,
Zhang Y, Yan Y M. Characterization of two 1D-encoded
ω-gliadin subunits closely related to dough strength and pan
bread-making quality in common wheat (Triticum aestivum L.). J
Cereal Sci, 2008, 47: 528−535
[8] Yan Y M, Surlan-Momirovic G, Prodanovic S, Zoric Z, Liu G.
Capillary zone electrophoresis analysis of gliadin proteins from
Chinese and Yugoslav winter wheat cultivars. Euphytica, 1999,
105: 197−204
[9] Yan Y M, Hsam S L K, Yu J Z, Jiang Y, Zeller F J. Genetic
polymorphisms at Gli-Dt gliadin loci in Aegilops tauschii as re-
vealed by acid polyacrylamide gel and capillary electrophoresis.
Plant Breed, 2003, 122: 120−124
[10] Metakovsky E V, Gomez M, Vazquez J F, Carrillo J M. High
genetic diversity of Spanish common wheat as judged from
gliadin alleles. Plant Breed, 2000, 119: 37−42
[11] Zhang X-Y(张学勇), Yang X-M(杨欣明), Dong Y-C(董玉琛).
Genetic analysis of wheat germplasm by acid polyacrylamide gel
electrophoresis of gliadins. Sci Agric Sin (中国农业科学), 1995,
28(4): 25−32 (in Chinese with English abstract)
[12] Yan Y, Zheng J, Xiao Y, Yu J, Hu Y, Cai M, Li Y, Hsam S L K,
Zeller F J. Identification and molecular characterization of a
novel y-type Glu-Dt1 glutenin gene of Aegilops tauschii. Theor
Appl Genet, 2004, 108: 1349−1358
[13] Yan Y, Hsam S L K, Yu J Z, Jiang Y, Ohtsuka I, Zeller F J. HMW
and LMW glutenin alleles among putative tetraploid and hexap-
loid European spelt wheat (Triticum spelta L.) progenitors. Theor
Appl Genet, 2003, 107: 1321−1330
[14] Van Herpen T W J M, Goryunova S V, van der Schoot J, Mitreva
M, Salentijn E, Vorst O, Schenk M F, van Veelen P A, Koning F,
van Soest L J M, Vosman B, Bosch D, Hamer R J, Gilissen L J
W J, Smulders M J M. Alpha-gliadin genes from the A, B, and D
genomes of wheat contain different sets of celiac disease epitopes.
BMC Genomics, 2006, 7: 1
[15] An X, Zhang Q, Yan Y, Li Q, Zhang Y, Wang A, Pei Y, Tian J,
Wang H, Hsam S L K, Zeller F J. Cloning and molecular charac-
terization of three novel LMW-i glutenin subunit genes from cul-
tivated einkorn (Triticum monococcum L.). Theor Appl Genet,
2006, 113: 383−395
[16] Zhang Y Z, Li Q Y, Yan Y M, Zheng J G, An X L, Xiao Y H, Wang
A L, Pei Y H, Wang H B, Hsam S L K, Zeller F J. Molecular char-
acterization and phylogenetic analysis of a novel glutenin gene
(Dy10.1t) from Aegilops tauschii. Genome, 2006, 49: 735−745
[17] Cornell H J, Wills-Johnson G. Structure-activity relationships
in coeliac-toxic gliadin peptides. Amino Acids, 2001, 21:
243−253
[18] Anderson O D, Litts J C, Greene F C. The α-gliadin gene family:
II. DNA and protein sequence variation, subfamily structure, and
origins of pseudogenes. Theor Appl Genet, 1997, 95: 59−65
[19] Allaby R G, Banerjee M, Brown T A. Evolution of the high mo-
lecular weight glutenin loci of the A, B, D and G genomes of
wheat. Genome, 1999, 42: 296−307
[20] DuPont F M, Vensel W, Encarnacao T, Chan R, Kasarda D D.
Similarities of omega gliadins from Triticum urartu to those en-
coded on chromosome 1A of hexaploid wheat and evidence for
their post-translational processing. Theor Appl Genet, 2004, 108:
1299−1308
[21] Gu Y Q, Crossman C, Kong X, Luo M, You F M, Coleman-Derr
D, Dubcovsky J, Anderson O D. Genomic organization of the
complex alpha-gliadin gene locus in wheat. Theor Appl Genet,
2004, 109: 648−657
[22] Thomas W, Okita S, Cheesbrough V, Reeves C D. Evolution and
heterogeneity of the α-/β-type and γ-type gliadin DNA sequences.
Biol Chem, 1985, 260: 8203−8213
[23] Anderson O D, Greene F C, Yip R E, Halford N G, Shewry P R,
Malpica-Romero J M. Nucleotide sequences of the two high-
molecular-weight glutenin genes from the D-genome of a hexap-
loid bread wheat, Triticum aestivum L. cv. Cheyenne. Nucl Acids
Res, 1989, 17: 461−462
[24] Anderson O D, Litts J C, Greene F C. The α-gliadin gene family:
I. Characterization of ten new wheat α-gliadin genomic clones,
evidence for limited sequence conservation of flanking DNA,
and Southern analysis of the gene family. Theor Appl Genet,
1997, 95: 50−58
[25] Wahls W P, Wallace L J, Moore P D. Hypervariable minisatellite
DNA is a hotspot for homologous recombination in human cells.
Cell, 1990, 60: 95−103
[26] Ennings C. How trinucleotide repeats may function. Nature,
1995, 378: 127
[27] Pei Y H, Wang A L, An X L, Li X H, Zhang Y Z, Huang X Q,
Yan Y M. Characterization and comparative analysis of three low
molecular weight glutenin C-subunit genes isolated from Ae-
gilops tauschii. Can J Plant Sci, 2007, 87: 273−280
第 4期 朱西平等: 普通小麦及近缘粗山羊草 α-醇溶蛋白基因的克隆、定位与进化分析 589
[28] Zhang W, Gianibelli M C, Ma W, Rampling L, Gale K R. Identi-
fication of SNPs and development of allele: Specific PCR mark-
ers for γ-gliadin alleles in Triticum aestivum. Theor Appl Genet,
2003, 107: 130−138
[29] Zhang Y Z, Li X H, Wang A L, An X L, Zhang Q, Pei Y H, Gao L
Y, Ma W J, Appels R, Yan Y M. Novel x-type HMW glutenin
genes from Aegilops tauschii and their implications on the wheat
origin and evolution mechanism of Glu-D1-1 proteins. Genetics,
2008, 178: 23−33
[30] Li X H, Ma W J, Gao L Y, Zhang Y Z, Wang A L, Ji K M, Wang
K, Appels R, Yan Y M. A novel chimeric LMW-GS gene from
the wild relatives of wheat Ae. kotschyi and Ae. juvenalis: Evolu-
tion at the Glu-3 loci. Genetics, 2008, 180: 93−101
[31] Yan Y M, Hsam S L K, Yu J Z, Yi J, Zeller F J. Allelic variation
of the HMW glutenin subunits in Aegilops tauschii accessions
detected by sodium dodecyl sulphate (SDS-PAGE), acid poly-
acrylamide gel (A-PAGE) and capillary electrophoresis.
Euphytica, 2003, 130: 377−385