全 文 :作物学报 ACTA AGRONOMICA SINICA 2011, 37(1): 5866 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn
本研究由国家重点基础研究发展计划(973计划 )项目 (2011CB100100, 2009CB118401)和国家高技术研究发展计划 (863计划)项目
(2006AA10Z188)资助。
* 通讯作者(Corresponding authors): 黎裕, E-mail: yuli@mail.caas.net.cn, Tel: 010-62131196; 吴子恺, E-mail: wuzikai@gxu.edu.cn, Tel:
0771-3238254
第一作者联系方式: E-mail: tanjack2000@163.com, Tel: 0771-4282163
Received(收稿日期): 2010-05-25; Accepted(接受日期): 2010-08-04.
DOI: 10.3724/SP.J.1006.2011.00058
玉米 Rubisco活化酶基因 ZmRCA1的序列变异分析
谭贤杰 1,2 宋燕春 3 石云素 3 程伟东 1 吴子恺 1,* 王天宇 3 黎 裕 3,*
1 广西大学农学院, 广西南宁 530005; 2 广西农业科学院玉米研究所, 广西南宁 530227; 3 中国农业科学院作物科学研究所, 北京 100081
摘 要: Rubisco活化酶(RCA)是一种可激活光合作用关键酶 Rubisco的伴侣蛋白, 可通过对 Rubisco的活性调节决定
植物的碳同化效率。为了研究玉米 ZmRCA1的多态性, 参考 GenBank中编码玉米 Rubisco活化酶的 ZmRCA1基因组
序列设计引物对玉米微核心种质的 95份自交系的 ZmRCA1进行测序, 获得长约 1 680 bp的基因组序列。多态分析表
明, 在 1 680 bp的区间内共发现 22个 SNP和 8个 InDel, 其中 5个 SNP和 1个 InDel变异产生氨基酸序列改变; 频
率在 0.1 以上的 13 个多态性位点共形成 27 种单倍型, 利用 6 个多态性位点就可以分辨约 90%的单倍型。ZmRCA1
基因具有高度序列保守性, 基因 DNA 序列相似性为 97.9%, 而氨基酸序列的相似性则达 99.8%; 中性检验表明,
ZmRCA1基因符合中性进化模型假设, 没有发生纯化选择。
关键词: Rubisco活化酶(RCA); 单核苷酸多态性(SNP); InDel; 连锁不平衡(LD); 单倍型; 单倍型标签 SNP
Analysis of Sequence Polymorphism of ZmRCA1 in Maize
TAN Xian-Jie1,2, SONG Yan-Chun3, SHI Yun-Su3, CHENG Wei-Dong1, WU Zhi-Kai1,*, WANG Tian-Yu3,
and LI Yu3,*
1 School of Agronomy, Guangxi University, Nanning 530005, China; 2 Maize Research Institute, Guangxi Academy of Agricultural Sciences, Nanning
530227, China; 3 Institute of Crop Sciences, Chinese Academy of Agricultural Sciences, Beijing 100081, China
Abstract: Rubisco is a pivotal enzyme that initiates the first step of carbon fixation and photorespiration in plant photosynthesis.
Rubisco accounts for up to half of the soluble protein in the leaves of plants. Nevertheless, the catalytic rate of Rubisco is com-
paratively low. Rubisco activity is regulated mainly by Rubisco activase, which serves as a molecular chaperone. By activating
and regulating Rubisco, RCA potentially influences the efficiency of carbon assimilation in plants. Thereby, RCA has identified a
possible target gene for improve production in crops breeding. To investigate polymorphism of ZmRCA1, sequened and analyzed
the genomic sequences of ZmRCA1 from a minicore set of 95 maize inbred lines. Totally 22 SNPs and 8 InDels were identified in
a 1 680 bp sequence alignment. There were five SNPs and one InDel, which generated amino acid sequence variation. A total of
27 haplotypes were identified with 13 polymorphic loci with the frequency of 0.1 or more. Approximately 90% haplotypes could
be distinctly distinguished by six polymorphic loci. The ZmRCA1 gene was highly conserved, with the genic similarity of 97.9%
and the amino acid sequence similarity of 99.8%. Neutrality tests showed that no purifying selection occurred in ZmRCA1.
Keywords: Rubisco activase (RCA); SNP; InDel; LD; Haplotype; htSNP
Rubisco (核酮糖-1,5-二磷酸核酮糖羧化酶/加氧
酶)是光合作用中的关键酶, 它催化 CO2同化的第一
步反应 , 同时也催化光呼吸的第一步反应 , 因此
Rubisco 控制着植物光合作用碳固定和光呼吸碳氧
化两个过程 , 对植物光合速率起决定作用 [1-2]。
Rubisco 在叶片中含量很高, 约可占叶片可溶性蛋
白的一半, 但它的催化效率却很低。Rubisco的催化
效率受底物浓度、光照、温度、pH等因素影响外, 还
主要受一种名为 Rubisco 活化酶(Rubisco activase,
RCA)调控, 钝化态 Rubisco经过 RCA的活化才能表
现出其羧化/加氧活性[3]。RCA是一种核编码的可溶
性叶绿体蛋白, 除可活化 Rubisco外, 还具有三磷酸
第 1期 谭贤杰等: 玉米 Rubisco活化酶基因 ZmRCA1的序列变异分析 59
腺苷酶(ATPase)活性。研究发现, RCA普遍存在于高
等植物(包括 C3和 C4植物)、绿藻、部分蓝细菌和古
细菌之中, 因此, 依赖于 RCA 的 Rubisco 活性调节
机制广泛存在于所有光合生物中。由于 Rubisco 在
光合作用中起枢纽作用, RCA 可调节 Rubisco 活性,
从而对光合速率和产量产生重要的影响。Martinez
等 [4]发现 , 高产玉米群体中的 Rubisco 活性更高 ,
RCA 蛋白含量也更高。翁晓燕等[5]研究表明, 在水
稻叶片生长过程中, RCA、Rubisco活力和光合速率
密切相关。Jiang 等[6]分析超级稻高产品种(系)的光
合效率研究发现高产品系具有更高的 Rubisco 和
RCA活性。张国等[7]研究发现小麦叶片衰老时 RCA
基因表达水平下降与光合速率下降密切相关。Ristic
等[8]发现, 在热胁迫条件下冬小麦的产量与 RCA 的
表达呈显著正相关。RCA已成为作物育种中一个重
要的靶基因, 对 RCA的生理、生化和分子生物学研
究是近年来光合作用研究的重要领域之一。
目前, 菠菜、拟南芥、大麦、玉米、水稻、棉
花等植物 RCA基因的 cDNA已被克隆。大多数植物
具有 α (43~47 kD)、β (41~42 kD)两种不同的 RCA
蛋白亚型, 不同植物产生这两种亚型有着不同的方
式[9]。棉花两个亚型由不同的基因编码, 而拟南芥、
水稻、菠菜等物种的 α、β 亚型由选择剪接同一
mRNA 前体产生[10]。在玉米中只存在一种 β 亚型
RCA, 在转录后调控形成长度为 43 kD和 41 kD两
种不同长度 RCA 多肽, 较短的多肽(41 kD)由较长
的多肽通过蛋白水解氨基末端形成[11]。通过诱变和
转基因方式开展 RCA 功能研究已经在多种作物中
进行[12]。Shen 等[13]报道, 对菠菜 RCA 的 α 亚基基
因中与 ATP结合部位序列进行定点突变, 发现位点
Gln109被 Glu替换后, RCA活化 Rubisco的活性上
升而 ATPase 活性下降, 说明 RCA 活化 Rubisco 活
性和 ATPase 活性并非紧密偶联 ; 用 Asp 替换
Gln109 也能增加活化 Rubisco 的活性, 但用其他氨
基酸替换则导致活性下降, 说明酸性残基(如 Glu 和
Asp)在这一位点上能增强活化 Rubisco 的作用。
Kurek 等[14]采用基因重排技术产生拟南芥 β 亚基的
新突变体, 突变体在热胁迫下依然有较高的 RCA活
性和光合作用效率。这些研究说明, 特定位点在基
因发挥功能中重要作用, 同样也暗示在自然界可能
存在能高效活化 Rubisco 或有更高转录活性的 RCA
等位基因, 因此鉴定自然群体中 ZmRCA1 基因的等
位变异, 有可能筛选到提高光合效率的 ZmRCA1 等
位基因。因此, 我们对玉米微核心种质 95份自交系
ZmRCA1 基因进行了测序分析, 以了解玉米自然群
体中 RCA序列的多态性, 为加深 RCA调节 Rubisco
的活性机制研究和通过关联分析找寻玉米群体中高
光合效率的 RCA等位基因提供信息。
1 材料与方法
1.1 材料
以前期构建的玉米自交系微核心种质 [15] 95份
为基础材料, 包括基因组已测序自交系 B73 等, 这
些材料具有广泛的多样性的国内和世界各地自交系
构成(表 1)。
1.2 DNA提取
在温室种植玉米材料, 出苗后 14 d左右剪取嫩
叶。采用改良 CTAB(十六烷基三甲基溴化铵)法提取
DNA[16], 用 1.0%琼脂糖凝胶电泳检测 DNA 质量,
用紫外分光光度计(Beckman, DU800)测量 DNA 浓
度。根据检测结果, 将各样品的 DNA浓度调整到 50
ng L1, 20℃保存备用。
1.3 ZmRCA1基因引物设计、扩增和测序
以 GenBank (http://www.ncbi.nlm.nih.gov/)中
B73 基因组的 ZmRCA1 基因组序列 AC211224 为模
板设计引物, 引物设计使用 DNAMAN 和 PRIMER
5.0 软件。共筛选到 2 对稳定测序引物(表 2)。引物
覆盖 ZmRCA1基因编码区的转译起始端和终止码后
约 150 bp, 中间交叠片段长约 187 bp。图 1 为
ZmRCA1基因结构和扩增子情况示意图。
图 1 ZmRCA1基因结构与扩增子
Fig. 1 ZmRCA1 gene structure and the amplicon
PCR 总体积为 50 µL, 含 10×buffer 5 µL, 1.5
mmol L1 MgCl2, 4种 dNTP各 200 mmol L1, 引物各
150 ng, 1.5 U Pfu PCR Master DNA polymerase
(Tiangen Bio. Co.), 100 ng基因组 DNA。PCR反应程
序为: 95℃预变性 5 min; 然后 95℃变性 45 s, 59℃退
火 30 s, 72℃延伸 140 s, 共 32个循环; 最后 72℃延
伸 8 min, 4℃保存。PCR产物经回收试剂盒纯化后
送农作物基因资源与基因改良国家重大科学工程测
序部用 ABI3730XL DNA 测序仪进行双向测序, 对
每个试样测 3次以保证测序准确性。比对 B73中该
基因序列测序结果与 GenBank 中相应序列, 以确认
60 作 物 学 报 第 37卷
表 1 微核心种质材料的系谱(来源)
Table 1 Pedigree(source) of the minicore inbred lines
编号
ID
自交系名称
Inbred line
系谱来源
Pedigree (source)
编号
ID
自交系名称
Inbred line
系谱来源
Pedigree (source)
1 吉 63 (127-32×铁 84)×(威 24×威 20) 49 Lo1125 Pioneer ADA (PR3374)
2 矮金 525 武陟矮×金皇后 50 K36 “库 6”选系
3 C103 Noah Hershey 51 遵 90110 78599
4 自 330 Oh43×可利 67 52 P138 78599
5 塘四平头 塘四平头 53 H21 黄早四×H84
6 获白 获嘉白马牙 54 488 8112×5003
7 Mo17 C103×187-2 55 X178 78599
8 旅 28 旅大红骨 56 昌 7-2 潍 59×黄早四
9 威风 322 W59E×风可 57 DH65232 DH6327×沈 5003
10 华 160 华东二号 58 沈 137 6JK111
11 黄早四 塘四平头杂株 59 H2 美国杂交种
12 E28 (旅 9宽×A619Ht)BC 60 晋穗 54 自 330变异
13 掖 8112 3382 61 GB 天津白玉米
14 5003 3147 62 X.L9010-3/O2 5105×opaque2
15 掖 478 U8112×5003 63 龙抗 15 RC103×长 3
16 丹 340 白轴旅 9×有稃玉米 64 皖系 23 Va35×B73
17 黄野四 3 (黄早四×野鸡红)×黄早四 65 关 17-1 关 73×Mo17
18 获唐黄 17 获唐白 42×海 1917×Mo17Ht 66 粤 267-1-1 5003×抗旱大粒黄
19 综 3 综合种 67 粤 89E4-2 武 102×黄早四
20 郑 58 掖 478 68 粤 20-3 掖单 13变异
21 鲁原 92 原齐 123×1137 69 武 202 武 403×Bup29
22 齐 319 78599 70 CML58 墨西哥
23 K12 黄早四×淮春 71 辽 2204 美国杂交种
24 资玉 3 鲁资玉 3号 72 黄 C (黄小162×自330/O2) ×Tuxpeno
25 京糯 2 不详 73 CN165 美国杂交种
26 冀甜 15 国内甜杂交种 74 沈 135 78599
27 D729 D团综合种 75 原武 02 武 105×多 229
28 太 184 混选 1号 76 444 A619×黄早四
29 XZ19 金 0-14×忻 335 77 早 49 Tuxpeno×早 22
30 13A/O2 不详 78 朝鲜白 朝阳白玉米
31 抚 96 南充 5×矮 13-31 79 707 国外杂交种
32 辽 7794 7922×8112/(32×5003) 80 87-20 不详
33 吉 846 Mo17×吉 63 81 岩 172 浦城矮玉米
34 吉 880 哲 B77A 82 中二/O2 中单 2号
35 九 03 不详 83 峰 273 春杂 1号
36 辐 842 甸 11×意 210/辐 746 84 P39/su 美国
37 鹿 65 北金 14×330 85 92黄 7 W153×C103
38 岩 103 原武 02 86 785 330×黄早四
39 齐 318 78599 87 92黄 40 853×Mo17
40 17564 综合种 88 赤黄 32 旅 9×Ci7
41 FR218 美国 89 兴 83 144×147
42 大MO 不详 90 龙抗 1 辽 1311(甸 11×大凤 22)
43 遗 67 不详 91 Lo1067 Pioneer 3780×Lo87602
44 91黄 5 甸 11A/旅 9 92 HR962 黄早四
45 辽 5110 7922×5003 93 55113-3-3-5 ZPDC551B
46 邯 102 河南多穗 94 承 18 顶上玉米×(公 70×60-22)
47 De811 {B68×[B73Ht×(C103×Mp3204双交种)Sel.]} 95 B73 BSSS
48 A632 (Mt42×B14)×B14(3)
第 1期 谭贤杰等: 玉米 Rubisco活化酶基因 ZmRCA1的序列变异分析 61
表 2 ZmRCA1扩增引物
Table 2 Primers for ZmRCA1 amplification
引物
Primer
引物序列
Primer sequence
退火温度
Annealing temperature ( )℃
扩增区域 a)
Amplified region a)
扩增长度
Amplified length (bp)
1Forward 5-TAGGCTTGGATGATGCGTG-3
1Reverse 5-TGATGTTTGGCAGGGTCAT-3
59 173672–174540 ~869
2Forward 5-ACCAGCAGGACATCACCAG-3
2Reverse 5-CACCTCCTCGATCCTATGC-3
59 172675–173860 ~1186
a) 参考序列 GenBank登录号为 AC211224。
a) Reference sequence GenBank accession number: AC211224.
测序片段完全无误。
1.4 数据分析
用 Vector NTI advance 10.0软件中 Contig-Ex-
press 组件拼接组装测序所得序列, 用 BioEdit7.0 软
件对序列进行比对和校对, 之后用 DNAsp 5.0 软件
分析序列。分别用 Watterson’s θw[17]和平均成对核苷
酸差异 π[18]参数估计核苷酸多态性; 从网站(http://
www.phytozome.net/sorghum)下载登录号为 Sb05g027-
870的高粱 RCA同源基因序列作为参照序列, 分别采
用Tajima D[19]和 Fu与Li的D*、F*参数[20]作中性测验。
另外, 根据已测序自交系 B73 的 ZmRCA1 基因转录
位点信息, 将所有核苷酸序列翻译成氨基酸序列进
行多态性分析。用 TASSEL2.1软件分析位点间的连
锁不平衡(LD)和位点多态性形成的单倍型。
2 结果与分析
2.1 核苷酸序列和氨基酸序列分析
在所测 ZmRCA1基因比对后总长 1 680 bp序列
中, 覆盖了基因起始密码子前 79 bp到终止子, 共有
多态性位点 30 个, 包括 SNP 位点 22 个, 其中位于
编码区的 SNP位点有 14个, 平均 76.4 bp有 1个 SNP;
InDel位点 8个, 其中位于非编码区的 InDel有 7个,
平均 210 bp有 1个 InDel, InDel平均长度为 6.1 bp。
所有的多态性位点情况汇列于表 3。
从多态性分布来看, 5-UTR 中无多态性; 第 1
外显子区(79~114 bp)无多态性位点, 第 2 外显子区
(305~813 bp)共有 6个 SNP位点, 1个 InDel; 第 3外
显子区(921~1 677 bp)共有 8 个 SNP 位点。在第 1
内含子区共有 5个 SNP和 3个 InDel, 第 2内含子中
有 3个 SNP和 4个 InDel位点。如果广义的单核苷
酸多态性性既包括单碱基突变, 也包括少数几个碱
基的插入或缺失(即 InDel)[21], 则在 ZmRCA1整个分
析区域的单核苷酸变异频率为平均每 56 bp 就有一
个多态性位点。
核苷酸多样性(π)是指一个基因序列中的每个
核苷酸在群体中被随机取代的可能性, 它可以反映
该基因的遗传变异程度。在本试验群体中 ZmRCA1
基因整个序列核苷酸多态性 π值为 0.00279, θw值为
0.00264。编码区 π 值(0.00216)小于非编码区 π 值
(0.00537), 应是编码区承受的更大选择压力的结
果。
根据 B73 ZmRCA1 基因的序列信息, 将所有核
苷酸序列翻译为氨基酸序列, 则只有 6 个多态性位
点引起氨基酸序列发生改变, 其中 5 个为碱基替换,
1个为 InDel。这 6个位点中只有 363位点的丝氨酸
插入和 380 位点的半胱氨酸与酪氨酸替换在群体中
频率高于 10%, 分别是 15.8%和 11.6%, 其余的氨基
酸变异位点频率都在 5%以下。
相似性比较分析表明, 95份材料的 ZmRCA1基
因序列相似性为 97.9%, 而氨基酸序列的相似性则
达 99.8%。根据 ZmRCA1 的基因保守功能结构域信
息 , 位于氨基酸序列的 73~360 区间为 P-loop
NTPase基序区 , 在这区间只有一份材料(岩 103)的
1 065位点处由C替换G的突变, 产生了脯氨酸替换
丙氨酸的变异。引起氨基酸序列变异频率 10%以上
的 363 位点插入和 380 位点替换的两个位点, 都不
在基因的保守功能结构域内。
2.2 ZmRCA1 序列多态性位点连锁不平衡与单
倍型分析
对频率 0.01以上的多态性位点进行连锁不平衡
分析 , 以位点距离和连锁不平衡参数 R2 (squared
allele-frequency correlations)作散点图(图 2)。在 LD
分析中, 通常以位点间 R2=0.1 的遗传距离来描述
LD 衰减[23], 从图 2 可看出 ZmRCA1 大约在 1 000~
1 100 bp衰减到 R2为 0.1水平。
以频率在 0.1 以上的位点进行 ZmRCA1 基因的
单倍型分析, 13 个频率在 0.1 以上的位点共形成 27
种单倍型, 其序列组成及各种单倍型的频率见表 4。
62 作 物 学 报 第 37卷
表 3 ZmRCA1基因多态性位点
Table 3 Polymorphic sites in ZmRCA1 gene
位点
Site
多态性类型
Polymorphic type
位置
Location
频率 a)
Frequency a) (%)
氨基酸变异 b)
Amino acid change b)
156 5 base del intron1 6.3 N
162 A/G intron1 13.7 N
170 6 base del intron1 7.4 N
216 A/G intron1 7.4 N
223 4 base del intron1 7.4 N
261 A/G intron1 6.3 N
271 T/C intron1 6.3 N
272 12 base del intron1 6.3 N
300 C/T intron1 10.5 N
363 3 base del exon2 15.8 S insert
380 G/A exon2 11.6 C/Y
456 C/G exon2 37.9 N
567 T/A exon2 7.4 N
738 A/C exon2 49.5 N
795 T/C exon2 9.5 N
798 T/C exon2 2.1 N
843 C/T intron2 8.4 N
849 T/C intron2 29.5 N
861 A/T intron2 22.1 N
865 2/4/6/8/10 base del intron2 — N
879 4/8 base del intron2 — N
906 8 base insert intron2 26.3 N
1065 C/G exon3 1.1 P/A
1169 C/G exon3 36.8 N
1211 T/C exon3 3.2 N
1235 C/G exon3 49.5 N
1517 C/G exon3 3.2 D/E
1574 C/G exon3 3.2 D/E
1580 A/G exon3 3.2 N
1672 C/T exon3 1.1 S/F
a) “–”为多个多态性类型; b) N为未引起氨基酸序列改变。
a) “–”: multi-polymorphism; b) N: no amino acid change.
图 2 ZmRCA1基因的位点间 LD散点图
Fig. 2 LD plot of ZmRCA1
在 27 种单倍型中, 第 17 单倍型的频率超过了
20%; 第 4和第 12单倍型的频率大于 10%; 其余 24
种单倍型的频率均在 1%~10%之间。根据标签 SNP
的定义, 少数几个标签 SNP 就能够提供该区域内大
多数的遗传多态性模式。在此试验群体 ZmRCA1基
因 13个多态性位点中, 380、456、865、906、1 169
和 1 235这 6个位点即可分辨 27种中的 22种单倍型,
这些单倍型可占群体 89.5%。因此, 利用此 6 个位点
开发的标记即可作为 ZmRCA1 基因的单倍型标签
SNP。理论上, 引起氨基酸序列变异的 363、380两个
位点间可形成 4 种组合, 但群体中只形成 0A、3A
表4 95个自交系ZmRCA1基因的单倍型
Table 4 Haplotypes in ZmRCA1 gene among 95 maize inbreds
多态性位点 Polymorphic site 自交系
Inbred line 162 300 363a) 380 456 738 849 861 865 a) 879 a) 906 a) 1169 1235
单倍型
Haplotype
频率
Freq.(%)
矮金 525, DH65232, 峰 273, 黄 C, 5003, 辽 7794 A T 0 A G C T T 10 0 0 C C 1 6.3
CN165 A T 3 A G A T A 6 4 0 C C 2 1.1
齐 318, 齐 319, X178, 辽 2204, 沈 135, 遵 90110 A T 3 A G A T T 10 4 8 G G 3 6.3
黄 102, LO1067, 粤 267-1-1, 早 49, 自 330, 晋穗 54, 粤 20-3, 丹 340,
444, 92黄 40
G C 3 A C A T T 10 4 8 G G 4 10.5
92黄 7, H2, P39/SU G T 0 A G A T A 6 4 0 C G 5 3.2
旅 28, 鹿 65 G T 0 A G C T T 10 0 0 C G 6 2.1
707 G T 0 A G C T T 6 4 0 C G 7 1.1
P138, 沈 137 G T 0 A G A C T 4 8 0 G C 8 2.1
55113-3-3-5 G T 0 A G C T T 10 0 0 G G 9 1.1
岩 103 G T 3 G G A C T 10 4 0 C C 10 1.1
48-2 G T 3 A C C C T 10 4 0 C G 11 1.1
大MO, K12, 太 184, 遗 67, 关 17-1, A632, DE811, 抚 96, 获唐黄 17,
D729, 龙抗 1
G T 3 A G A T A 6 4 0 C C 12 11.6
京糯 2号 G T 3 G G C T A 6 4 0 C G 13 1.1
冀 880, 九 03, 华 160, 鲁原 92, 粤 89E4-2, 承 18, 原武 02, 武 202 G T 3 G G C T T 10 0 0 C G 14 8.4
综 3 G T 3 A C A C T 0 8 0 G G 15 1.1
资玉 3, 兴 83 G T 3 A C A C T 2 8 0 G G 16 2.1
赤黄 32, E28, GB, 冀 63, 冀 846, LO1125, B73, 掖 478, 辐 842, 龙抗
15, 辽 5110, 91黄 5, X.L9010-3/O2, 13A/O2, 488, 皖系 23, 掖 8112,
FR218, XZ19, 郑 58
G T 3 A C C C T 10 4 0 G C 17 21.1
H21 G T 3 A G C C T 10 4 0 G C 18 1.1
785 G T 3 A G A T A 6 4 0 G C 19 1.1
黄早四, 塘四平头, HR962, C103 G T 3 A G C T A 6 4 0 G C 20 4.2
CML58 G T 3 A C A T T 10 4 8 G G 21 1.1
冀甜 15 G T 3 A C A T T 8 8 8 G G 22 1.1
昌 7-2 G T 3 A G A T T 10 4 0 G G 23 1.1
87-20, 朝鲜白, 威风 322, 黄野四 3, K36, 获白 G T 3 A G A T T 8 8 8 G G 24 7.4
岩 172 G T 3 G G A T T 8 8 8 G G 25 1.1
中二/02 G T 3 A G C T T 10 0 0 G G 26 1.1
Mo17 G T 3 A G C T T 10 4 0 G G 27 1.1
可开发标记 Potential marker SNP SNP STS SNP SNP SNP SNP SNP SNP STS STS SNP SNP
a) 数字代表该插入位点的碱基数, 如, 0为没有插入; 3为 3个碱基的插入, 其他 InDel位点类推。
a) Figures mean the numbers of base insert at the site. For example, 0 for no insert, 3 for three-base insert.
64 作 物 学 报 第 37卷
和 3G这 3种组合类型, 虽然此两位点未处于功能域
中, 但也有潜在引起酶结构变异及影响表型的可能,
在关联分析中这两个位点应重点关注。另外, 还有 4
个低频率的位点变异引起氨基酸序列改变, 这些改
变亦有引起酶结构改变的可能, 在关联分析时应针
对这些位点开发标记, 并加大群体容量, 鉴定更多
此变异类型的材料以提高统计效力。
2.3 ZmRCA1序列的中性测验
利用 ZmRCA1 序列中的 SNP 位点作 Tajima D
测验, 在中性进化条件下, θw和 π值应该近似相等。
因此在标准中性进化模型下, Tajima D的理论值为
零。在本试验中的 Tajima D值为 0.168, 未达到显
著水平。另外, 编码区和非编码区的 Tajima D值分
别为 0.075和 0.357, 未达到显著水平。Fu与 Li的
D*、F*测验值分别是 0.961和 0.792, 也未达显著水
平。因此, 通过比较群体突变率的 Tajima D测验和
通过等位基因变异频率的偏倚检测 Fu与 Li的 D*、
F*测验都表明 ZmRCA1在群体未偏离中性进化, 没
有发生纯化选择。另外, ZmRCA1的 Tajima D值为
正值, 表明存在较多中等频率的等位基因, 这可能
是由于存在群体结构 , 经历瓶颈效应或平衡选择
的结果。
3 讨论
3.1 ZmRCA1基因序列的变异
SNP 和 InDel 变异是基因组中最常见的变异,
并且部分变异可引起表型巨大差异。人类基因组中
每 1~2 kb就存在 1个 SNP[24]; 然而, 在玉米基因组
中的 SNP频率比人类高得多, Tenaillon等[25]对玉米
第 1染色体 21个位点测序表明 SNP频率为 1个 SNP/
104 bp; Rafalski等[26]研究表明, 在非编码区 SNP频
率为 1个 SNP/48 bp, 而在编码区则是 1个 SNP/130
bp; Mogg等[27]对玉米 97个 SSR引物侧翼序列进行
测序, 发现每 40 bp存在 1个 SNP; Ching等[28]对 36
份自交系 18个基因研究表明, 每 41 bp就有一个多
态性位点, 在非编码区为 1个 SNP/47.7 bp, 而在编
码区则是 1个 SNP/130.5 bp; InDel为非编码区 1个
InDel/ 85 bp, 编码区为 1个 InDel/2 349 bp。本研究
中 ZmRCA1 基因的 SNP 频率与前人研究相比, 在
非编码区的 SNP 频率稍低, 编码区 SNP 频率稍高;
InDel频率无论是编码区和非编码区频率都高。整体
而言, SNP和 InDel频率和前人研究差异并不大, 且
SNP 变异频率比 InDel 频率更高、非编码区变异频
率比编码区频率更高的趋势与前人研究结果是一致
的。这种不同基因间变异频率差异应是玉米基因组
中不同区段受自然和人工选择、遗传漂变等因素影
响的结果, 而基因内部编码区比非编码区有更小变
异应是编码区受选择压力更大的结果。
3.2 ZmRCA1基因的保守性
在作物驯化和育种中, 一些重要的基因往往表
现等位基因变异减少和特定等位基因纯化固定的现
象, 如玉米 c1[29]、y1[30]和水稻 sh4[31]等基因。毫无
疑问, 玉米驯化和育种中也可能对提高光效的目标
基因进行选择, 致使此类基因的变异减少。在光合
作用过程中 Rubisco (核酮糖-1,5-二磷酸核酮糖羧化
酶 /加氧酶 )、PEPC(磷酸烯醇式丙酮酸羧化酶 )、
NADP-ME (NADP-苹果酸酶)和 PPPDK (磷酸丙酮
酸二激酶)等基因都催化重要的反应步骤, 这些基因
本身及其调节基因都可能为玉米驯化与育种的目标
基因。本研究发现 , ZmRCA1 基因序列相似性为
97.85%, 氨基酸序列的相似性则达 99.76%。并且在
基因保守结构域中只有 1 份材料存在氨基酸序列差
异。说明该基因有很高的保守性, 这可能与 RCA在
调节光合作用关键酶 Rubisco 活性中发挥重要作用
密切相关。但是本研究对 ZmRCA1 的中性检验中
Tajima D 测验和 Fu 与 Li 测验都未达显著, 说明
ZmRCA1 没有受到正向选择的影响, 这种结果可能
是: (1) ZmRCA1并不是调节光合作用效率的重要基
因; (2) ZmRCA1 基因功能可能受其他机制所调节,
例如启动子和操纵子等对转录活性调节。玉米 tb1
基因就是如此, tb1基因为控制玉米分蘖的一种 TCP
转录因子基因 , 是玉米驯化的主要靶标基因之一 ,
研究表明 tb1 基因在启动子区而不是在基因编码区
多态性显著降低 [32]; (3)试验群体经历了瓶颈效应 ,
ZmRCA1基因内突变为新突变, 尚未受选择的影响。
在未来研究中, 把研究材料拓宽到有更高多样性的
种质(如包括玉米地方品种和玉米近缘物种), 并对
ZmRCA1 基因相关序列区域特别是启动子区进行研
究 , 可为玉米中 ZmRCA1 是否受到选择作用和
ZmRCA1 调节 Rubisco 的活性机制有更深了解。本
研究发现, ZmRCA1 的基因保守功能结构域区间内
只有 1份材料(岩 103)的 1 065位点处由 C替换 G的
突变, 产生脯氨酸替换丙氨酸的差异, 此氨基酸差
异是否引起酶功能改变有待进一步研究。另外 ,
ZmRCA1 的基因功能结构域高度保守性暗示着需要
在更大自然群体中寻找突变体。
第 1期 谭贤杰等: 玉米 Rubisco活化酶基因 ZmRCA1的序列变异分析 65
3.3 ZmRCA1基因 htSNP标记开发与关联分析
随着基因组学的飞速发展, 通过关联分析剖析
数量性状成为当前遗传研究的重要手段, 关联分析
不仅可以定位 QTL, 基于候选基因的关联分析还可
以用于鉴定影响表型的特定等位基因, 并开发功能
标记用于分子标记辅助选择[33]。但是在关联分析中,
基因型鉴定常是应用关联分析的限制因素, 特别是
基于全基因组的关联分析需要对大量标记进行基因
型分析, 成本往往很高[34]。近来, 一种基于位点单
倍型标签 SNP分析方法可以克服基因型分析量过大
的问题[35], 也就是用最少的标签 SNP区分出最多的
SNP。基于此, 本研究对 ZmRCA1 基因多态性进行
分析发现, 13个频率在 0.1以上的多态性位点共形成
27 种单倍型, 利用 6 个位点多态性就可以分辨约
90%的群体的单倍型 , 因此 , 利用这 6个位点开发
ZmRCA1的标签 SNP标记, 继而用于 ZmRCA1基因
型分析, 即可完成基于 ZmRCA1 基因多态性与表型
的关联分析。鉴于植物光合作用的复杂性, 仅从一
个基因着手来揭示基因多态性与光合效率或产量等
性状的关系, 可能会存在一定的局限性, 应全面检
测 PEPC、DADP-ME 和 PPPDK 等关键酶和其调节
酶的基因多态性, 结合精准的相关表型性状鉴定进
行关联分析以找寻自然群体中的高光效等位基因。
同时, 在相关基因多态性检测中最好应用标签 SNP
标记方式以减少分析成本, 提高效率。
4 结论
ZmRCA1基因比对序列 1 680 bp区间内共发现
22个 SNP和 8个 InDel, 其中 5个 SNP和 1个 InDel
变异产生氨基酸序列的改变。ZmRCA1 基因具有高
度序列保守性, 基因DNA序列相似性为 97.9%,而氨
基酸序列的相似性则达 99.8%。ZmRCA1 基因符合
中性进化模型假设, 没有发生纯化选择。13 个频率
在 0.1 以上的多态性位点共形成 27 种单倍型, 利用
6个位点多态性就可以分辨约 90%的单倍型, 对这 6
个位点开发标记可用于基于 ZmRCA1基因多态性与
表型的关联分析研究。
References
[1] Ellis R J. The most abundant protein in the world. Trends Bio-
chem Sci, 1979, 4: 241244
[2] Parry M A J, Madgwick P J, Carvahlo J F C, Andralojc P J.
Prospects for increasing photosynthesis by overcoming the limi-
tations of Rubisco. J Agric Sci, 2007, 145: 3143
[3] Portis A R. Regulation of ribulose 1,5-bisphosphate carboxy-
lase/oxygenase activity. Annu Rev Plant Physiol Plant Mol Biol,
1992, 43: 415437
[4] Martinez B E, Molina G J, Sanchez J E. Regulation of Rubisco
activity during grain-fill in maize: possible role of Rubisco acti-
vase. J Agric Sci, 1997, 128: 155161
[5] Weng X-Y(翁晓燕), Mao W-H(毛伟华). The relationship of
Rubisco activase to Rubisco and photosynthetic rate during de-
velopment of rice leaf. Acta Agric Zhejiang (浙江农业学报),
2000, 12(3): 121125 (in Chinese with English abstract)
[6] Jiang D-A(蒋德安), Lu Q(陆庆), Weng X-Y(翁晓燕). Role of
key enzymes for photosynthesis in the diurnal of photosynthetic
rate in rice. Acta Agron Sin (作物学报), 2001, 27(3): 301307
(in Chinese with English abstract)
[7] Zhang G(张国), Li B(李滨), Zou Q(邹琦). Cloning and expres-
sion of Rubisco activase gene in wheat. Chin Bull Bot (植物学通
报), 2005, 22(3): 313319 (in Chinese with English abstract)
[8] Ristic Z, Momcilovic I, Budovinik U, Vara Prasad P V, Fu J, De-
ridder B P, Elthon T E, Mladenov N. Rubisco activase and wheat
productivity under heat-stress conditions. J Exp Bot, 2009, 60:
40034014
[9] Parry M A J, Keys A J, Madgwick P J, Carmo-Silva A E, An-
dralojc P J. Rubisco regulation: a role for inhibitors. J Exp Bot,
2008, 59: 15691580
[10] Salvucci M E, van de Loo F J, Stecher D. Two isoforms of
rubisco activase in cotton, the products of separate genes not al-
ternative splicing. Planta, 2003, 216: 736744
[11] Vargas-Suarez M, Ayala-Ochoa A, Lozano-Franco J, Garcia-
Torres I, Diaz-Quinonez A, Ortiz-Navarrete V F, Sanchez-
de-Jimenez E. Rubisco activase chaperone activity is regulated
by a post translational mechanism in maize leaves. J Exp Bot,
2004, 55: 25332539
[12] Sage R F, Way D A, Kubien D S. Rubisco, Rubisco activase, and
global climate change. J Exp Bot, 2008, 59: 15811595
[13] Shen J B, Ogren W L. Alteration of spinach Ribulose-1,5-
bisphosphate carboxylase/oxygenase activity in response to
changing partial pressure O2 and light in Phaseolus vulgaris.
Plant Physiol, 1992, 99: 12011207
[14] Kurek I, Chang T K, Bertain S M, Madrigal A, Liu L, Lassner M
W, Zhu G. Enhanced thermostability of Arabidopsis Rubisco ac-
tivase improves photosynthesis and growth rates under moderate
heat stress. Plant Cell, 2007, 19: 32303241
[15] Li Y, Shi Y, Cao Y, Wang T. Establishment of a core collection
for maize germplasm preserved in Chinese National Genebank
using geographic distribution and characterization data. Genet
Resour Crop Evol, 2004, 51: 845852
[16] Doyle J J, Doyle J L. Isolation of plant DNA from fresh tissue.
Focus, 1990, 12: 1315
66 作 物 学 报 第 37卷
[17] Watterson G A. On the number of segregating sites in genetical
models without recombination. Theor Pop Biol, 1975, 7: 256276
[18] Nei M, Li W H. Mathematical model for studying genetic varia-
tion in terms of restriction endonucleases. Proc Natl Acad Sci
USA, 1979, 76: 52695273
[19] Tajima F. Statistical method for testing the neutral mutation hy-
pothesis by DNA polymorphism. Genetics, 1989, 123: 585595
[20] Fu Y X, Li W H. Statistical tests of neutrality of mutations. Ge-
netics, 1993, 133: 693709
[21] Brookes A J. The essence of SNPs. Gene, 1999, 234: 177186
[22] Clifford R, Edmonson M, Hu Y, Nguyen C, Scherpbier T, Bue-
tow K H. Expression-based genetic/physical maps of single nu-
cleotide polymorphisms identified by the cancer genome ana-
tomy project. Genome Res, 2000, 10: 12591265
[23] Zondrvan K T, Cardon R C. The complex interplay among fac-
tors that influence allelic association. Nat Rev Genet, 2004, 5:
89100
[24] Deutsch S, Iseli C, Bucher P, Antonarakis S E, Scott H S. A
cSNP map and database for human chromosome 21. Genome Res,
2001, 11: 300307
[25] Tenaillon M I, Sawkins M C, Long A D, Gaut R L, Doebley J F,
Gaut B S. Patterns of DNA sequence polymorphism along chro-
mosome 1 of maize (Zea mays ssp. mays L.). Proc Natl Acad Sci
USA, 2001, 98: 91619166
[26] Rafalski A. Applications of single nucleotide polymorphisms in
crop plant genetics. Curr Opin Plant Biol, 2002, 5: 94100
[27] Mogg R, Batley J, Hanley S, Edwards D, O’Sullivan H, Edwards
K J. Characterising the flanking regions of Zea mays microsatel-
lites reveals a large number of useful sequence polymorphisms.
Theor Appl Genet, 2002, 105: 532543
[28] Ching A, Caldwell K S, Jung M, Dolan M, Smith O S, Tingey S,
Morgante M, Rafalski A J. SNP frequency, haplotype structure
and linkage disequilibrium in elite maize inbred lines. BMC
Genet, 2002, 3: 19
[29] Hanson M A, Gaut B S, Stec A O, Fuerstenberg S I, Goodman M
M, Coe E H, Doebley J F. Evolution of anthocyanin biosynthesis
in maize kernels: the role of regulatory and enzymatic loci. Ge-
netics, 1996, 143: 13951407
[30] Palaisa K A, Morgante M, Williams M, Rafalski A. Contrasting
effects of selection on sequence diversity and linkage disequili-
brium at two phytoene synthase loci. Plant Cell, 2003, 15:
17951806
[31] Zhang L B, Zhu Q, Wu Z Q, Ross-Ibarra J, Gaut B S, Ge S, Sang
T. Fast fixation of non-shattering allele but slow domestication of
rice. New Phytol, 2009, 184: 708720
[32] Wang R L, Stec A, Hey J, Lukens L, Doebley J. The limits of se-
lection during maize domestication. Nature, 1999, 398: 236239
[33] Flint-Garcia S A, Thomsberry J M, Buckler E S. Structure of
linkage disequilibrium in plants. Annu Rev Plant Biol, 2003, 54:
357374
[34] Seng K C, Seng C K. The success of the genome-wide associa-
tion approach: a brief story of a long struggle. Eur J Human
Genet, 2008, 16: 554564
[35] Patil N, Berno A J, Hinds D A, Barrett W A, Doshi J M, Hacker
C R, Kautzer C R, Lee D H, Marjoribanks C, McDonough D P,
Nguyen B T, Norris M C, Sheehan J B, Shen N, Stern D, Sto-
kowski R P, Thomas D J, Trulson M O, Vyas K R, Frazer K A,
Fodor S P, Cox D R. Blocks of limited haplotype diversity re-
vealed by high-resolution scanning of human chromosome 21.
Science, 2001, 294: 17191723