免费文献传递   相关文献

Molecular Cloning and Expression Analysis of C4 Phosphoenolpyruvate Carboxylase Gene from A. hypochondriacus L.

籽粒苋C4型磷酸烯醇式丙酮酸羧化酶基因的克隆和表达分析



全 文 :作物学报 ACTA AGRONOMICA SINICA 2011, 37(10): 18011808 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn

本研究由国家自然科学基金项目(30971838), 山西省回国留学人员基金项目(200986)和山西省国际科技合作项目(2011081005)资助。
* 通讯作者(Corresponding authors): 张维锋, E-mail: zhwfen@sina.com; 杨武德, E-mail: sxauywd@126.com
第一作者联系方式: E-mail: byfok@126.com ** 共同第一作者
Received(收稿日期): 2011-03-23; Accepted(接受日期): 2011-06-25; Published online(网络出版日期): 2011-07-28.
URL: http://www.cnki.net/kcms/detail/11.1809.S.20110728.0959.001.html

DOI: 10.3724/SP.J.1006.2011.01801
籽粒苋 C4 型磷酸烯醇式丙酮酸羧化酶基因的克隆和表达
冯瑞云 1,2 白云凤 2,** 李 平 3 张维锋 2,* 王媛媛 1 杨武德 1,*
1 山西农业大学农学院, 山西太谷 030801; 2 山西省农业科学院作物科学研究所, 太原 030031; 3 山西大学生物工程学院, 山西太原
030006
摘 要: 磷酸烯醇式丙酮酸羧化酶(phosphoenolpyruvate carboxylase, PEPC)是 C4途径的关键酶之一。本研究克隆了双
子叶植物籽粒苋(A. hypochondriacus L.) C4型 PEPC基因的 cDNA和 gDNA全长序列。该基因编码区 cDNA全长 2 895
bp (GenBank 登录号为 HQ186302), 编码 964个氨基酸残基。对应的 gDNA全长为 6 785 bp, 含 10个外显子和 9个
内含子, 内含子总长 3 890 bp, 其中第一内含子最长, 为 1 662 bp, 具 GATA-motif、G-box等 15个光应答元件, 9个激
素应答元件, 29个 CAAT box, 72个 TATA box。该特征在本研究范围内的植物中, 为籽粒苋所独有。比较多种植物表
明, 不同植物之间的 C3/C4型 PEPC基因的外显子长度具有较高的一致性, 而内含子的长度变化较大。不同植物 PEPC
基因对核苷酸具有一定的选择性, 并且外显子和内含子的 GC 含量呈正相关。总的趋势是单子叶植物外显子和内含
子的 GC含量均高于双子叶植物。利用半定量 RT-PCR分析表达模式, 发现籽粒苋 PEPC基因主要在叶片中表达, 表
达量随光照时间延长而增加。
关键词: 籽粒苋(A. hypochondriacus L); C4光合途径; 磷酸烯醇式丙酮酸羧化酶; 基因组序列; 叶片特异性; 光诱导
表达
Molecular Cloning and Expression Analysis of C4 Phosphoenolpyruvate Car-
boxylase Gene from A. hypochondriacus L.
FENG Rui-Yun1,2, BAI Yun-Feng2,**, LI Ping3, ZHANG Wei-Feng2,*, WANG Yuan-Yuan1, and YANG
Wu-De1,*
1 College of Agronomy, Shanxi Agricultural University, Taigu 030801, China; 2 Institute of Crop Sciences, Shanxi Academy of Agricultural Sciences,
Taiyuan 030032, China; 3 Bio-engineering School of Shanxi University, Taiyuan 030006, China
Abstract: Phosphoenolpyruvate carboxylase (PEPC) plays a crucial role in primarily fixing atmospheric CO2 in C4 and CAM
plants. This paper aimed at cloning both cDNA and genomic DNA of PEPC gene from Amarnthus hypochondriacus in order to pro-
vide candidate genes for C4 genetic engineering. The cDNA was cloned by RT-PCR, and the corresponding gDNA was cloned by
LA-PCR. The sequence characteristics were analyzed using bioinformatics softwares including Blast, ClustalX (1.8), DNAMAN,
PlantCARE. The gene expression pattern was analyzed by using semi-quantitative RT-PCR. The results indicated that the cDNA with
the complete coding region was 2 895 bp in length which encoded 964 putative amino acids. The amino acid at site 774 was the ser-
ine that is an invariant residue in all C4 phosphoenolpyruvate carboxylases regardless of their taxonomic. The corresponding gDNA
was 6 785 bp in length which harbored ten exons and nine introns. The longest intron was the first intron with 1 662 bp in length. A
computer scan disclosed that the first intron harbored 15 light-induced elements, nine hormone-induced elements, 29 TAAT motifs
and 72 TATA motifs. In comparisons of PEPC genes between different species the exons are usually conserved but the introns have
often diverged in both nucleotide sequences and lengths. The GC ratios of exons are positively correlated with those of introns in
PEPC genes from different species. And the GC ratios of PEPC gene in dicotyledon A. hypochondriacus, potato, A. thaliana and ice
plant are lower than those in monocotyledon maize, rice and wheat. The semi-quantitative RT-PCR analysis revealed that the cloned
PEPC gene was light-inducible leaf-specifically expressed and classified as C4-type sub-family groups.
Keywords: Amarnthus hypochondriacus; C4 photosynthetic type; PEPC; gDNA; Leaf-specific; Light-inducible expression
1802 作 物 学 报 第 37卷

以 CO2固定初始产物的不同, 植物可分成 C3、
C4和 CAM 三类。以三碳化合物 3-磷酸甘油酸为最
初光合产物的光合途径为 C3途径(或卡尔文循环)。
以四碳化合物草酰乙酸为最初光合产物的光合途径
为 C4途径。C4途径具有 CO2浓缩机制[1], 能高效利
用大气中的 CO2, 使植物保持较高的光合效率。
磷酸烯醇式丙酮酸羧化酶(phosphoenolpyruvate
carboxylase, PEPC)是 C4途径的关键酶之一。PEPC
存在于所有能进行光合作用的有机体中 , 包括植
物、绿藻、蓝细菌和光合细菌。以其序列特征和功
能结构, PEPC 基因被划分为 C4、C3-1、C3-2 3 个亚
族[2], C4型主要在叶肉细胞的胞质中表达, 并且受光
照调控; C3-1型主要在黄色叶片、茎等部位表达, C3-2
型主要在根部表达。C4型 PEPC基因由 C3型 PEPC
基因进化而来[3-4]。不同类型 PEPC的蛋白质一级结
构具有很大的相似性, 但它们的动力学特征却有很
大差异, C4型 PEPC的 Km值比 C3型高 10倍以上[5]。
在 C4和 CAM 光合途径中, C4型 PEPC 与 CO2的高
亲和力是 C4 植物具有较高光合效率的重要因素
之一。
主要粮食作物小麦、水稻、马铃薯、大豆等均
为C3植物, 没有C4型 PEPC, 缺乏CO2浓缩机制, 使
得 1,5-二磷酸核酮糖羧化酶/加氧酶(Rubisco)羧化作
用减弱, 氧化作用增强, 光呼吸提高, 所固定的 CO2
最高有 50%被光呼吸消耗[6]。较低的光合效率成为
进一步提高 C3作物产量的主要内在限制因素。通过
基因工程手段改善光合效率, 提高农作物的产量水
平, 一直是国际光合作用研究和作物遗传育种领域
关注的热点。将 C4型 PEPC基因导入 C3植物, 能提
高光合效率[7]。迄今为止, 转基因利用的 C4型 PEPC
基因主要来自玉米[8]、高粱[9]、甘蔗[10]等单子叶植物,
其他来源的较少。籽粒苋是双子叶 C4植物, 属苋科
苋属, 抗旱耐瘠, 生长快, 生物学产量很高[11]。克隆
籽粒苋 C4型 PEPC 基因, 分析其基因组结构和序列
特征及其基因表达模式, 可进一步拓宽 C4光合途径
关键酶基因的来源, 为通过基因工程手段改善作物
的光合效率提供候选基因, 也为该基因的有效利用
提供遗传信息和科学依据。
1 材料与方法
1.1 试验材料
籽粒苋种子由本室保存。基因克隆所用的 LA-Taq
酶和M-MLV反转录酶为大连宝生物公司产品。
1.2 DNA和 RNA的提取
用 SDS 法提取籽粒苋基因组 DNA, 用改良方
法[12]提取总 RNA。
1.3 引物设计
根据籽粒苋 PEPC 基因序列(GenBank 登录号为
L49175)设计引物, 正向引物 FppcI 序列为 5′-CAAG
ATCTTATGGCTAGTGGGAAGTTGGAG-3′; 反向引
物 RppcII序列为 5′-CGGTAACCTTAACCGGTGTTCT
GCATTCC-3′。
采用分段克隆籽粒苋 gDNA。根据克隆的 cDNA
测序结果, 在2 124位为内切酶ApaL I的单切点, 为方
便基因拼接 , 在其上、下游设计引物 , 上游引物
FppcII: 5′-GAATGGCGTGCACTCATGGAC-3′, 下游
引物 RppcI: 5′-GTCCATGAGTGCACGCCATTC-3′。
PEPC基因表达模式分析所用内标基因 actin的
扩增引物为 UPactin: 5′-CTACAATGAGCTTCGGGT
TGC-3′和 Dactin: 5′-GACTTCTGGACAACGGAAT
C-3′; PEPC 基因扩增引物为 UPppc: 5′-CGGATGA
AATCAGGAGGGTT-3′ 和 Dppc: 5′-GCCTAAGTG
CGTTGTAAT-3′。
1.4 基因克隆
采用 RT-PCR 方法克隆 cDNA。以籽粒苋光照
7.5 h 的叶片中提取的总 RNA 为模板, 按以下步骤
反转录合成 cDNA第一链。总 RNA 2 μL, 10 μmol L–1
的反向引物 RppcII 2 μL、10 mmol L–1的 dNTP 1.5 μL
和DEPC处理的ddH2O 12.5 μL, 混匀, 70℃水浴5 min,
冰浴 5 min, 再加入 5×RT buffer 5 μL、5 U μL–1
RNasin 1 μL和 100 U μL–1 M-MLV反转录酶 1 μL,
混匀后, 放于 42℃ 60 min, 然后 70℃ 15 min, 再加
入 10 mg mL–1 RNase 0.2 μL, 放于 37℃ 20 min, 通
过反转录合成 cDNA第 1链。
以 cDNA第 1链为模板, 进行 PCR扩增。扩增
体系总体积 50 μL, 包含 cDNA第 1链 5 μL、10×PCR
buffer 5 μL、10 mmol L–1 dNTPs 1 μL、10 μmol L–1
正向引物 UPppcI 2 μL、10 μmol L–1反向引物 RppcII
2 μL、5 U μL–1 Taq DNA聚合酶(TaKaRa, 大连) 0.3
μL和 ddH2O 35 μL。反应程序为 94℃预变性 5 min;
94℃ 45 s, 55℃ 1 min, 72℃ 3 min, 35个循环; 72℃
延伸 10 min。
采用分段克隆 gDNA, 然后拼接。上游片段扩增
体系总体积 50 μL, 含籽粒苋 DNA 2 μL、10×PCR
buffer 5 μL、10 mmol L–1 dNTPs 1 μL、10 μmol L–1
正向引物 FppcI 2 μL、10 μmol L–1反向引物 RppcI 2 μL、
第 10期 冯瑞云等: 籽粒苋 C4型磷酸烯醇式丙酮酸羧化酶基因的克隆和表达 1803

5 U μL–1 Taq DNA聚合酶(TaKaRa, 大连) 0.3 μL和
ddH2O 37 μL。反应程序为 94℃预变性 5 min; 98℃ 20
s, 68℃ 10 min, 30个循环; 72℃延伸 10 min。
gDNA 下游片段扩增除所用引物为 FppcII 和
RppcII 外, 其余同上游片段。反应程序为 94℃预变性
5 min; 94℃ 30 s, 55℃ 1 min, 72℃ 3 min, 35个循环;
72℃延伸 10 min。
以 1.0%琼脂糖凝胶电泳检测和分离扩增的 PCR
产物。回收纯化后, 连接到 pSURE-T载体(北京博迈
德)上, 转化大肠杆菌 Top10 感受态细胞(北京博迈
德), 酶切鉴定后, 挑选阳性克隆, 送北京博迈德科
技发展有限公司测序。
1.5 序列特征分析
用 ClustalX(1.8)比对序列和构建进化树 , 用
DAMBE 分析碱基组成, 用 RepeatMasker[17]分析串
联重复序列(tandem repeats), 用DNAMAN分析分散
重复序列和 RNA二级结构, 用 PlantCARE[18]分析内
含子调控序列。
1.6 基因表达模式分析
运用半定量 RT-PCR 检测 PEPC 基因的表达量,
以 actin作为内标基因。将籽粒苋植株暗处理 1 d后,
再置光照条件下 2.5、5和 7.5 h, 分别提取暗处理和
不同光照时段的根、茎、叶的总 RNA, 以此为模板,
按以下步骤合成 cDNA 第 1 链。总 RNA 2 μL, 50
μmol L–1的 Oligo dT Primer 2 μL、10 mmol L–1的
dNTP 1.5 μL和 DEPC处理的 ddH2O 12.5 μL, 混匀,
70℃水浴 5 min, 冰浴5 min, 再加入5×RT buffer 5 μL、
5 U RNasin 1 μL和 100 U M-MLV反转录酶 1 μL, 混
匀后, 放于 42℃ 60 min, 然后 70℃ 15 min, 再加入
10 mg mL–1 RNase 0.2 μL, 放于 37℃ 20 min, 通过反
转录合成 cDNA第 1链。
以 cDNA第 1链为模板, 扩增 PEPC基因片段。
扩增体系总体积 50 μL, 含 cDNA 第 1 链 5 μL、
10×PCR buffer 5 μL、10 mmol L–1 dNTPs 1 μL、10
μmol L–1正向引物 UPppc 2 μL、10 μmol L–1反向引物
Dppc 2 μL、5 U μL–1 Taq DNA聚合酶 0.3 μL和 ddH2O
35 μL。反应程序为 94℃预变性 5 min; 94℃ 45 s,
55℃ 1 min, 72℃ 1 min, 25个循环; 72℃延伸 6 min。
扩增内标基因 actin的正向引物为 Upaction, 反
向引物为 Daction, 其他同 PEPC基因。取 20 μL PCR
产物经 1%琼脂糖凝胶电泳和凝胶成像, 采用软件
BandScan进行灰度分析, 用 Microsoft Excel作图。
2 结果与分析
2.1 籽粒苋 PEPC基因克隆和比对
利用玉米 C4 型 PEPC 基因的 cDNA 序列
(GenBank 登录号为 X15239)进行 Query, Blast 搜索
到籽粒苋的同源基因(GenBank 登录号为 L49175)。
该序列长 3 106 bp, ORF由 2 895 bp组成, 编码 964
个氨基酸残基。在该基因的起始密码子和终止密码
子处设计引物, 以籽粒苋叶片总 RNA 为模板, 用
RT-PCR 方法扩增 , 获得约 3 kb 的基因片段 (图
1-A)。该基因长 2 895 bp, 编码 964个氨基酸残基, 与
数据库中的原序列有 16 个碱基不同, 对应有 9个氨
基酸的差异。将该克隆基因命名为 AhPEPC (GenBank
登录号为 HQ186302)。

图 1 籽粒苋 PEPC 基因的克隆
Fig. 1 Cloning of PEPC gene from A. hypochondriacus L.
A: cDNA; M: DNA分子量标准 DL5000; B: gDNA的上游序列; M: DNA分子量标准 BM5000; C: gDNA的下游序列;
M: DNA分子量标准 DL15000。
A: cDNA; M: DNA marker DL5000; B: 5´end sequence of gDNA; M: DNA marker BM5000; C: 3´end sequence of gDNA;
M: DNA marker DL15000.
1804 作 物 学 报 第 37卷

将 AhPEPC和黄花菊属 C4植物 F. trinervia、黄花
菊属 C3植物 F. pringlei以及水稻、小麦、玉米、马
铃薯、拟南芥的同源基因进行多重比对, cDNA序列
一致性为 81.18%, 氨基酸序列性一致为 87.51%。基
于 cDNA 序列和氨基酸序列构建的系统进化树均显
示, 籽粒苋先与拟南芥、马铃薯这 2个双子叶植物聚
为一类, 玉米、水稻、小麦这 3个单子叶植物先聚为
一类, 与传统的植物系统分类结果一致。
已有研究表明, 不同类型 PEPC 的蛋白质一级
结构相似, 但动力学特征差异很大。黄花菊属植物
F. pringlei 的 C3型 PEPC 在第 774 位的氨基酸是苯
丙氨酸(A), 其近缘种 F. trinervia的 C4型 PEPC相应
位置的氨基酸是丝氨酸(S)。定点突变表明, 该位点
对 PEPC 动力学特性至关重要[13-14]。本研究克隆的
PEPC 基因推导的蛋白质(AhPEPC)相应位置的氨基
酸残基为丝氨酸, 玉米的 C4型 PEPC 相应位置的氨
基酸残基也为丝氨酸, 其他植物的 C3型 PEPC 相应
位置的氨基酸残基则为苯丙氨酸(图 2), 初步表明克
隆的 AhEPEC基因属于 C4型 PEPC基因。
2.2 PEPC基因组结构和内含子相位
以籽粒苋基因组 DNA 为模板 , 分 2 段扩增
PEPC 的基因组 DNA, 两端序列有部分重叠, 以便
拼接。扩增的 2个片段一个长约 5 kb (图 1-B), 另一
个长约 2 kb (图 1-C), 全序列拼接, 从起始密码子到
终止密码子共 6 785 bp。将该序列与克隆的 cDNA
序列进行比对, 表明其含有 9个内含子和 10个外显
子(图 3)。9个内含子均遵守 III 类内含子(mRNA 前
体内含子, 剪接型内含子)的 GT-AG法则。
内含子相位是一个只包括 3个变量的极为简单的
分子特征, 指内含子在蛋白质编码序列中的插入位
置。籽粒苋 PEPC基因的第 2个内含子位于外显子三
联体密码子的第 2个核苷酸之后, 为相位 2, 第 4个和
第 6 个内含子位于外显子三联体密码子的第一个核苷
酸之后, 为相位 1, 其余 6个内含子均位于 2个完整的
三联体密码子之间, 为相位 0。表明这 3种相位的内含
子在 PEPC基因中的分布是不对称的, 相位 0占多数。
2.3 内含子和外显子的长度多态性
本研究克隆的籽粒苋 PEPC 基因外显子总长
2 895 bp, 内含子总长 3 890 bp。10个外显子中, 以
第 8 个外显子最长, 为 999 bp, 第 3 个外显子最短,
为 85 bp。9 个内含子中, 以第 1 个内含子最长, 为
1 662 bp, 第 5个内含子最短, 为 79 bp。籽粒苋、玉
米、小麦、马铃薯、拟南芥和冰叶日中花等 6 种植
物 PEPC 基因外显子的总长度分布在 2 883 bp 和
2 916 bp之间, 并且这些植物 PEPC基因的第 3、第
4、第 5、第 7、第 8 和第 9 个外显子的长度完全一
致, 其他位置的外显子长度变化也较小。这 6 种植
物 PEPC基因的内含子总长度分布在 906 bp和 4 537
bp 之间, 但每个内含子的长度变化都很大, 尤其是
第 1 个内含子, 最长 1 662 bp (籽粒苋), 最短的为
104 bp (玉米), 相差 15倍之多(表 1)。
在不同植物 PEPC 基因外显子比对中, 发现水
稻 PEPC基因第 2个外显子的第 43~168核苷酸之间
的序列变成了内含子(图 4-A)。序列分析发现第 44
个核苷酸的碱基突变为 T,与前一位核苷酸正好形成
5端的剪接位点(供体位点) GT, 而第 167~168 位的
碱基 AG 正好是内含子 3端的剪接位点(受体位点),
致使在成熟的mRNA分子中去掉了 126 bp长的一段
外显子序列, 导致编码蛋白的第 70个氨基酸后面比
其他物种缺失了 42个氨基酸(图 4-B)。
2.4 基因 GC含量分析
在 DNA双螺旋结构中, DNA的 2条互补链靠氢
键维系, A与T配对, 中间有 2个氢键, 为弱耦合; G与
C配对, 中间有 3个氢键, 为强耦合。因为配对碱基之

图 2 AhPEPC 与其他物种 PEPC 的部分氨基酸序列的对比
Fig. 2 Partial amino acid alignment of AhPEPC with other published PEPC proteins from different species
框内氨基酸残基示 C4型 PEPC特有的氨基酸残基丝氨酸(S), C3型 PEPC特有的氨基酸残基苯丙氨酸(A)。右侧数字示末位氨基酸所在
位置。比对序列包括本研究克隆的籽粒苋 PEPC基因推导的氨基酸序列(AhPEPC)和来自黄花菊属 C4植物 F. trinervia (X61304)、黄花
菊属 C3植物 F. pringlei (Z489666)以及水稻(AP003409)、小麦(AJ007705)、玉米(X15239)、马铃薯(X90982)、拟南芥(NC_003070)
的 PEPC氨基酸序列。
The boxed amino acids indicate the special amino acids in both C4 plants and C3 plant. The left numbers indicate the positions of last amino
acids. PEPC amino acid sequences for alignment are derived from the F. trinervia (GenBank Accession No. X61304), F. pringlei (Z48966), O.
sativa (AP003409), T. aestivum (AJ007705), Z. mays (X15239), S. tuberosum (X90982), and A. thaliana (NC_003070), respectively.
第 10期 冯瑞云等: 籽粒苋 C4型磷酸烯醇式丙酮酸羧化酶基因的克隆和表达 1805




▬ exons — introns

图 3 籽粒苋 PEPC 的基因组结构
Fig. 3 PEPC genomic constructs of A. hypochondriacus

表 1 不同植物 PEPC 基因外显子和内含子的长度多态性
Table 1 Polymophism of exons and introns of PEPC gene in different plant species
外显子 Exon 内含子 Intron 编号
Number 长度范围
Length range (bp)
平均
Average (bp)
标准差
SD
长度范围
Length range (bp)
平均
Average (bp)
标准差
SD
1 144–189 (168) 169.5 13.8 104–1662 (1662) 737.4 522.6
2 392–395 (392) 394 1.4 80–679 (679) 206.3 214.1
3 85 (85) 85 0 74–1454 (187) 526.5 493.0
4 223 (223) 223 0 100–531 (120) 251.5 152.3
5 104 (104) 104 0 79–126 (79) 98.0 16.3
6 88–91 (88) 89 1.4 99–368 (161) 207.5 101.2
7 155 (155) 155 0 76–287 (99) 154.3 85.4
8 999 (999) 999 0 82–379 (316) 220.0 128.7
9 387 (387) 387 0 78–806 (587) 302.3 286.1
10 294–303 (294) 296.5 3.2
总长度 Total length 2883–2919(2895) 2913 11.8 906–4537 (3890) 2704 1203.3
括号内数值为籽粒苋 PEPC基因的相应值。用于比对的其他物种包括小麦(GenBank登录号: AJ007705)、玉米(X15239)、马铃薯
(X90982)、拟南芥(NC_003070)和冰叶日中花(X14588)。
The numbers in parentheses are the corresponding values of A. hypochondriacus PEPC gene. The other species for alignment are T.
aestivum (AJ007705), Z. mays (X15239), S. tuberosum (X90982), A. thaliana (NC_003070), and M. crystallinum (X14588).



图 4 PEPC 基因第 2 外显子部分序列及其对应的氨基酸序列比对
Fig. 4 Alignments of the second exon of PEPC gene from different species
A: 核苷酸序列比对; 框内示水稻中转变为内含子的序列; B: 氨基酸序列比对。比对序列分别来自籽粒苋(AhPEPC)、拟南芥
(NC_003076)、马铃薯(X90982)、冰叶日中花(X14588)、玉米(X15239)、小麦(AJ007705)和水稻(AP003409)。
A: Alignments of nucleotide sequences; the boxed sequence indicats an intron sequence converted from exon. B: Alignments of amino acid
sequences. The sequences for alignments are derived from A. hypochondriacus (AhPEPC), A. thaliana (NC_003070), S. tuberosum (X90982),
M. crystallinum (X14588), Z. mays (X15239), T. aestivum (AJ007705), and O. sativa (AP003409), respectively.
1806 作 物 学 报 第 37卷

间氢健数量的不同导致 DNA双螺旋结构刚性的不同。
富含 GC 的 DNA 双螺旋的刚性强于富含 AT 的 DNA
双螺旋, 染色质结构也随之不同[15]。分析籽粒苋 PEPC
基因的 GC 含量, 顺序是外显子>gDNA>内含子, 拟
南芥等其他 6个物种也呈同样趋势(图 5), 不同植物
之间互相比较, 籽粒苋、拟南芥、马铃薯、冰叶日中
花这 4 个双子叶植物的内含子和外显子的 GC 含量均
低于玉米、小麦、水稻等 3 个单子叶植物。gDNA 的
GC 含量也有相同趋势, 只是拟南芥略有不同 , 其
gDNA 的 GC 含量低于玉米和小麦, 但略高于水稻,
这可能与拟南芥的内含子最短(380 bp), 其 GC含量
对 gDNA 影响小, 致使 gDNA 的 GC 含量接近外显
子。GC含量相关分析表明, gDNA与内含子的相关
系数为 0.8803, 与外显子的相关系数为 0.9540, 内
含子与外显子的相关系数为 0.8707, 三者之间的GC
含量呈现高度正相关。籽粒苋外显子和内含子的 GC
含量比为 1.37, 拟南芥、马铃薯、冰叶日中花、小
麦、水稻的比例在 1.33~1.38 之间, 玉米偏高, 达
1.64。将这 7种植物的各个内含子的 GC含量与其两
侧相邻外显子的平均 GC 含量做成散点图, 趋势基
本相同(图 6), 表明不同植物 PEPC基因的核苷酸组
成有一定的偏好, 其内含子和外显子的 GC 含量呈
现正相关。


图 5 不同植物 PEPC 基因的 GC 含量
Fig. 5 GC conten of PEPC gene of different plant species
1: 籽粒苋(A. hypochondriacus); 2: 拟南芥(A. thaliana); 3: 马铃
薯(S. tuberosum); 4: 冰叶日中花(M. crystallinum); 5: 玉米(Z.
mays); 6: 小麦(T. aestivum); 7: 水稻(O. sativa)。

2.5 第 1内含子序列特征和调控元件分析
籽粒苋PEPE基因第 1内含子长 1 662 bp, 是其他
8个内含子平均长度(278 bp)的 6倍, 也是该基因 9个
内含子中最长的 1个内含子。该内含子序列含 T最多,
为 637个, A次之, C最少, 为 232个, GC含量为 0.31,
具有内含子 GC含量较低的一致特点。在 72~107位是
一段 19 bp的串联重复序列, 该序列匹配碱基数 18个,

图 6 PEPC 基因内含子及其两侧外显子平均 GC 含量的对应关系
Fig. 6 Relationships of GC contents of introns with their
proximate exons

含有 1个 Indel位点。该内含子还含有 7个大于 10 bp
的分散正向重复序列和 5个分散反向重复序列。Blast
搜索未发现同源序列。利用 PlantCARE 在线分析, 该
内含子含有 15个光应答元件, 即 ACE、ATCT-motif、
BoxI、BoxII、GA-motif、GATA-motif、I-box各 1个,
G-box 6个, GTI-motif 2个; 还有 1个与基因高度表达
相关的顺式调控元件 UTR Py-rich stretch, 2个茉莉酸
应答相关元件 CGTCA-motif, 1 个乙烯利应答相关元
件 ERE, 1个顺式作用调控元件OBP-1 site, 3个赤霉素
应答元件 P-box, 3个与抗性和胁迫应答相关的顺式元
件 TC-rich repeats, 1个水杨酸应答元件 TCA-element,
以及 29 个 CAAT box, 72 个 TATA box。玉米 C4型
PEPC基因第 1内含子仅含有 1个GGGCGG光应答元
件, 无激素应答元件、CAAT box 等其他调控序列。
2.6 基因表达模式分析
籽粒苋 PEPC 基因无论暗处理或光照 2.5、5.0
和 7.5 h, 在叶片中均有表达, 并且随着光照时间的
延长, 表达丰度也相应增加。但 PEPC 基因在暗处
理或光照 7.5 h后, 在根和茎中均不表达或表达量很
低(图 7-A)。BandScan灰度分析表明, 光照 2.5、5.0
和 7.5 h后叶片 PEPC基因表达量分别是暗处理的 4
倍、8倍和 12倍(图 7-B)。上述结果说明籽粒苋 PEPC
基因是光诱导、叶片特异表达的, 与 C4型 PEPC 基
因的表达模式一致。
3 讨论
植物不同类型的 PEPC 具有相似的一级结构, 但
动力学特征差异很大[5], 而第 774 位氨基酸残基的种
类是重要影响因素之一, C3 型为苯丙氨酸, C4 型为丝
氨酸[13-14]。本研究克隆的籽粒苋 PEPC 基因推导的氨
基酸序列在相应位置的氨基酸残基为丝氨酸, 初步表
明克隆的基因属于 C4型。用半定量 RT-PCR方法研究
第 10期 冯瑞云等: 籽粒苋 C4型磷酸烯醇式丙酮酸羧化酶基因的克隆和表达 1807


图 7 半定量 RT-PCR 分析 PEPC 基因的表达模式
Fig. 7 Expression analysis of PEPC gene by semi-quantitative RT-PCR
A: 光照对不同器官中 PEPC基因表达的影响; B: PEPC基因表达的灰度分析。
A: Effects of light on PEPC gene expression in different organs; B: Grayscale analysis of PEPE gene expression.

籽粒苋 PEPC 基因的表达模式, 证实该基因是在叶片
中特异表达的, 表达量随着光照时间的延长而增加。
综合上述结果, 表明克隆的 PEPC基因属于 C4型。
利用 C4型 PEPC 基因改造 C3植物已有多年历
史。高粱 C4型 PEPC 基因能在小麦中高效表达[16],
高粱、玉米的 C4型 PEPC基因能显著提高水稻的光
合效率[17-18]。但甘蔗和玉米的 C4型 PEPC基因不能
在双子叶植物烟草中高效表达[19], 似乎表明 C4基因
在 C3植物中的表达受种系发生距离的影响。遗传密
码子分析表明, 双子叶植物比单子叶植物更多地选择
第 3位为 A或 T的同义密码子[20-21]。本研究表明, 籽
粒苋、拟南芥、马铃薯、冰叶日中花这 4 个双子叶植
物的 PEPC 基因比单子叶植物玉米、小麦、水稻更多
地选择 A和 T。这些结果似乎在某种程度上从分子水
平解释了为什么单子叶植物 PEPC 基因不能在双子叶
植物中高效表达。据此, 本研究克隆的籽粒苋 C4 型
PEPC基因似乎更适合转入马铃薯等双子叶植物。
在生物进化过程中, 突变是经常发生的。本研
究发现, 籽粒苋、拟南芥、马铃薯、玉米、小麦等
作物 PEPC基因第 2外显子第 43位至第 168位的核
苷酸序列, 在水稻的对应部分转变为内含子。序列
比对表明可能由单核苷酸突变引起。由于没有造成
移码, 后面的氨基酸序列仍能保持正常。在 GenBank
中搜索到水稻 PEPC基因的另外 2条同源基因(登录
号为 NM_01050836 和 AK101274.1), 在编码序列中
也均无这段序列, 表明该序列对 PEPC 基因行使正
常功能不是必需的。因此在 PEPC 转基因研究中可
以考虑删除这段序列, 以减少转基因复制、转录和
翻译过程中的能量消耗。
内含子不编码蛋白质, 但内含子中往往含有一
些调控元件, 影响基因表达。比如, 内含子同某些蛋
白质结合影响转录的起始和延伸; 内含子剪接增加
了 mRNA 在核内的稳定性, 导致在细胞质中积累更
多成熟的 mRNA; 内含子包含一些具有开放染色体
功能的特殊序列, 它们通过影响核质成分、位置等
来影响基因的表达[22-23]。利用玉米自身的内含子能
提高转基因在玉米中的表达水平 [24], 利用来自矮牵
牛的内含子能提高转基因在拟南芥中的表达水平[25]。
本研究发现, 不同植物 PEPC 基因的外显子和内含子
的 GC含量呈现正相关, 表明内含子在选择核苷酸成
分上不是随机的, 受到外显子的约束, 二者呈协同
进化的趋势。这些结果似乎预示内含子效应与其所
在基因组的碱基组成有一定关系。迄今相关研究报
道甚少, 尚需进一步探讨。
4 结论
从双子叶植物籽粒苋中克隆了 PEPC基因编码区
完整的 cDNA (GenBank登录号为HQ186302)和 gDNA
序列。cDNA全长 2 895 bp, 编码 964个氨基酸。gDNA
全长 6 785 bp, 含有 10个外显子和 9个内含子。其中
第一内含子长达 1 662 bp, 具 GATA-motif、G-box 等
15个光应答元件, 9个激素应答元件, 29个 CAAT box,
72个 TATA box。该特征在本研究范围内的植物中, 为
1808 作 物 学 报 第 37卷

籽粒苋所独有。籽粒苋 PEPC 基因是在叶片中特异表
达的, 表达量随光照时间延长而增加, 符合植物 C4型
PEPC基因的一般表达模式。
References
[1] Caemmerer S, Furbank R T. The C4 pathway: an efficient CO2
pump. Photosynthesis Res, 2003, 77: 191–207
[2] Schaeffer A R, Sheen J. Maize C4 photosynthesis involves differ-
ential regulation of phosphoenolpyruvate carboxylase gene. Plant
J, 1992, 2: 221–232
[3] Engelmann S, Blaesing O E, Svensson P, Westhoff P. Molecular
evolution of C4 phosphoenolpyruvate carboxylase in the genus
Flaveria: a gradual increase from C3 to C4 characteristics. Planta,
2003, 217: 717–725
[4] Blaesing O E, Ernst K, Streubel M, Westhoff P, Svensson P. The
non-photosynthetic phosphoenolpyruvate carboxylases of the C4
dicot Flaveria trinervia-implications for the evolution of C4 pho-
tosynthesisl. Planta, 2000, 215: 448–456
[5] Izui K, Matsumura H, Furumoto T, Kai Y. Phosphoenolpyruvate
carboxylase: a new era of structural biology. Annu Rev Plant Biol,
2004, 55: 69–84
[6] Ogren W L, Photorespiration: pathways, regulation and modifi-
cation. Annu Rev Plant Physiol, 1984, 35: 415–442
[7] Haesler R E, Hirsch H J, Kreuzaler F, Peter haensel C. Overex-
pression of C4-cycle enzymes in transgenic C3 plants: a biotech-
nological approach to improve C3-photosynthesis. J Exp Bot,
2002, 53: 591–607
[8] Zhou B-Y(周宝元), Ding Z-S(丁在松), Zhao M(赵明). Allevia-
tion of drought stress inhibition on photosynthesis by over ex-
pression of PEPC gene in rice. Acta Agron Sin (作物学报), 2011,
37(1): 112–118 (in Chinese with English abstract)
[9] Zhang F, Chi W, Wang Q, Zhang Q D, Wu N F. Molecular clon-
ing of C4-specific Ppc gene of sorghum and its high level expres-
sion in transgenic rice. Chin Sci Bull, 2003, 48: 1835–1840
[10] Yang R-Z(杨荣仲), Tan Y-M(谭裕模), Zhang M-Q(张木清),
Chen R-K(陈如凯), Li Y-R(李杨瑞). Primary study of genetic
transformation of tobacco with sugarcane C4 phosphoenolpyru-
vate carboxylase gene. Chin J Trop Crops (热带作物学报), 2004,
25(2): 61–65 (in Chinese with English abstract)
[11] Shukla S, Bhargava A,Chatterjee A, Srivastava A, Singh S P.
Genotypic variability in vegetable amaranth (Amaranthus tricolor
L.) for foliage yield and its contributing traits over successive
cuttings and years. Euphytica, 2006, 151: 103–110
[12] Bai Y-F(白云凤), Guo Z-H(郭志华), Bai D-M(白冬梅), Wang
X-Q(王小琦), Zhang W-F(张维锋). An improved method for ex-
tration and identification of potato RNAs. Acta Hortic Sin (园艺
学报), 2007, 34(4): 1059–1062 (in Chinese with English abstract)
[13] Engelmann S, Blaesing O E, Westhoff P, Svensson P. Serine 774
and animo acids 296 to 437 comprise the major C4 determinants
of the C4 phosphoenolpyruvate carboxylase of Flaveria trinervia.
FEBS Lett, 2002, 524: 11–14
[14] Blaesing O E, Westhoff P, Svensson P. Evolution of C4 phos-
phoenolpyruvate carboxylase in Flaveria, a conserved serine re-
sudue in the carboxyl-terminal part of the enzyme is a major de-
terminant for C4-specific characteristics. J Biol Chem, 2000, 275:
27917–27923
[15] Levisky V G. RECON: a program for prediction of nucleosome
formation potential. Nucl Acids Res, 2004, 32: 346–349
[16] Chen X Q, Zhang X D, Liang R Q, Zhang L Q, Yang F P, Cao M Q.
Expression of the intact C4 type PEPC gene cloned from maize in
transgenic winter wheat. Chin Sci Bull, 2004, 49: 2137–2143
[17] Xiang X-C(向珣朝), He L-B(何立斌), Sun J-M(孙建明), Li
J-H(李季航), Yao Y-P(姚嫣萍), Li P(李平). Effect of maize
PEPC gene in different genetic backgrounds of CMS maintainers
and tolerance to photooxidation in the PEPC transgenic line.
Chin J Rice Sci (中国水稻科学), 2009, 23(3): 257–262 (in Chi-
nese with English abstract)
[18] Ku M S B, Agarie S, Nomura M, Fukayama H, Tsuchida H, Ono
K, Hirose S, Toki S, Miyao M, Matsuka M. High-level expres-
sion of maize phosphoenolpyruvate carboxylase in transgenic rice
plants. Nat Biotechnol, 1999, 17: 76–81
[19] Hudaspeth R L, Grula J W, Dai Z Y, Edwards G E, Ku M S B.
Expression on maize phosphoenolpyruvate carboxylase in trans-
genic tobacco. Plant Physiol, 1982, 98: 458–464
[20] Kawabe A, Miyashita N T. Patterns of codon usage bias in three
dicot and four monocot plant species. Genes Genet Systems, 2003,
78: 343–352
[21] Li Ping(李平), Bai Y-F(白云凤), Feng R-Y(冯瑞云), Wang
Y-Y(王原媛), Zhang W-F(张维锋). Analhysis of codon bias of
NAD-ME gene in Amaranthus hypochondriacus. Chin J Appl
Environ Biol (应用和环境生物学报), 2011, 17(1): 12–17 (in
Chinese with English abstract)
[22] Furger A, O’Sullivan J M, Binnie A, Lee B A, Proudfoot N J.
Promoter proximal splice sites enhance transcription. Gene Dev,
2002, 16: 2792–2799
[23] Jia Q, Wu H T, Zhou X J, Gao J, Zhao W, Ar Q S, Wei J S, Hou
L H, Wu S Y, Zhang Y. A “GC-rich” method for mammalian
gene expression: a dominant role of non-coding DNA GC content
in regulation of mammalian gene expression. Sci China: Life Sci,
2010, 53: 94–100
[24] Wang Y B, Lang Z H, Zhang J, He K L, Song F P, Huang D F. Ubi1
intron-mediated enhancement of the Bt cry1AH gene in transgenic
maize (Zea mays L.). Chin Sci Bull, 2008, 53(20): 3185–3190
[25] Jeong Y M, Mun J H, Kim H. An upstream region in the first in-
tron of petunia action depolymerizing factor 1 affects tissue-
specific expression in transgenic Arabidopsis. Plant J, 2007, 50:
230–239