免费文献传递   相关文献

Cloning and Analysis of GmCIL4 Gene in Glycine max L.

大豆GmCOL4基因的克隆与分析


The model plant Arabosopsis thaliana has been identified to have four major flowering pathways. Among them, the photoperiod pathway integrates the light signal including light/dark cycle, light spectrum, light intensity, and light duration, to mediate flower initiation.


全 文 :作物学报 ACTA AGRONOMICA SINICA 2010, 36(4): 539−548 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn

本研究由“十一五”国家科技支撑计划重点项目(2007BAD59B02), 国家转基因植物研究与产业化专项(2008ZX0809-001)和国家高技术研究发
展计划(863计划)项目(2006AA10A111, 2007AA10Z119)资助。
* 通讯作者(Corresponding authors): 陈新建, E-mail: xinjian@371.net; 傅永福, E-mail: fuyf@caas.net.cn
第一作者联系方式: E-mail: zhangqz1020@gmail.com
Received(收稿日期): 2009-07-28; Accepted(接受日期): 2009-12-10.
DOI: 10.3724/SP.J.1006.2010.00539
大豆 GmCOL4 基因的克隆与分析
张清哲 1 马锦花 1 陈新建 1,* 傅永福 2,*
1 河南农业大学农学院, 河南郑州 450002; 2 中国农业科学院作物科学研究所 / 农作物基因资源与遗传改良国家重大科学工程, 北京
100081
摘 要: CONSTANS (CO)是植物光周期开花途径中的关键基因之一。通过 RT-PCR和生物信息学的方法, 克隆了大豆
GmCOL4基因并分析其结构特征, 用实时荧光定量 PCR (quantitative real-time RT-PCR, qRT-PCR)研究了其转录特点。
结果表明, GmCOL4 的 4个外显子编码一个具有 B-box 和 CCT 保守结构域的 CO-like 蛋白, 在序列上与拟南芥
(Arabidopsis thaliana) COL9相似性最高, 为 64.3%。分析其转录特征发现, GmCOL4表达主要受生物节律的影响, 受
光的调节作用较弱。器官特异性表达分析发现, GmCOL4主要在大豆叶片中表达, 表达模式与 COL9相似。这为大豆
中 CO基因家族的功能研究提供了重要的依据。
关键词: CONSTANS; 生物信息学; 生物节律钟; 光周期; 大豆
Cloning and Analysis of GmCOL4 Gene in Glycine max L.
ZHANG Qing-Zhe1, MA Jin-Hua1, CHEN Xin-Jian1,*, and FU Yong-Fu2,*
1 College of Agronomy, Henan Agricultural University, Zhengzhou 450002, China; 2 Institute of Crop Sciences, National Key Facility of Crop Gene
Resource and Genetic Improvement, Chinese Academy of Agricultural Sciences, Beijing 10081, China
Abstract: The model plant Arabidopsis thaliana has been identified to have four major flowering pathways. Among them, the
photoperiod pathway integrates the light signal including light/dark cycle, light spectrum, light intensity, and light duration, to
mediate flower initiation. CONSTANS (CO) is a key gene in photoperiodic flowering pathway and acts between genes of the cir-
cadian clock and meristem identity. CO encodes a protein containing two zinc finger regions (B-box I and II) near the amino ter-
minus and a CCT (CO, CO-like, TOC1) domain near the carboxy terminus. The CO from Arabidopsis thaliana is one member of
the family comprised of 17 members, which can be classed into three subgroups based on their characters of functional domains.
To elucidate the function of CO in flowering in soybean, cloned one of CO-like gene, named as GmCOL4, from Glycine max L.
Kennong 18. Bioinformatics analysis revealed that GmCOL4 encoded a protein embedded two conserved domains, B-box and
CCT, and belonged to subgroup III. Phylogenetic analysis based on the critical amino acid sequences indicated that GmCOL4 was
much close to COL9 with similarity of 64.3%. The expression profiles of GmCOL4 by quantitative real-time RT-PCR (qRT-PCR)
showed a similar pattern to that of COL9. GmCOL4 was largely regulated by biological circadian, while the light appeared weak
effect on it. And GmCOL4 expressed mainly in leaves and had its highest amount in anthesis. The results suggested that GmCOL4
is one of the important genes in the regulation of flowering and photoperiodic in soybean. It paves a way to study the function of
CO family in soybean and its application in soybean molecular breeding.
Keywords: CONSTANS; Bioinformatics; Circadian clock; Photoperiod; Glycine max L.
20世纪 20年代, Garner等[1]首次提出了植物光
周期的现象。随后, 其他的生物体中的光周期反应
也被发现[2]。光周期是调控植物开花的重要代谢途
径之一, 在该途径中, CONSTANS (CO)基因在响应
光周期调节中起着重要作用, 致使 CO 基因成为研
究植物开花调控的重要基因之一。
Putterill 等[3]最早报道了拟南芥中的 CO 基因,
它对光周期的响应起着关键作用。通过大量的研究
540 作 物 学 报 第 36卷

发现 CO 介于生物节律钟与下游开花基因之间, 将
光信号转变为开花信号[4]。在CO参与的调控途径中,
许多基因如 CYCLING DOF FACTOR 1(CDF1)、
FLAVIN-BINDING 、 KELCH REPEAT 、 F-BOX
PROTEIN1(FKF1)、GIGANTEA(GI)、phytochromes
(phy)和 cryptochromes(cry)等都参与其中, 并与其相
互作用, 共同调节植物的开花时间。CDF1、FKF1
和 GI调控 CO的转录[5-6], PhyA和 Cry2共同作用能
够调控 CO蛋白的稳定性, 而 PhyB能促进 CO蛋白
的降解 [7]。CO 蛋白激活光周期开花途径整合子
FLOWER LOCUS T(FT) 和 SUPPERSSOR OF
OVEREXPRESSION OF CO 1(SOC1)的转录[8-11]。
CO 是一类锌指蛋白转录因子, 含有与蛋白作
用相关的 B-box 和与核定位有关的 CCT (CO、
CO-Like 和 TOC1)两类重要的保守结构域[12-15]。随
着基因组计划及生物信息学的兴起, 不同物种中的
CO 不断被认知 , 如水稻 (Oryza sativa)[16]、小麦
(Tritivum aestivum)[17] 和 衣 藻 (Chlamydomonas
reinhardtii)[18]的 CO 基因。在已研究的生物中, CO
常以多个拷贝的形式存在于生物体中, 如拟南芥的
CO家族有 17个成员[15], 水稻中有 16个成员[19], 并
且已经在甘蓝型油菜(Brassica napus)中克隆得到 4
个CO同源基因[20], 在温带裸子植物欧洲云杉(Picea
abies)中鉴定到 2个 CO同源基因[21]。
大豆作为一种短日照植物, 其开花时间受光周
期的严格调控。大豆基因组测序工作已经基本完成,
但大豆开花的分子机理还不清楚。为了更好地理解
光周期对大豆开花调控的分子机制及大豆中 CO 家
族基因的表达模式和功能, 本文以大豆垦农 18为研
究对象, 根据不同生物同源基因序列的比对, 克隆
得到位于第 20号染色体上的GmCOL4基因, 用生物
信息学的方法分析其结构特征, 并通过实时荧光定
量 PCR (quantitative real-time RT-PCR, qRT-PCR)的
方法鉴定其在 mRNA水平上的昼夜节律性表达模式,
及其组织器官特异性表达模式和不同发育时期的表
达模式。该研究为进一步解析 CO 在光周期诱导的
大豆开花过程中的作用奠定了基础。
1 材料与方法
1.1 试验材料
1.1.1 GmCOL4 基因克隆样品 将大豆垦农 18
(Glycine max L. Kennong 18, KN18)种子播种在
25~28℃, 短日(SD, 8 h光照/16 h黑暗)条件的光照
培养间, 6 周后取单叶液氮冷冻存于–80℃冰箱, 备
用。
1.1.2 光周期和昼夜节律样品 大豆垦农18种子
分别播种在长日(LD, 18 h光照/6 h黑暗)和短日(SD,
8 h光照/16 h黑暗)条件下, 在单叶完全展开时每隔
2 h一次, 各取 24个时间点(共 48 h), 随后将幼苗分
别转移至连续光照(LL)和连续黑暗(DD)条件下培养,
仍每隔 2 h一次, 各取 24个时间点(共 48 h)。所有
样品取后立即液氮冷冻存于−80℃冰箱。
1.1.3 不同发育时期和组织器官样品 将大豆品
种垦农18 (KN18)种植于光照培养间, 日照条件为短
日(SD, 8 h光照/16 h黑暗), 温度为 25~28℃。在单
叶展开前取地上部幼苗, 在单叶展开期(播种后两周)
取根、下胚轴、上胚轴、子叶、单叶和茎尖(包括顶
端分生组织和幼叶), 在开花期(第 4复叶全展期, 播
种后 45 d)取根、茎、单叶、第 1、2、3复叶和叶柄、
花、花后 7、14和 21 d的荚和种子, 分别于单叶全
展期、第 1、2、3和 4复叶全展期(开花期), 取地上
部分。所有样品均在光照开始后 0.5 h取样[22], 取后
立即以液氮冷冻存放于−80℃冰箱(表 1)。
1.2 基因克隆
通过搜索(http://www.phytozome.net/index.php),
得到大豆的 CO 同源基因后 , 根据预测基因的
mRNA序列和 CDS序列, 用 Premier5.0设计引物。
用 Trizol 法提取 mRNA, 以生长在短日条件下的大
豆单叶总 RNA为模板, 用 TaKaRa公司提供的试剂
盒合成单链 cDNA, 并以此为模板, 先克隆包含部
分 UTR的基因 mRNA片段(所用引物被命名为 UF、
UR), 在此基础上克隆基因的 CDS序列(所用引物被
命名为 F、R, 表 3)。用琼脂糖凝胶回收试剂盒(北京
天根生化科技有限公司)回收 PCR 产物。将回收产
物与 pGWC[23]载体连接、转化(参照 TaKaRa试剂盒
方法), 挑取正向克隆送到中国农业科学院重大工程
楼测序部或北京三博生物技术公司进行测序。
1.3 分子进化树构建
根据拟南芥 CO 家族以及其他物种报道的 CO
家族全长序列和本研究克隆得到的 GmCOL4 的共
60个序列(表 2), 用 MEGA 4构建分子进化树。采用
Neighbor-Joining (NJ)法的 Complete Deletion模式建
树, 用 Bootstrap进行检验, 并重复 1 000次。
1.4 基因结构作图
采用GSDS (gene structure display server)进行作
图(http://gsds.cbi.pku.edu.cn/index.php)。
第 4期 张清哲等: 大豆 GmCOL4基因的克隆与分析 541


表 1 不同发育时期和组织器官样品及缩写
Table 1 Samples of different tissues/organs and developmental stages and their abbreviations
注释 Annotation 缩写 Abbreviation
播种后 1周幼苗 One week-old seedlings Seedling
单叶全展期根 Roots at unifoliolates fully expanded U-R
单叶全展期下胚轴 Hypocatyls at unifoliolates fully expanded U-HH
单叶全展期上胚轴 Epicotyls at unifoliolates fully expanded U-EH
单叶全展期子叶 Cotyledons at unifoliolates fully expanded U-C
单叶全展期单叶 Unifoliolates at unifoliolates fully expanded U-U
单叶全展期茎顶端 Shoot apex at unifoliolates fully expanded U-SAM
开花期根 Roots at flowering F-R
开花期茎 Stems at flowering F-St
开花期单叶 Unifoliolates at flowering F-U
开花期第 1复叶 1st trifoliolates at flowering F-T1
开花期第 2复叶 2nd trifoliolates at flowering F-T2
开花期第 3复叶 3rd trifoliolates at flowering F-T3
开花期第 4复叶 4th trifoliolates at flowering F-T4
开花期叶柄 Petioles at flowering F-Pt
花蕾 Buds F-F
开花后 7 d的荚 Pods at 7 days after flowering Pd1
开花后 14 d的荚 Pods at 14 days after flowering Pd2
开花后 21 d的荚 Pods at 21 days after flowering Pd3
第 1复叶全展期单叶 Unifoliolate at 1st trifoliolate fully expanded T1-U
第 2复叶全展期单叶 Unifoliolate at 2nd trifoliolate fully expanded T2-U
第 3复叶全展期单叶 Unifoliolate at 3rd trifoliolate fully expanded T3-U
第 1复叶全展期第 1复叶 1st trifoliolate at 1st trifoliolate fully expanded T1-T1
第 2复叶全展期第 1复叶 1st trifoliolate at 2nd trifoliolate fully expanded T2-T1
第 3复叶全展期第 1复叶 1st trifoliolate at 3rd trifoliolate fully expanded T3-T1
第 2复叶全展期第 2复叶 2nd trifoliolate at 2nd trifoliolate fully expanded T2-T2
第 3复叶全展期第 2复叶 2nd trifoliolate at 3rd trifoliolate fully expanded T3-T2
第 3复叶全展期第 3复叶 3rd trifoliolate at 3rd trifoliolate fully expanded T3-T3
开花后 7 d的种子 Seeds at 7 days after flowering 7DAF
开花后 14 d的种子 Seeds at 14 days after flowering 14DAF
开花后 21 d的种子 Seeds at 21 days after flowering 21DAF
成熟期种子 Seeds at maturity Mature
单叶全展期地上部 Aerial parts at unifoliolates fully expanded U-A
第 1复叶全展期地上部 Aerial parts at 1st trifoliolate fully expanded T1-A
第 2复叶全展期地上部 Aerial part at 2nd trifoliolate fully expanded T2-A
第 3复叶全展期地上部 Aerial parts at 3rd trifoliolate fully expanded T3-A
开花期地上部 Aerial parts at flowering F-A

1.5 实时荧光定量 PCR
利用 Beacon Designer 7.0 生物软件设计 qRT-
PCR用到的所有引物(表 3), 用 SYBR Green I检测
荧光信号、15 μL 的反应体系 , 在 ABI 公司的
StepOne 实时定量 PCR 仪上完成。通过扩增曲线和
熔解曲线, 确定引物的特异性。利用 StepOne 生物
软件和 Microsoft Excel 分析处理实验结果, 参照
ABI 公司提供的 ΔΔCt 计算方法计算相对表达量
(relative expression)。
2 结果与分析
2.1 GmCOL4基因的克隆与序列分析
通过 Blast比对分析, 得到 1个与拟南芥 CO基
因同源的大豆 CO 基因, 命名为 GmCOL4。首先根
542 作 物 学 报 第 36卷

表 2 不同物种 CO 家族基因及其在 GenBank 的登录号
Table 2 CO family genes from different species and their GenBank accession numbers
No. 基因名称
Gene symbol
登录号
Acc. number
种名
Species name
No. 基因名称
Gene symbol
登录号
Acc. number
种名
Species name
1 BvCOL1 EU437782.1 31 PrZn AAD22518 松树 Pinus rediata
2 BvCOL3 EU437784
甜菜 Beta vulgaris
32 PsCOLa AAX47172.1
3 Bj COL1 DQ534066 芥菜 Brassica juncea 33 PsCOLb AAX20015.1
豌豆 Pisum sativum
4 BnCO1 AF016010 34 PdCOL1 AY515150
5 BnCO2 AF016011 35 PdCOL2 AY515151
美洲黑杨 Populus deltodes
6 BnCOL AY280868
甘蓝型油菜
Brassica napus
36 RsCOL1 AF052690.1 萝卜 Raphanus sativus
7 BoCOL1 CAL29800.1 37 SaCO ACM69281 白芥 Simapis alba
8 BoCO CAL29801.1
甘蓝 Brassica oleracea
var. alboglabra 38 StCO ABO43724.1 马铃薯 Solanum tuberosum L.
9 FaCO FJ377616 草莓 Fragaria ananassa 39 TaHd1-1 AB094490
10 HvCOL1 AF490468 40 TaHd1-2 AB094488.1
11 HvCOL2 AF490470.1 41 TaHd1-3 AB094491
小麦 Tritivum aestivum
12 HvCOL3 AF490472.1 42 ZmCO NP_001120722.1 玉米 Zea mays
13 HvCOL4 AF490475.1 43 CONSTANS NP_197088.1
14 HvCOL5 AY082958 44 AtCOL1 NP_197089
15 HvCOL6 AY082961.1 45 AtCOL2 NP_186887
16 HvCOL8 AY082964.1
大麦 Hordeum vulgare
46 AtCOL3 NP_180052
17 LpCOL AY600919 黑麦草 Lolium perenne 47 AtCOL4 NP_197875
18 LtCOL AY553297 毒麦 Lolium temulentum 48 AtCOL5 AAM45054
19 LeCO1 AAS67377 49 AtCOL6 AAM10103
20 LeCO2 AAS67378 50 AtCOL7 NP_177528
21 LeCO3 AAS67379
番茄
Lycopersicon esculentum
51 AtCOL8 NP_175339
22 OsHd1 BAC92734 水稻 Oryza sativa 52 AtCOL9 NP_187422
23 InCOL AAG24863 牵牛 Ipomoea nil 53 AtCOL10 Q9LUA9
24 MdCOL1 AAC99309 54 AtCOL11 O23379
25 MdCOL2 AAC99310
苹果 Malus domestica
55 AtCOL12 Q9LJ44
26 PpCOL1 BAD89084 56 AtCOL13 O82256
27 PpCOL2 CAI64584 57 AtCOL14 O22800
28 PpCOL3 CAI64585
葫芦藓
Physcomitrella paten
58 AtCOL15 Q9C7E8
29 PaCOL1 AM267532.1 59 AtCOL16 Q8RWD0
拟南芥 Arabidopsis thaliana
30 PaCOL2 EF650085
欧洲云杉 Picea abies
60 GmCOL4 GQ892878 大豆 Glycine max L.

表 3 本研究所用的引物
Table 3 Primers used in this study
引物名称 Primer name 序列 Sequence 用途 Function
UF 5-TTTTGCGGCATATCGTGGTT-3
UR 5-TCAGCAGCTTCTGGTTGTGCTCAAAG-3
基因克隆
Gene cloning
F 5-ATGGGTTATATATGTGATTTTTGTG-3
R 5-TCAGCAGCTTCTGGTTGTGC-3
基因克隆
Gene cloning
Q-4F 5-ACCCTTTGAGCACAACCAGA-3
Q-4R 5-GTTTTTCTTTTGCTACTATAGGACTG-3
qRT-PCR表达分析
Expression analysis of qRT-PCR
Q-ACT11F 5-ATCTTGACTGAGCGTGGTTATTCC-3
Q-ACT11R 5-GCTGGTCCTGGCTGTCTCC-3
qRT-PCR内参基因
Reference gene for qRT-PCR
Q-UKN1F 5-TGGTGCTGCCGCTATTTACTG-3
Q-UKN1R 5-GGTGGAAGGAACTGCTAACAATC-3
qRT-PCR内参基因
Reference gene for qRT-PCR

第 4期 张清哲等: 大豆 GmCOL4基因的克隆与分析 543


据 GmCOL4 预测基因组中的编码区序列设计引物,
用 RT-PCR的方法克隆得到含有部分 UTR的 cDNA
片段。再根据 cDNA片段设计引物克隆 CDS序列。
测序结果表明, GmCOL4含有 1个长度为 1 230 bp的
开放阅读框, 编码 1个长度为 409个氨基酸的蛋白。
对预测的 GmCOL4 蛋白序列分析发现, 在氨
基末端有 2 个串联的锌指结构域——B-box, 羧基
末端有 1个 CCT结构域(图 1-B)。每个 B-box包含
1 个有 4 个半胱氨酸组成的 C-X2-C-X16-C-X2-C 的
特殊结构。CCT 结构域大约有 45 个碱基组成。分
析拟南芥 co突变体证实, CO功能必不可少的氨基
酸残基存在于 B-box 和 CCT 结构域中 [15], 在
GmCOL4 中, 这些关键位点同拟南芥 CO 和 COL9
一样保守。通过序列比对发现 GmCOL4 在第 1 个
B-box前面和 CCT结构域后面的氨基酸和 COL9一
样, 相对于 CO的蛋白序列短一截(图 1-B)。利用从
网上获取的 GmCOL4 预测基因组序列与克隆得到
的 GmCOL4 的 CDS 比对作图发现, GmCOL4 有 4
个外显子和 3 个内含子组成, 结构组成上与 COL9
相似(图 1-A)。

图 1 GmCOL4 与拟南芥 CO 和 COL9 的序列比对和结构比较
Fig. 1 Comparison of sequences and structure of GmCOL4, CO, and COL9
A: GmCOL4由 4个外显子组成, 其结构组成与 COL9相似; B: GmCOL4有 2个 B-box和 1个 CCT功能域。
A: GmCOL4 structure is similar to COL9 with 4 exons; B: GmCOL4 contains two B-box motifs and one CCT domain.

2.2 GmCOL4的进化树分析
为了揭示 GmCOL4的进化地位, 用 MEGA 4软
件构建了不同物种 CO 家族的进化树(图 2)。由图 2
可知 , GmCOL4 与双子叶植物拟南芥的 COL9
(64.3%)、COL10 (62.6%)在同一个进化枝上, 亲缘关
系最近, 但与拟南芥 CO 的相似性只有 22.7%; 与
长日植物藜科的甜菜(Beta vulgaris) BvCOL3的亲缘
关系比豆科的豌豆(Pisum sativum) PsCOLs的近; 与
544 作 物 学 报 第 36卷


图 2 GmCOL4 与其他物种的 CO、COLs 的进化树分析
Fig. 2 Phylogenetic relationship of GmCOL4 with CO and COLs in other species
A: 植物 CO、COLs蛋白的亲缘关系; B: GmCOL4与拟南芥 CO、COLs的亲缘关系。GenBank登录号见表 2。
A: phylogenetic relationship among COLs proteins. B: phylogenetic relationship of GmCOL4 with Arabidopsis COLs.
GenBank accession numbers are in Table 2.
第 4期 张清哲等: 大豆 GmCOL4基因的克隆与分析 545


草本植物的单子叶禾本科 CO 家族基因亲缘关系较
远; 与木本植物的 CO基因的亲缘关系更远。
根据 B-box的数量和保守性, 以及 B-box与 CCT
功能域之间内含子的数量, 拟南芥 CO家族的 17个基
因可分为 3个亚组[15,19], I亚组含有 2个 B-box, 1个内
含子, CO 和 COL1-5 属于这一组; II 亚组含有 1 个
B-box, 1个内含子, 包括COL6、COL7、COL8和COL16;
III亚组含有 1个B-box和 1个保守性较低的锌指结构,
3个内含子, 包括 COL9-15 (图 2-B)。GmCOL4含有 2
个 B-box, 3个内含子, 且在基因结构上与 COL9结构
相似(图 1-A), 因此将其归于 III亚组中(图 2-B)。
2.3 GmCOL4 mRNA 的光周期和昼夜节律性表
达分析
由于拟南芥 CO的表达受生物节律钟的调控[6]。
为了研究 GmCOL4 在大豆光周期响应中的作用, 将
大豆 KN18 在不同条件下培养 , 提取 mRNA, 用
qRT-PCR技术, 选 ACTIN11为内参基因[22](表 3), 分
析其表达丰度。
长日条件(LD, 18 h光照/6 h黑暗)下, 开灯后 8 h
内, GmCOL4的表达量较低, 随后逐渐上升, 在 ZT 12
(开灯后 12 h)和 ZT 18 (黑暗开始时)到达峰值, 关灯后
逐渐降低, 在开灯后 2 h降到最低(图 3-A, B)。在短日
条件(SD, 8 h光照/16 h黑暗)下, GmCOL4 mRNA自开
灯后开始积累, 在 ZT 10 (关灯后 2 h)达到峰值, 随后
在开灯前 4 h达到最低值(图 3-C, D)。比较 GmCOL4
mRNA 的表达峰值发现, 生长在短日条件下植株的
GmCOL4转录水平高于生长在长日条件下的植株。
为了验证 GmCOL4 的 mRNA 的表达是否也受
生物节律钟的调控, 把长日照下的植株转移到连续
光照(LL)和连续黑暗(DD)条件下, 在连续光照第一
天 GmCOL4的 mRNA在开灯后 2 h降到最低, 在开
灯后 8 h内表达量低, 随后逐渐积累, 这与长日条件
下的表达模式相似, 表现出一定的节律性, 而连续
黑暗条件下的表达规律要弱的多。当短日照下的植
株转移到连续光照(LL)和连续黑暗条件(DD)后, 发
现 GmCOL4 的 mRNA 在连续光照或黑暗第一天表
现出短日条件下的节律性, 第二天的这种表达规律
就明显减弱。

图 3 不同条件下 GmCOL4 mRNA 的表达
Fig. 3 Expression of GmCOL4 mRNA in different conditions
A: GmCOL4 mRNA在长日-连续光照(LD-LL)条件下的表达; B: GmCOL4 mRNA在长日-连续黑暗(LD-DD)条件下的表达; C: GmCOL4
mRNA在短日-连续光照(SD-LL)条件下的表达; D: GmCOL4 mRNA在短日-连续黑暗(SD-DD)条件下的表达。
A: expression of GmCOL4 mRNA in long day-continuous light; B: expression of GmCOL4 mRNA in long day-continuous dark; C: expression
of GmCOL4 mRNA in short day-continuous light: D: expression of GmCOL4 mRNA in short day-continuous dark.

546 作 物 学 报 第 36卷

2.4 GmCOL4 在组织器官和不同发育时期的表
达模式
为了揭示GmCOL4在大豆生长发育过程中的作
用, 利用 qRT-PCR 技术分析其在不同组织器官和不
同发育时期的表达模式。在短日条件(8 h光照/16 h
黑暗)下, 取由营养生长向生殖生长转化、开花结实
等重要事件过程的根、茎、单叶、复叶、花(花蕾)、
荚和种子等(表 1)。
分析 GmCOL4 在单叶全展期和开花期的 19 个
组织器官中的表达情况(图 4)后发现, GmCOL4在大
豆根、茎、叶、花、荚中均有表达, 其中在单叶全
展期的子叶中表达量比较高, 在开花期叶柄中表达
量达到峰值。另外, 从整体趋势上看, GmCOL4在开
花期的表达量明显高于单叶全展期。GmCOL4 在根
中的表达量很低, 叶片中的表达量较高, 尤其是开
花期的单叶、第 1 和第 2 复叶中的表达量更高; 在
幼苗、单叶全展期的茎顶端和未成熟荚中的表达量
低于叶片中的表达量。同时, GmCOL4在开花期茎中
的表达也比较高(图 4-A)。
通过分析不同发育时期的表达模式发现 ,
GmCOL4 在不同时期的单叶中第 1 复叶全展期的表
达量最高; 在不同时期的第 1 复叶中, 开花期的表
达量最高; 在不同时期第 2 复叶中, 开花期的表达
量最高; 最后其表达峰出现在第 3 复叶全展期第 3
复叶。单叶中排除第 1 复叶全展期, 其他 4 个时期
中 GmCOL4 的表达量呈现出递增的趋势。第 1、第
2 复叶的不同时期中 GmCOL4 的表达量也出现逐渐
升高的趋势。这与组织器官中的表达模式一致(图
4-B)。
进一步分析GmCOL4在不同发育时期的种子和

图 4 GmCOL4 在不同发育时期和不同器官中的表达模式
Fig. 4 Soybean GmCOL4 mRNA expression profile in different tissues/organs and at different developmental stages
A: GmCOL4基因在不同组织器官的表达模式; B: GmCOL4基因在不同组织发育时期的表达模式; C: GmCOL4基因在不同组织发育时
期种子中的表达模式; D: GmCOL4基因在不同组织发育时期地上部的表达模式。样品缩写见表 1。
A: mRNA expression profile of soybean GmCOL4 gene in different tissues/organs; B: mRNA expression profile of soybean GmCOL4 gene at
different developmental stages; C: mRNA expression profile of soybean GmCOL4 gene in seeds at different developmental stages; D: mRNA
expression profile of soybean GmCOL4 gene in aerial parts at different developmental stages. Abbreviations of samples are in Table 1.
第 4期 张清哲等: 大豆 GmCOL4基因的克隆与分析 547


地上部分的表达模式, 发现 GmCOL4在成熟种子中
的表达量明显高于未成熟种子(图 4-C), 在单叶全展
期和第 1 复叶全展期地上部表达量较高, 而在第 3
复叶全展期地上部表达量低于开花期的表达量, 却
高于第 2复叶全展期的表达量(图 4-D)。
3 讨论
GmCOL4编码的蛋白在氨基端含有 2个串联的
B-box锌指结构域, 在羧基端含有 1个 CCT结构域,
GmCOL4 在基因结构上和 COL9 一样比 CO 短了一
截。并且, 其 CDS 中含有 4 个外显子(长度分别为
572、223、305和 130 bp)和 3个内含子(513、4 161
和 300 bp), COL9也有 4个外显子(长度分别为 528、
172、292和 128 bp)和 3个内含子(长度分别为 102、
93和 96 bp)。说明 GmCOL4与 COL9可能具有类似
功能。但是, 虽然 GmCOL4 外显子的长度与 COL9
相似, 但内含子的长度差别很大, COL9第 2个内含
子是 3个内含子中最短的一个, 而 GmCOL4却截然
相反 , 是 3 个内含子中最长的一个 , 而且长度是
COL9 的很多倍, 这使得 GmCOL4 基因组长度明显
大于 COL9, 这可能表明 GmCOL4 和 COL9 一样在
功能上不同于 CO。结果表明, 大豆基因组中含有
CO 家族第 III 亚家族中的蛋白, 但大豆中的 CO 家
族基因的转录后调节机制(如 mRNA 的剪切)以及功
能可能与拟南芥不同。
GmCOL4 mRNA的表达在不同光周期下都表现
出节律性。长日条件下, GmCOL4 mRNA在黄昏时
得到积累, 但它在光照阶段也有一个积累峰, 这和
拟南芥 CO的表达不同, 与衣藻 CrCO[18]和 COL9[24]
的表达有部分相似性。短日条件下 GmCOL4 mRNA
表达模式与拟南芥 CO 一致。连续光照和连续黑暗
的第一天 GmCOL4 mRNA 的积累表现出与前一天
相似的模式。证明 GmCOL4 mRNA的表达主要受生
物节律钟的调节, 光周期的影响较弱。在短日条件
下表达量比长日条件下高, 与短日照促进大豆开花
的生理特点一致。表达分析结果显示, GmCOL4的功
能与 CO和 COL9都有不同之处。
对GmCOL4的组织器官和不同发育时期的表达
模式的研究发现, 其 mRNA 在各组织器官中都表
达。但是, 开花期中的表达量高于单叶全展期, 并且
在从单叶全展期到开花期等不同时期的单叶、第 1
和第 2 复叶中的表达量呈现递增趋势, 据此可以推
测GmCOL4在光周期开花调控和花的发育中具有重
要作用。
4 结论
从大豆 KN18中克隆到位于第 20号染色体上的
CO-like基因 GmCOL4, 它含有 CO家族基因的保守
结构域, 其 mRNA 的表达在不同光周期下表现出节
律性, 在不同的组织器官中均有表达, 但在开花时
期具有较高水平的表达。推测 GmCOL4基因在大豆
光周期开花调节中起重要作用。

致谢: 感谢陈其军博士提供 pGWC 载体, 范成明老
师和胡瑞波博士提供实验材料并给予实验技术指导
和在实验数据处理上的帮助。
References
[1] G arner W W, Allard H A. Effect of the relative length of day and
night and other factors of the environment on growth and repro-
duction in plants. J Agric Res, 1920, 18: 553−606
[2] Shaw D, Goldman B D. Gender differences in influence of pre-
natal photoperiods on postnatal pineal melatonin rhythms and
serum prolactin and follicle-stimulating hormone in the Siberian
hamster (Phodopus sungorus). Endocrinology, 1995, 136:
4237−4246
[3] Putterill J, Robson F, Lee K, Simon R, Coupland G. The
CONSTANS gene of Arabidopsis promotes flowering and encodes
a protein showing similarities to zinc finger transcription factors.
Cell, 1995, 80: 847−857
[4] Suarez-Lopez P, Wheatley K, Robson F, Onouchi H, Valverde F,
Coupland G. CONSTANS mediates between the circadian clock
and the control of flowering in Arabidopsis. Nature, 2001, 410:
1116−1120
[5] Imaizumi T, Schultz T F, Harmon F G, Ho L A, Kay S A. FKF1
F-box protein mediates cyclic degradation of a repressor of
CONSTANS in Arabidopsis. Science, 2005, 309: 293−297
[6] Sawa M, Nusinow D A, Kay S A, Imaizumi T. FKF1 and
GIGANTEA complex formation is required for day-length mea-
surement in Arabidopsis. Science, 2007, 318: 261−265
[7] Valverde F, Mouradov A, Soppe W, Ravenscroft D, Samach A,
Coupland G. Photoreceptor regulation of CONSTANS protein in
photoperiodic flowering. Science, 2004, 303: 1003−1006
[8] Kardailsky I, Shukla V K, Ahn J H, Dagenais N, Christensen S K,
Nguyen J T, Chory J, Harrison M J, Weigel D. Activation tagging
of the floral inducer FT. Science, 1999, 286: 1962−1965
[9] Kobayashi Y, Kaya H, Goto K, Iwabuchi M, Araki T. A pair of
related genes with antagonistic roles in mediating flowering sig-
nals. Science, 1999, 286: 1960−1962
[10] Onouchi H, Igeno M I, Perilleux C, Graves K, Coupland G.
Mutagenesis of plants overexpressing CONSTANS demonstrates
novel interactions among Arabidopsis flowering-time genes.
Plant Cell, 2000, 12: 885−900
[11] Samach A, Onouchi H, Gold S E, Ditta G S, Schwarz-Sommer Z,
Yanofsky M F, Coupland G. Distinct roles of CONSTANS target
genes in reproductive development of Arabidopsis. Science, 2000,
548 作 物 学 报 第 36卷

288: 1613−1616
[12] Borden K L. RING fingers and B-boxes: Zinc-binding pro-
tein-protein interaction domains. Biochem Cell Biol, 1998, 76:
351−358
[13] Strayer C, Oyama T, Schultz T F, Raman R, Somers D E, Mas P,
Panda S, Kreps J A, Kay S A. Cloning of the Arabidopsis clock
gene TOC1, an autoregulatory response regulator homolog. Sci-
ence, 2000, 289: 768−771
[14] Torok M, Elkin L D. Two B or not two B? Overview of the rap-
idly expanding B-box family of proteins. Differentiation, 2000,
67: 63−71
[15] Robson F, Costa M M, Hepworth S R, Vizir I, Pineiro M, Reeves
P H, Putterill J, Coupland G. Functional importance of conserved
domains in the flowering-time gene CONSTANS demonstrated by
analysis of mutant alleles and transgenic plants. Plant J, 2001, 28:
619−631
[16] Yano M, Katayose Y, Ashikari M, Yamanouchi U, Monna L, Fuse
T, Baba T, Yamamoto K, Umehara Y, Nagamura Y, Sasaki T. Hd1,
a major photoperiod sensitivity quantitative trait locus in rice, is
closely related to the Arabidopsis flowering time gene
CONSTANS. Plant Cell, 2000, 12: 2473−2484
[17] Nemoto Y, Kisaka M, Fuse T, Yano M, Ogihara Y. Characteriza-
tion and functional analysis of three wheat genes with homology
to the CONSTANS flowering time gene in transgenic rice. Plant J,
2003, 36: 82−93
[18] Serrano G, Herrera-Palau R, Romero J M, Serrano A, Coupland G,
Valverde F. Chlamydomonas CONSTANS and the evolution of
plant photoperiodic signaling. Curr Biol, 2009, 19: 359−368
[19] Griffiths S, Dunford R P, Coupland G, Laurie D A. The evolution
of CONSTANS-like gene families in barley, rice, and Arabidopsis.
Plant Physiol, 2003, 131: 1855−1867
[20] Robert L S, Robson F, Sharpe A, Lydiate D, Coupland G. Con-
served structure and function of the Arabidopsis flowering time
gene CONSTANS in Brassica napus. Plant Mol Biol, 1998, 37:
763−772
[21] Holefors A, Opseth L, Ree Rosnes A K, Ripel L, Snipen L, Foss-
dal C G, Olsen J E. Identification of PaCOL1 and PaCOL2, two
CONSTANS-like genes showing decreased transcript levels pre-
ceding short day induced growth cessation in Norway spruce.
Plant Physiol Biochem, 2009, 47: 105−115
[22] Hu R-B(胡瑞波). Molecular Cloning, Expression Profiles and
Functional Analysis of FT/TFL1 Genes in Soybean (Glycine
max). PhD Dissertation of Chinese Academy of Agricultural
Sciences, 2009 (in Chinese with English Abstract)
[23] Chen Q J, Zhou H M, Chen J, Wang X C. Using a modified TA
cloning method to create entry clones. Anal Biochem, 2006, 358:
120−125
[24] Cheng X F, Wang Z Y. Overexpression of COL9, a CONSTANS-
LIKE gene, delays flowering by reducing expression of CO and
FT in Arabidopsis thaliana. Plant J, 2005, 43: 758−768