免费文献传递   相关文献

Identification of PEBP Gene Family in Gossypium arboreum and Gossypium raimondii and Expression Analysis of the Gene family in Gossypium hirsutum

亚洲棉和雷蒙德氏棉PEBP家族基因的鉴定及该家族基因在陆地棉组织中表达分析



全 文 :作物学报 ACTA AGRONOMICA SINICA 2015, 41(3): 394404 http://zwxb.chinacrops.org/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn

本研究由国家自然科学基金项目 (31360366), 新世纪优秀人才支持计划项目 (NCET-12-1072)和新疆生产建设兵团博士基金项目
(2012BB007)资助。
* 通讯作者(Corresponding author): 黄先忠, E-mail: xianzhongh106@163.com, Tel: 0993-2057262
第一作者联系方式: E-mail: chaoyue_014@163.com, Tel: 0993-2057262
Received(收稿日期): 2014-09-10; Accepted(接受日期): 2014-12-19; Published online(网络出版日期): 2015-01-12.
URL: http://www.cnki.net/kcms/detail/11.1809.S.20150112.0939.005.html
DOI: 10.3724/SP.J.1006.2015.00394
亚洲棉和雷蒙德氏棉 PEBP家族基因的鉴定及该家族基因在陆地棉组
织中表达分析
李 超 1 张彦楠 1 刘焕龙 1 黄先忠 1,2,*
1 石河子大学生命科学学院 / 农业生物技术重点实验室, 新疆石河子 832003; 2 Plant Genome Mapping Laboratory, University of
Georgia, Athens 30605, GA, USA
摘 要: 磷脂酰乙醇胺结合蛋白(phosphatidyl ethanolamine-binding proteins, PEBP)基因家族广泛存在于真核生物中,
在被子植物中主要起着促进或抑制开花和控制株型的作用。利用亚洲棉(Gossypium arboreum, A2)和雷蒙德氏棉
(Gossypium raimondii, D5)的基因组数据库, 分别搜索到 8个棉花 PEBP同源基因, 都包含 4个外显子和 3个内含子,
编码的蛋白都存在 PEBP家族的保守基序和关键氨基酸位点, 表明二倍体棉花中至少存在 8个 PEBP家族基因。进化
分析表明, 8个 PEBP基因分属于 3个亚家族, 含 FLOWERING LOCUS T (FT)-like亚家族 1个、TERMINAL FLOWER 1
(TFL1)-like亚家族 5个(包括 3个 TFL1和 2个 BFT)、MOTHER OF FT AND TFL1 (MFT)-like亚家族 2个。实时荧光
定量 PCR分析陆地棉(Gossypium hirsutum) 8个 PEBP基因在根、茎、叶、幼苗顶端分生组织、花、胚珠和 25 d的纤
维组织中的表达, 表明 FT1 在叶片中表达量最高, 其次在纤维、胚珠和花中; MFT1 在各组织中均表达, 但在纤维中
表达量最高, 其次是花和叶片中, 而 MFT2 以在叶片中表达为主; TFL1a、TFL1b 和 TFL1c 均在根中表达量最高, 但
TFL1c 在叶片、花和胚珠中也有相对较高的表达; BFT1 和 BFT2 在叶片中表达量最高, 但除幼苗顶端分生组织外,
BFT1在其他各组织中的表达明显高于 BFT2。这些结果表明, PEBP家族基因在棉花的生长发育中可能具有不同的功能。
关键词: 磷脂酰乙醇胺结合蛋白; 亚洲棉; 雷蒙德氏棉; 成花素; 基因表达
Identification of PEBP Gene Family in Gossypium arboreum and Gossypium
raimondii and Expression Analysis of the Gene Family in Gossypium hirsutum
LI Chao1, ZHANG Yan-Nan1, LIU Huan-Long1, and HUANG Xian-Zhong1,2,*
1 Key Laboratory of Agrobiotechnology / College of Life Sciences, Shihezi University, Shihezi 832003, China; 2 Plant Genome Mapping Labora-
tory, University of Georgia, Athens 30605, GA, USA
Abstract: The phosphatidylethanolamine-binding proteins (PEBP) widely exist in eukaryotes. In angiosperms, PEBP family
genes play important role in promoting or inhibiting flowering, as well as plant architecture control. Eight PEBP genes were iden-
tified from diploid cotton Gossypium arboreum (A2) and Gossypium raimondii (D5) genome database, respectively. All the PEBP
genes of cotton contained four exons and three introns, and their encoded proteins contained a conserved PEBP motif and critical
amino acid sites of PEBP family, which indicated there were at least eight PEBP genes in diploid cotton. Phylogenetic analysis
showed that eight cotton PEBP genes comprised three subfamilies: FLOWERING LOCUS T (FT)-like containing one gene,
TERMINAL FLOWER 1 (TFL1)-like containing five genes including three TFL1 and two BFT genes, and MOTHER OF FT AND
TFL1 (MFT)-like containing two genes. The expression patterns of eight Gossypium hirsutum PEBP family genes in root, stem,
leaf, shoot apical meristem, flower, ovule and 25 days post-anthesis (DPA) fiber were determined with quantitative Real-time
reverse transcription PCR (qRT-PCR). The results showed that FT1 transcript was preferentially expressed in leaf and secondly in
fiber, ovule and flower. MFT1 expressed in all the tissues, with the highest expression level in fiber, then in flower and leaf, while
MFT2 transcript was preferentially expressed in leaf. TFL1a, TFL1b, and TFL1c expressed mainly in root, and TFL1c also ex-
pressed in leaf, flower and ovule. Expression of BFT1 and BFT2 were present mainly in leaf, and that of BFT1 in the other six
第 3期 李 超等: 亚洲棉和雷蒙德氏棉 PEBP家族基因的鉴定及该家族基因在陆地棉组织中表达分析 395


tissues except for shoot apical meristem (SAM) were higher than that of BFT2. Expression analysis revealed that eight PEBP
genes in cotton have different expression patterns, showing their different functional roles in regulation of cotton development.
Keywords: PEBP; Gossypium arboreum; Gossypium raimondii; Florigen; Gene expression
磷脂酰乙醇胺结合蛋白(phosphatidyl ethanola-
mine-binding proteins, PEBP)家族基因因含有进化上
较为保守的乙醇胺结合域而得名, 广泛存在于动、
植物及酵母中[1-3]。在植物中, PEBP 家族主要分为
FLOWERING LOCUS T (FT)-like, TERMINAL
FLOWER 1 (TFL1)-like和MOTHER OF FT AND TFL1
(MFT)-like 3个亚家族[4]。其中, MFT-like是 FT-like
和 TFL1-like亚家族的祖先, 在苔藓和石松植物中没
有 FT 和 TFL1 同源基因, 但分别含有 4 个和 2 个
MFT 同源基因, 表明 FT/TFL1-like 是伴随着种子植
物的进化而出现的[5]。MFT-like 的主要功能与苔藓
植物的配子囊、孢子体的发育以及种子发育和萌发
有关, 而在种子植物由营养生长向生殖生长的转变
过程中, FT/TFL1-like基因起着重要的作用[5-8]。
在拟南芥基因组中, 包含 6 个 PEBP 家族基因,
分为 3 个亚家族, 其中 FT和 TWIN SISTER OF FT
(TSF)属于 FT-like, TFL1, BROTHER OF FT AND
TFL1 (BFT)和 ARABIDOPSIS THALIANA CENTROR-
ADIALIS (ATC)属于 TFL1-like, MFT 属于 MFT-like
亚家族[8]。对 FT 和 TFL1 基因的功能研究得相对较
为清楚, 但其他基因的功能还需进一步研究。FT基因
编码的蛋白被认为是植物的成花激素(Florigen)[9-11]。
目前研究认为, FT 蛋白主要在叶片合成, 经过韧皮
部到顶端分生组织, 与 bZIP转录因子 FLOWERING
LOCUS D (FD)蛋白结合, 促进下游开花身份相关基
因 APETALA1 (AP1)等表达, 进而促进植物开花[12]。
但 FT-like基因存在着功能冗余或相反的现象, 在南
瓜(Cucurbita moschata)、龙胆(Gentiana triflora)和苹
果(Malus × domestica Borkh.)等植物中都存在 2 个
FT 同源基因, 且对开花均具有促进作用[13-15]; 在烟
草(Nicotiana tabacum)中存在 4 个 FT 同源基因
NtFT1、NtFT2、NtFT3和 NtFT4, 在短日照条件下只
有 NtFT4能够促进开花, 其他 3个 FT同源基因均对
开花有抑制作用[16]; 在甜菜(Beta vulgaris)中有 2个
FT 同源基因相互作用调节开花, 其中 BvFT2 是 FT
的功能保守基因, 促进开花, 而 BvFT1 抑制开花,
并且其表达下调对甜菜春化反应起着关键作用[17]。
TFL1-like 与 FT-like 的序列相似性很高, 但二者功
能正好相反, TFL1-like 抑制开花并维持花序分生组
织的无限生长, 例如金鱼草(Antirrhinum majus)的
CEN基因和拟南芥(Arabidopsis thaliana)的 TFL1基
因[18-19]。FT/TFL1-like 的这种功能差异主要由 2 个
关键氨基酸位点不一致造成的, FT 中为 Tyr85, 而
TFL1中为 His88[20]。此外, FT/TFL1-like第 4外显子
上 14个氨基酸片段 LGRQTVYAPGWRQN和三联体
LYN, 也对FT/TFL1-like的功能相反起着重要作用[21]。
棉花是一种重要的纤维作物, 农业生产中所栽
培棉花的种类为四倍体的陆地棉(Gossypium hirsu-
tum)和海岛棉(Gossypium barbadense), 它们都是在
进化过程中由 A 基因组供体——亚洲棉(Gossypium
arboreum, A2)和 D 基因组供体——雷蒙德氏棉
(Gossypium raimondii, D5)种间杂交形成的[22]。对棉
花 PEBP 家族基因的克隆和功能分析, 有利于解析
棉花生长发育及开花的分子机制, 并利用这类基因
调节棉花的开花时间, 对提高棉花产量和纤维品质
具有重要的理论指导意义。近年来, 本实验室一直
开展棉花 PEBP 家族基因的鉴定和功能分析, 前期
从陆地棉中克隆了一个编码成花素的同源基因
GhFTL1 (本研究中该基因被命名为 GhFT1), 在拟南
芥中过量表达可以促进早花[23]。从海岛棉中克隆了
2 个 MFT-like 同源基因 GbMFT1 和 GbMFT2, 二者
在萌发的种子中表达量较高, 并且 GbMFT2受 ABA
诱导[24-25]。Argiriou等[26]从陆地棉中分离了 2个TFL1-
like 基因 GhTFL1a 和 GhTFL1b, 二者主要在根中表
达。由于栽培棉是异源四倍体 , 基因组较为复杂 ,
PEBP家族基因的研究远远落后于其他植物。随着亚
洲棉和雷蒙德氏棉基因组测序的完成, 为在全基因组
水平上分析棉花 PEBP 家族基因提供了可能[27-28]。本
研究利用二倍体棉花基因组数据库分析棉花 A2、D5
基因组中的 PEBP 家族成员 , 并利用棉花丰富的
EST 数据库查找 PEBP 基因转录本, 利用我们前期
对棉花PEBP基因研究的成果, 结合发表的相关文献,
分析它们在陆地棉的不同组织中的表达特征, 为进
一步研究棉花 PEBP家族基因的功能奠定了基础。
1 材料与方法
1.1 试验材料
2014 年 4 月 25 日, 将陆地棉(G. hirsutum)品种
新陆早 33种植于石河子大学试验农场。采集播种后
40 d 的根、茎、真叶和棉花顶端, 在解剖镜下剥去
396 作 物 学 报 第 41卷

叶片将幼苗顶端分生组织分离出来; 采集开花当天
的花、胚珠以及 25 DPA (day post-anthesis)的棉桃,
将纤维从棉桃中剥离。将所有棉花组织立即浸没于
液氮中, –80℃保存备用。
1.2 棉花 PEBP家族基因的查找
分别以拟南芥的 6 个 PEBP 家族基因 FT
(GenBank登录号为 AF152096.1)、TSF (GenBank登
录号为 AF152907.1)、MFT (GenBank 登录号为
AF147721.1)、TFL1 (GenBank登录号为 U77674.1)、
ATC (GenBank登录号为 AB024714.1)和 BFT (Gen-
Bank登录号为NM_125597.1)的开放阅读框(ORF)序
列为查询序列 (query), 利用植物比较基因组学
Phytozome V.9.1 (http://www.phytozome.net/)门户网
站, 选择物种 G. raimondii, 在 Blast program中选择
TBlastX 程序, 其他为缺省值, 搜索棉花 D5 基因组
数据库, 选择比对结果中 E值小于 E–10的序列, 并
根据数据库给出的功能注释(functional annotations)
筛选 PEBP基因。用 Pfam (http://pfam.sanger.ac.uk/)
程序对基因编码的蛋白序列进一步鉴定[29], 参数设
置为缺省值。利用 NCBI (http://www.ncbi.nlm.nih.
gov/)的 BlastN 工具(参数设置为缺省值)比对分析棉
花D5基因组PEBP家族基因与GenBank数据库中其他
PEBP基因的相似性, 并根据比对结果给基因命名。
利用NCBI的 TBlastX工具, 同样分别以拟南芥
的 6个 PEBP家族基因的 ORF为 query, 选择全基因
组鸟枪(whole-genome shotgun contigs, wgs)数据库,
Organism限制为 G. arboreum, 其他为缺省值, 搜索
棉花 A2基因组上的 PEBP 家族序列, 选择比对结果
中 E值小于 E–10的序列, 并用 MegAlign程序与 D5
基因组上的 PEBP 家族基因逐一比对分析 ; 选择
Expressed sequence tags (EST)数据库, Organism限制
为 Gossypium, 查找棉花 EST数据库中的所有 PEBP
家族基因的 EST序列。
1.3 序列比较及进化树构建
利用 ScanProsite (http://prosite.expasy.org/)在线
工具搜索棉花 PEBP 家族蛋白的保守结构域。运用
Clustal X2程序比对蛋白序列。利用 MEGA 5.1进行
拟南芥和棉花 PEBP 家族蛋白的系统进化分析 [30],
ClustalW 比对蛋白氨基酸序列 , 邻位相连法
(Neighbor-Joining, NJ)构建进化树, BootStrap参数设
置为 1000次重复, 使分支结果更为可靠。
1.4 棉花总 RNA的提取和 cDNA第一链的合成
采用杭州博日科技有限公司(BIOER) Biospin 多糖
多酚植物总 RNA 提取试剂盒提取新陆早 33 棉花不同
组织的总 RNA, 方法参照试剂盒说明书。利用 Supermo
III M-MLV反转录酶(北京百泰克)合成 cDNA第 1链。
1.5 棉花 PEBP家族基因的组织表达分析
根据上面分析二倍体棉花 PEBP 家族基因的序
列, 结合已经从四倍体棉花中克隆的 PEBP 家族基
因的序列设计实时荧光定量 PCR (quantitative Real-
time RT-PCR, qRT-PCR)分析的引物(表 1), 内参基因
为棉花的 Ubiquitin7 (UBQ7, GenBank 登录号为
DQ116441.1)。以棉花不同组织的 cDNA为模板, 采
用北京康为世纪有限公司 FASTSYBR Mixture (With
ROX)试剂盒, 利用 7500 Fast实时荧光定量 PCR仪
(Life Technologies, Foster City, CA, USA)进行基因
表达量的检测。检测每份样品目的基因和内参基因
的 Ct值(循环阈值), 每份样品 3次重复。

表 1 本研究所用的引物
Table 1 PCR primers used in this study
引物名称
Primer name
上游引物序列
Forward primer sequence (5–3)
下游引物序列
Reverse primer sequence (5–3)
参照基因
Reference gene
GenBank登录号
GenBank accession No.
GhFT1 GCTTTGGTCAAGAGGTGGTC ATGTCCTACGGCCACCGGATCCACT GhFT1 HM631972.1
GhMFT1 CAAGTGAACCAAGATTGAGGGAG GAGCACCCGCCACTTGAATCCTT GbMFT1 KC513744.1
GhMFT2 CTTTGGTGATGACTGACCCTGATGC GTTGGAACAGCACCAGTATGTAGCG GbMFT2 KF739071.1
GhTFL1a CTGGTGATGACAGACCCAGAT TTTGCTTGAAGAGGAGGAACA GhTFL1a EU026443.1
GhTFL1b TAAGGGAGCACCTTCACTGG TCTGTCGACGTTTCTGCTTG GhTFL1b EU026437.1
GhTFL1c CTATGAGATCCCAAGGCCAG ATCGTTCTCAGCAGCGAAAT GrTFL1c
GhBFT1 ACAGTGAGGCCACCATCTTC TCTTGCGGCAGTTTCTCTCT GrBFT1
GhBFT2 CGGTAACGTACAACCCCAAC CGGATTTGGAGTCTCGTAGC GrBFT2
UBQ7 AGAGGTCGAGTCTTCGGACA GCTTGATCTTCTTGGGCTTG Ubiquitin7 DQ116441.1
第 3期 李 超等: 亚洲棉和雷蒙德氏棉 PEBP家族基因的鉴定及该家族基因在陆地棉组织中表达分析 397


qRT-PCR总体系为 10.0 μL, 其中 cDNA 30 ng,
2 × FASTSYBR 混合物 5.0 μL, 基因特异正向引物
(10 μmol L–1) 0.2 μL, 反向引物(10 μmol L–1) 0.2 μL,
用 RNase-Free H2O补足到 10.0 μL。采用二步法 PCR,
反应程序为 95℃预热 10 min, 95℃ 15 s, 60℃ 1 min,
共 40个循环, 熔解曲线阶段为仪器默认程序。采用
2–ΔCt 法分析试验数据, 先分别计算出每组的 ΔCt=
Ct 目的基因–Ct 内参基因, 再根据 ΔCt 值求出 2–ΔCt以及标准
误, 使用 Microsoft Excel 2010软件处理数据。
2 结果与分析
2.1 棉花中的 PEBP家族基因
通过比对分析 G. raimondii (D5)基因组数据库,
共得到 8个 PEBP家族基因, 它们分别位于第 1、第
4、第 6、第 7、第 9 染色体上(表 2)。Blast 比对分
析 8 个 PEBP 家族基因的 CDS 序列, 其中转录序列
Gorai .004G264600.1 与本实验室克隆的陆地棉
GhFT1 (GenBank 登录号为 HM631972.1)[23]的相似
性为 100%; Gorai.009G174600.2 与 GbMFT1 (Gen-
Bank 登录号为 KC513744.1)[24]的相似性为 98%, 它
们之间仅有几个碱基差异 , 可认为是同一个基因 ;
Gorai.006G192300.1与 GbMFT2 (GenBank登录号为
KF739071.1)[25]的相似性为 100%, 说明是 MFT2 基
因; Gorai.001G121800.1与 GrTFL1a (GenBank登录
号为EU026438.1)[26]的相似性为 100%, 与GhTFL1a[26]
的相似性为 99%, 为 TFL1a基因; Gorai.006G155800.1
与 GrTFL1b (GenBank 登录号为 EU026439.1)[26]的
相似性为 100%, 与GhTFL1b[26]的相似性为 99%, 为
TFL1b基因; Gorai.009G403800.1与GrTFL1b的相似性
只有 59.7%, 可能是一个新的 TFL1基因, 因此被命名为
GrTFL1c; Gorai.004G120400.1和 Gorai.007G010800.1
与其他物种的 BFT基因相似性较高, 例如它们所编码
的蛋白与大豆 GmBFT (GenBank 登录号为 NM_
001249668.1)所编码的蛋白序列相似性分别为 82%和
83%, 它们之间的核苷酸序列相似性为 85%, 说明是 2
个不同的BFT基因, 因此被命名为GrBFT1和GrBFT2。
虽然 G. arboreum (A2)基因组草图已经测序完成,
在 GenBank 中只能搜索到 A2基因组的散弹(wgs)序
列。通过比对, 从 A2基因组中获得了 8个 wgs序列,
通过和相应 D5基因组的 PEBP基因比较, 获得了 A2
基因组的 8个 PEBP家族基因(表 3)。
在棉花的 EST 数据库中, 也只从陆地棉、海岛
棉和亚洲棉中搜索到 8个属于棉花 PEBP家族的EST
序列 (表 4)。Blast 比对分析表明 , JK805297.1、
ES826802.1 和 JG852183.1 为 GhFT1 的 EST 序列,
ES800631.1、DW499267.1和BQ410064.1为GbMFT1
的 EST 序列 , DW506990.1 和 DW506935.1 为
GbMFT2 的 EST 序列, 另外 5 个棉花 PEBP 家族基
因未能找到相关的 EST序列。
综上所述, 在棉花 A2、D5基因组中均存在 8个
PEBP家族基因, FT1同源基因只有 1个, TFL1同源
基因有 5个, MFT同源基因有 2个(表 2和表 3)。而
目前的棉花 EST数据库中只存在 8个 PEBP家族基
因高度相似序列 , 分别对应 GhFT1、GbMFT1 和
GbMT2 基因(表 4)。因此, 在棉花中可能存在 8 个
PEBP 家族基因。并且在四倍体棉花中除 TFL1c、
BFT1 和 BFT2 没有相关的克隆报道外, 其余 5 个基
因均己克隆(表 2和表 3)。

表 2 雷蒙德氏棉(G. raimondii, D5)基因组中的 PEBP家族基因
Table 2 PEBP family genes in G. raimondii (D5) genome
D5基因组转录名
Transcript name of
D5 genome
染色体定位
Chromosome in
D5 genome
PEBP家族基因
PEBP family gene
开放阅读框/基因组 a
Open reading frame
/genome (bp) a
棉花中同源基因 b
Homologous gene of
cotton b
Gorai.004G264600.1 4 GrFT1 525/3145 GhFT1 (HM631972.1)
Gorai.009G174600.2 9 GrMFT1 528/902 GbMFT1 (KC513744.1)
Gorai.006G192300.1 6 GrMFT2 519/1872 GbMFT2 (KF739071.1)
Gorai.001G121800.1 1 GrTFL1a 525/1022 GrTFL1a (EU026438.1)
Gorai.006G155800.1 6 GrTFL1b 519/1078 GrTFL1b (EU026439.1)
Gorai.009G403800.1 9 GrTFL1c 510/1393
Gorai.004G120400.1 4 GrBFT1 525/796
Gorai.007G010800.1 7 GrBFT2 522/784
a基因组长度指与 ORF相对应基因组区域的长度(bp); b括号内为 GenBank登录号。
a Genome length refers to the length of the corresponding genomic region of ORF (bp); b The contents in parentheses represent the
GenBank accession number.
398 作 物 学 报 第 41卷

表 3 亚洲棉(G. arboreum, A2)基因组中的 PEBP家族基因
Table 3 PEBP family genes in G. arboreum (A2) genome
GenBank登录号
GenBank accession
No.
E值
E-value
染色体定位
Chromosome in
A2 genome
PEBP家族基因
PEBP family gene
开放阅读框/基因组 a
Open reading frame/
genome (bp) a
棉花中同源基因 b
Homologous gene of
cottonb
AYOE01007731.1 3E–75 3 GaFT1 525/3131 GhFT1 (HM631972.1)
AYOE01027581.1 3E–45 10 GaMFT1 528/890 GbMFT1 (KC513744.1)
AYOE01031795.1 1E–29 11 GaMFT2 519/1874 GbMFT2 (KF739071.1)
AYOE01002909.1 2E–34 1 GaTFL1a 525/1002 GaTFL1a (EU026434.1)
AYOE01032160.1 6E–43 11 GaTFL1b 519/1091 GaTFL1b (EU026442.1)
AYOE01036587.1 1E–35 12 GaTFL1c 510/1358
AYOE01008523.1 1E–40 3 GaBFT1 525/794
AYOE01031581.1 2E–26 11 GaBFT2 522/792
a基因组长度指与 ORF相对应基因组区域的长度(bp); b括号内为 GenBank登录号。
a Genome length refers to the length of the corresponding genomic region of ORF (base pairs). b The contents in parentheses represent
the GenBank accession number.

表 4 棉花 PEBP基因家族 EST序列信息
Table 4 EST sequences of PEBP family genes in cotton
GenBank登录号
GenBank accession No.
E值
E-value
来源
Origin
基因名称
Gene name
JK805297.1 4E–96
海岛棉 Hai7142, 6~24 DPA纤维
G. barbadense Hai7142, 6–24 DPA fiber
GhFT1
ES826802.1 5E–95
陆地棉 Xu142, 0~10 DPA纤维
G. hirsutum Xu142, 0–10 DPA fiber
GhFT1
JG852183.1 4E–80
亚洲棉 Shixiya, 种子、幼苗、叶、花苞、花和棉铃
G. arboreum Shixiya, seed, seedling, leaf, bud, flower, and boll
GhFT1
ES800631.1 6E–44
陆地棉 Xu142, 0~10 DPA纤维
G. hirsutum Xu142, 0–10 DPA fiber
GbMFT1
DW499267.1 2E–33
陆地棉 Des119, 顶端分生组织、根和幼嫩纤维
G. hirsutum Des119, SAM, root, young fiber
GbMFT1
BQ410064.1 3E–29
亚洲棉 AKA8400, 7~10 DPA纤维
G. arboreum AKA8400, 7–10 DPA fiber
GbMFT1
DW506990.1 6E–46
陆地棉 Des119, SAM、根和幼嫩纤维
G. hirsutum Des119, SAM, root, and young fiber
GbMFT2
DW506935.1 1E–34
陆地棉 Des119, SAM、根和幼嫩纤维
G. hirsutum Des119, SAM, root, and young fiber
GbMFT2

2.2 棉花 PEBP家族基因结构
分别比较亚洲棉和雷蒙德氏棉 8 个 PEBP 家族
基因的ORF及ORF相对应基因组区域的序列, 分析
这 8 个基因的外显子和内含子结构。结果显示和拟
南芥 PEBP基因结构相似, 棉花的 8个 PEBP基因均
由 4 个外显子和 3 个内含子组成, 并且差异主要在
内含子部分(图 1)。说明棉花 PEBP家族基因的结构
在进化上十分保守, 可能具有类似的功能。
2.3 棉花 PEBP家族蛋白序列比对及进化树分析
PEBP 蛋白家族中通常含有一个长度为 23 个氨
基酸的保守基序 [FYL]-x-[LVM]-[LIVF]-x-[TIVM]-
[DC]-P-D-x-P-[SNG]-x(10)-H。将拟南芥中的 6 个
PEBP 蛋白家族成员, 即 AtFT (GenBank 登录号为
AAF03936.1)、AtTSF (GenBank登录号为AAF03937.1)、
AtTFL1 (GenBank 登录号为 AAB41624.1)、ATC
(GenBank登录号为 BAA75931.1)、AtBFT (GenBank
登录号为 NP_201010.1)和 AtMFT (GenBank登录号
为 AAD37380.1), 与棉花 PEBP 蛋白家族 GhFT1
(ADK95113.1)、GbMFT1 (AGJ98454.1)、GbMFT2
(AIE37919.1)、GhTFL1a (ABW24970.1)、GhTFL1b
第 3期 李 超等: 亚洲棉和雷蒙德氏棉 PEBP家族基因的鉴定及该家族基因在陆地棉组织中表达分析 399


(ABW24964.1)、GrTFL1c、GrBFT1和 GrBFT2氨基
酸序列比对分析(图 2), 表明棉花 PEBP 蛋白中都存
在 PEBP 保守基序和决定 FT/TFL1 功能的关键氨基
酸位点 Tyr85 (Y)/His88 (H), 该位点在 GhFT1中为
Y, 在棉花 TFL1-like 中均为 H; 同样, 另外一个关
键氨基酸 Gln140 (Q)/Asp144 (D), 该位点在 GhFT1
中为 Q, 在棉花 TFL1-like中均为 D。
将 A2基因组中推测的 8个、D5基因组中推测的
8个及已经报道的 5个四倍体棉花的 PEBP家族基因,
与拟南芥 6个 PEBP基因构建进化树, 结果表明, 棉
花 PEBP 家族被明显地分为 3 个分支, 即 FT-like、
TFL1-like和 MFT-like亚家族(图 3)。

图 1 亚洲棉和雷蒙德氏棉 PEBP家族基因外显子及内含子分析
Fig. 1 Exons and introns analysis of G. arboreum and G. raimondii PEBP homologs
ATG和 TGA/TAG/TAA分别代表起始密码子和终止密码子, 黑色方框和直线分别代表外显子和内含子, 数字表示外显子和
内含子的长度(bp)。
ATG and TGA/TAG/TAA represent initiation codon and termination codon, respectively. Black box and lines represent exonic
and intronic regions, respectively. Numbers indicate the length of exons and introns (base pairs).
400 作 物 学 报 第 41卷


图 2 棉花与拟南芥 PEBP家族蛋白序列比对
Fig. 2 Multiple sequence alignment of cotton PBEP homologs and the member of PEBP family in Arabidopsis
Consensus pattern: PEBP家族蛋白保守序列; 三角形代表决定 FT/TFL1功能的关键氨基酸位点 Tyr85 (Y)/His88 (H)和 Gln140
(Q)/Asp144 (D)。
Consensus pattern: the consensus pattern of PEBP family; Triangle indicates amino acids Tyr85 (Y)/His88 (H) and Gln140 (Q)/Asp144 (D).

2.4 棉花 PEBP家族基因的组织表达分析
qRT-PCR分析表明, 8个 PEBP基因在陆地棉的
根、茎、叶、幼苗顶端分生组织、花、胚珠和 25 d
的纤维等 7个组织具有完全不同的表达模式(图 4)。
FT1在叶片中的表达量最高, 在花、胚珠和 25 d的
纤维中也有较高的表达, 但在根和幼苗顶端分生组
织中几乎不表达(图 4-A); MFT1 在各组织中均有表
达, 但在 25 d 的纤维中表达量最高, 其次是花和真
叶(图 4-B); MFT2 在真叶和幼苗顶端分生组织中具
有较高的表达(图 4-C); TFL1a、TFL1b 和 TFL1c 均
在根中的表达量最高(图 4-D, E, F), TFL1a在茎秆和
SAM 中有弱的表达, TFL1b 在其他组织中几乎检测
不到, 但 TFL1c 在真叶、花和胚珠中也有较高的表
达; BFT1 和 BFT2 在所检测的 7 个棉花组织中均有
表达, 且在叶片中的表达量最高, 但除幼苗顶端分
生组织外 BFT1 在其他 6 个组织中的表达明显高于
BFT2 (图 4-G, H)。
3 讨论
目前, 全基因组测序及数据挖掘是生物学研究
的热点领域之一。二倍体棉花 G. arboreum (A2)和 G.
raimondii (D5)测序工作的完成, 为利用全基因组数
第 3期 李 超等: 亚洲棉和雷蒙德氏棉 PEBP家族基因的鉴定及该家族基因在陆地棉组织中表达分析 401



图 3 棉花与拟南芥 PEBP家族基因进化分析
Fig. 3 A Neighbor-Joining phylogenetic analysis of cotton PEBP homologs and the PEBP family in Arabidopsis
括号内为 GenBank登录号。The GenBank accession number is in parenthese.

据研究棉花中基因家族的分类、序列特点、新基因
的克隆、功能预测以及异源四倍体棉花序列分析等
提供了方便。本研究利用 G. raimondii (D5)基因组数
据库, 查找到棉花中可能存在的 8个 PEBP基因, 它
们分别位于第 1、第 4、第 6、第 7和第 9染色体上
(表 2)。与 G. raimondii相一致的是, 在 G. arboreum
(A2)的 wgs基因组序列数据库中也只找到 8个 PEBP
基因, 分别位于第 1、第 3、第 10、第 11和第 12染
色体上(表 3)。结构分析表明, 棉花 8 个 PEBP基因
不仅具有植物 PEBP家族基因类似的基因结构(图 1),
并且蛋白序列中含有 PEBP 家族蛋白的保守基序;
在 FT/FTL1-like 中, 决定促进或者抑制开花的关键
氨基酸位点在棉花中也是一致的(图 2), 表明植物
PEBP家族基因功能在进化上具保守性。
进化分析表明, 棉花中的 PEBP 家族基因也分
为 3 个亚家族。其中, FT-like 只有 1 个 FT1 基因;
TFL1-like包括 TFL1a、TFL1b、TFL1c、BFT1和 BFT2
共 5个基因; MFT-like包括MFT1和MFT2两个基因
(图 3)。在拟南芥[8]、南瓜[13]、龙胆[14]、苹果[15]、烟
草[16]等植物基因组中均存在多个FT-like基因, 并且
存在功能冗余或相反的现象 , 但在二倍体 G. ar-
boreum和 G. raimondii基因组中只存在 1个 FT-like
402 作 物 学 报 第 41卷

基因, 与我们前期在四倍体 G. hirsutum中克隆的一
个 GhFT1基因一致[23]。值得注意的是, 在四倍体棉
花中可能还存在其他 FT-like基因, 但是目前只发现
1个 GhFT1。拟南芥基因组中存在 3个 TFL1-like基
因[8], 且均抑制开花, Argiriou等[26]在四倍体 G. hir-
sutum、二倍体 G. arboreum和 G. raimondii中均克隆
到了 2 个棉花 TFL1-like 基因 TFL1a、TFL1b, 但
TFL1c、BFT1、BFT2尚无相关研究报道。迄今为止,
除了在苔藓和石松植物中分别含有 4个和 2个 MFT
同源基因外, 在多数种子植物(如大豆[5]、小麦[7]、
拟南芥[8]等)中, 只发现 1 个 MFT-like 基因, 其功能
多与种子萌发有关 , 我们前期在四倍体 G. bar-
badense中克隆了GbMFT1和GbMFT2 2个MFT-like
基因, 与二倍体 G. arboreum和 G. raimondii基因组
中的 2个 MFT-like一致[24-25]。
根据GenBank中统计结果(2013年 1月 1日), 棉
花 EST 数目共有 464 601 条(http://www.ncbi.nlm.
nih.gov/genbank/dbest/dbest_summary), 包括 G. hir-
sutum 297 522条、G. arboreum 64 087条、G. rai-
mondii 63 577条。但在棉属 EST数据库中, 只检索
到 8个 PEBP家族基因 EST序列, 分属于 FT1、MFT1
和 MFT2基因(表 4)。分析原因, 一方面由于 EST主
要是通过 cDNA 文库大规模随机测序获得, 有很多
组织的 cDNA 文库少有构建, 就很难获得组织特定
表达的基因; 另外由于基因表达量很低, 一些基因
在表达量很低的组织中很难被检测到, 使 EST 数据

图 4 PEBP家族基因在陆地棉不同组织中的表达
Fig. 4 Expression patterns of PEBP family genes in different tissues of G. hirsutum
SAM: 幼苗顶端分生组织。SAM: shoot apical meristem.
第 3期 李 超等: 亚洲棉和雷蒙德氏棉 PEBP家族基因的鉴定及该家族基因在陆地棉组织中表达分析 403


库中很少有这些基因的 EST序列信息。
与我们前期的研究[23]一致, 除了在根中很难检
测到 GhFT1 基因的表达外, 在叶片、茎秆、花、胚
珠等棉花不同组织中都有表达, 但在叶片中的表达
最高(图 4-A)。在拟南芥中过量表达 GhFT1 可以明
显地促进早花[23], 暗示着棉花 FT1 基因可能起着开
花促进作用, 并与拟南芥 AtFT基因作用模式一样[9-11],
在叶片中转录为 mRNA并合成 FT1蛋白, FT1蛋白
再由韧皮部经过长距离运输到顶端分生组织, 激活
下游信号, 促进植物开花。GhMFT1在花、叶片、纤
维中有较高的表达(图 4-B), 与 GbMFT1[24]的表达类
似; GhMFT2在叶和 SAM中表达相对较高(图 4-C)。
近年来的研究表明, 高等植物中 MFT-like 基因调控
种子的发育[5-8, 24], 我们前期的研究也表明 G. bar-
badense 的 GbMFT1 和 GbMFT2 在萌发的种子中高
表达, 并且 GbMFT2基因的表达受 ABA诱导[24-25]。
TFL1a、TFL1b 均在根中的表达量最高(图 4-D, E),
其基因表达模式和 Argiriou 等[26]研究结果相似, 但
它们在根中的分子机制及功能并不十分清楚 [26]。
TFL1c除了在根中表达量最高外, 在真叶、花和胚珠
中也有较高的表达(图 4-F), BFT1和 BFT2均在叶片
中表达较高(图 4-G, H), 并且它们编码的蛋白都具
有类似 TFL1的关键氨基酸位点 His (H)和 Asp (D),
推测其除了可能具有抑制开花的作用以外, 可能还
具有其他重要的功能。棉花的 8个 PEBP基因, 除了
TFL1a、TFL1b外, 均在叶片中高表达, 表明 TFL1a、
TFL1b 在分生组织的维持和分化过程中可能不受光
周期的直接诱导; 而 FT1、MFT1、MFT2、TFL1c、
BFT1、BFT2这 6个 PEBP基因的调节可能受光周期
的诱导。
总之, 在二倍体棉花基因组 A2和 D5中均存在 8
个 PEBP 家族基因, 其中 5 个与已知的四倍体棉花
PEBP基因序列一致, 且这 8个 PEBP基因在四倍体
陆地棉中均有表达, 表明棉花 PEBP 基因家族在二
倍体中数目较为保守, 但四倍体陆地棉由 A2 与 D5
基因组进化而来, 四倍体棉花也可能具有 A2 与 D5
两套的 PEBP 家族基因, 同时也不排除四倍体棉花
PEBP 基因家族在进化过程中由于重复基因间的相
互作用只有一组二倍体基因组 (A2 或 D5)来源的
PEBP基因表达[31]。因此, 在四倍体棉花中究竟存在
多少个 PEBP 基因, 相应的基因序列与二倍体有什
么不同, 以及它们在棉花发育过程中的功能需要进
一步的克隆研究。本研究为进一步解析棉花发育及
开花的分子机制提供了研究基础, 将来利用这类基
因调节棉花的开花时间, 对提高棉花产量和纤维品
质具有重要的理论指导意义。
4 结论
在棉花二倍体 G. arboreum (A2)和 G. raimondii
(D5)的基因组上存在 8个 PEBP家族基因, 它们所编
码的蛋白存在一个长度为 23个氨基酸的 PEBP保守
基序; 棉花的 8个 PEBP家族基因包括 4个外显子和
3 个内含子, 并分属 3 个亚家族, 即 1 个 FT-like, 2
个 MFT-like, 5个 TFL1-like (包括 3个 TFL1和 2个
BFT基因); 8个 PEBP家族基因在棉花不同组织中具
有不同的表达模式, 表明它们在棉花分生组织决定
中可能起完全不同的作用。
References
[1] Banfield M J, Barker J J, Perry A C, Brady R L. Function from
structure? The crystal structure of human phosphatidylethanola-
mine-binding protein suggests a role in membrane signal trans-
duction. Structure, 1998, 6: 1245–1254
[2] Hengst U, Albrecht H, Hess D, Monard D. The phosphati-
dylethanolamine-binding protein is the prototype of a novel fam-
ily of serine protease inhibitors. J Biol Chem, 2001, 276: 535–540
[3] Chautard H, Jacquet M, Schoentgen F, Bureaud N, Bénédetti H.
Tfs1p, a member of the PEBP family, inhibits the Ira2p but not
the Ira1p Ras GTPase-activating protein in Saccharomyces cere-
visiae. Eukaryot Cell, 2004, 3: 459–470
[4] Chardon F, Damerval C. Phylogenomic analysis of the PEBP
gene family in cereals. J Mol Evol, 2005, 61: 579–590
[5] Li Q, Fan C, Zhang X, Wang X, Wu F, Hu R, Fu Y. Identification
of a soybean MOTHER OF FT AND TFL1 homolog involved in
regulation of seed germination. PLoS One, 2014, 9: e99642
[6] Xi W, Liu C, Hou X, Yu H. MOTHER OF FT AND TFL1 regu-
lates seed germination through a negative feedback loop modu-
lating ABA signaling in Arabidopsis. Plant Cell, 2010, 22:
1733–1748
[7] Nakamura S, Abe F, Kawahigashi H, Nakazono K, Tagiri A, Ma-
tsumoto T, Utsugi S, Ogawa T, Handa H, Ishida H, Mori M,
Kawaura K, Ogihara Y, Miura H. A wheat homolog of MOTHER
OF FT AND TFL1 acts in the regulation of germination. Plant
Cell, 2011, 23: 3215–3229
[8] Karlgren A, Gyllenstrand N, Kallman T, Sundstrom J F, Moore D,
Lascoux M, Lagercrantz U. Evolution of the PEBP gene family in
plants: functional diversification in seed plant evolution. Plant
Physiol, 2011, 156: 1967–1977
[9] Corbesier L, Vincent C, Jang S, Fornara F, Fan Q, Searle I, Gi-
akountis A, Farrona S, Gissot L, Turnbull C, Coupland G. FT
protein movement contributes to long-distance signaling in floral
induction of Arabidopsis. Science, 2007, 316: 1030–1033
[10] Tamaki S, Matsuo S, Wong H, Yokoi S, Shimamoto K. Hd3a
protein is a mobile flowering signal in rice. Science, 2007, 316:
1033–1036
[11] Lifschitz E, Eviatar T, Rozman A, Shalit A, Goldshmidt A, Am-
404 作 物 学 报 第 41卷

sellem Z, Alvarez J P, Eshed Y. The tomato FT ortholog triggers
systemic signals that regulate growth and flowering and substitute
for diverse environmental stimuli. Proc Natl Acad Sci USA, 2006,
103: 6398–6403
[12] Abe M, Kobayashi Y, Yamamoto S, Daimon Y, Yamaguchi A,
Ikeda Y, Ichinoki H, Notaguchi M, Goto K, Araki T. FD, a bZIP
protein mediating signals from the floral pathway integrator FT at
the shoot apex. Science, 2005, 309: 1052–1056
[13] Lin M K, Belanger H, Lee Y J, Varkonyi-Gasic E, Taoka K, Mi-
ura E, Xoconostle-Cázares B, Gendler K, Jorgensen R A, Phinney
B, Lough T J, Lucas W J. FLOWRING LOCUS T protein may
act as the long-distance florigenic signal in the cucurbits. Plant
Cell, 2007, 19: 1488–1506
[14] Imamura T, Nakatsuka T, Higuchi A, Nishihara M, Takahashi H.
The gentian orthologs of the FT/TFL1 gene family control floral
initiation in Gentiana. Plant Cell Physiol, 2011, 52: 1031–1041
[15] Kotoda N, Hayashi H, Suzuki M, Igarashi M, Hatsuyama Y, Ki-
dou S, Igasaki T, Nishiguchi M, Yano K, Shimizu T, Takahashi S,
Iwanami H, Moriya S, Abe K. Molecular characterization of
FLOWERING LOCUS T-like genes of apple (Malus × domestica
Borkh). Plant Cell Physiol, 2011, 51: 561–575
[16] Harig L, Beinecke F A, Oltmanns J, Muth J, Müller O, Rüping B,
Twyman R M, Fischer R, Prüfer D, Noll G A. Proteins from the
FLOWERING LOCUS T-like subclade of the PEBP family act
antagonistically to regulate floral initiation in tobacco. Plant J,
2012, 72: 908–921
[17] Pin P A, Benlloch R, Bonnet D, Wremerth-Weich E, Kraft T,
Gielen J J, Nilsson O. An antagonistic pair of FT homologs me-
diates the control of flowering time in sugar beet. Science, 2010,
330: 1397–1400
[18] Bradley D, Ratcliffe O, Vincent C, Carpenter R, Coen E. Inflo-
rescence commitment and architecture in Arabidopsis. Science,
1997, 275: 80–83
[19] Bradley D, Carpenter R, Copsey L, Vincent C, Rothstein S, Coen
E. Control of inflorescence architecture in Antirrhinum. Nature,
1996, 379: 791–797
[20] Hanzawa Y, Money T, Bradley D. A single amino acid converts a
repressor to an activator of flowering. Proc Natl Acad Sci USA,
2005, 102: 7748–7753
[21] Ahn J H, Miller D, Winter V J, Banfield M J, Lee J H, Yoo S Y,
Henz S R, Brady R L, Weigel D. A divergent external loop con-
fers antagonistic activity on floral regulators FT and TFL1.
EMBO J, 2006, 25: 605–614
[22] Wendel J, Brubaker C, Alvarez I, Cronn R. Genetics and Geno-
mics of Cotton. New York: Springer-Verlag, 2009. pp 3–22
[23] 东锐, 院海英, 顾超, 郑银英, 黄先忠, 崔百明. 棉花 GhFTL1
基因的克隆及初步功能分析. 棉花学报, 2011, 23: 515–521
Dong R, Yuan H Y, Gu C, Zheng Y Y, Huang X Z, Cui B M.
Clone and primary analysis of the function of GhFTL1 gene in
cotton (Gossypium hirsutum). Cotton Sci, 2011, 23: 515–521 (in
Chinese with English abstract)
[24] 顾超 , 李超 , 李晓波 , 肖向文 , 崔百明 , 黄先忠 . 海岛棉
GbMFT1 基因的克隆及表达分析 . 作物学报 , 2013, 39:
1391–1399
Gu C, Li C, Li X B, Xiao X W, Cui B M, Huang X Z. Cloning
and expression analysis of GbMFT1 gene in Gossypium bar-
badense L. Acta Agron Sin, 2013, 39: 1391–1399 (in Chinese
with English abstract)
[25] 顾超 , 郭丹丽 , 张峰 , 李雪源 , 艾先涛 , 黄先忠 . 海岛棉
GbMFT2 基因的克隆及表达分析 . 棉花学报 , 2014, 26:
197–203
Gu C, Guo D L, Zhang F, Li X Y, Ai X T, Huang X Z. Cloning
and expression analysis of GbMFT2 gene in Gossypium bar-
badense L. Cotton Sci, 2014, 26: 197–203 (in Chinese with Eng-
lish abstract)
[26] Argiriou A, Michailidis G, Tsaftaris A S. Characterization and ex-
pression analysis of TERMINAL FLOWER1 homologs from cul-
tivated alloteraploid cotton (Gossypium hirsutum) and its diploid
progenitors. J Plant Physiol, 2008, 165: 1636–1646
[27] Wang K B, Wang Z W, Li F G, Ye W W, Wang J Y, Song G L, Yue
Z, Cong L, Shang H H, Zhu S L, Zou C S, Li Q, Yuan Y L, Lu C
R, Wei H L, Gou C Y, Zheng Z Q, Yin Y, Zhang X Y, Liu K,
Wang B, Song C, Shi N, Kohel R J, Percy R G, Yu J Z, Zhu Y X,
Wang J, Yu S X. The draft genome of a diploid cotton Gossypium
raimondii. Nat Genet, 2012, 44: 1098–1103
[28] Li F, Fan G, Wang K, Sun F, Yuan Y, Song G, Li Q, Ma Z, Lu C,
Zou C, Chen W, Liang X, Shang H, Liu W, Shi C, Xiao G, Gou C,
Ye W, Xu X, Zhang X, Wei H, Li Z, Zhang G, Wang J, Liu K,
Kohel R J, Percy R G, Yu J Z, Zhu Y X, Wang J, Yu S X. Genome
sequence of the cultivated cotton Gossypium arboreum. Nat
Genet, 2014, 46: 567–572
[29] Finn R D, Bateman A, Clements J, Coggill P, Eberhardt R Y,
Eddy S R, Heger A, Hetherington K, Holm L, Mistry J, Sonn-
hammer E L, Tate J, Punta M. Pfam: the protein families database.
Nucl Acids Res, 2014, 42: 222–230
[30] Tamura K, Peterson D, Peterson N, Stecher G, Nei M, Kumar S.
MEGA5: molecular evolutionary genetics analysis using maxi-
mum likelihood, evolutionary distance, and maximum parsimony
methods. Mol Biol Evol, 2011, 28: 2731–2739
[31] Wendel J F, Schnabel A, Seelanan T. Bidirectional interlocus
concerted evolution following allopolyploid speciation in cotton
(Gossypium). Proc Natl Acad Sci USA, 1995, 92: 280–284