免费文献传递   相关文献

棉花LIM蛋白基因家族的进化及表达特征分析



全 文 :植物生理学报 Plant Physiology Journal 2015, 51 (12): 2133~2142  doi: 10.13592/j.cnki.ppj.2015.0506 2133
收稿 2015-09-18  修定 2015-11-17
资助 新疆维吾尔自治区高技术项目(201111116)、国家高技术研究发展计划项目(“863”项目) (2012AA101108-05-04)和新疆维吾尔自治
区自然科学基金(2015211B013)。
* 通讯作者(E-mail: fanling@xaas.ac.cn; Tel: 0991-4527003)。
棉花LIM蛋白基因家族的进化及表达特征分析
杨洋, 李波, 胡文冉, 张经博, 范玲*
新疆农业科学院核技术生物技术研究所, 乌鲁木齐830091
摘要: 植物LIM蛋白参与细胞骨架的调节及调控次生细胞壁的发育。本研究在雷蒙德氏棉(D5)、亚洲棉(A2)基因组和陆地
棉的A、D亚基因组中分别鉴定出14个LIM基因。陆地棉GhLIM基因在2个亚组间的染色体上的分布及基因的复制模式是
一致的。推测其复制发生在其祖先同可可(6个LIM)分开之后, A2、D5基因组分化之前; 陆地棉LIM除多倍体化使其数目加
倍外, 没有基因复制与丢失事件发生。蛋白系统进化分析表明, 所有被子植物LIM蛋白可以划分为4个亚组(部分具有小亚
组): αLIM1 (FLIM1、WLIM1、PLIM1)、βLIM1、γLIM2 (WLIM2)、δLIM2 (PLIM2-I、PLIM2-II)。陆地棉GhLIM的同源
复制基因分别在WLIM2和PLIM2-I、PLIM2-II中聚为独立的分支。通过分析深度测序表达谱, 发现陆地棉GhLIM有3种表
达类型: 组成型表达的GhLIM1、2 (FLIM), GhLIM3 (WLIM1), GhLIM13 (βLIM1)和GhLIM4、8、14 (WLIM2); 雄蕊中优势
表达的GhLIM7、9 (PLIM2-I), GhLIM5、6、10、11 (PLIM2-II); 在雄蕊和纤维中优势表达的GhLIM12 (PLIM2-I)。实时荧
光定量PCR分析表明, GhLIM基因各成员在不同的纤维发育阶段具有不同的表达特征, GhLIM1、13、14在纤维的快速伸
长期(5~15 DPA)上调表达, 在15 DPA表达量最高; GhLIM2则在纤维次生壁发育期(18~28 DPA)显著上调表达, 在28 DPA表
达量最高。而GhLIM12在10~23 DPA持续高表达, 在28 DPA则没有表达。上述结果说明GhLIM家族基因在纤维发育的不
同阶段发挥着不同的功能。
关键词: 棉花; LIM; 纤维发育; 基因复制; 基因表达模式
Evolution and Expression Analysis of the LIM Protein Gene Family in Cotton
YANG Yang, LI Bo, HU Wen-Ran, ZHANG Jing-Bo, FAN Ling*
Institute of Nulclear and Biological Technologies, Xinjiang Academy of Agricultural Sciences, Urumuqi 830091, China
Abstruct: Plant LIM acts as an actin bundler to facilitate elongation of cells and also functions as a transcription fac-
tor involved in secondary cell wall development. In this study, 14 putative LIM genes were identified from the whole
genomes of Gossypium raimondii (D5), G. arboreum (A2), and 2 subgenomes (A, D) of G. hirsutum, respectively. In
G. hirsutum, the distribution and the duplication patterns of LIM family members on each couple homology chromo-
somes were consistent, suggesting that the LIM gene may had duplicated since the ancestors of cacao and diploid cot-
tons had diverged, and before the divergence of the D5 and A2 diploid cottons, and GhLIMs may not experienced a
single duplicate or gene loss in G. hirsutum, except the chromosome redoubling. The phylogenetic analysis suggested
that the angiosperm LIM proteins could clustered into four groups (subgroups are gathered within groups): αLIM1
(FLIM1, WLIM1, PLIM1), βLIM1, γLIM2 (WLIM2), δLIM2 (PLIM2-I, PLIM2-II); the duplicated homologs of
GhLIM were clusted in WLIM2, PLIM2-I, PLIM2-II subgroups respectively. The GhLIM genes expressing profiling
analysis showed that, there were 3 types of expressing patterns: GhLIM1/2 (FLIM), GhLIM3 (WLIM1), GhLIM13
(βLIM1) and GhLIM4/8/14 (WLIM2) were widely expressed in different tissues; GhLIM7/9 (PLIM2-I) and Gh-
LIM5/6/10/11 (PLIM2-II) were preferentially expressed in the stamen; LIM12 (PLIM2-I) were strongly expressed in
stamen and fiber. Quantitative PCR results of GhLIM exhibited different expression patterns during the process of fi-
ber development, the expressing of GhLIM1 was up-regulated in elongation stage, and peaked in 15 DPA; GhLIM2
was redominant up-regulated at stage of secondary wall biosynthesis, and peaked in 28 DPA; and the expression level
of GhLIM12 was constantly high during 10–23 DPA, and disappeared in 28 DPA, these result indicating different
subfunctionalisations of GhLIM genes in different fiber development phases.
Key words: cotton; LIM; fiber development; gene duplication; gene expression profiling
植物生理学报2134
LIM蛋白是一类半胱氨酸富集蛋白(Cys-rich
proteins, CRPs), 其命名源于LIN11、ISL1和MEC3
三个从动物中鉴定的含有LIM结构域蛋白的首字
母缩写(Freyd等1990; Karlsson等1990; Way和Chalfie
1988)。LIM结构域在真核生物中广泛存在且高度
保守, 其保守基序为[C-X2-C-X17-H-X2-C]-X2-[C-
X2-C-X17-CX2-H] (Arnaud等2007)。植物中首先从
向日葵(Helianthus annuus L.)花粉中分离出了HaP-
LIM1 (Baltz等1992a, b), 随后又在烟草(Nicotiana
tabacum L.) (Thomas等2006)、百合(Lilium longi-
florum Thunb.) (Wang等2008)、拟南芥[Arabidopsis
thaliana (L.) Heynh.] (Papuga等2010)及棉花(Gos-
sypium hirsutum L.) (罗明等2003; Li等2013; Han等
2013)等物种中陆续发现了LIM蛋白。植物LIM蛋
白家族一般含有2个被40~50个氨基酸残基分隔的
LIM结构域。Eliasson等(2000)将植物LIM分为在
花粉中特异表达的 PLIM1、PLIM2和组成型表达
的WLIM1, WLIM2。Arnaud等(2007)进一步将植
物LIM蛋白分为四大亚组αLIM1、βLIM1、γLIM2
和δLIM2; 其中αLIM1具有PLIM1、WLIM1和
FLIM 三个小亚组, βLIM1为新发现的LIM蛋白类
型, 具体功能不详, γLIM2和δLIM2分别包括了
WLIM2和PLIM2。植物LIM蛋白的亚细胞定位和
动物一样, 具有细胞质、细胞核及核质同时定位3
种情况。在动物中, 定位于细胞核的LIM蛋白主要
参与发育基因的转录调控(Thaler等2002), 而定位
于细胞质的LIM蛋白主要作为ABP (actin-binding
protein)参与调节肌动蛋白细胞骨架形成(Tran等
2005)。烟草NtWLIM1、2, 向日葵WLIM1和拟南
芥LIM蛋白家族都表现出在细胞核质同时定位的
特性(Brière等2003), 烟草NtWLIM1蛋白能够特异
性的结合PAL-box激活苯丙烷代谢途径关键酶, 参
与调控木质素生物合成(Kawaoka等2000; Kawaoka
和Ebinuma 2001)。NtWLIM2通过激活组蛋白基因
的表达参与调控细胞增殖与细胞周期进程(Moes
等2013)。而向日葵HaPLIM1在花粉小孢子和成熟
花粉的外皮层都具有定位, 主要同actin蛋白互作参
与细胞骨架调控, 在多种类型细胞的核中没有发
现HaPLIM1, 并且没有发现该蛋白具有特异的
DNA或RNA结合活性(Baltz等1996)。
棉花是重要的经济作物, 而我国棉花纤维品
质仍需进一步的提高(张天真和郭旺珍2007)。为
此, 研究者对棉纤维发育的分子机理进行了大量
研究。Li等(2013)发现, 陆地棉GhWLIM5在纤维发
育的快速伸长期优势表达, 主要功能是在细胞质
中作为F-actin的结合蛋白, 使细胞骨架更加稳定。
Han等(2013)发现, 陆地棉GhWLIM1a基因既作为
actin蛋白的结合体能促进纤维的伸长生长, 也作为
转录因子能激活PAL-box基因从而参与苯丙烷类
化合物的合成影响次生细胞壁的发育。在基因组
层面对棉花LIM蛋白基因家族的研究未见报道, 本
研究利用棉花基因组测序数据, 在基因组层面分
析陆地棉LIM蛋白基因家族, 从基因家族各成员的
结构、系统发育关系、基因的染色体分布、基因
复制及基因在棉花不同组织及棉纤维发育各阶段
的表达谱来研究棉花LIM基因家族。为进一步鉴
定该基因家族在棉纤维发育中的功能, 发掘新型
的纤维品质改良基因奠定基础。
材料与方法
1 材料
陆地棉(Gossypium hirsutum L.)基因组及蛋白
数据来自(http://mascotton.njau.edu.cn) (Zhang等
2015)、亚洲棉(Gossypium arboreum L.)数据来自
(http://cgp.genomics.org.cn) (Li等2014), 雷蒙德氏棉
(Gossypium raimondii Ulbr.) (Paterson等2012)、可可
(Theobroma cacao L.)、番木瓜(Carica papaya L.)、
葡萄(Vitis vinifera L.), 大豆(Glycine max Merr.)、烟
草(Nicotiana tabacum L.)、拟南芥[Arabidopsis
thaliana (L.) Heynh.]、毛果杨(Populus trichocarpa
Torr. & A.Gray)、水稻(Oryza sativa L.)、玉米(Zea
mays L.)、耧斗菜(Aquilegia coerulea)、无油樟(Am-
borella trichopoda Baill.)、云杉(Picea abies H.
Karst.)、卷柏(Selaginella moellendorffii Hieron.)、
小立碗藓(Physcomitrella patens Bruch & Schimp.)数
据均来自Phytozome数据库(http://phytozome.jgi.
doe.gov/pz/portal.html)。棉花RNA-seq数据来自
NCBI网站BioProject (PRJNA248163)中的SRA数据
包, 包括陆地棉(TM-1): 根、茎、叶、花托、花
瓣、雄蕊、雌蕊、副萼(SRX797899-SRX797906),
0 DPA (day post anthesis)胚珠(SRX797909), 5、10、
20、25 DPA纤维(SRX797917-797920)。
杨洋等: 棉花LIM蛋白基因家族的进化及表达特征分析 2135
陆地棉品种‘新陆早36号’于2014年种植于新
疆玛纳斯试验田, 开花当天标记后, 采集5、10、
15、18、21、23、28 DPA棉纤维样品, 每个样品均
取3次重复, 用液氮速冻并保存, 用于RNA提取。
2 棉花及其他物种LIM蛋白家族的识别
从Pfam (pfam.xfam.org)下载LIM结构域种子
序列, 使用隐马尔可夫模型(Hidden Markov Mod-
els)方法进行本地蛋白质数据库的检索, 候选LIM
同源蛋白应符合两个条件: (1)具有2个完整的LIM
保守结构域和(2) E值<1×e-5。从相应物种数据库
中下载候选LIM蛋白的CDS序列及基因组序列作
为候选。将候选基因的CDS序列在NCBI数据库中
进行比对, 检索相应的基因及EST序列。蛋白保守
基序(motif)的鉴定用MEME (http://meme.sdsc.edu/
meme/meme-intro.html)软件进行(陈秀玲等2014)。
3 蛋白多序列比对与系统树构建
使用Clustal X软件在默认参数下进行LIM蛋
白的多序列比对, 用BioEdit手动调整优化序列。
通过ProtTest软件分析, 得出构建进化树的最适模
型为JTT+G, 随后利用Phylips软件包(http://evolu-
tion.genetics.washington.edu/phylip.html), 选择
JTT+G模型, bootstrap值设定为1 000, 采用邻接法
(nerghbor-join, NJ)构建植物LIM蛋白家族的系统
发育树。
4 基因结构与基因重复分析
在GSDS网站(http://gsds.cbi.pku.edu.cn/), 将棉
花LIM基因的编码区序列(CDS)与全基因组序列比
对, 获得各基因内含子、外显子的个数和排布情
况(易吉明等2015)。棉花LIM蛋白基因倍增模式
分析参照Maher等(2006)的方法。使用MCScanX
软件对棉花LIM蛋白基因家族成员所在基因组区
段进行基因复制共线性分析, 采用Circos软件绘制
LIM蛋白基因家族在陆地棉基因组中的分布与复
制情况。
5 LIM基因在棉花不同组织及棉纤维不同发育时
期的表达谱分析
采用Tophat和Cufflinks软件包对棉纤维转录
组数据进行分析, 提取其中GhLIM基因的基因表达
量(fragments per kilobase of exon per millon frag-
ments mapped, FPKM值) (Trapnell等2012), 进行对
数转换和标准化, 并去除表达量较低的LIM基因
(FPKM<1), 利用层次聚类算法分析LIM基因在陆
地棉和海岛棉棉纤维不同发育时期的表达数据,
通过软件HemI展现层次聚类结果(Deng等2014)。
采用热硼酸/蛋白酶K法(Wan和Wilkins 2014)
提取各纤维样品RNA, 各样品RNA浓度均一化后,
利用M-MLV反转录酶(Promega, USA)合成cDNA。
选取在纤维中优势表达的GhLIM基因进行实时荧
光定量PCR分析(表1)。以棉花泛素基因Ubiquitin
(EU604080.1)作为内参, 以2-ΔΔCT法计算基因的相对
表达量(Livak和Schmittgen 2001)。
表1 LIM基因定量引物
Table 1 The primers for LIM gene quantitative PCR analysis
基因 引物序列(5′→3′)
GhLIM1 F: AAGCCTGTTTCAGATGCC
R: CACCGAATAAATTCACCACT
GhLIM2 F: TGGAGGGTGTACCATTAG
R: CGAGCTGGCTGTAGTTTC
GhLIM12 F: GAAGGGATGCTACAGTCA
R: CACCAGCTTCTTCAGATT
GhLIM13 F: GCTCCTTTGAGGGTGTCT
R: CCTTGTGATATGAAGTGCC
GhLIM14 F: TCATTTCGAGCAACTATTC
R: CTTCCACCGTTACCTTCT
  F表示正向引物, R表示反向引物。
实验结果
1 棉花LIM蛋白基因家族鉴定
通过对棉花基因组数据库的HMMsearch, 从
雷蒙德氏棉、亚洲棉和陆地棉A、D两个亚基因
组各鉴定了LIM蛋白14个。经过BLAST和结构域
分析, 确定这些基因的编码蛋白均具有2个串联的
LIM保守结构域(图1)。对棉花LIM基因进行系统
进化分析(图1-A), 发现进化树由14个进化亚支组
成, 每个亚支均由4个分别来自雷蒙德氏棉、亚洲
棉和陆地棉A、D亚基因组的LIM直系同源体(or-
thologs)组成, 各直系同源蛋白间的相似度在95%
以上, 表明棉花LIM家族有14个成员(图1-A)。陆
地棉LIM基因命名为GhLIM1~14, 并在最后添加字
母“a”或“d”来区分各基因的AD亚基因组归属, 对
于亚洲棉和雷蒙德氏分别命名为GaLIM1~14和
GrLIM1~14。
对棉花LIM蛋白家族的保守基序进行分析(图
植物生理学报2136
图1 棉花LIM蛋白保守系统进化(A)、保守结构域(B)及内含子外显子结构(C)
Fig.1 The phylogenetic (A), conservred domain (B) and gene intro-extro structure (C) of LIM gene family in cotton (G. raimon-
dii, G. arboreum, and G. hirsutum)
1-B, 表2), 发现该蛋白家族除具有2个LIM保守结
构域外, 大多数在C-端还有可变区。对棉花LIM基
因的内含子和外显子的数量和分布情况进行分析
(图1-C), 大多数棉花LIM基因含有4个内含子5个外
显子。第1内含子和第1、2、4外显子长度高度保
守, 而第4内含子和第5外显子长度具有较高的变
异。大多数直系同源基因间的内含子和外显子的
数目和长度是保守的, 但个别基因的内含子和外显
子数目和长度发生了变异, 如GhLIM2d、GhLI-
M5a。
表2 棉花LIM蛋白的保守基序
Table 2 The motifs of LIM proteins of cotton
基序编号 基序长度 一致序列
1 74 Kx4FxGTx2KCx2CxKTxYPxEKVTx2Gx3HKxCF(K/R)CxHGGCx4SxYx2Ax4LYCKHHx2QLFx2KG
2 70 (M/A)xFxGTx2KCxACxKTVx2V(D/E)x4(D/E)(G/N)x3HKxCF(K/R)CxHCKGxLx4YxS(M/F)
(D/E)GVLYC(K/R)PHF(D/E)QLFKx2G
3 26 (S/A)Sx4Ex2Ax5Ax6Ex3
4 14 (P/x)X5SX6E
5 10 (F/x)(S/x)KNF(Q/x)(T/x)x(K/x)x
6 11 (S/N)x2KxF(x)X3(P/A)K
7 10 LTSMEIAAES
杨洋等: 棉花LIM蛋白基因家族的进化及表达特征分析 2137
图2 陆地棉与其他物种LIM蛋白系统发育分析
Fig.2 The phylogenetic tree of LIM homologs from G. hirsutum and other plant
Ac: 耧斗菜, At: 拟南芥, Atr: 无油樟, Cp: 番木瓜, #Gh: 陆地棉, Gm: 大豆, Nt: 烟草, Os: 水稻, Pa: 云杉, Ppa: 小立碗藓, *Pt: 毛果杨, Sm:
卷柏, Tc: 可可, Vv: 葡萄, Zm: 玉米; 拟南芥、毛果杨、水稻的LIM蛋白来自文献(Arnaud等2007); 其他物种LIM基因名称后的数字为基因
组数据中的PACID。
2 植物LIM蛋白的系统进化分析
将小立碗藓LIM基因作为外群体(out group)
对LIM蛋白系统进化分析, 结果表明(图2): 所有陆
生植物LIM蛋白家族起源于共同的祖先, 从小立碗
藓之后, 植物LIM蛋白可划分为LIM1和LIM2两大
亚组, 而从无油樟开始, 所有被子植物的LIM1和
LIM2又各自分开, 形成4个亚组。根据文献(Ar-
naud等2007), 将4个亚组命名为αLIM1、βLIM1和
γLIM2、δLIM2。
(1) αLIM1亚组包括WLIM1、PLIM1及FLIM
三个小亚组(Arnaud等2007)。棉花在WLIM1分支
中有1个成员GhLIM3, 即是已被证明在棉纤维发
育中有重要功能的GhWLIM1a (Han等2013)。
FLIM基因家族具有在纤维组织中优势表达的特征
植物生理学报2138
分支, 分支I中有4个来自棉花: GhLIM5、6、10、
11。分支II中没有单子叶植物, 棉花在该分支有3
个成员: GhLIM7、9、12。
3 棉花LIM基因的共线性复制分析
陆地棉28个LIM基因在染色体上的分布情况
如图3所示, LIM在A和D两个亚组的染色体分布具
有对应关系(除GhLIM1a、d分别位于A03和D02染
色体之外), A/D亚组的4、10、13号染色体上各具
(Arnaud等2007), 该分支中杨树的PtXLIM1a和PtX-
LIM1b在木质部发育过程中优势表达, 陆地棉在该
分支中有2个成员GhLIM1和GhLIM2。(2) βLIM1
是一个较小的分支, 单子叶植物及拟南芥没有这
一类型的LIM蛋白。棉花具有1个成员GhLIM13。
(3) γLIM2亚组中主要为WLIM2。WLIM2亚组蛋
白的保守性比较高。陆地棉在该亚组有3个成员:
GhLIM4、8、14。(4) δLIM2: 该亚组形成两个大
图3 陆地棉LIM基因家族的染色体分布与基因共线性分析
Fig.3 The chromosome location and gene duplication of LIM gene family in G. hirsutum
D: 雷蒙德氏棉染色体; A: 亚洲棉染色体; Dt: 陆地棉D亚组染色体; At: 陆地棉A亚组染色体; s: scaffold。
杨洋等: 棉花LIM蛋白基因家族的进化及表达特征分析 2139
表3 GhLIM基因复制模式分析
Table 3 Gene duplication of the LIM family in G. hirsutum
复制基因对 基因名称 染色体位置 复制模式
1 LIM5 A08:3317942-3321244; D08:3860280-3863197 染色体片段复制
LIM6 A08:81122784-81124119; D08:47449283-47450699
LIM10 A11:7733788-7734758; D11:7943780-7944751
LIM11 A12scaffold3368:60171-61341; D12:59063440-59065255
2 LIM7 A08:95400730-95401535; D08:57574421-57575526 染色体片段复制
LIM9 A11:1908693-1909926; D11:1801374-1802618
LIM12 A12:8361447-8365526; D12:55619328-55620352
3 LIM4 A06:97439770-97441739; D06scaffold4158:70895-72847 染色体片段重复
LIM8 A10:98666072-98668192; D10scaffold4398:38499-40617
LIM14 A13:1760147-1761896; D13:1645856-1647603

有1个对应的基因(GhLIM2、8、14), 6和11号染色
体上各有2个基因(GhLIM3、4, GhLIM9、10), 8和
12号染色体上各有3个基因(GhLIM5、6、7, Gh-
LIM11、12、13)。在亚组内, LIM基因的分布是不
均匀的, 具有成簇分布的现象。
通过MCScanX软件分析, 发现陆地棉LIM基因
家族成员所在的基因组区域间存在显著的共线性
关系(图3), 有10个棉花LIM家族成员位于3个染色体
倍增块上(表3), 并且不同亚组的LIM基因复制模式
是一致的。结合进化分析(图2)可以看出, γLIM2和
δLIM2中的GhLIM基因发生了多次复制, 并且每一
组复制基因都在进化树上和一个来自可可的LIM蛋
白聚为一个分支。推测棉花LIM基因家族复制的时
间发生在其祖先同可可分开之后, A2、D5基因组分化
之前; 陆地棉中, 除多倍体化造成LIM基因的数目加
倍外, 该基因没有其他的基因复制与丢失事件发生。
4 陆地棉LIM基因家族的表达模式分析
对陆地棉(TM-1)不同发育阶段的纤维, 及其
他不同组织的RNA-Seq数据进行分析 , 获得了
GhLIM基因表达量的FPKM值, 利用HemI软件绘制
出GhLIM基因表达模式图。结果如图4所示, 28个
GhLIM基因均有表达。根据基因在不同组织中的
表达模式, 可将其分为3种类型, (1)组成型表达:
GhLIM1、2、3 (αLIM1), GhLIM13 (βLIM1)和Gh-
LIM4、8、14 (γLIM2), (2)在雄蕊中优势表达:
LIM5、6、7、9、11 (δLIM2), (3)在雄蕊和纤维中
优势表达: LIM12 (δLIM2)。其中GhLIM1、2、
12、13、14在纤维中优势表达。
棉纤维的发育主要可以分为5个不同的发育
阶段: 起始(0~5 DPA), 快速伸长(5~18 DPA), 初次
生壁发育转换(18~21 DPA), 次生壁发育(21~30
DPA)和脱水成熟。本研究进一步通过实时荧光定
量PCR对GhLIM1、2、12、13、14在棉纤维不同
发育阶段(5、10、15、18、21、23、28 DPA)的表
达量进行检测, 结果如图5所示: GhLIM1、13、14
均在纤维的快速伸长期(5~15 DPA)上调表达, 在
10~15 DPA表达量最高; 不同的是GhLIM1在之后
的18~28 DPA持续较高表达, 而GhLIM13、14的表
达水平则降低。GhLIM2从纤维18 DPA (转换期)开
始显著上调表达, 至28 DPA表达量最高。而属于
PLIM2-I亚组的GhLIM12则在10~23 DPA持续高表
达, 在28 DPA (次生壁发育)表达水平很低。上述
结果说明不同GhLIM家族基因在纤维发育的不同
阶段可能发挥着不同的功能。
讨  论
1 棉花LIM基因家族的复制与进化
本研究的结果表明, 棉花LIM基因家族的大多
数成员具有4内含子5外显子, 与大多数植物的LIM
基因结构相似(Baltz等1992a, b; Thomas等2006; Ar-
naud等2007; Paguga等2010)。而Arnaud等(2007)发
现杨树、拟南芥和水稻LIM基因家族的第1、2、4
外显子和第1、4内含子高度保守, 本研究中, 棉花
LIM的第1、2、4外显子和第1内含子同样高度保
守, 但第5个外显子和第4个内含子具有较多的长
度变异(200~2 000 bp), 并且对应其蛋白的C-端具
植物生理学报2140
有可变的结构域, 推测棉花LIM基因家族在进化中
功能产生了分化。
棉属的共同祖先在与可可分化之后(33.7 MYA),
经历了特有的基因组复制事件(Wang等2012; Pat-
erson等2012; Li等2014, 2015; Zhang等2015), 本研
究GhLIM1a、d分别位于A03和D02染色体上, 通过
比较分析, 发现其恰好位于陆地棉A亚基因组上最
大的染色体异位区上(A02–A03) (Zhang等2015), 可
见该基因家族在陆地棉A、D两个亚基因组上的染
色体分布是一致的。
2 棉花LIM基因的表达模式
植物LIM蛋白参与细胞骨架的调节及调控次
生细胞壁的发育(Baltz等1992a, b; Papuga等2010),
两种WLIM蛋白在棉纤维发育中的功能已得到了
证实(Han等2013; Li等2013)。本研究的结果表明,
棉花LIM基因家族共有14个成员, 其中在发育的棉
纤维中优势表达的有五种(GhLIM1、2、12、13、
14), 且它们在纤维发育过程中的表达模式有很大
的不同, 表明它们在纤维发育中可能具有不同的
功能。
Arnaud等(2012)对杨树PtLIM家族进行了系
统进化和组织表达分析 , 发现αLIM1家族中的
PtLIM基因可以划分为PtWLIM1和PtFLIM1两类,
PtFLIM1主要在木质部分化和扩张时期表达, 推测
其功能与次生壁中木质素的合成有关(Arnaud等
2007, 2012), 并发现棉纤维EST文库中也有FLIM1
类基因的大量表达。本研究发现, 棉花中的FLIM1
有两个成员, GhLIM1在在纤维的快速伸长期(5~15
DPA)上调表达, 在10~15 DPA表达量最高; 并且在
之后的18~28 DPA持续具有较高表达, GhLIM2从
图4 GhLIM 基因家族在陆地棉中的表达模式
Fig.4 The expression patterns of GhLIM genes in G. hirsutum
杨洋等: 棉花LIM蛋白基因家族的进化及表达特征分析 2141
纤维18 DPA (转换期)开始显著上调表达, 至28
DPA表达量最高。暗示这两个基因可能参与棉纤
维次生壁的发育。
本研究中植物δLIM2亚组可以分为PLIM2-I
和PLIM2-II, 拟南芥AtPLIM2在细胞伸长过程中,
具有对肌动蛋白的结合、稳定和成束调节能力
(Paguga等2010)。杨树的纤维状花絮同棉花纤维
具有相似的起源(Arnaud等2012)。在杨树中, Pt-
PLIM也可划分为两种: 属于PLIM2-II的PtPLI-
M2a、b主要在花粉中优势表达, 而属于PLIM-I的
PtPLIM2c、d除在花粉中表达外, 还在杨絮和荚膜
中表达(Arnaud等2012)。本研究中棉花GhLIM12
同杨树PtPLIMc、d同属PLIM2-I亚组, GhLIM12表
达特征与其余棉花GhLIM不同, 除在雄蕊中优势表
达外, 在纤维发育的5~23 DPA也有较高的表达, 暗
示该基因在棉纤维发育过程中有重要的作用。
参考文献
陈秀玲, 王傲雪, 张珍珠, 李景富(2014). 番茄NAC转录因子家族的
鉴定及生物信息学分析. 植物生理学报, 50 (4): 461~470
罗明, 肖月华, 侯磊, 罗小英, 李德谋, 裴炎(2003). 棉花LIM结构域
图5 GhLIM基因家族在棉纤维发育过程中的表达模式
Fig.5 The expression patterns of GhLIM genes during the process of fiber development
植物生理学报2142
基因(GhLIM1)的克隆和表达分析. 遗传学报, 30 (2): 175~182
易吉明, 黄婷, 黄勇, 陈东红(2015). 小立碗藓MADS-box基因家族
的系统进化分析. 植物生理学报, 51 (2): 197~206
张天真, 郭旺珍(2007). 棉花分子育种的现状、问题与展望. 中国农
业科技导报, 9 (2): 19~25
Arnaud D, Déjardin A, Leplé JC, Lesage-Descauses MC, Boizot N,
Villar M, Bénédetti H, Pilate G (2012). Expression analysis of
LIM gene family in poplar, toward an updated phylogenetic clas-
sification. BMC Res Notes, 5: 102
Arnaud D, Déjardin A, Leplé JC, Lesage-Descauses MC, Pilate G
(2007). Genome-wide analysis of LIM gene family in Populus
trichocarpa, Arabidopsis thaliana, and Oryza sativa. DNA Res,
14 (3): 103~116
Baltz R, Domon C, Pillay DT, Steinmetz A (1992a). Characterization
of a pollen-specific cDNA from sunflower encoding a zinc finger
protein. Plant J, 2 (5): 713~721
Baltz R, Evrard JL, Bourdon V, Steinmetz A (1996). The pollen-spe-
cific LIM protein PLIM-1 from sunflower binds nucleic acids in
vitro. Sex Plant Rep, 9 (5): 264~268
Baltz R, Evrard JL, Domon C, Steinmetz A (1992b). A LIM mo-
tif is present in a pollen-specific protein. Plant Cell, 4 (12):
1465~1466
Brière C, Bordel AC, Barthou H, Jauneau A, Steinmetz A, Alibert G,
Petitprez M (2003). Is the LIM-domain protein HaWLIM1 asso-
ciated with cortical microtubules in sunflower protoplasts? Plant
Cell Physiol, 44 (10): 1055~1063
Deng W, Wang Y, Liu Z, Cheng H, Xue Y (2014). HemI: a toolkit for
illustrating heatmaps. PLoS One, 9 (11): e111988
Eliasson A, Gass N, Mundel C, Baltz R, Kräuter R, Evrard JL, Stein-
metz A (2000). Molecular and expression analysis of a LIM pro-
tein gene family from flowering plants. Mol Gen Genet, 264 (3):
257~267
Freyd G, Kim SK, Horvitz HR (1990). Novel cysteine-rich motif and
homeodomain in the product of the Caenorhabditis elegans cell
lineage gene lin-II. Nature, 344 (6269): 876~879
Han LB, Li YB, Wang HY, Wu XM, Li CL, Luo M, Wu SJ, Kong ZS,
Pei Y, Jiao GL et al (2013). The dual functions of WLIM1a in
cell elongation and secondary wall formation in developing cot-
ton fibers. Plant Cell, 25 (11): 4421~4438
Karlsson O, Thor S, Norberg T, Ohlsson H, Edlund T (1990). Insulin
gene enhancer binding protein Isl-1 is a member of a novel class
of proteins containing both a homeo- and a Cys-His domain. Na-
ture, 344 (6269): 879~882
Kawaoka A, Ebinuma H (2001). Transcriptional control of lignin
biosynthesis by tobacco LIM protein. Phytochemistry, 57 (7):
1149~1157
Kawaoka A, Kaothien P, Yoshida K, Endo S, Yamada K, Ebinuma H
(2000). Functional analysis of tobacco LIM protein Ntlim1 in-
volved in lignin biosynthesis. Plant J, 22 (4): 289~301
Li F, Fan G, Lu C, Xiao G, Zou C, Kohel RJ, Ma Z, Shang H, Ma X,
Wu J et al (2015). Genome sequence of cultivated Upland cotton
(Gossypium hirsutum TM-1) provides insights into genome evo-
lution. Nat Biotechnol, 33 (5): 524~530
Li F, Fan G, Wang K, Sun F, Yuan Y, Song G, Li Q, Ma Z, Lu C, Zou
C et al (2014). Genome sequence of the cultivated cotton Gos-
sypium arboreum. Nat Genet, 46 (6): 567~572
Li Y, Jiang J, Li L, Wang XL, Wang NN, Li DD, Li XB (2013). A cot-
ton LIM domain-containing protein (GhWLIM5) is involved in
bundling actin filaments. Plant Physiol Biochem, 66: 34~40
Livak KJ, Schmittgen TD (2001). Analysis of relative gene expression
data using real-time quantitative PCR and the 2-ΔΔCT method.
Methods, 25 (4): 402~408
Maher C, Stein L, Ware D (2006). Evolution of Arabidopsis microR-
NA families through duplication events. Genome Res, 16 (4):
510~519
Moes D, Gatti S, Hoffmann C, Dieterle M, Moreau F, Neumann K,
Schumacher M, Diederich M, Grill E, Shen WH et al (2013). A
LIM domain protein from tobacco involved in actin-bundling
and histone gene transcription. Mol Plant, 6 (2): 483~502
Papuga J, Hoffmann C, Dieterle M, Moes D, Moreau F, Tholl S,
Steinmetz A, Thomas C (2010). Arabidopsis LIM proteins: a
family of actin bundlers with distinct expression patterns and
modes of regulation. Plant Cell, 22 (9): 3034~3052
Paterson AH, Wendel JF, Gundlach H, Guo H, Jenkins J, Jin D,
Llewellyn D, Showmaker KC, Shu S, Udall J et al (2012). Re-
peated polyploidization of Gossypium genomes and the evolu-
tion of spinnable cotton fibres. Nature, 492 (7429): 423~427
Thaler JP, Lee SK, Jurata LW, Gill GN, Pfaff SL (2002). LIM factor
Lhx3 contributes to the specification of motor neuron and inter-
neuron identity through cell-type-specific protein-protein inter-
actions. Cell, 110 (2): 237~249
Thomas C, Hoffmann C, Dieterle M, Van Troys M, Ampe C, Stein-
metz A (2006). Tobacco WLIM1 is a novel F-actin binding pro-
tein involved in actin cytoskeleton remodeling. Plant Cell, 18 (9):
2194~2206
Tran TC, Singleton C, Fraley TS, Greenwood JA (2005). Cysteine-rich
protein 1 (CRP1) regulates actin filament bundling. BMC Cell
Biol, 6: 45
Trapnell C, Roberts A, Goff L, Pertea G, Kim D, Kelley DR, Pimentel
H, Salzberg SL Rinn JL, Pachter L (2012). Differential gene and
transcript expression analysis of RNA-seq experiments with To-
pHat and Cufflinks. Nat Protoc, 7 (3): 562~578
Wan CY, Wilkins TA (1994). A modified hot borate method signifi-
cantly enhances the yield of high-quality RNA from cotton (Gos-
sypium hirsutum L.). Anal Biochem, 223 (1): 7~12
Wang HJ, Wan AR, Jauh GY (2008). An actin-binding protein, Ll-
LIM1, mediates calcium and hydrogen regulation of actin dy-
namics in pollen tubes. Plant Physiol, 147 (4): 1619~1636
Wang K, Wang Z, Li F, Ye W, Wang J, Song G, Yue Z, Cong L, Shang
H, Zhu S et al (2012). The draft genome of a diploid cotton Gos-
sypium raimondii. Nat Genet, 44 (10): 1098~1103
Way JC, Chalfie M (1988). mec-3, a homeobox-containing gene that
specifies differentiation of the touch receptor neurons in C. ele-
gans. Cell, 54 (1): 5~16
Zhang TZ, Hu Y, Jiang WK, Fang L, Guan XY, Chen JD, Zhang JB,
Saski C, Scheffler BE, Stelly DM et al (2015). Sequencing of al-
lotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a
resource for fibre improvement. Nat Biotechnol, 33 (5): 531~537