全 文 :作物学报 ACTA AGRONOMICA SINICA 2013, 39(2): 222−229 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn
本研究由国家自然科学基金项目(31000732)和中央级公益性科研院所基本科研业务专项(SJB1009)资助。
* 通讯作者(Corresponding authors): 白志川, E-mail: baizhichuan@yahoo.com.cn, Tel: 13983634203; 袁有禄, E-mail: youluyuan@hotmail.com,
Tel: 0372-2525371
第一作者联系方式: E-mail: zuoriyiran20@163.com, Tel: 0372-2525370
Received(收稿日期): 2012-06-20; Accepted(接受日期): 2012-10-09; Published online(网络出版日期): 2012-12-11.
URL: http://www.cnki.net/kcms/detail/11.1809.S.20121211.1705.011.html
DOI: 10.3724/SP.J.1006.2013.00222
三个陆地棉水孔蛋白基因的克隆与表达分析
李 伟 1,2 商海红 2 王少干 2 范森淼 2 李俊文 2 刘爱英 2 石玉真 2
龚举武 2 巩万奎 2 王 涛 2 白志川 1,* 袁有禄 2,*
1 西南大学园艺园林学院, 重庆 400716; 2 中国农业科学院棉花研究所 / 棉花生物学国家重点实验室, 河南安阳 455000
摘 要: 从陆地棉 SSH-cDNA 文库的测序结果中得到一条具有完整 ORF 的陆地棉水孔蛋白基因序列, 将其命名为
GhAQP2。以该基因编码的氨基酸序列为探针, 在棉花EST数据库经同源搜索得到 2个相似性较高的EST, 利用RACE
技术获得其全长 cDNA 序列, 将其基因命名为 GhAQP3 和 GhAQP4。基因结构分析发现 GhAQP2 和 GhAQP3 各有 4
个外显子, 3个内含子; GhAQP4有 3个外显子, 2个内含子。生物信息分析表明 3个基因编码蛋白均含有 6个跨膜区,
2个 NPA结构域, 其氨基酸序列具备 MIP超家族典型的蛋白保守区序列特征。多序列比对发现 3个基因的氨基酸序
列与其他物种 PIP2类水孔蛋白氨基酸序列具有很高的同源性。qRT-PCR分析表明, GhAQP2在纤维伸长后期优势表
达, GhAQP3在下胚轴和子叶中高表达, GhAQP4在纤维伸长前期优势表达, 推测 3个基因在不同的组织中发挥作用。
GhAQP2在 20DPA优势表达, 为研究该基因在纤维伸长向次生壁加厚期转化过程中的表达调控提供了重要信息。
关键词: 陆地棉(Gossypium hirsutum L.); 棉纤维; 水孔蛋白基因; 序列分析; 结构分析; 表达模式
Cloning and Expression Analysis of Three Aquaporin Genes in Upland Cotton
(Gossypium hirsutum L.)
LI Wei1,2, SHANG Hai-Hong2, WANG Shao-Gan2, FAN Sen-Miao2, LI Jun-Wen2, LIU Ai-Ying2, SHI
Yu-Zhen2, GONG Ju-Wu2, GONG Wan-Kui2, WANG Tao2, BAI Zhi-Chuan1,*, and YUAN You-Lu2,*
1 Horticulture and Landscape College, Southwest University, Chongqing 400716, China; 2 Cotton Research Institute, Chinese Academy of Agricultural
Sciences, State Key Laboratory of Cotton Biology, Anyang 455000, China
Abstract: To provide an insight into molecular mechanism of cotton fiber development, we analyzed the sequence characteristics
of three aquaporin genes in Gossypium hirsutum L. and their expression profiling in the different tissues. Based on the bioinfor-
matic analysis of the ESTs from the cotton fiber SSH-cDNA library, we obtained a cDNA sequence with an ORF of 927 bp, which
has the homolog sequence of aquaporin genes, and it was designated as GhAQP2. With the protein sequence of GhAQP2 as a
probe, two homologous ESTs in G. hirsutum database were screened out, and the rapid-amplification of cDNA ends (RACE) was
used to amplify the full length cDNAs of GhAQP genes (designated as GhAQP3 and GhAQP4). Bioinformatic analysis showed
that GhAQP2 and GhAQP3 were composed of four exons and three introns, GhAQP4 had three exons and two introns in com-
parison of their sequences of genomic DNA and cDNA by DNAMAN. GhAQP2, GhAQP3, and GhAQP4 exhibited a typical
structure with six transmembrane domains which linked by five loops and had the consensus sequence HINPAVTFG of MIP fam-
ily and two highly conserved peptides Asn-Pro-Ala (NPA). These deduced amino acids showed high identity with the aquaporin of
PIP2 subfamily reported from other plant species by multiple alignment analysis. The tissue specific expression analysis by using
quantitative RT-PCR assays indicated that GhAQP2 expressed predominantly in 20 DPA fiber cell, while GhAQP3 expressed
highly in the hypocotyl and cotyledon. Moreover, GhAQP4 showed highly significant expression level in 10 DPA fiber cell, hy-
pocotyl and cotyledon. These results suggested that the three GhAQP genes might play different roles in different cotton tissues.
The result of GhAQP2 predominantly expressed in 20 DPA fiber cell, provides important information for the further research on
the gene-expression regulation during developmental stages from fiber cell elongation to secondary cell wall synthesis.
Keywords: Gossypium hirsutum L.; Cotton fiber; Aquaporin genes; Sequence analysis; Structure analysis; Expression patterns
第 2期 李 伟等: 三个陆地棉水孔蛋白基因的克隆与表达分析 223
植物 Aquaporin (AQP)由多基因家族编码。目前,
编码 AQP的基因已在拟南芥(Arabidopsis thaliana)、
玉米(Zea mays)和水稻(Oryza sativa L.)等基因组中
被发现, 其中拟南芥中发现 35个[1]、玉米中有 36个[2]、
水稻中分离到 33个[3]。近年来, 棉花 AQP基因的功
能研究得到了国内的关注 , Smart 等 [4]从陆地棉
(Gossypium hirsutum L.)纤维 cDNA文库中分离到一
个 AQP基因片段, 在花后 5~15 d (5~15DPA)纤维中
有一定量的表达。李登第等[5]从陆地棉 cDNA 文库
中筛选出一个胚珠优势表达基因 GhAQP1, 在 9DPA
胚珠中特异表达并受胚珠发育调节。Liu等[6]从陆地
棉 SSH-cDNA文库中筛选出 GhPIP1-2, 其表达量在
5 DPA 达到峰值, 之后随纤维细胞的伸长而逐渐降
低。目前, 棉花 AQP的研究主要集中在纤维发育的
伸长期, 在其他组织中 [7]及在纤维伸长到次生壁加
厚转折期的相关研究报道均较少。
本研究在实验室已构建的陆地棉开花后 20 d纤
维 SSH-cDNA 的基础上, 克隆了 GhAQP2 基因, 并
利用同源克隆方法得到了 GhAQP3和 GhAQP4的编
码区。对这 3 个基因进行相关生物信息学分析, 了解
基因序列特征 ; 并利用实时荧光定量 PCR 技术
(Quantitative Real-time PCR, qRT-PCR)研究 3个基因
在棉花不同组织中的表达特性, 以期推测其功能并
通过调控基因表达来改良棉花纤维品质和产量。特
别是对在纤维伸长向次生壁加厚转化阶段优势表达
的 GhAQP2 的研究, 不仅为该基因在该时期表达调
控提供了重要信息, 而且为进一步改良棉花纤维品
质和产量奠定了研究基础。
1 材料与方法
1.1 试验材料
从纤维高断裂比强度品系 0-153 和转基因抗虫
棉 sGK9708为亲本构建的高代重组自交系群体(F6:9)
中选育出纤维高断裂比强度系 69307 [8-9], 于 2011年
4月 15日将其种植于中国农业科学院棉花研究所试
验农场, 开花当天挂牌标记为 0 DPA, 按照开花后
不同时期(10、15、18和 20 DPA)收取棉铃, 用镊子
将纤维从胚珠上小心剥取后以液氮速冻, –70℃冰箱
保存备用; 棉花种子经脱绒灭菌后沙培到子叶平展
期, 分别取子叶和下胚轴以液氮速冻, –70℃冰箱保
存备用; 将子叶平展期幼苗转至 Hogland [10]营养液
水培, 取四叶期茎尖, 于–70℃冰箱保存备用。
1.2 试验试剂
TIANDZ 植物总 RNA 提取试剂盒购自 Invitr-
ogen公司; 3′-full RACE Kit、pMD-18T Vector、SYBR
Green Real-time PCR Master Mix均购自 TaKaRa公
司。大肠杆菌(Escherichia coli)菌株 DH5α保存于本
实验室。实验所需引物的合成和 DNA测序均由生工
生物工程(上海)有限公司完成。
1.3 棉花基因组 DNA(gDNA)与总 RNA提取
采用 CTAB 法提取棉花叶片基因组 DNA (Ge-
nomic DNA, gDNA) [11]。利用植物总 RNA提取试剂
盒, 参照其说明书提取棉纤维组织及非纤维组织(下
胚轴、茎和子叶)总 RNA。利用琼脂糖凝胶电泳检测
gDNA 和总 RNA 完整性, Thermo Scientific NaNo-
Drop 2000c检测 gDNA和总 RNA浓度及纯度。
1.4 GhAQP2、GhAQP3和 GhAQP4基因来源
以纤维高断裂比强度系 69307[8-9]为材料, 构建
一个陆地棉开花后 20 d纤维的 SSH-cDNA文库, 从
反向 Northern 验证得到的阳性克隆测序结果中, 得
到一条具有完整 CDS区的 EST序列, 该序列与陆地
棉 PIP2类水通道蛋白具有较高的同源关系, 被命名
为 GhAQP2。并以其氨基酸序列作为探针 , 利用
tBlastn从 NCBI数据库中的陆地棉(G. hirsutum) EST
数据库检索得到 2 条序列相似性较高的序列 DW-
485949 (2E–166)和 CO499537 (1E–153)。
1.5 GhAQP2、GhAQP3和 GhAQP4的 cDNA全
长序列克隆及基因组序列扩增
以开花后10 d棉纤维总RNA为模板, 利用 3′-full
RACE试剂盒自带引物(3′RACE Outer Primer: 5′-TA
CCGTCGTTCCACTAGTGATTT-3′), 根据 DW485949
和 CO499537序列, 设计结合基因特异性引物(GhAQ-
P3-F: 5′-GGTGACGTTTGGACTGTTCG T-3′; GhAQ-
P4-F: 5′-TGTCGAAGGAAGTGAGTGAAG-3′), 进行
3′RACE 扩增, 得到 2 个基因的全长 cDNAs。同时,
以棉花叶片 gDNA为模板, 根据 3个基因的 CDS区
设计引物(表 1, 引物 P1、P2、P3), 进行基因组序列
扩增, 得到其基因组全长序列。
1.6 生物信息学分析
用 NCBI (http://www.ncbi.nlm.nih.gov/)中 BlastN
进行序列同源性分析; 利用 ORF Finder (http://www.
ncbi.nlm.nih.gov/gorf/gorf.html)进行编码区分析; 选
用 ProtParam (http://web.expasy.org/protparam)和
Predictprotein (http://www.predictprotein.org/)分别分析
蛋白序列氨基酸基本理化性质和跨膜结构域; 采用
NCBI中的 CDD[12]数据库(conserved domain database,
CDD, http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.
cgi)和 Hmmscan (http://www.hmmer.janelia.org/)分析
224 作 物 学 报 第 39卷
蛋白保守区和结构域。用 NCBI Splign [13]比对 cDNA
序列与基因组 DNA, 采用 DNAMAN 软件进行基因
结构作图。利用 ClustalW (http://www.ebi.ac.uk/
Tools/msa/clustalw2)进行氨基酸多序列比对, 采用
MEGA4.0 (Neighbor-Joining 法)构建系统进化树。
1.7 qRT-PCR纤维表达特性分析
根据 3 个基因的序列, 设计特异 qRT-PCR 引物
(表 1, 引物 P4、P5、P6), 以 69307材料不同组织(10
DPA、15 DPA、18 DPA、20 DPA、子叶、下胚轴、
茎 )总 RNA 合成的第一链 cDNA 为模板 , 棉花
Histone-3 (AF024716)作为内参基因[14] (表 1, 引物
P7)。利用 ABI7500 FAST Real-time PCR实时荧光定
量 PCR仪检测目的基因表达模式。反应体系 25 μL,
含 2×Ultra SYBR 混合液(with ROX) 12.5 μL、10
μmol L–1正反向引物各 0.5 μL、cDNA模板 2.5 μL、
去离子水 9 μL。扩增程序为 95℃ 10 min; 95℃ 15 s;
60℃ 35 s; 72℃ 35 s (收集荧光信号); 40个循环。采用
2–ΔΔCT法对目标基因进行相对定量的差异表达分析。
2 结果与分析
2.1 GhAQP3和GhAQP4的 cDNA全长序列的克隆
从棉花开花后 20 d纤维的 SSH-cDNA中筛选出
一个陆地棉水孔蛋白编码序列 , 分析发现其包含
927 bp的完整 CDS区, 编码 308个氨基酸, 将其命
名为 GhAQP2。以 GhAQP2编码的氨基酸为探针, 从
陆地棉 EST数据库中得到 2条相似性较高的 EST序
列 DW485949 (2E–166)和 CO499537(1E–153)。ORF
Finder 分析发现 EST-DW485949 和 CO499537 的
CDS区不完整, 缺乏终止密码子。利用 3′-RACE技
术, 以开花后 10 d棉纤维的总 RNA为模板, 分别扩
增了 847 bp和 967 bp, 从而获得其完整 3′端 cDNA
序列(图 1), 与相应的 EST拼接, 得到其 cDNA全长
序列, 并设计引物进行验证, 发现与拼接结果一致,
将其命名为 GhAQP3 和 GhAQP4, 其全长 cDNA 序
列分别为 1242 bp和 1156 bp, 各包含 856 bp和 837
bp的 CDS区, 编码 291个和 278个氨基酸残基。
2.2 GhAQP2、GhAQP3和 GhAQP4基因结构分析
利用 cDNA 序列设计特异性引物 (表 1), 以
69307 材料的 gDNA 为模板, 扩增得到 GhAQP2、
GhAQP3 和 GhAQP4 编码区基因组全长序列(图 2),
其长度分别为 1547、1588和 1325 bp; 将基因组全长
DNA序列与 cDNA序列比较, 发现GhAQP2和GhAQP3
各由 4个外显子和 3个内含子构成, 而 GhAQP4 只含
有 3个外显子和 2个内含子(图 3)。
2.3 GhAQP2、GhAQP3和 GhAQP4推导的氨基
酸序列分析
利用 ProtParam对 3个 AQP基因推导的蛋白质
序列进行基本理化性质和二级结构的分析发现, 三
者均具备跨膜结构必需的 α-螺旋等典型结构(表 2)。
利用 Predictprotein对蛋白序列的跨膜结构域分析表
明, GhAQP2、GhAQP3和 GhAQP4蛋白均含有由 5
个环相连构成的跨膜区域。利用 BlastP 在蛋白保守
区数据库 (conserved domain database, CDD)中对
GhAQP2、GhAQP3和 GhAQP4蛋白质进行保守区预
测发现 3个基因均具备 MIP蛋白家族的典型保守序
列“HINPAVTFG”和 2 个“NPA”保守肽段, 其 E 值分
别为 9.95E–65、4.17E–62和 4.76E–68, 推测 3 个基
因均为 AQP 蛋白基因家族的成员。利用 Hmmscan
分析 3 个蛋白的结构域表明, 均与 MIP 超家族的典
型结构域 PF00230.15具有较高的相似性, GhAQP2、
GhAQP3和 GhAQP4蛋白与MIP超家族氨基酸序列
匹配的区域分别是 33~270、35~272和 28~257, Domain
E-values中 Ind和 Cond值分别为 5.2E–88、3.8E–92,
6.0E–87、4.4E–91、2.7E–84和 2.0E–88。
表 1 GhAQP2、GhAQP3和 GhAQP4克隆需用的引物
Table 1 Primers for GhAQP2, GhAQP3, and GhAQP4 isolation
正向引物 Forward primer 反向引物 Reverse primer 引物编号
Primer ID 名称 Name 序列 Sequence 名称 Name 序列 Sequence
P1 GhAQP2-F CTGTTTCATTTTTCAGCAAAGC GhAQP2-R GGTCCACACTGAACTCAAGGTT
P2 GhAQP3-F TTCACAGCTTAAAACACAATATGACT GhAQP3-R AAAGCCCAAGCAATACCAAGT
P3 GhAQP4-F TGGCCCTTAGCACTTGCCTTC GhAQP4-R TGAGACAAACATATTGTGGTT
P4 GhAQP2-qF GTGGCGTTGGTATTCTTGGTAT GhAQP2-qR CCCCCGTAGTTGTTGTAGTAGG
P5 GhAQP3-qF GCCACCCTTCTTTTCTTGTATG GhAQP3-qR AAAGCCCAAGCAATACCAAGT
P6 GhAQP4-qF GGAAAAGGAGAGTAGCGATGAA GhAQP4-qR GGAAGTGAGTGAAGAAGGGATG
P7 Histon3-qF GAAGCCTCATCGATACCGTC Histon3-qR CTACCACTACCATCATGTC
第 2期 李 伟等: 三个陆地棉水孔蛋白基因的克隆与表达分析 225
图 1 GhAQP3和 GhAQP4的 3′-RACE扩增
Fig. 1 3′-RACE amplification of GhAQP3 and GhAQP4
M: marker; 1: GhAQP3; 2: GhAQP4.
图 2 GhAQP2、GhAQP3和 GhAQP4的基因全长扩增
Fig. 2 Full-length DNA amplification of GhAQP2, GhAQP3,
and GhAQP4
1–3: fragment size of full-length DNA of GhAQP4, GhAQP3, and
GhAQP2, respectively; M: marker.
2.4 GhAQP2、GhAQP3和 GhAQP4多序列比对
用 ClustalW 将 GhAQP2、GhAQP3和 GhAQP4
蛋白序列与部分棉花AQP蛋白氨基酸序列多重比对
发现: 3个基因均具有由 5个短环(A-E)连接的 6个跨
膜螺旋(1~6), 以及 MIP超家族典型的保守氨基酸序
列“HINPAVTFG”和 2个“NPA”保守结构域(图 3)。PIPs
类蛋白序列多重比对分析发现, PIP2 类水孔蛋白具有
较长的 C-末端, N-末端和 C-末端氨基酸均具有比较大
的可变性; 而 PIP1类水孔蛋白的 N末端较大, 保守性
相对略低(图 3), 由此也可以推测 GhAQP2、GhAQP3
和 GhAQP4均属于 PIP2类水孔蛋白。
利用 GhAQP2、GhAQP3 和 GhAQP4 与棉花和
其他物种的 AQP 蛋白序列做 Neighbor-Joining 进化
树发现 GhAQP2与蓖麻(Ricinus communis) RcPIP2-1
聚于同一个小的分支, 说明这2个蛋白同源性很高, 二
者均属于 PIP2类亚家族(图 4)。而 GhAQP2、GhAQP3
与蓖麻(Ricinus communis) RcPIP2-1聚于同一个亚支,
可见 3个蛋白的同源性也较高。GhAQP4与 GhPIP2-6、
AtPIP2-8、GhPIP2-3和 GhPIP2-4形成一个亚支, 其
同源性较高, 属于 PIP2类亚家族的蛋白。
2.5 GhAQP在棉花不同组织中的表达特征分析
利用 qRT-PCR分析发现, GhAQP2、GhAQP3和
GhAQP4 在棉花不同组织中有不同的表达模式(图
5)。GhAQP2在纤维发育的后期优势表达, 随着棉纤
图 3 GhAQP2、GhAQP3和 GhAQP4的基因结构
Fig. 3 Gene Structure of GhAQP2, GhAQP3, and GhAQP4
表 2 GhAQP2、GhAQP3和 GhAQP4基因推导的氨基酸序列分析
Table 2 Sequence analysis of the deduced amino acids of GhAQP2, GhAQP3, and GhAQP4
蛋白质二级结构 Secondary structure 基本理化性质 Basic physical and chemical properties
名称
ID α-螺旋
α-helix (%)
β-折叠
β-folding (%)
Loop-环
Loop-ring (%)
分子量
Molecular weight (kD)
等电点
Isoelectric point
平均亲水系数
Average hydrophilic
coefficient
GhAQP2 40.60 6.80 52.60 33.2 7.65 0.295
GhAQP3 43.64 6.53 49.83 31.1 6.41 0.429
GhAQP4 48.20 4.68 47.12 29.6 8.99 0.501
226 作 物 学 报 第 39卷
图 4 棉花 GhAQP2、GhAQP3和 GhAQP4的多序列比对
Fig. 4 Multiple sequence alignment of GhAQP2, GhAQP3, and GhAQP4
1~6为高度保守的亲水跨膜螺旋; NPA是由高度保守的 3个氨基酸(Asn-Pro-Ala)组成的基序; 序列比对图中, 对同源性=100%和同源性
≥75%的氨基酸分别用黑色、灰色背景表示。
Regions 1–6 represent the typical conserved hydrophilic transmembrane helix; NPA domain is composed of highly conserved amino acid
(Asn-Pro-Ala) composition of the motif; in the alignment of nine predicted amino acid sequences with ClustalW, residues with homology of
100% are heavily shaded, and those with ≥75% are lightly shaded.
维细胞发育时期的延长, 到 20 DPA表达量最高, 而
在下胚轴、茎和子叶中的表达量较低, 推测该基因
可能与纤维细胞伸长向次生壁加厚期转化阶段的水
分代谢有关; GhAQP4 在纤维组织和非纤维组织中
均有一定量表达, 在 10 DPA纤维中表达量最高, 之
后随着纤维细胞快速伸长, 其表达量逐渐降低, 表
第 2期 李 伟等: 三个陆地棉水孔蛋白基因的克隆与表达分析 227
明其参与纤维细胞伸长, 但与 Histon-3 相比, 其相
对表达量并不太高, 且在下胚轴、子叶和茎尖中均
有表达, 具备组成型表达的特点; GhAQP3在下胚轴
和子叶中表达量很高, 分别是Histon-3表达量的 600
倍和 1000 倍左右, 而在纤维组织中基本不表达, 说
明该基因具有一定的组织器官特异性。从 3 个基因
的表达模式可以推测, 这 3个棉花 AQP基因功能发
生了明显的分化 , 具备不同的表达模式 , 其中
GhAQP2 和 GhAQP3 具备部分特异表达的特性 ,
GhAQP4则具备组成型表达的特点。
图 5 GhAQP2、GhAQP3和 GhAQP4的系统进化树
Fig. 5 Phylogenetic tree of GhAQP2, GhAQP3, and GhAQP4
GhAQP2、GhAQP3、GhAQP4、GhPIP2-3、GhPIP2-4、GhPIP2-6、
GhPIP1-2、GhγTIP1、GhNIP1-2、GhSIP1-2、GhNIP6-5: 棉花
AQP; RcPIP2-2、RcPIP2-1、RcPIP2-7: 蓖麻 AQP; GmPIP2-7: 大
豆 AQP; PtPIP2-1: 杨树 AQP; VvPIP2-7: 葡萄 AQP; AtPIP2-4、
AtPIP2-8: 拟南芥 AQP。进化树分支上数字为 Bootstrap值。
GhAQP2, GhAQP3, GhAQP4, GhPIP2-3, GhPIP2-4, GhPIP2-6,
GhPIP1-2, GhγTIP1, GhNIP1-2, GhSIP1-2, and GhNIP6-5: AQP of
G.. hirsutum; RcPIP2-2, RcPIP2-1, and RcPIP2-7: AQP of R. com-
munis; GmPIP2-7: AQP of Glycine max; PtPIP2-1: AQP of Populus
trichocarpa; VvPIP2-7: AQP of Vitis vinifera; AtPIP2-4 and At-
PIP2-8: AQP of Arabidopsis. The number in each clade represents
bootstrap value.
3 讨论
AQP是一类在细胞膜上高效选择性转运水分子
和其他物质的膜通道蛋白。根据亚细胞定位、结构
特征及氨基酸序列同源性可将其分为 PIPs (位于质
膜)、TIPs (位于液泡膜)、NIPs ( 廇与大豆根 菌周膜
上水通道蛋白 NOD26类似的通道蛋白)、SIPs (内质
网与质膜上的碱性小分子内在蛋白) 4大类[7]。本研
究在已构建的陆地棉开花后 20 d纤维 SSH-cDNA文
库的基础上, 得到了 GhAQP2 基因, 通过序列比对
获得 2 个与 GhAQP2 基因同源性较高的 EST, 在此
基础上, 通过 RACE 方法获得 GhAQP3 和 GhAQP4
基因全长 cDNAs。并根据 3个基因序列设计引物, 扩
增得到了相应的基因组DNA序列, 对其结构分析发
现 GhAQP2和 GhAQP3是各由 4个外显子和 3个内
含子组成, 而 GhAQP4有 3个外显子和 2个内含子,
推测 GhAQP4 可能在进化的过程中丢失了一个内含
子。在拟南芥中, PIPs类均有 3个内含子, 而 AtPIP2-4
也有内含子丢失的现象[15]。
通过预测 3 个基因的蛋白质序列发现, 三者均
有典型的跨膜域, 属跨膜结合蛋白, 与 MIP 超家族
的典型特点一致[16-19]。多序列比对与进化树分析发
现, 与拟南芥和蓖麻的AQP蛋白同源性较高, 3个基
因具备水通道蛋白 PIP 亚家族的保守结构域, 因此推
测它们为 AQP基因家族中的 PIP2类亚家族的成员。
AQP 基因广泛参与植物各种重要生命活动。例如, 调
节种子萌发[20]和逆境应答[21-22]等过程水分的跨膜快速
流动等。在细胞水平上, PIPs类水孔蛋白主要参与细胞
水分的吸收与外排, 而 TIPs类则通过维持细胞的动态
平衡来调节膨压, 通过两类亚家族协调作用, 共同维
持细胞结构的完整性[23]。此外, 有研究表明 PIP2亚家
族基因可能参与烟草花药的脱水开裂[24], 并通过调节
水分的代谢参与植物的生长和脱水等过程。我们分析,
GhAQP2、GhAQP3 和 GhAQP4 编码的蛋白序列中均
包含有“HINPAVTFG”和 2 个“NPA”高度保守区域, 这
2个结构域在其他的 AQP中直接参与水分代谢, 从而
推测这 3 个基因可能参与棉花不同组织中水分子的结
合和选择性运输[25]。
根据表达特征, AQP 分为组成型表达和特异型
表达两类。如烟草 NtAQP1在所有器官中都表达, 属
组成型表达[26]。而 NOD26只在大豆根瘤中细菌与植
物共生膜中表达, 属特异型表达[27]。在棉花中, Liu
等[6]发现 GhPIP1-2和 GhγTIP1在 5~15 DPA纤维中
大量表达, 可能参与细胞胞间连丝的拉伸和可溶性
糖、K+和苹果酸酯的输入, 但在次生壁形成起始阶
段表达量下降。李登第等 [5]研究发现 GhAQP1 在
9DPA 的胚珠中特异表达, 推测其主要参与胚珠生长
228 作 物 学 报 第 39卷
图 6 GhAQP2、GhAQP3和 GhAQP4在棉花各器官组织中的差异表达
Fig. 6 Differential expression of GhAQP2, GhAQP3 and GhAQP4 in different organs and tissues in Gossypium hirsutum L.
H10、H15、H18、H20分别代表开花后 10、15、18和 20 d的纤维; H: 下胚轴; S: 茎; C: 子叶。
H10: 10 DPA; H15: 15 DPA; H18: 18 DPA; H20: 20 DPA; H: hypocotyl; S: stem; C: cotyledon.
的渗透调节; 另有研究证明[28]GhPIP2-3 和 GhPIP2-4
在棉纤维伸长期高量表达, 可能在纤维细胞伸长过
程中参与了水分快速进出, 进而调节纤维细胞的渗
透平衡和膨胀[29]。与以往棉花中克隆的 AQP基因比
较[5-6,29], 本研究中 GhAQP2 具有不同的表达模式,
该基因在棉纤维伸长后期优势表达; 而 GhAQP3 在
纤维中基本不表达, 在下胚轴、子叶中有较高的表
达量 , 说明该基因具有一定的组织器官特异性 ;
GhAQP4 在纤维细胞和非纤维细胞中均表达, 但其
相对表达量并不高, 具备组成型表达的特点。
PIPs 类能够促进水分快速流入正在伸长的细胞
液泡 [30-31], 同时也有研究表明 , 过量表达拟南芥
AtPIP1b 可以增加水分的消耗[32]。在棉花纤维伸长
向次生壁加厚期过渡后, 其细胞的水分含量逐步降
低, 而 GhAQP2 在纤维细胞伸长向次生壁加厚转化
阶段表达量逐渐增加, 因此我们推测该基因可能与
纤维细胞的水分消耗有关, 对于该基因如何行使其
功能, 我们正在进行下一步的研究。
4 结论
从陆地棉中分离克隆出 3 个基因 GhAQP2、
GhAQP3 和 GhAQP4, 其编码的蛋白均属于 PIP2 亚
家族。GhAQP2在纤维伸长后期优势表达; GhAQP3
在子叶和下胚轴中表达较高; 而 GhAQP4 在纤维细
胞和非纤维细胞中均表达, 在伸长前期有相对的表
达优势, 但相对表达量较少。结果暗示, 这 3个基因
发生了功能分化, GhAQP2 在纤维细胞伸长向次生
壁加厚转化阶段表达量逐渐增加, 该基因可能与纤
维细胞的水分含量降低有关。
References
[1] Johanson U, Karlsson M, Johansson I, Gustavsson S, Sjovall S,
Fraysse L, Weig A R, Kjellbom P. The complete set of genes en-
coding major intrinsic proteins in Arabidopsis provides a frame-
work for a new nomenclature for major intrinsic proteins in
plants. Plant Physiol, 2001, 126: 1358–1369
[2] Chaumont F, Barrieu F, Wojcik E, Chrispeels M J, Jung R. Aq-
uaporins constitute a large and highly divergent protein family in
maize. Plant Physiol, 2001, 125: 1206–1215
[3] Sakurai J, Ishikawa F, Yamaguchi T, Uemura M, Maeshima M.
Identification of 33 rice aquaporin genes and analysis of their ex-
pression and function. Plant Cell Physiol, 2005, 46: 1568–1577
[4] Smart L B, Vojdani F, Maeshima M, Wilkins T A. Genes involved
in osmoregulation during turgor-driven cell expansion of deve-
loping cotton fibers are differentially regulated. Plant Physiol,
1998, 116: 1539–1549
[5] Li D-D(李登第), Huang G-Q(黄耿青), Tan X(谭新), Wang J(王
杰), Wang X-L(王秀兰), Xu W-L(许文亮), Wu Y-J(吴雅洁),
Wang H(汪虹), Li X-B(李学宝). Cloning and GhAQP1 gene and
its specific expression during ovule development in cotton. Plant
Physiol Mol Biol (植物生理与分子生物学学报), 2006, 32(5):
543–550 (in Chinese with English abstract)
[6] Liu D Q, Tu L I, Wang L, Li Y J, Zhu L F, Zhang X L. Charac-
terization and expression of plasma and tonoplast membrane aq-
uaporins in elongating cotton fibers. Plant Cell Rep, 2008, 27:
1385–1394
[7] Park W, Scheffler B E, Bauer P J, Campbell B T. Identification of
the family of aquaporin genes and their expression in upland cot-
ton (Gossypium hirsutum L.). BMC Plant Biol, 2010, 10:
1471–2229
[8] Sun F-D(孙福鼎), Li J-W(李俊文), Liu A-Y(刘爱英), Shi
Y-Z(石玉真), Wang T(王涛), Zhang J-H(张建宏), Wang S-F(王
淑芳), Yuan Y-L(袁有禄). Analysis of genetic variation for fiber
quality and yield traits in a recombinant inbred population of
第 2期 李 伟等: 三个陆地棉水孔蛋白基因的克隆与表达分析 229
Gossypium hirsutum L. Cotton Sci (棉花学报), 2010, 22(4):
319–325 (in Chinese with English abstract)
[9] Ji Z-B(计志斌), Shang H-H(商海红), Yan H-C(闫恒超), Wang
S-G(王少干), Li J-W(李俊文), Liu A-Y(刘爱英), Shi Y-Z(石玉
真), Gong J-W(龚举武), Gong W-K(巩万奎), Wang T(王涛),
Yuan Y-L(袁有禄). Gene expression profile analyses of cotton
fiber during secondary cell wall deposition. Mol Plant Breed (分
子植物育种), 2011, 9(3): 327–335 (in Chinese with English ab-
stract)
[10] Han L(韩璐), Zhang W(张薇). Screening of cotton varieties with
high nitrogen efficiency at seedling stage. Chin Agric Sci Bull (中
国农学通报), 2011, 27(1): 84–88 (in Chinese with English ab-
stract)
[11] Paterson A H, Brubaker C L, Wendel J F. A rapid method for ex-
traction of cotton (Gossypium spp.) genomic DNA suitable for
RFLP or PCR analysis. Plant Mol Biol, 1993, 11: 122–127
[12] Marchler-Bauer A, Lu S, Anderson J B, Chitsaz F, Derbyshire M
K, DeWeese-Scott C, Fong J H, Geer L Y, Geer R C, Gonzales N
R, Gwadz M, Hurwitz D I, Jackson J D, Ke Z, Lanczycki C J, Lu
F, Marchler G H, Mullokandov M, Omelchenko M V, Robertson
C L, Song J S, Thanki N, Yamashita R A, Zhang D, Zhang N,
Zheng C, Bryant S H. CDD: a conserved domain database for the
functional annotation of proteins. Nucl Acids Res, 2011, 39:
225–229
[13] Kapustin Y, Souvorov A, Tatusova T, Lipman D. Splign: algo-
rithms for computing spliced alignments with identification of
paralogs. Biol Direct, 2008, 3: 20
[14] Tu L-L(涂礼莉), Zhang X-L(张献龙), Liu D-Q(刘迪秋), Jin
S-X(金双侠), Cao J-L(曹景林), Zhu L-F(朱龙付), Zheng F-L(郑
锋林), Tan J-F(谭家福), Zhang C-B(张存斌). Screening control
gene of real-time quantitative PCR in cotton fiber development
and somatic embryogenesis. Chin Sci Bull (科学通报), 2007,
52(20): 2379−2385 (in Chinese with English abstract)
[15] Luo P, Wang Y H, Wang G D, Essenberg M, Chen X Y. Molecular
cloning and functional of (+)-δ-cadinene-8-hydroxylase, a cyto-
chrome P450 mono-oxygenase (CYP706B1) of cotton sesquiter-
pene biosynthesis. Plant J, 2001, 28: 95−104
[16] Fu D, Libson A, Miercke L J, Weitzman C, Nollert P, Krucinski J,
Stroud R M. Structure of a glycerol conducting channel and the
basis for its selectivity. Science, 2000, 290: 481–486
[17] Murata K, Mitsuoka K, Hirai T, Walz T, Agre P, Heymann J B,
Engel A, Fujiyoshi Y. Structural determinants of water per-
meation through aquaporin-1. Nature, 2000, 407: 599–605
[18] Reizer J, Reizer A, Saier M H Jr. The MIP family of integral
membrane channel proteins: sequence comparisons, evolutionary
relationships, reconstructed pathway of evolution, and proposed
functional differentiation of the two repeated halves of the pro-
teins. Crit Rev Biochem Mol Biol, 1993, 28: 235–257
[19] Jung J S, Preston G M, Smith B L, Guggino W B, Agre P. Mo-
lecular structure of the water channel through aquaporin CHIP.
The hourglass model. J Biol Chem, 1994, 269: 146–148
[20] Johnson K D, Herman E M, Chrispeels M J. An abundant, highly
conserved tonoplast protein in seeds. Plant Physiol, 1989, 91:
1006–1013
[21] Alexandersson E, Danielson J A, Råde J, Moparthi V K, Fontes
M, Kjellbom P, Johanson U. Transcriptional regulation of aqu-
aporins in accessions of Arabidopsis in response to drought stress.
Plant J, 2010, 61: 650–660
[22] Jang J Y, Lee S H, Rhee J Y, Chung G C, Ahn S J, Kang H S.
Transgenic Arabidopsis and tobacco plants overexpressing an
aquaporin respond differently to various abiotic stresses. Plant
Mol Biol, 2007, 64: 621–632
[23] Fotiadis D, Jeno P, Mini T, Wirtz S, Muller S A, Fraysse L,
Kjellbom P, Engel A. Structural characterization of two
aquaporins isolated from native spinach Leaf plasma membranes.
J Biol Chem, 2001, 276: 1707–1714
[24] Bots M, Vergeldt F, Wolters-Arts M, Weterings K, van As H,
Mariani C. Aquaporins of the PIP2 class are required for efficient
anther dehiscence in tobacco. Plant Physiol, 2005, 137:
1049−1056
[25] Jiang Y(姜勇), Ma T-H(麻彤辉). The importance of NPA motif
in the expression of AQP1 and function of turning the water. Chin
Sci Bull (科学通报), 2007, 52(4): 426–431 (in Chinese)
[26] Otto B, Kaldenhoff R. Cell-specific expression of the mer-
cury-insensitive plasma-membrane aquaporin NtAQP1 from
Nicotiana tabacum. Plant, 2000, 211: 167–172
[27] Santoni V, Gerbeau P, Javot H, Maurel C. The high diversity of
aquaporins reveals novel facets of plant membrane functions.
Curr Opin Plant Biol, 2000, 3: 476–481
[28] Li D-D(李登第). Cloning and Analyses of Expression and Func-
tion of the Genes Encoding Aquaporins in Cotton (Gossypium
hirsutum L.). PhD Dissertation of Center China Normal Univer-
sity, 2009 (in Chinese with English abstract)
[29] Wu Y-J(吴雅洁 ). Cloning and Analyses of Expression and
Transgenic Research of PIP Genes and HB Genes in Cotton. PhD
Dissertation of Center China Normal University, 2008 (in Chi-
nese with English abstract)
[30] Ludevid D, Höfte H, Himelblau E, Chrispeels M J. The expres-
sion pattern of the tonoplast intrinsic protein γ-TIP in Arabidopsis
thaliana is correlated with cell enlargement. Plant Physiol, 1992,
100: 1633–1639
[31] Eisenbarth D A, Weig A R. Dynamics of aquaporins and water
relations during hypocotyl elongation in Ricinus communis L.
seedlings. J Exp Bot, 2005, 56: 1831–1842
[32] Aharon R, Shahak Y, Wininger S, Bendov R, Kapulnik Y, Galili G.
Overexpression of a plasma membrane aquaporin in transgenic
tobacco improves plant vigor under favorable growth conditions
but not under drought or salt stress. Plant Cell, 2003, 15:
439–447