免费文献传递   相关文献

Adaptive Evolution in the PHY-PAS1 Domain of PHYP in Gymnosperms

裸子植物中光敏色素PHY-PAS1 结构域的适应性进化


光敏色素是一类红光/远红光受体, 在植物种子萌发到成熟的整个生长发育过程中均起重要的调节作用。光敏色素PHYPAS1 结构域存在于光敏色素基因家族的所有成员中, 对调节发色团的光谱特性和光信号转导非常关键。光敏色素基因家族通过基因重复产生, 而基因重复可能与物种形成有关。PHYP基因是裸子植物光敏色素基因家族发生第1次重复后产生的, 并且以单拷贝形式存在。为了研究不同裸子植物PHYP基因编码蛋白的PHY-PAS1结构域在进化过程中是否受到相同的选择压力以及是否发生了适应性进化, 该研究利用分支模型、位点模型以及分支-位点模型对裸子植物31条PHYP基因序列编码蛋白的PHY-PAS1结构域所受到的选择压力进行了分析。结果表明, 在由PHY-PAS1结构域序列构建的系统树中, 多数分支处于强烈的负选择压力下 (w<1); 有14个分支处于正选择压力下 (w>1), 其中13个分支发生在属内种间; 与之相比, 在较为古老的谱系中相对缺少这种正选择压力。

Phytochromes, which receive and transmit signals generated by red and far- red light, can regulate a wide range of developmental and physiological responses during plant development. Their PHY-PAS1 domain is critical for tuning spectroscopic properties of the bound bilin and signal transduction and exists in all members of the gymnosperm phytochrome gene family created by gene duplication. Gene duplications can play significant roles in speciation. The PHYP gene occurs from the first gene duplication event, as a single copy. To further test whether PHY-PAS1 domains in PHYP have experienced the same constraint or positive selection during their evolution in distinct gymnosperm species , we assayed the molecular evolution of 31 gymnosperm PHY-PAS1 domain sequences under the branch, site and branch-site models. Most lineages are highly conserved, with w< 1, but 14 lineages evolved under positive selection, with w> 1; among them 13 lineages are of co-generic species. By contrast, such selective pressure is not detected in more distantly related species.


全 文 :植物学报Chinese Bulletin of Botany 2009, 44 (5): 608-618, w w w .chinbullbotany.com
doi: 10.3969/j.issn.1674-3466.2009.05.012
收稿日期 : 2008-10-30; 接受日期 : 2009-03-10
基金项目 : 国家自然科学基金 (No.30270153,30771763)、中国科学院百人计划引进国外杰出人才资助项目 (No.0729281F02)和
湖北省自然科学基金青年杰出人才资助项目 (No.0631061H01)
* 通讯作者。E-mail: tingw ang@w bgcas.cn
.研究报告.
裸子植物中光敏色素 PHY-PAS1结构域的适应性进化
王静 1, 3 , 王艇 1*, 苏应娟2 , 森林 1 , 张冰 2 , 杨永霞1
1中国科学院武汉植物园 , 武汉 430074; 2中山大学生命科学学院, 广州 510275
3河南师范大学生命科学学院 , 新乡 453007
摘要 光敏色素是一类红光/远红光受体, 在植物种子萌发到成熟的整个生长发育过程中均起重要的调节作用。光敏色素PHY-
PAS1结构域存在于光敏色素基因家族的所有成员中, 对调节发色团的光谱特性和光信号转导非常关键。光敏色素基因家族通
过基因重复产生, 而基因重复可能与物种形成有关。PHYP基因是裸子植物光敏色素基因家族发生第1次重复后产生的, 并且
以单拷贝形式存在。为了研究不同裸子植物PHYP基因编码蛋白的PHY-PAS1结构域在进化过程中是否受到相同的选择压力
以及是否发生了适应性进化, 该研究利用分支模型、位点模型以及分支-位点模型对裸子植物31条PHYP基因序列编码蛋白
的PHY-PAS1结构域所受到的选择压力进行了分析。结果表明, 在由PHY-PAS1结构域序列构建的系统树中, 多数分支处于
强烈的负选择压力下 (w<1); 有14个分支处于正选择压力下 (w>1), 其中13个分支发生在属内种间; 与之相比, 在较为古老的
谱系中相对缺少这种正选择压力。
关键词 适应性进化 , 裸子植物 , PHY-PAS1结构域 , PHYP基因
王静 , 王艇 , 苏应娟 , 森林 , 张冰 , 杨永霞 (2009). 裸子植物中光敏色素 PHY-PAS1结构域的适应性进化 . 植物学报 44, 608-
618.
光敏色素是直接参与调节光周期反应的光受体
(Quail, 2002), 它对红光和远红外光非常敏感 (Smith,
1982); 在植物种子萌发到成熟的整个生长发育过程
中, 光敏色素均起着重要的调节作用 (Reed et al. ,
1993; Parks and Quail, 1993; Nagatani et al. , 1993;
Devlin et al., 1998, 1999)。在裸子植物中发现有 4种
光敏色素(phytochrome, PHY )基因, 它们分别是
PHYN1、PHYN2、PHYO和 PHYP; 其中前 3个对应
于被子植物的 A 类光敏色素基因(PHYA、PHYC和
PHYE), 而 PHYP则对应于被子植物的B类光敏色素
基因(PHYB和 PHYD)(Basu et al. , 2000)。Clapham
等 (1998, 1999, 2002) 研究发现, 阻止欧洲赤松(Pinus
sylvestris)次生针叶延长和欧洲云杉(Picea abies)发
芽所需远红光的量随着纬度的增加逐渐减少 , 认为
PHYP和 PHYO基因是裸子植物渐变群对红光 /远红
光反应不同的关键。
植物光敏色素由位于 N端光感受区的 PAS(Per/
Arndt/Sim)-GAF(cGMP phosphodies terase/adenyl cy-
clase/FhlA)-PHY (phytochrome domain) 结构域和 C
端光调节区的 PAS1-PAS2-HKRD (hist idine kinase
related domain) 结构域组成。PAS1结构域被认为与
核定位有关 (Chen et al., 2005), 而且由于该结构域
处于光调节区 , 也可能与光信号转导有关 ; GAF结构
域是发色团结合的部位, 高度保守 (Rockwell et al.,
2006 ); 而PHY结构域是保持光敏色素吸收光谱的完
整所必需的 (Oka et al. , 2004)。因 PHY 结构域与
GAF有一定的相似性 , 故被认为也可能呈现 GAF折
叠 (Rockwell et al. , 2006)。
正选择是分子进化的重要动力, 它能够加速同源
蛋白的分化 (Swanson et al., 2001)。现已鉴定出的
609王静等: 裸子植物中光敏色素PHY-PAS1结构域的适应性进化
处于正选择下的基因多是参与免疫反应和防御的相
关基因 (Bishop, 2005; Nielsen et al., 2005; 高远等,
2008)、毒素蛋白基因 (Liu et al., 2005; Hao et al. ,
2008) 以及通过基因重复产生的基因 (Mathews et al.,
2003; Zhang et al., 2005)。基因重复可能与物种的
形成有关 (Lynch and Conery, 2000)。PHYP 基因是
裸子植物光敏色素基因家族发生第 1次重复后产生
的, 并且以单拷贝形式存在 (Schneider-Poetsch et
al., 1998)。因此, 它们在不同裸子植物的进化过程中
是否受到相同的选择压力以及是否发生了适应性进
化是本文所关注的问题。Yang和 Nielsen (2002)、
Mathews等 (2003) 在对被子植物光敏色素 A-C/F基
因以及光敏色素 B-D/E 基因的分析中检测到了正选
择。然而, 在裸子植物的PHYP中是否也存在适应性
进化, 目前尚不清楚。因此, 本文针对裸子植物 PH-
YP基因编码蛋白的N端的PHY结构域和C端的PAS1
结构域(即 PHY-PAS1结构域)展开了分子进化分析 ,
以期了解该结构域在裸子植物演化过程中是否对相
关的光环境形成适应性 , 从而深化对 PHY-PAS1结
构域功能的认识。
1 材料与方法
1.1 材料
测序所用的植物材料包括苏铁科 (Cycadaceae) 1种、
银杏科 (Ginkgoaceae) 1种、松科 (Pinaceae) 4种、
杉科 (Taxodiaceae) 4种、柏科 (Cupressaceae) 3种、
三尖杉科(Cephalotaxaceae)3种和红豆杉科 (Taxac-
eae) 10种, 它们均采自中国科学院武汉植物园。分
布于不同地区的欧洲赤松 (Pinus sylvestris L.)、蕨类
植物铁线蕨 (Adiantum capillus-veneris L.) 及外类群风
兜地钱 (Marchantia paleacea Bertol. var. diptera (Mont.)
Hatt.) 的序列数据取自 GenBank。表 1列出了本研究
所用植物材料和序列的数据库登录号。
1.2 总DNA提取、PCR、 克隆和测序
用于 DNA 提取的材料为新鲜的叶片 , 方法采用改进
的 CTAB法 (苏应娟等, 1998)。
每 25 mL PCR反应体系中包括 : 50 ng模板、引
物各 8 pmol、2 U Taq DNA聚合酶 (Takara, 大连)和
由 Takara公司提供的 10 倍 PCR缓冲液 2.5 mL及
2.5 mmol.L-1 dNTPs 0.5 mL。聚合酶链式反应 (PCR)
在 Biometra PCR扩增仪(Thermobio, 德国)上进行。
扩增 PHY-PAS1结构域采用的引物根据作者所得到
的南方红豆杉 (Taxus wallichiana Zucc. var. mairei
(Lemée et H. Léveil lé) L. K. Fu et Nan Li) PHYP序列
(数据未发表)和欧洲赤松 PHYP 的 cDNA 序列 (X96-
738 ) 设计, 引物具有极强的特异性。引物 1 : 5 -
CTCTGACTTGGAGCCTTAC-3; 引物2: 5- ATACTGG-
GAGACTGGGTTA-3。 引物由上海英骏生物技术有限
公司合成。PCR反应程序为: 94°C 5分钟; 94°C 30
秒, 55°C 60秒, 72°C 90秒, 35个循环; 72°C 10分
钟。
PCR产物在1.0%琼脂糖凝胶和1×TAE电泳缓冲
液中电泳 35分钟 (电压为 120 V), 切下目的片段 , 用
QIAEX II (Qiagen, 德国) 柱式 DNA 胶回收试剂盒回
收 PCR产物。所得 PCR 产物与 PMD19-T载体连接,
转化由大肠杆菌(Escherichia coli)DH5a制得的感受
态细胞。在含有 X-Gal、IPTG和氨苄青霉素的 LB琼
脂平板培养基上培养, 采用蓝白斑筛选法获得阳性克
隆。将至少 3个阳性克隆交英骏公司用 ABI377型自
动测序仪测序 , 测序引物为 M13+/M13-。为了保证
测序的准确性 , 对所得序列的正、反链进行测定并加
以校准。
1.3 系统发育分析
序列经 ClustalX1.81 (Thompson et al., 1997) 软件比
对, 个别位点进行人工校正。以风兜地钱的 PHY1基
因为外类群, 分别采用最大似然法 (maximum likel i-
hood, ML)、最大简约法(max imum pars imony, MP)
和贝叶斯法构建系统发育树。空位 (gap) 编码为缺失
(miss ing)。ML和MP分析采用PAUP (Swofford, 2002)
软件完成。贝叶斯分析使用 MrBayes软件(Ronquist
and Huelsenbeck, 2003)完成。MP 分析时采用如下
610 植物学报 44(5) 2009
选项: 树二组重新连接 (TBR)、启发式搜索 (heurist ic
search)、多重性选择 (MULTREES opt ion)、 ACCT-
RAN优化和 100次随机附加的重复。利用自展分析
(bootstrap, 重复 1 000次) 检验各分支的置信度。在
构建 ML 树之前, 使用 ModelTest软件 (Posada and
Crandall, 1998) 对碱基替换模型进行选择, 并进行
100次的重抽样 (bootst rap)。采用贝叶斯法构建系统
树时, 似然模型参数的设置为 : DNA 替换取 GTR
(general t ime reversible) 模型 , 位点变异速率取 g分
布。系统发育模型的后验概率依照 M e t rop o l i s -
Hast ings-Green 算法, 通过 4条链 (Markov Chain
Monte Carlo, MCMC), 运行 1 000 000 代估计。每
100 代保存 1 棵树。MCMC 分析以随机树起始, 摒弃
老化样本(burnin= 2 500)后, 由剩余样本构建一致树。
1.4 正选择和负选择的检测
在核苷酸水平上的正选择通常使用 w来估测。w是同
源编码蛋白序列之间非同义核苷酸替换 (dN) 和同义
核苷酸替换 (dS) 的比值 (Nei and Kumar, 2000)。
w>1表明序列受到正选择; w<1 表明序列受到负选
择; w=1则显示中性进化。本文采用 PAML4 (Yang,
2007)中的 3个模型: 分支模型 (Yang, 1998)、位点
模型 (Nielsen and Yang, 1998; Yang, 2000) 以及分
支 -位点模型 (Yang et al., 2005; Zhang et al., 2005)
进行分析。同时对系统树上所有分支也进行了自由
比率模型分析 , w>1的分支在图 1中以字母 c-m 标
出, 对应的比率分别为 wc-wm; 分支 a位于系统树中
裸子植物的基部 , 分支 b位于红豆杉科植物的基部,
对应的比率分别为wa和wb; 而w0为背景分支的比率。
在分支模型中 , 分别进行了单比率 (one-ratio) 和
自由比率 (free-rat io) 模型的分析。单比率模型是最
简单的模型, 假定进化树上所有分支的比率相同 , 为
w0 (表 2); 自由比率模型假定不同的分支有不同的比
率。由于该模型中参数较多 , 所以有可能会导致w值
不甚精确; 然而该模型的优势在于缺少序列信息时,
估测 w值不受影响。
位点模型假定不同位点经历不同的选择压力, 而
系统树的不同分支上并无差异。本文采用 3对模型,
并进行似然比检验 (likelihood ratio test, LRT)。这 3对
模型分别为: M1a (近中性模型) 和 M2a (正选择模型),
M0 (单比率模型) 和M3 (离散模型)以及M7 (beta模型)
和 M8 (beta & w模型) (Nielsen and Yang, 1998; Yang,
2000)。这 3对模型进行 LRT检验时, 用统计量 2Di
(Di=i1-i0, i1、 i0分别表示 2个模型下的似然值) 依 c2
分布检验显著性, 自由度为2个模型参数数目的差值。
分支 - 位点模型假定每个核苷酸位点一定是
dN/dS比率的 4个分类类别中的 1类。第 1类由所有
分支中高度保守的位点组成 , 其dN / dS比率较小 (w0);
第2类由中性或者选择压力较小的位点组成 , 这类位
点的比率接近 1或者略小于 1 (w1); 第 3类是由背景
分支高度保守 (w0), 但前景分支比率 (w2) 显著大于1
的位点组成; 第4类是由背景分支中性进化或者所受
选择压力较小 (w1), 但前景分支比率 (w2) 显著大于1
的位点组成。分支 -位点模型包括 A和 B 2个模型,
A模型包括 2个检验: 检验 1和检验 2。在检验 1中,
零假设为模型 M1a (Yang et al., 2005), 该模型假定
在所有分支中只有2类位点, 分别为0无论前景分支上的位点是处于放松的选择压力下
(w0<1)、中性选择下 (w0=1)还是正选择压力下 (w0>1),
均可以进行统计检验。因为备选假设比零假设多2个
参数 (p2 和 w2), 所以采用 c2, 自由度 df=2, 来进行检
测分析。在检验 2中, 零假设仍然是 A模型, 但是需
要设定 w2=1。该零假设允许一些位点在背景分支中
处于负选择状态, 而在前景分支中是中性进化。因
此, 检验 2可以直接检验前景分支中是否存在正选
择。本研究根据 Yang (2007) 的建议只采用检验 2。
2 结果与讨论
2.1 系统发育树的构建
测得的31种裸子植物的PHY-PAS1结构域序列长度
介于 978-1 095 bp之间。比对、调整后序列长度为
1 161 bp, 空位作缺失处理; 其中 1-771 bp为 PHY-
PAS1的编码区, 772-1 161 bp为内含子区。序列中
611王静等: 裸子植物中光敏色素PHY-PAS1结构域的适应性进化
有 801个变异位点, 569个信息位点, 分别占 68.99%
和 49.01%。简约性分析得到 1棵最简约树, 树长为
1 861, 一致性指数(consistency index, CI)和维持性
指数(resistance index, RI)分别为 0.693 4和0.795 5。
用MP和ML法构建出的系统树的拓扑结构完全
一致 (图 1A)。银杏 (Ginkgo b iloba L.) 位于裸子植
物的基部, 随后分出多歧苏铁 (Cycas mulitipinnata C.
J.Chen et S.Y.Yang), 多歧苏铁为松科 /红豆杉科 /三
尖杉科 / 杉科 / 柏科代表植物的姊妹群。红豆杉科、
三尖杉科、柏科和松科均为单系群 , 支持率很高
(boots trap值均在96%以上); 松科为前三者所形成分
支的姊妹群。三尖杉科和红豆杉科构成姊妹群并得
到有力支持 (bootstrap>97%)。红豆杉科各属中白豆
杉属 (Pseudotaxus Cheng)与红豆杉属 (Taxus L. ) 互
为姊妹群 (bootst rap=100%); 穗花杉属 (Amentotaxus
Pilg. )代表植物云南穗花杉(A. yunnanens is H. L. Li)
和穗花杉(A. argotaenia (Hance) Pilg.) 组成的分支和
榧树属 (Torreya Arn.) 成为姊妹群 (bootstrap>99%)。
穗花杉属+榧树属与红豆杉属+白豆杉属构成姊妹
群 (bootstrap>93%)。柏科+杉科代表植物组成一个
表 1 植物材料名称、来源以及编码 PHY-PAS1结构域 PHYP基因的 GenBank登录号
Table 1 Names and origins of the plant mater ials and the accession numbers of PHYP gene encoding PHY-PAS1 domain
Number Species Collection place Accession No.
1 Taxus wall ichiana Zucc . var. chinensi s (Pilg.) Flor in WBGCA S (cultivated) FJ393247
2 T. walli chiana Zucc. var. mairei (Lemée et H. Léveillé) WBGCA S (cultivated) FJ393246
L. K. Fu et N. Li
3 T. yunnanensis W. C. Cheng et L. K. Fu. WBGCA S (cultivated) FJ393245
4 T. media Rehd. ‘Hicksii’ WBGCA S (cultivated) FJ393248
5 Pseudotaxus chienii (W. C. Cheng) W. C. Cheng WBGCA S (cultivated) FJ393250
6 T. cuspi data Siebold et Zucc. WBGCA S (cultivated) FJ393249
7 Torreya fargesi i Franch. WBGCA S (cultivated) FJ393263
8 To. grandi s Fort. var. merril lii Hu WBGCA S (cultivated) FJ393264
9 Amentotaxus yunnanensi s H. L. Li WBGCA S (cultivated) FJ393261
10 A. argotaeni a (Hance) Pilg. WBGCA S (cultivated) FJ393262
11 Cephalotaxus s inensi s (Rehder et E. H. Wilson ) H. L. Li WBGCA S (cultivated) FJ393251
12 C. ol iveri Mas t. WBGCA S (cultivated) FJ393253
13 C. fortunei Hook. WBGCA S (cultivated) FJ393252
14 Cryptomeria fortunei Hooibrenk ex Otto et Dietr. WBGCA S (cultivated) FJ393254
15 Cr . j aponica D. Don WBGCA S (cultivated) FJ393255
16 Taxodium di sti chum Rich. WBGCA S (cultivated) FJ393256
17 Ta. ascendens Brongn. WBGCA S (cultivated) FJ393257
18 Chamaecypari s pi sifera (Siebold et Zucc .) Endl. WBGCA S (cultivated) FJ393260
19 Sabina gaussenii (Cheng) Cheng et W. T. Wang WBGCA S (cultivated) FJ393259
20 Pl atycladus ori entali s (L.) Franco WBGCA S (cultivated) FJ393258
21 Pi nus kwangtungensi s Chun ex Tsiang WBGCA S (cultivated) FJ393243
22 P. thunb ergii Par l. WBGCA S (cultivated) FJ393244
23 P. dabeshanensi s W. C. Cheng et Y . W. Law WBGCA S (cultivated) FJ393242
24 P. el liotti i Engelm. WBGCA S (cultivated) FJ393241
25 Gi nkgo b il oba L. WBGCA S (cultivated) FJ393266
26 Cycas muliti pinnata C. J. Chen et S. Y. Yang WBGCA S (cultivated) FJ393265
27 P. sylves tri s L. 1 - EU120619
28 P. sylves tri s L. 2 - EU120615
29 P. sylves tri s L. 3 - EU120590
30 Marchantia paleacea Bertol. var. di ptera (Mont.) Hatt. - AB022917
31 Adiantum capil lus-veneris L. - AB016151
WBGCA S: 中国科学院武汉植物园。WBGCA S: Wuhan Botanical Garden, Chinese Academy of Sciences
612 植物学报 44(5) 2009
分支, 作为红豆杉科+三尖杉科的姊妹群存在, 支持
率很高 (boots trap>98%)。用贝叶斯法获得的结果与
用MP、ML法构建的系统树相比 , 除了苏铁和银杏的
位置发生互换之外, 其它分支结构没有变化。
2.2 PHY-PAS1结构域正选择位点的检测
以用 M P 和 M L 法构建的进化树为树文件 , 利用
PAML软件对 PHY-PAS1结构域的编码区进行进化
分析。单比率(one-ratio)模型假定所有的分支均有同
样的 w值, 涉及 59个参数。在该模型下, 似然值 i0 =
-5 265.79, K=2.62, 估测的 w值为 0.117 2 (表 2); 分
支模型中, 自由比率(free-ratio)模型假定每个分支均
有独立的w值, 包括115个参数, 似然值i1=-5 111.25。
因为自由比率模型比单比率模型多 56个参数, 所以
2Di=2(i1-i0)=309.08, 进行自由度 df=56的 c2比较,
结果显示自由比率模型显著优于单比率模型 (P<0.
001) (表 2)。在该模型中, wn、wd、we、wo、wh、wi、wp
以及 wk均为 µ, 表明这些分支中没有出现同义替换 ;
图 1
Figure 1
A
613王静等: 裸子植物中光敏色素PHY-PAS1结构域的适应性进化
图 1 基于 31条 PHYP基因编码蛋白的 PHY-PA S1结构域序列构建的系统树(外类群为风兜地钱 (Marchanti a pal eacea Bertol.
var. di ptera (Mont.) Hatt.))
(A)MP、ML树和贝叶斯树。分支上的数字分别为MP法 (斜线之前, 1 000次重复)和 ML法(斜线之后, 100次重复)构树的自展
支持率 , 分支下的数字为贝叶斯后验概率值。 (B)用于 PAML分析的 MP/ML树。分支上的数字为自由比率模型(free-ratio)得到的所
有分支的 w值 , 加粗表示该分支 w>1。分支 c-p表示在自由比率模型下w>1的谱系 ; 分支 a和 b在分支 -位点模型下用作前景分支。
Figure 1 Phylogeny based on the sequence data of PHY-PAS1 domain in PHY P of 31 gymnosperm species (Marchantia paleacea
Bertol. var. di ptera (Mont.) Hatt. w as used as the outgroup)
(A) MP, ML and Bayesian trees. The numbers above each branch denote the bootstrap propor tion (percentage) f or MP (1 000
replicates , before the s lash), ML (100 replicates , af ter the slash) . The numbers under each branch denote the posterior probability
values for Bayes ian; (B) MP/ ML tree used f or PAML analys is. The numbers above branches indicate the es timates of the w ratios
under the free-ratio model, w hich assumed an independent w ratio for each branch in the tree. The branches w ith w>1 are draw n
in thick lines . Branches c-p indicated are the lineages w ith w >1 under the f ree-ratio model. Branches a and b are used as the
foreground branches in the branch-site model.
B
614 植物学报 44(5) 2009
而分支 c、f、g、j、l和m中, w值均大于 1 (wc=95.72,
wf=1.33, wg=1.30, wj=2.67, wl=1.60, wm=9.48), 显示
在这些分支中存在正选择 ; 其它分支上的w值均小于
1 (图 1B)。
位点模型 (Nielsen and Yang, 1998; Yang, 2000)
的结果表明, 不同位点之间所受的选择压力不同。例
如, M3模型比单比率模型更加适合所分析数据(2Di=
81.32, P< 0.01)。尽管M2a和M8模型均能够检测到
一个适应性进化 (w>1) 位点 (数据未显示), 但统计上
缺乏显著性 (表3)。这表明在该结构域上大多数位点
均处于强烈的负选择压力下(表 2)。
在分支 -位点模型中, a*-g*表示分支a-g为正选
择检测的前景分支 , 而其它分支均为背景分支。尽管
所有分支的模型A检验均比单比率模型 (M0) 更加适
合 (P<0.01), 并且分支a和m在此模型中也检测到小
部分位点 (分别为 1.23% 和 13.2%)在前景分支中处
于正选择下 (w2分别为 3.01和 1.43), 但是统计上不
显著 (P>0.05)。另外, 在此模型下, 分支 e、 l、n和
g检测出的所有位点均为 w>1(表 2), 这样大的比例
(100%) 表明位点 w>1是由于选择压力降低的缘故;
然而也不具显著性 (P>0.05)。
2.3 讨论
本研究显示, 裸子植物不同分支的PHYP基因编码蛋
白的 PHY-PAS1结构域所受选择压力各不相同, 并
且多数分支中该结构域处于强烈的负选择压力下 (w
<1)。这说明对于裸子植物 PHY-PAS1结构域在进化
过程中负选择起主导作用。然而, 同时也检测到少数
分支处于正选择压力下(w>1), 表明 PHYP 基因编码
蛋白的 PHY-PAS1结构域发生了适应性进化。值得
注意的是, 有些分支 (wn、wd、we、wo、wh、wi、wp和
wk) w为µ, 显示它们没有出现同义替换 , 表明在同义
表 2 裸子植物 PHYP基因编码蛋白的 PHY-PAS1结构域在不同模型下的参数估计值以及对数似然值
Table 2 Parameter estimates and log- likelihood values for PHY -PAS1 domain of PHY P in gymnosperm under dif f erent
models
Model P i Es timates of parameters Positively selec ted sites
M0: one- ratio 59 -5 265.79 w0=0.12 None
Br anch model
Free- ratio 115 -5 111.25 wn=µ wd=µ we=µ wh=µ wi=µ wk=µ wo=µ wp=µ wm=9.48 None
wc=95.72 wf=1.33 wg=1.30 wj=2.67 wl=1.61
Site model
M1a: neutral 60 -5 249.13 p0=0.95, (p1=0.05) Not allow ed
M2a: selection 62 -5 249.13 p0=0.95, p1=0.05 (p2= 0.00), w2= 29.41 None
M3: discrete 63 -5 225.13 p0=0.58, p1=0.16 ( p2= 0.26), w0=0.06, w1=0.06, w2=0.33 None
M7: (beta) 60 -5 228.57 p= 0.90, q= 6.04 Not allow ed
M8: (beta & w) 62 -5 228.28 p0=0.99, (p1=0.01) , p=0.96, q=6.68, w=1.00 None
Br anch-site model
Model A
a* 62 -5 248.57 p0=0.94, p1=0.05 (p1+p2=0.01), w2=3.01 None
b* 62 -5 249.13 p0=0.95, p1=0.05 (p1+p2=0.00), w2=1.00 None
e* 62 -5 246.14 p0=0.00, p1=0.00 (p1+p2=1.00), w2=µ None
l* 62 -5 240.61 p0=0.00, p1=0.00 (p1+p2=1.00), w2=1.72 None
m* 62 -5 249.13 p0=0.82, p1=0.04 (p1+p2=0.13), w2= 1.43 None
n* 62 -5 248.16 p0=0.00, p1= 0.00 (p1+p2=1.00), w2=62.04 None
g* 62 -5 239.773 p0=0.00, p1= 0.00 (p1+p2=1.00), w2=2.32 None
P: 模型中参数的数目 ; i: 似然值 ; w0: 所有分支上的 dN/dS; wc-wm: c-m分支上的 dN/dS; a*-g*表示前景分支为 a-g的分支位点模
型。
P: Number of parameters in the model; i: Likelihood value; w0: The dN/dS ratio for all branches; wc-wm : The dN/dS ratios for branches
c-m, respectively; a*-g* indicate the branch-site model that branches a-g are f oreground branches for detecting pos itive selection.
615王静等: 裸子植物中光敏色素PHY-PAS1结构域的适应性进化
密码子的使用上可能存在其它较强的约束力 (Austin
and Robert , 2005)。出现这种结果可能与环境改变有
关。在外界环境突然改变时 , 可能只有发生非同义替
换的个体因具有更好的适应能力而得以生存。基于
自由比率模型估测出的结果显示 , 多数 w>1的分支
均发生在属内种间, 如红豆杉科红豆杉属的云南红豆
杉(T. yunnanensis W. C. Cheng et L. K. Fu.)、红豆
杉 (T. wallichiana Zucc. var. chinensis (Pilg. ) Florin)
以及曼地亚红豆杉 (T. media Rehd. ‘Hicks ii’), 这 3
个物种的 w均大于 1(w=µ); 松科松属的华南五针松
(P. k wangtungensis Chun ex Ts iang) 和大别山五针
松 (P. dabeshanens is W. C. Cheng et Y. W. Law) 的
w也大于1。但是, 在较古老的谱系中 , 正选择压力出
现的较少。这种现象可能是由于来自同属的植物亲
缘关系较近, 所处的生境类似 , 从而经历了相似的选
择作用。此外, 分别来自西班牙和土耳其的欧洲赤松
的 PHYP基因编码蛋白的 PHY-PAS1结构域均表现
出强烈的正选择 , 这也可能与它们的生境有关。取样
于西班牙和土耳其的欧洲赤松分别位于北纬 39°27
和 37°22的高海拔区域 , 海拔高度分别为 2 050 m和
1 600 m (Pyhajarvi et al. , 2007), 纬度仅相差 02°05,
海拔相差 400 m, 光环境比较相似 , 因此受到相似的
选择压力。
裸子植物的PHYP和被子植物的PHYB/D/E同为
B类光敏色素基因 (Schneider-Poetsch et al. , 1998)。
Yang和Nielsen (2002) 在分析 PHYB/D/E基因时, 检
测到了正选择位点。然而, 在裸子植物 PHYP基因编
码蛋白的 PHY-PAS1结构域中却没有检测到正选择
位点, 尽管有 14个分支 (c、f、g、j、l、m、n、d、e、
o、h、 i、p和 k) 被检测到有正选择发生。裸子植物
和被子植物光敏色素基因的这种差异首先可能与光
敏色素的进化速率有关。S chne ider -P oe ts ch 等
(1998) 报道, 被子植物光敏色素基因的进化速率比裸
子植物的快。相对于被子植物光敏色素 , 裸子植物与
低等植物光敏色素的进化距离较小。其次, 从正选择
发生的时间上考虑 , PHYP 存在于所有的裸子植物
中, 并且在现存裸子植物形成之前就已经分化出来
(Schneider-Poetsch et al. , 1998)。裸子植物虽然到
古生代末期之后才成为陆地植物的主要代表, 但是它
的历史可以追溯到 3.45-3.95亿年前。研究表明, 如
果适应性进化发生在早期并已经被固定下来, 那么正
选择的检测会更加困难, 尤其是要鉴定发生在单个位
点或者极少数位点的正选择 (Perutz, 1983; Newcomb
et al., 1997)。Golding和Dean (1998)曾指出, 如果所
检测的序列是在数百万年前发生的分化, 那么这些序
列就会积累大量进化中性的替换, 或是纯粹为了适应
不断变化的环境而机械式发生的选择性替换 (这类选
择性替换虽然也重要, 但不会对蛋白功能产生主要影
响); 要想在这样的背景下 , 鉴定出能够明显改变蛋白
功能的几个少数适应性进化位点极其困难。所以, 即
使 PHYP基因编码蛋白的 PHY-PAS1结构域在裸子
植物出现的早期发生过正选择(图1B), 但是由于可能
早已被固定下来或是被掩盖于其它替换中, 所以仅靠
目前的模型还不能够准确鉴定出该结构域中的正选
择位点。
本文采用了 3种不同的模型 , 即分支模型、位点
模型以及分支 -位点模型, 对裸子植物 31条 PHYP基
因序列编码蛋白的 PHY-PAS1结构域所受到的选择
压力进行了分析。分支模型 (Yang, 1998) 允许不同
的谱系有不同的 w值, 因此适合检测谱系上的正选
择; 该模型假定位点间的 w值没有差异, 因此, 只有
在所有位点的平均 dN值大于平均 dS值的情况下, 该
模型才能够检测到谱系上的正选择。位点模型
(Nielsen and Yang, 1998; Yang, 2000) 允许不同的位
点有不同的 w值, 但是在谱系间没有区别 , 因此只有
表 3 似然比值检验统计量 (2Di)
Table 3 Likelihood ratio statis tic s (2Di)
Comparison 2Di df P
One-ratio vs. M0 309.08** 56 <0.001
M0 vs . M3 (disc rete) 81.32* 4 <0.001
M1a (neutral) vs . M2a 0 2 1.00
(selec tion)
M7 (beta) vs. M8 0.58 2 0.75
(beta & w)
* P<0.05, x2=3.84; ** P<0.01, x2=6.63
616 植物学报 44(5) 2009
在所有谱系平均 dN值大于平均 dS值的情况下, 该模
型才能够检测到个别位点上的正选择。如果正选择
发生在很短的时间内或者极少数氨基酸位点上
(Gillespie, 1991), 那么分支模型和位点模型检测正选
择的力度就会受到限制。基于上述原因, 本文同时也
采用了分支 -位点模型, 该模型允许不同位点和不同
谱系间 w值可变。当适应性进化只涉及少量氨基酸位
点时, 分支或位点模型可能检测不到它们所发生的正
选择; 然而, 对波段式选择 (episodic selection) 比较
敏感的分支 -位点模型 (Yang and Nielsen, 2002) 却
可能鉴定出相关位点。在本研究中, 利用分支模型检
测到数个分支经历了正选择, 但是在分支 -位点模型
下却未能在这些分支检测到正选择位点 (表 2)。这显
示, 分支 -位点模型并非一定比分支模型敏感。此外,
也可能与所选取的基因片段有关。因为本研究只是针
对光敏色素基因的部分而非全长序列, 如果正选择发
生在 PHY-PAS1结构域之外的位置, 则无法检测到。
参考文献
高远 , 田李 , 秦松 (2008). 植物进化中的正选择作用 . 植物学通
报 25, 401-406.
苏应娟 , 王艇 , 杨维东 , 黄超 , 范国宽 (1998). 罗汉松属植物
DNA的提取与 RAPD分析 . 中山大学学报(自然科学版) 37,
13-18.
Austin LH, Robe rt F (2005). Nucleotide substitution and recom-
bination at orthologous loci in Staphylococcus aureus. J Bioact
187, 2698-2704.
Basu D, Dehesh K, Schneider -Poets ch HAW, Harrington
SE, M c-Couch SR, Quail PH (2000). Rice PHYC gene:
structure, expression, map position and evolution. Plant Mol
Biol 44, 27-42.
Bishop JG (2005) . Directed mutagenesis confirms the functional
importance of posit ively selec ted s ites in polygalacturonase
inhibitor protein. Mol Biol Evol 22, 1531-1534.
Chen M, Tao Y, Lim J, Shaw A, Chor y J (2005). Regulation of
phy tochrome B nuclear localization through light-dependent
unmasking of nuclear-localization signals. Curr Biol 15, 637-
642.
Clapham DH, Dormling I, Ekberg I, Eriksson G, Qamaruddin
M, V ince-Prue D (1998). Latitudinal cline of requirement for
far -red light for the photoperiodic control of bud set and ex-
tension grow th in Picea abies (Norw ay spruce). Physiol Plant
102, 71-78.
Clapham DH, Kolukisaoglu HU, Lars son CT, Qamaruddin
M, Ekbe rg I, Wiegmann-Eirund C, Schneider-Poets ch
HAW, von Arnold S (1999). Phytochrome types in Picea and
Pinus. Expression patterns of PHYA-related types. Plant Mol
Biol 40, 669-678.
Clapham DH, Ekberg I, Eriksson G, Nore ll L, V ince-Pr ue D
(2002). Requirement for far -red light to maintain secondary
needle extention grow th in northern but not southern popula-
tions of Pinus sylvestris (Scots pine). Physiol Plant 114, 207-
212.
Devlin PF, Patel SR, Whitelam GC (1998). Phytochrome E influ-
ences internode elongation and f low ering time in Arabidopsis.
Plant Cell 10, 1479-1487.
De vlin PF, Robson PR, Patel SR, Goos ey L, Sharrock RA,
Whitelam GC (1999). Phytochrome D acts in the shade-avoid-
ance syndrome in Arabidopsis by controlling elongation grow th
and f low ering time. Plant Physiol 119, 909-915.
Gillespie JH (1991). The Causes of Molecular Evolution. Oxford:
Oxford University Press. pp. 132-139.
Golding GB, Dean AM (1998). The structural basis of molecular
adaptation. Mol Biol Evol 15, 355-369.
Hao D, Huang B, Yang L (2008). Phylogenetic relationships of
the genus Taxus inf erred f rom chloroplast intergenic spacer
and nuclear coding DNA. Biol Pharm Bull 31, 260-265.
Liu ZY, Bos JIB, Armstrong M, Whisson SC, da Cunha L,
Torto-Alalibo T, Win J, Avrova AO, Wright F, Birch PRJ,
Kamoun S (2005) . Patterns of diversify ing selection in the
phytotoxin-like sc r74 gene family of Phytophthora i nfestans.
Mol Biol Evol 22, 659-672.
Lynch M, Coner y JS (2000). The evolutionary fate and conse-
617王静等: 裸子植物中光敏色素PHY-PAS1结构域的适应性进化
Nat Rev Mol Cell Biol 3, 85-93.
Re ed JW, Nagpal P, Poole DS, Fur uya M, Chory J (1993) .
Mutations in the gene f or the red-far-red light receptor phyto-
chrome B alter cell elongation and physiological responses
throughout Arabidopsis development. Plant Cell 5, 147-157.
Rockw ell NC, Su YS, Lagarias JC (2006). Phytochrome s truc-
ture and signaling mechanisms. Annu Rev Plant Biol 57, 837-
858.
Ronquist F, Huelsenbeck JP (2003). MrBayes 3: Bayesian
phy logenetic inference under mixed models . Bioinformatics
19, 1572-1574.
Schneider-Poets ch HAW, Koluk is aoglu U, Clapham DH,
Hughe s J, Lamparte r T (1998). Non-angiosperm phyto-
chromes and the evolution of vascular plants . Physiol Plant
102, 612-622.
Smith H (1982). Light quality, photoperception, and plant strategy.
Annu Rev Plant Physiol 33, 481-518.
Swanson WJ, Yang Z, Wolfner MF, Aquadro CF (2001). Posi-
tive darw inian selection in the evolution of mammalian f emale
reproductive proteins. Proc Natl Acad Sci USA 98, 2509-2514.
Swoffor d DL (2002). PAUP*: Phylogenetic Analysis Using Parsi-
mony (*and other methods), version 4.0b 10. Sunder land:
Sinauer Associates.
Thom ps on JD, Gibson TJ, Ple wniak F, Jeanm ougin F,
Higgins DG (1997). The CLUSTAL× w indow s interface: f lex-
ible strategies for multiple sequence alignment aided by quality
analysis tools. Nucleic Acids Res 25, 4876-4882.
Yang Z (1998). Likelihood ratio tests for detecting positive selec-
tion and application to primate lysozyme evolution. Mol Bi ol
Evol 15, 568-573.
Yang Z (2000) . Maximum likelihood estimation on large phylog-
enies and analysis of adaptive evolution in human influenza
virus A. J Mol Evol 51, 423-432.
Yang Z (2007). PAML 4: a program package for phylogenetic
analys is by maximum likelihood. Mol Biol Evol 24, 1586-1591.
Yang Z, Nielsen R (2002). Codon-substitution models for detect-
ing molecular adaptation at indiv idual s ites along spec if ic
lineages. Mol Biol Evol 19, 908-917.
quences of duplicate genes. Science 290, 1151-1155.
Mathe ws S, Bur leigh JG, Donoghue M J (2003) . A daptive
evolution in the photosensory domain of phy tochrome A in
early angiosperms. Mol Biol Evol 20, 1087-1097.
Nagatani A, Ree d JW, Chory J (1993). Isolation and init ial char-
acterization of Arabidopsis mutants that are deficient in phyto-
chrome A. Plant Physiol 102, 269-277.
Nei M, Kumar S (2000). Molecular Evolution and Phylogenetics.
Oxford: Oxford University Press. pp. 51-71.
Newcom b RD, Campbell PM, Ollis DL, Che ah E, Russe ll RJ,
Oaks hott JG (1997). A s ingle amino acid substitution con-
ver ts a carboxy lesterase to an organophosphorous hydro-
lase and confers insec ticide resistance on a blow fly. Proc
Natl Acad Sci USA 94, 7464-7468.
Niels en R, Bus tamante C, Clark AG, Glanow ski S, Sackton
TB, Hubis z MJ, Flede l-Alon A, Tanenbaum DM , Cive llo
D, White TJ, Sninsky JJ, Adams MD, Cargill M (2005). A
scan f or positively selected genes in the genomes of humans
and chimpanzees. PLoS Biol 3, 976-985.
Niels en R, Yang Z (1998). Likelihood models for detecting posi-
tively selected amino acid sites and applications to the HIV-1
envelope gene. Genetics 148, 929-936.
Oka Y, Matsushita T , Mochizuki N, Suzuki T, Tokutomi S,
Nagatani A (2004). Functional analysis of a 450-amino acid
N-terminal fragment of phytochrome B in A rabidopsis . Plant
Cel l 16, 2104-2116.
Par ks BM , Quail PH (1993). hy8, a new c lass of Arabidopsis
long hypocotyl mutants deficient in functional phytochrome A.
Plant Cell 5, 39-48.
Perutz MF (1983). Species adaptation in a protein molecule. Mol
Biol Evol 1, 1-28.
Posada D, Crandall KA (1998). Model test: testing the model of
DNA substitution. Bioi nformatics 14, 817-818.
Pyhäjär vi T , Gar cía-Gil M R, Knür r T , M ik k one n M ,
Wachow iak W, Savolainen O (2007). Demographic history
has inf luenced nuc leotide diversity in European Pinus
sylves tris populations. Genetics 177, 1713-1724.
Quail PH (2002). Phytochrome photosensory signaling netw orks.
618 植物学报 44(5) 2009
Adaptive Evolution in the PHY-PAS1 Domain of PHYP
in Gymnosperms
Jing Wang1, 3, Ting Wang1*, Yingjuan Su2, Lin Sen1, Bing Zhang2, Yongxia Yang1
1Wu han Botani cal Ga rde n, Chin ese Academy o f Scie nce s, Wuha n 4 300 74, Chi na; 2Schoo l o f Li fe Sci ences, Sun Ya t-sen
Un iversit y, Guan gzh ou 5102 75, Ch ina; 3Co lle ge o f L ife Scien ce, Hen an Normal Uni versit y, X inxian g 4 530 07, Chi na
Abstr act Phytochromes, w hich receive and transmit s ignals generated by red and f ar- red light, can regulate a w ide range of
developmental and physiological responses during plant development. Their PHY-PA S1 domain is critical for tuning spectroscopic
properties of the bound bilin and signal transduction and ex ists in all members of the gymnosperm phytochrome gene family created
by gene duplication. Gene duplications can play signif icant roles in speciation. The PHYP gene occurs from the f irst gene duplica-
tion event, as a single copy. To f urther tes t w hether PHY-PAS1 domains in PHY P have exper ienced the same constraint or positive
selection dur ing their evolution in distinct gymnosperm species , w e assayed the molecular evolution of 31 gymnosperm PHY-PA S1
domain sequences under the branch, site and branch-site models. Mos t lineages are highly conserved, w ith w < 1, but 14 lineages
evolved under positive selection, w ith w > 1; among them 13 lineages are of co-gener ic species. By contras t, such selec tive
pressure is not detected in more dis tantly related species.
Ke y words ad apti ve evo lut ion, gymno spe rm, PHY-PAS1 doma in, PHYP ge ne
Wang J, Wang T, Su YJ , Sen L, Zhang B, Yang YX (2 009). Ada ptive evol ution in the PHY-PAS1 do main of PHYP in gymn osperms. Chin
Bul l Bo t 44 , 60 8-61 8.
* Author for correspondence. E-mail: tingw ang@w bgcas.cn
(责任编辑: 孙冬花)
Yang Z, Wong WSW, Nielse n R (2005). Bayes empirical Bayes
inference of amino ac id s ites under positive selection. Mol
Biol Evol 22, 1107-1118.
Zhang J, Niels en R, Yang Z (2005). Evaluation of an improved
branch-site likelihood method for detecting positive selec tion
at the molecular level. Mol Biol Evol 22, 2472-2479.