免费文献传递   相关文献

Molecular Evolution of psbD Gene in Ferns:Selection Pressure and Co-evolutionary Analysis

蕨类植物psbD基因的适应性进化和共进化分析



全 文 :植物科学学报  2013ꎬ 31(5): 429~438
Plant Science Journal
    DOI:10􀆰 3724 / SP􀆰 J􀆰 1142􀆰 2013􀆰 50429
蕨类植物 psbD基因的适应性进化和共进化分析
许 可1ꎬ2ꎬ 王 博1ꎬ2ꎬ 苏应娟3ꎬ 高 磊1ꎬ 王 艇1∗
(1. 中国科学院植物种质创新与特色农业重点实验室ꎬ中国科学院武汉植物园ꎬ 武汉 430074ꎻ
2. 中国科学院大学ꎬ 北京 100049ꎻ 3. 中山大学生命科学学院ꎬ 广州 510275)
摘  要: D2蛋白是植物光系统Ⅱ复合体(PSⅡ)核心蛋白之一ꎬ 由叶绿体 psbD基因编码ꎮ 为了深入理解核心薄
囊蕨类植物在阴生环境下的“辐射”式演化ꎬ 我们对 12种蕨类植物的 psbD基因进行了克隆和测序ꎬ 然后联合已
公布的其他 8种蕨类植物的 psbD序列ꎬ 基于 ω值(非同义替换率 dN 和同义替换率 dS 的比值)探讨了该基因经
受的选择压力ꎮ 发现 D2蛋白在大多数分支和位点受到强烈的负选择ꎬ 但是树蕨类分支的 psbD进化速率低且 ω
值较高ꎮ 借助多种模型进行的共进化分析显示ꎬ 树蕨类 D2蛋白的 168R、 245H和 272M两两组成具有共进化关
系的氨基酸位点对ꎮ
关键词: 核心薄囊蕨ꎻ psbD基因ꎻ 选择压力ꎻ 共进化
中图分类号: Q941          文献标识码: A          文章编号: 2095 ̄0837(2013)05 ̄0429 ̄10
      收稿日期: 2013 ̄04 ̄17ꎬ 修回日期: 2013 ̄06 ̄28ꎮ
  基金项目: 国家自然科学基金资助项目(31070594)ꎻ 湿地演化与生态恢复湖北省重点实验室开放课题ꎮ
  作者简介: 许可(1987-)ꎬ 男ꎬ 硕士研究生ꎬ 主要从事植物进化遗传学研究(E ̄mail: xuke09@mails􀆰 ucas􀆰 ac􀆰 cn)ꎮ
  ∗通讯作者(Author for correspondence􀆰 E ̄mail: tingwang@wbgcas􀆰 cn)ꎮ
Molecular Evolution of psbD Gene in Ferns:
Selection Pressure and Co ̄evolutionary Analysis
XU Ke1ꎬ2ꎬ WANG Bo1ꎬ2ꎬ SU Ying ̄Juan3ꎬ GAO Lei1ꎬ WANG Ting1∗
(1􀆰 Key Laboratory of Plant Germplasm Enhancement and Specialty Agricultureꎬ Wuhan Botanical Gardenꎬ Chinese Academy
of Sciencesꎬ Wuhan 430074ꎬ Chinaꎻ 2􀆰 University of Chinese Academy of Sciencesꎬ Beijing 100049ꎬ Chinaꎻ
3􀆰 School of Life Sciencesꎬ Sun Yat ̄sen Universityꎬ Guangzhou 510275ꎬ China)
Abstract: The D2 protein of the PhotosystemⅡ(PSⅡ) reaction center complex is encoded by
the chloroplast gene psbD. To gain a better understanding of the adaptive radiation of core
leptosporangiate ferns in low ̄light environmentsꎬ we sequenced psbD in twelve species and
collected eight published sequences to represent extant ferns in order level. We then evaluated
the selection pressure of D2 protein based on ω values ( nonsynonymous synonymous
substitution ratio). The results of statistical tests based on different models indicated that most
sites and branches were under strong negative selectionꎬ but tree ferns exhibited a slower
evolutionary rate and higher ω value compared with other ferns. Co ̄evolution analysis based on
different approaches showed that the D2 ̄R168ꎬ D2 ̄H245 and D2 ̄M272 of tree ferns were
involved in the same co ̄evolution network.
Key words: Core leptosporangiatesꎻ psbD geneꎻ Selective pressureꎻ Co ̄evolution
    一般认为ꎬ 伴随被子植物在白垩纪的兴盛ꎬ 包
括蕨类在内的、 非种子植物以外的其他维管植物的
多样性和丰富度都极度下降[1]ꎮ 然而ꎬ 近来有学
者利用分子和化石资料相结合的方法研究却发现ꎬ
随着被子植物的兴起ꎬ 部分蕨类植物因对阴生环境
的适应ꎬ 其物种多样性反而显著增加[2]ꎮ 现存的
蕨类植物超过 12000 种ꎬ 是微管植物中仅次于被
子植物的第二大类群[3]ꎬ 不仅形态性状变异极其
多样ꎬ 而且具有陆生、 水生、 石生和附生等多种类
型ꎮ 考虑到不同生境的环境因子ꎬ 特别是光条件的
明显差异ꎬ 推测蕨类植物在光合作用中起关键作用
的一些功能基因ꎬ 极有可能伴随物种的“辐射”式
分化而发生适应性进化ꎮ
光系统Ⅱ反应是植物吸收光能、 进行光诱导的
电荷分离、 产生电子传递并催化水光解的过程[4]ꎬ
该过程是在光系统Ⅱ( PSⅡ)复合体中完成[5]ꎮ
PSⅡ复合体的核心是由两个结构相似的 D1 和 D2
蛋白组成的光反应中心ꎬ 其中 D2蛋白由叶绿体基
因 psbD编码[6]ꎮ D2蛋白在维持 PSⅡ反应中心构
像的稳定和电子传递方面起重要作用ꎬ 同时还参与
调节 D1蛋白的表达[7]ꎮ 由于自然选择的作用ꎬ 功
能重要的蛋白质在进化过程中通常会受到较强的选
择压力ꎮ 为度量分子水平的选择压力ꎬ 可估算蛋白
编码基因序列的核苷酸非同义替换率(dN)和同义
替换率(dS)的比值 ω(ω =dN / dS)ꎬ 作为选择压
力的指标[8]ꎮ 另一方面ꎬ 同一蛋白质的氨基酸残
基之间还可能在进化上存在相关性: 重要氨基酸残
基在进化过程中发生的替换有可能因位于其他位点
的残基的替换而得到补偿ꎬ 从而维持蛋白质结构和
功能的稳定ꎮ 这些进化上相关的氨基酸残基ꎬ 被称
为共进化残基(co ̄evolving residues) [9ꎬ 10]ꎮ 鉴定
共进化残基ꎬ 有助于深化对适应性进化复杂机制的
理解[11]ꎮ
本研究根据 psbD基因侧翼的保守区序列设计
引物ꎬ 克隆并测定了 12 种蕨类植物的 psbD 基因
序列ꎬ 联合其他已经公布的蕨类植物 psbD基因序
列ꎬ 进而对 psbD基因及其编码的 D2 蛋白展开了
适应性进化和共进化分析ꎮ 目的是: 第一ꎬ 检测
psbD基因在蕨类不同分支所受的选择压力ꎻ 第
二ꎬ 鉴定 D2蛋白发生适应性进化的氨基酸位点ꎻ
第三ꎬ 揭示蕨类植物 D2蛋白氨基酸位点的共进化
式样ꎮ
1  材料和方法
1􀆰 1植物材料
实验所用的植物材料采自中国科学院武汉植物
园(WBGCAS)ꎬ 中国科学院华南植物园(SCBG ̄
CAS)和深圳市中国科学院仙湖植物园 ( FBG ̄
SCAS)ꎬ 另外由 GenBank 数据库(http: / / www􀆰
ncbi􀆰 nlm􀆰 nih􀆰 gov / )获得了 8种蕨类植物以及1种
外类群的 psbD基因序列(表 1)ꎮ 取样的原则是根
据Smith等[12]和刘红梅等[13]对蕨类植物的分类ꎬ
表 1  材料来源和 GenBank登录号
Table 1  Source of materials and GenBank
accession numbers
种名
Species
采集地点∗∗
Location
GenBank
登录号
GenBank
accession No.
鹿角蕨 Platycerium bifurcatum
(Cav.) C.Chr. WBGCAS KC831598
巢蕨 Asplenium australasicum
(J.Sm.) Hook. WBGCAS KC831602
欧洲蕨∗
Pteridium aquilinum (L.) Kuhn HM535629
碎米蕨∗
Cheilanthes lindheimeri Hook. HM778032
铁线蕨∗
Adiantum capillus ̄veneris L. NC_004766
瘤足蕨 Plagiogyria japonica Nakai FBGSCAS KC831599
桫椤∗ Alsophila spinulosa
(Hook.) R. M. Tryon NC_012818
笔筒树 Sphaeropteris lepifera
(Hook.) R. M. Tryon WBGCAS KC831594
苹 Marsilea quadrifolia L. WBGCAS KC831603
蜂巢槐叶蘋 Salvinia molesta Mitchell WBGCAS KC831595
满江红 Azolla caroliniana Willd. WBGCAS KC831600
海金莎∗
Lygodium japonicum (Thunb.) Sw. EU328240
芒萁 Dicranopteris linearis
(Burm.) Underw. FBGSCAS KC831601
漏斗瓶蕨 Vandenboschia radicans
(Sw.) Cop. WBGCAS KC831597
华南紫萁 Osmunda vachellii Hook. SCBGCAS KC831605
观音座莲∗ Angiopteris evecta
(J. R. Forst.) Hoffmann NC_008829
松叶蕨∗ Psilotum nudum (L.) Beauv. NC_003386
劲直阴地蕨
Botrychium strictum Underw. WBGCAS KC831596
七指蕨 Helminthostachys zeylanica
(L.) Hook. SCBGCAS KC831604
问荆∗ Equisetum arvense L. NC_014699
水韭∗ Isoetes flaccida
Shuttlew. ex A. Braun NC_014675
    注: ∗ꎬ 表示由 GenBank 获得的数据ꎻ ∗∗ꎬ WBGCAS—中国
科学院武汉植物园ꎬ SCBGCAS—中国科学院华南植物园ꎬ
FBGSCAS—深圳市中国科学院仙湖植物园ꎮ
Notes: ∗Sequences data were downloaded from GenBankꎻ
∗∗WBGCAS—Wuhan Botanical Gardenꎬ Chinese Acade ̄
my of Sciencesꎬ SCBGCAS—South China Botanical Gar ̄
denꎬ Chinese Academy of Sciencesꎬ FBGSCAS—Fairy ̄
lake Botanical Gardenꎬ Shenzhen and Chinese Academy
of Sciences.
034 植 物 科 学 学 报 第 31卷 
使得材料样本覆盖到蕨类植物的目级水平ꎻ 物种丰
富度较高核心薄囊蕨类植物的水龙骨目(Polypodi ̄
ales)、 树蕨目(Cyatheales)和水生异型孢子蕨目
(Salviniales)ꎬ 我们分别选取了 5 种、 3 种和 3 种
代表植物ꎮ
1􀆰 2  总 DNA提取、 PCR、 克隆和测序
采用植物基因组 DNA抽提试剂盒(TIANGENꎬ
北京)对材料进行总 DNA 的提取ꎬ 实验步骤按照
试剂盒说明书进行ꎮ 根据 psbD基因侧翼的保守区
设计两对 PCR 引物: F1 ( 5′ ̄TCCYTGTTCATA ̄
CATAGGCTTYTC ̄3′)和 R1(5′ ̄ATGGTAAGGCG ̄
TAAGTCGTC ̄3′)、 F2 ( 5′ ̄CGTGGGCACCAAG ̄
TAATTTACCAGA ̄3′)和 R2 (5′ ̄ATGGTAAGGCG ̄
TAAGTCGTC ̄3′)ꎮ 引物由上海英骏生物技术有限
公司(上海)合成ꎮ 每 50 μL PCR 反应体系包括:
2􀆰 5 ng DNA模板、 正反向引物各 2 μL(10 μmol /
L)、 1􀆰 5 U LA Taq DNA聚合酶(TAKARAꎬ 大连)
和 10倍 PCR缓冲液 5 μL、 8 μL dNTPsꎮ PCR 反
应程序为: ①预变性 94℃ 7 minꎬ ②变性 94℃
30 sꎬ ③退火和延伸 62℃ 3 minꎬ ④后延伸 72℃
10 minꎻ 其中② ~③重复 35 个循环ꎮ 将获得的
PCR产物纯化后与 PCR 2􀆰1 载体连接ꎬ 热激转化
至大肠杆菌 DH5αꎬ 然后挑选阳性克隆进行 PCR
鉴定ꎮ 随机挑选 3个阳性克隆送华大生物技术有限
公司(武汉)进行测序ꎮ
1􀆰 3  系统发育树的构建
利用 MUSCLE 软件[14]对序列进行比对ꎬ 采
用 Modeltest 3􀆰7 软件[15]选取最适核苷酸进化模
型ꎮ 运行MrBayes 3􀆰2 软件[16]经贝叶斯途径推测
系统发育关系ꎬ 后验概率依 Metropolis ̄Hastings ̄
Green算法通过马尔可夫链(Markov Chain Mon ̄
ta Carloꎬ MCMC)运行 1000000 代估计ꎮ MCMC
分析以随机树起始ꎬ 每 100 代保存一棵树ꎮ 使用
Tracer v1􀆰 5 软件[17]检验收敛程度ꎻ 当所有参数
的有效取样大小(Efficient Sampling Sizeꎬ ESS)
值均大于 500 时ꎬ 认为迭代运算达到收敛ꎮ 摒弃
老化样本(Burnin = 2500) ꎬ 由剩余样本构建一
致树ꎮ
1􀆰 4  适应性进化分析
主要利用 PAML 4􀆰 5 软件[18]完成分析ꎮ 采用
3种模型: (1)分支模型[19]ꎬ 它允许非同义替换和
同义替换的比值 ω 在不同支系上有变化ꎬ 其中单
比率模型(One ratio model)假定所有进化支的 ω
值都是一致的ꎬ 而自由比率模型(Free ratio model)
假定各支的 ω 值各不同ꎬ 还有居于两者之间的二
比率模型(Two ratio model)假定前景支与背景支
的 ω值不同ꎬ 自由比率模型和二比率模型分别与
单比率模型进行似然比检验(Likelihood ratio testꎬ
LRT)ꎬ 检验模型之间是否有显著性差异ꎻ (2)位
点模型[8ꎬ20]假设不同位点有不同的选择压力ꎬ 模型
M2a(选择) 、 M3(离散)及 M8(beta 和 ω)的假
定条件中均允许存在 ω值大于 1 的位点ꎬ 与各自
对应的零假设模型 M1a(近中性) 、 M0(单一比
率)及 M7(beta)进行 LRT 分析ꎬ 通过比较模型
间差异的显著性来检验正选择位点ꎻ (3)分支 ̄位
点模型[21]将进化树上的支系分成前景支和背景支
两类ꎬ 仅仅允许前景支有正选择位点ꎬ 采用分支 ̄
位点模型 A的检验 2 检验前景支是否存在正选择
位点ꎮ
此外ꎬ 还基于机理式和经验式整合模型(Me ̄
chanistic ̄empirical combination modelꎬ MEC)[22]、
固定效应似然模型 ( Fixed effects likelihood mo ̄
delꎬ FEL)和单一似然祖先计数法(Single likelihood
ancestor countingꎬ SLAC) [23]进行分析ꎮ MEC 分
析利 用 网 络 服 务 器 Selecton ( http: / / selec ̄
ton􀆰 tau􀆰 ac􀆰 il / )完成ꎬ FEL和 SLCA分析采用 Dat ̄
amonkey服务器(http: / / www􀆰 datamonkey􀆰 org / )
完成ꎮ
1􀆰 5  共进化分析
采用 Pearson相关系数法[24]、 参数检验法[25]
和互信息法(Mutual Information)[26]等对氨基酸残基
的共进化关系进行了检测ꎮ 通过网络服务器 CAPS
(http: / / bioinf􀆰 gen􀆰 tcd􀆰 ie / caps / )[27]、 Spidermon ̄
key[28](http: / / www􀆰 datamonkey􀆰 org / )和 Intermap
3D[29] ( http: / / www􀆰 cbs􀆰 dtu􀆰 dk / services / Inter ̄
Map3D/ )完成分析ꎮ
2  结果
2􀆰 1  系统发育关系树的构建
测得的 12 种蕨类植物的 psbD 基因的 ORF
134  第 5期                      许 可等: 蕨类植物 psbD基因的适应性进化和共进化分析
区长度均为 1059 bpꎬ 编码 353 个氨基酸ꎮ 序列
提 交 至 GenBankꎬ 登 录 号 为: KC831594 ̄
KC831605(表 1)ꎮ 以石松类植物水韭( Isoetes
flaccida)为外类群ꎬ 利用 psbD 基因序列基于贝
叶斯法重建了 20 种蕨类植物的系统发育树(图
1)ꎬ 该系统树的拓扑结构与 Smith 等[12]的报道
基本一致ꎮ 木贼科的问荆(Equisetum arvense)、
合囊蕨科的观音座莲(Angiopteris evecta)、 松叶
蕨科的松叶蕨(Psilotum nudum)以及瓶儿小草科
的劲直阴地蕨 (Botrychium strictum)和七指蕨
(Helminthostachys zeylanica)都是蕨类中比较原
始的基部类群ꎬ 聚在一起ꎮ 薄囊蕨类植物的早期
成员华南紫萁 (Osmunda vachellii)独自构成一
支ꎬ 占据薄囊蕨类的最基部位置ꎻ 随后是漏斗瓶
蕨(Vandenboschia radicans)与互为姊妹群的芒
萁(Dicranopteris linearis)和海金沙 ( Lygodium
japonicum)构成一个单系分支(后验概率 0􀆰 84)ꎮ
核心薄囊蕨的水生异型孢子蕨类(以下简称: 水
生蕨类)、 树蕨类和水龙骨类聚在一起构成单系
分支(后验概率为 1􀆰 00)ꎮ
2􀆰 2  选择压力检测
2􀆰 2􀆰 1  运用 PAML检测选择压力
以用贝叶斯法构建的进化树为树文件ꎬ 利用
PAML软件对 psbD基因进行进化分析ꎮ 分支模型
中ꎬ 单比率模型涉及 40 个参数ꎬ 似然值 ℓ0 =
-6641􀆰 19ꎬ 估测的 ω 值为 0􀆰 0165ꎻ 自由比率模
型包括 77 个参数ꎬ 似然值 ℓ1 =-6580􀆰19(表 2)ꎮ
以 2Δℓ=2(ℓ1-ℓ0)= 122􀆰 00ꎬ 进行自由度为 37的
χ2 的比较ꎬ 结果显示自由比率模型显著优于单比
率模型(p<0􀆰 01)(表 3)ꎬ 这提示各支系的 ω值不
同ꎬ 选择压力在支系间异质ꎮ 以树蕨类分支(B)
为前景支ꎬ 其他分支的为背景支ꎬ 运行二比率模型
!"#$%
Core leptosporangiates
#$%
Leptosporangiates
0.55
A
B
C
0.96
0.84
0.99
0.99
0.51
0.79
0.1
Platycerium bifurcatum
Asplenium australasicum
Pteridium aquilinum
Cheilanthes lindheimeri
Adiantum capillus-veneris
Plagiogyria japonica
Alsophila spinulosa
Sphaeropteris lepifera
Marsilea quadrifolia
Salvinia molesta
Azolla caroliniana
Lygodium japonicum
Dicranopteris linearis
Vandenboschia radicans
Osmunda vachellii
Angiopteris evecta
Psilotum nudum
Botrychium strictum
Helminthostachys zeylanica
Equisetum arvense
Isoetes flaccida
分支上的数字为后验概率ꎬ 后验概率为 1􀆰 00的未标示ꎬ A、 B和 C分别代表水龙骨类、 树蕨类和水生蕨类ꎮ
Posterior probability values are given above branchesꎬ the value of 1􀆰 00 are not displayed. Aꎬ B and C stand for
Polypodialesꎬ Cyatheales and Salviniales.
图 1  基于蕨类 psbD基因序列数据利用贝叶斯法得出的一致树
Fig􀆰 1  Consensus tree resulting from the Bayesian inference of psbD gene sequences of ferns
234 植 物 科 学 学 报 第 31卷 
表 2  psbD基因在不同模型下的参数估计值和对数似然值
Table 2  Parameter estimates and log ̄likelihood values for psbD gene under different models
模型         
Models         
参数个数
p∗
似然值

参数估计值
Estimated value of parameters
正选择位点
Positively
selected sites
分支模型
Branch model
位点模型
Site model
分支 ̄位点模型
Branch ̄site
model
单一比率 (M0) 40 -6641.191417 ω= 0.01647 不允许Not allowed
二比率 A (MA) 41 -6638.653830 ω0 = 0.01862ꎬ ω1 = 0.00907
不允许
Not allowed
二比率 B (MB) 41 -6632.739321 ω0 = 0.014503ꎬ ω1 = 0.08188
不允许
Not allowed
二比率 C (MC) 41 -6639.135648 ω0 = 0.01784ꎬ ω1 = 0.00748
不允许
Not allowed
自由比率 F (MF) 77 -6580.192339
ωa = 0.0001ꎬ ωb = 0.2174ꎬ
ωc = 0.0333
不允许
Not allowed
Model 1a (M1a): 近中性 41 -6632.291118
p0 = 0.98951ꎬ ω0 = 0.01402ꎬ
p1 = 0.01049ꎬ ω1 = 1.00000
不允许
Not allowed
Model 2a (M2a): 正选择 43 -6632.291118
p0 = 0.98951ꎬ ω0 = 0.01402ꎬ
p1 = 0.01049ꎬ ω1 = 1.00000ꎬ
p2 = 0.00000ꎬ ω2 = 48.75004

None
Model 3 (M3): 离散 44 -6614.675254
p0 = 0.69673ꎬ ω0 = 0.00000ꎬ
p1 = 0.29046ꎬ ω1 = 0.04699ꎬ
p2 = 0.01281ꎬ ω2 = 0.34518

None
Model 7 (M7): beta 41 -6616.641299 p= 0.17182ꎬ q= 8.47194 不允许Not allowed
Model 8 (M8): beta和 ω>1 43 -6616.644821
p0 = 0.99999ꎬ p= 0.17182ꎬ
q= 8.47190ꎬ p1 = 0.00001ꎬ
ω= 2.60238

None
水龙骨分支 (Ma0):ω2 固定为 1 42 -6632.291118
p0 = 0.98951ꎬ ω0 = 0.01402ꎬ
p1 = 0.01049ꎬ ω1 = 1.00000ꎬ
p2+p3 = 0.00000ꎬ ω2 = 1.00000
不允许
Not allowed
水龙骨分支 (Ma): ω2 为估计值 43 -6632.291118
p0 = 0.98951ꎬ ω0 = 0.01402ꎬ
p1 = 0.01049ꎬ ω1 = 1.00000ꎬ
p2+p3 = 0.00000ꎬ ω2 = 1.00000

None
树蕨分支 (Mb0): ω2 固定为 1 42 -6627.799297
p0 = 0.93391ꎬ ω0 = 0.01280ꎬ
p1 = 0.00924ꎬ ω1 = 1.00000ꎬ
p2+p3 = 0.05685ꎬ ω2 = 1.00000
不允许
Not allowed
树蕨分支 (Mb): ω2 为估计值 43 -6627.799297
p0 = 0.93391ꎬ ω0 = 0.01280ꎬ
p1 = 0.00924ꎬ ω1 = 1.00000ꎬ
p2+p3 = 0.05685ꎬ ω2 = 1.00000
168R (50.0%)
水生蕨分支 (Mc0): ω2 固定为 1 42 -6632.291118
p0 = 0.98951ꎬ ω0 = 0.01402ꎬ
p1 = 0.01049ꎬ ω1 =1.00000ꎬ
p2+p3 = 0.00000ꎬ ω2 = 1.00000
不允许
Not allowed
水生蕨分支 (Mc): ω2 为估计值 43 -6632.291118
p0 = 0.98951ꎬ ω0 = 0.01402ꎬ
p1 = 0.01049ꎬ ω1 =1.00000ꎬ
p2+p3 = 0.00000ꎬ ω2 = 1.00000

None
注: p∗为 ω分布中参数的个数ꎻ ℓ为最大似然值的对数ꎮ
Notes: p∗ is number of parameters in ω distributionꎻ ℓ means log maximum likelihood value.
进行检测ꎬ 结果显示树蕨分支的 ω 值是其他分支
的 5倍多(0􀆰 08188 / 0􀆰 014503≈5􀆰 65)ꎻ 秩和检验
结果表明树蕨类分支的非同义替换速率(dN)与其
他蕨类植物差异不显著(p>0􀆰 05)ꎬ 而同义突变速
率(dS)极显著降低(p<0􀆰 01)ꎬ 进而导致树蕨类植
物分支的 ω值较高(图 2)ꎮ
对 D2蛋白编码序列位点间选择压力检测结果
表明ꎬ M3模型显著优于M0模型(p<0􀆰 01)(表 3)ꎬ
334  第 5期                      许 可等: 蕨类植物 psbD基因的适应性进化和共进化分析
表 3  PAML4􀆰 5软件中不同模型的
似然比值检验统计量(2 Δℓ)
Table 3  Likelihood ratio statistics of different
models in PAML version 4.5(2 Δℓ)
模型比较
Comparison of models
自由度
d.f. 2 Δℓ
p值
p value
M0 & MA 1 5.08 <0.05∗
M0 & MB 1 16.90 <0.01∗∗
M0 & MC 1 4.11 <0.05∗
M0 & MF 37 122.00 <0.01∗∗
M1a & M2a 2 0.00 1.00
M0 & M3 4 53.03 <0.01∗∗
M7 & M8 2 0.00 1.00
Ma0 & Ma 1 0.00 1.00
Mb0 & Mb 1 0.00 1.00
Mc0 & Mc 1 0.00 1.00
    注: MA和 MaꎬMB和 MbꎬMC和 Mc分别代表:以水龙骨类分
支、树蕨类分支和水生蕨类分支为前景支的二比率模型和
分支位点模型ꎻMF 代表自由比率模型ꎻ∗∗代表极显著ꎬ∗
代表显著ꎮ
Notes: MA and Maꎬ MB and Mbꎬ MC and Mcꎬ stands for poly ̄
podiales branchesꎬ cyatheales branches and salviniales
branches as the foreground branches of two ratio model
and branch ̄site modelꎬ respectivelyꎻ MF means freed ̄ra ̄
tio modelꎻ ∗∗ indicates extremely significant differenceꎬ
∗indicates significant difference.
说明位点间承受的选择压力具有异质性ꎻ 而 M2a
和 M8 不优于各自对应的零模型 M1a 和 M7(p>
0􀆰 05)(表 3)ꎬ 因此这两对模型进行比较无法检验
正选择ꎮ 模型 M3中 3类密码子位点的 p0、 p1和
p2 分别对应的 ω 值为 0􀆰 00000、 0􀆰 04699 和
0􀆰 34518ꎬ 说明 98􀆰 7%左右的位点处于较强的负选
择压力(表 2)ꎮ
由于核心薄囊蕨(水龙骨类ꎬ 树蕨类和水生
蕨类)占蕨类总数 80%以上[30] ꎬ 分布范围更加广
泛ꎬ 生境也更加多样化(包含旱生、 水生和附生
等[31ꎬ32] )ꎬ 为了检测核心薄囊蕨的 psbD 基因是
否经历插曲式自然选择ꎬ 分别设置水龙骨类(a)、
树蕨类(b)和水生异型蕨类(c)为前景支ꎬ 采用
分支 ̄位点模型进行正选择位点的检测ꎮ 分支 a 和
分支 c上没有检测出正选择位点ꎬ 分支 b 虽然检
测到 168R 一 个 正 选 择 位 点 (后 验 概 率 为
50􀆰 0%)ꎬ 但似然比检验拒绝存在正选择位点的
假设(表 3)ꎬ 因此分支 b 的检测不能作为可信的
正选择证据ꎮ
0.01 subst. / site
dN
Adiantum capillus-veneris
Cheilanthes lindheimeri
Pteridium aquilinum
Platycerium bifurcatum
Asplenium australasicum
Sphaeropteris lepifera
Alsophila spinulosa
Plagiogyria japonica
Salvinia molesta
Azolla caroliniana
Marsilea quadrifolia
Dicranopteris linearis
Lygodium japonicum
Vandenboschia radicans
Osmunda vachellii
Botrychium strictum
Helminthostachys zeylanica
Psilotum nudum
Angiopteris evecta
Equisetum arvense
Isoetes flaccida
0.1 subst. / site 0.1
A. capillus-veneris A. capillus-veneris
C. lindheimeri C. lindheimeri
P. aquilinum P. aquilinum
P. bifurcatum P. bifurcatum
A. australasicum A. australasicum
S. lepifera S. lepifera
A. spinulosa A. spinulosa
P. japonica P. japonica
S. molesta S. molesta
A. caroliniana A. caroliniana
M. quadrifolia M. quadrifolia
D. linearis D. linearis
L. japonicum L. japonicum
V. radicans V. radicans
O. vachellii O. vachellii
B. strictum B. strictum
H. zeylanica H. zeylanica
P. nudum P. nudum
A. evecta A. evecta
E. arvense E. arvense
I. flaccida I. flaccida
dS d dN S/
图 2  自由比率模型下的选择压力检测结果ꎬ 支长分别代表 dN、 dS 和 ω(ω=dN / dS)值ꎬ 阴影区域代表树蕨类
Fig􀆰 2  Selective pressure based on free ̄ratio modelꎬ branch length indicates dNꎬ
dS and ω (ω=dN / dS) valuesꎬ tree ferns are shown in shaded regions
434 植 物 科 学 学 报 第 31卷 
2􀆰 2􀆰 2  基于 Selecton和 Datamonkey检测选择压力
2􀆰 2􀆰 2􀆰 1  利用Selecton的MEC模型分析选择压力
根据 MEC 模型计算出的各个位点 ω >1 的
BEB后验概率以及 ω 值绘制成图 3ꎬ 总长为 353
个氨基酸位点ꎬ 在后验概率大于 95%条件下ꎬ 以
ω≤0􀆰 21为标准的负选择位点有 349 个ꎬ 占总序
列的 98􀆰 9%ꎻ 以 ω>1为标准在后验概率大于 80%
的条件下ꎬ 没有正选择位点ꎮ
2􀆰 2􀆰 2􀆰 2  基于 Datamonkey检测选择压力
利用 SLAC 模型和 FEL 模型ꎬ 在 p =0􀆰 05 的
标准下ꎬ 未检测到正选择位点ꎬ 分别鉴定出 234
个和 268个负选择位点ꎮ 这提示负选择起主导作
用ꎮ
2􀆰 3  D2蛋白序列的共进化分析
采用多种方法在 D2蛋白氨基酸序列内部共鉴
定出 13对共进化位点对ꎮ CAPS 方法鉴定出 1 对
共进化位点对ꎬ 它们的共进化方式与蛋白质的疏水
性和分子量均呈极显著相关(p<0􀆰 01)ꎮ Spider ̄
monkey模块共检测 5对共进化位点对ꎬ 鉴定过程
如下: 经贝叶斯图形模型 ( Bayesian graphical
modelsꎬ BGMs)进行预处理ꎬ 在 25 个分支的 57
个位点上发现有 91 个非同义替换存在潜在的共进
化关系ꎬ 在 p=0􀆰 5的水平ꎬ 进一步运行 BGMs 模
型的单亲模型(One parent)和双亲模型(Two pa ̄
rent)共鉴别出 5 对共进化对ꎮ 最后利用 InterMap
3D中的行列加权互信息(RCW ̄MI)、 互信息 ̄熵比
(MI / E)和依赖性(Dependency) 3 个模型共鉴定
出 10对共进化位点对(表 4)ꎮ 其中有 4 对共进化
位点在两种服务器均被检测到ꎮ
3  讨论
3􀆰 1  树蕨类植物分子进化速率降低
利用 psbD基因构建的系统发育树中树蕨类植
物分支(B)的支长较短(图 1)ꎬ 说明树蕨类植物
psbD基因的核苷酸替换速率低于其他蕨类植物ꎬ
树蕨类进化速率降低不仅存在于叶绿体基因[33]ꎬ
也存在于核基因和线粒体基因[34]ꎬ 可能因为:
(1)树蕨类的世代周期较长ꎬ 如瘤足蕨属(Plagio ̄
gyria)的世代周期为 15 年[35]ꎬ 因生殖引起的核苷
酸替换的几率较小ꎬ 同样的现象也存在于被子植物
中ꎬ 多年生植物进化速率低于一年生种类[36]ꎻ
(2)树蕨类植物大多是零星式分布ꎬ 有效种群规模
较小[37]ꎬ 缺乏有效的基因交流ꎬ 种群中的遗传变
异容易因漂变而丢失ꎮ
3􀆰 2  不同分支上自然选择作用
侏罗纪时代蕨类植物曾在地球上极为繁盛ꎬ 伴
1
1
11
11
21
21
31
31
41
41
51
51
61
61
71
71
81
81
91
91
10
1
10
1
11
1
11
1
12
1
12
1
13
1
13
1
14
1
14
1
15
1
15
1
16
1
16
1
17
1
17
1
18
1
18
1
19
1
19
1
20
1
20
1
21
1
21
1
22
1
22
1
23
1
23
1
24
1
24
1
25
1
25
1
26
1
26
1
27
1
27
1
28
1
28
1
29
1
29
1
30
1
30
1
31
1
31
1
32
1
32
1
33
1
33
1
34
1
34
1
35
1
35
1
0.60
0.50
0.40
0.30
0.20
0.10
0.00
0.80
0.60
0.40
0.20
0.00
ω
!
"
#
ω
es
tim
at
ed
v
al
ue
s
ω
1$
%
&

p-
va
lu
e
fo
r ω

1
()*+,-. Amino acide site No.
        氨基酸位点编号参照笔筒树 psbD基因序列ꎮ
        Sites are numbered according to the psbD sequence of Cyathea lepifera.
图 3  MEC所估计的参数值
Fig􀆰 3  Estimated values of parameters under MEC
534  第 5期                      许 可等: 蕨类植物 psbD基因的适应性进化和共进化分析
表 4  D2蛋白的共进化对
Table 4  Co ̄evolution pairs with the D1 protein
服务器
Websites
共进化对
Co ̄evolutionary pairs
CAPS 18 19
Spidermonkey 168 245
180 64
210 285
241 178
288 19
45 115
InterMap3D 41 122
168 245
168 272
245 272
19 288
8 14
8 84
64 180
18 117
45 115
    注: 字体加粗的数字表示被一种以上服务器鉴定出的共进化位点ꎮ
Note: Numbers in bold indicate that sites have been detec ̄
ted more than once.
随着被子植物在白垩纪的兴起ꎬ 陆地生态系统开始
发生明显改变ꎮ 水龙骨类祖先和水生蕨类祖先通过
生态型分化(石生、 附生和泽生等)ꎬ 大部分栖息
于被子植物难于生存的环境[3]ꎬ 而树蕨类植物与
部分被子植物生境重叠(如发现桫椤和竹子部分生
态位重叠[37])ꎬ 争夺光的环境压力更大ꎮ 在分子水
平进行选择压力检测证实ꎬ 树蕨类植物的 PSⅡ复
合体 D2蛋白受到选择压力显著不同于其他蕨类ꎮ
3􀆰 3  具有重要功能的位点进化
本研究采用的位点模型和分支位点模型均未检
测到正选择位点ꎮ 可能是因为 psbD基因序列数据
包含的变异太少ꎬ 适应性信号被淹没于极其普遍的
净化选择之中ꎮ 其次ꎬ 从进化的时间上考虑ꎬ 核心
薄囊蕨的水龙骨类、 树蕨类和水生蕨类在 2􀆰 1 ~
2􀆰 2亿年前已经分化[2]ꎬ 如果适应性进化发生在早
期并已经被固定下来ꎬ 鉴定单个或者是少数几个的
正选择会更加困难ꎮ 所以ꎬ 即使 psbD基因编码的
D2蛋白在核心薄囊蕨分化的早期发生过正选择ꎬ
但是由于有可能被掩盖在不影响其功能的中性替换
中ꎬ 因此需要开发新的方法检测功能重要位点的适
应进化ꎮ
本研究利用多种方法鉴定出蕨类植物 D2 蛋白
分子内 13对共进化位点ꎬ 这些位点为理解蕨类植
物 D2进化机制提供了重要信息ꎬ 如鉴定出的 45S
和 115Ⅰ位点ꎬ 在水生蕨类中共进化ꎬ 这两个位点
对应的密码子均是回复突变ꎬ 45S 与水韭的一致ꎬ
115Ⅰ与蓝藻的一致ꎮ 考虑到水韭和蓝藻均为水生
植物ꎬ 这两个位点的回复突变可能与水生生活形态
有关ꎮ
2011年ꎬ Umena 等报道了蓝藻(Thermosyn ̄
echococcus vulcanus)PSⅡ复合体分辨率为 1􀆰 9Å
的晶体结构ꎬ 表明 D2 ̄Y244 与 Fe+2结合相关[38]ꎬ
该位点对其结构的稳定和功能的实现具有重要意
义ꎮ 然而树蕨类植物与之相应的位点 245ꎬ 由疏水
性酪氨酸(Y)替换成碱性组氨酸(H)ꎬ 考虑到正电
荷与负电荷之间可形成离子键ꎬ 该位点的突变可能
加强了与 Fe+2的结合ꎮ 共进化分析显示ꎬ 树蕨类植
物 168R、 272T和 245H构成的共进化网络ꎬ 一方
面说明 245H位点很重要ꎬ 该位点的突变需要其他
位点进行补偿以维持 PSⅡ复合体结构的稳定和功
能的实现ꎻ 另一方面说明蛋白质水平分子进化的作
用机制复杂ꎬ 单个具有重要功能的氨基酸位点改变
可能引起连锁反应ꎮ
参考文献:
[ 1 ]   Crane P RꎬFriis E MꎬPedersen K R. The origin and
early diversification of angiosperms [ J] . Natureꎬ
1995ꎬ 374(6517): 27-33.
[ 2 ]   Schneider HꎬSchuettpelz EꎬPryer K MꎬCranfill Rꎬ
Magallon SꎬLupia R. Ferns diversified in the sha ̄
dow of angiosperms[J].Natureꎬ 2004ꎬ 428(6982):
553-557.
[ 3 ]   Page C N. Ecological strategies in fern evolution:a
neopteridological overview [ J ] . Rev Palaeobot
Palynoꎬ 2002ꎬ 119(1-2): 1-33.
[ 4 ]   孙瑞雪ꎬ杨春虹.光系统Ⅱ的结构与功能以及光合膜
对环境因素的响应机制[J] .生物物理学报ꎬ 2012ꎬ
28(7): 537-548.
[ 5 ]   Shi L XꎬHall MꎬFunk CꎬSchroder W P. Photosys ̄
tem Ⅱꎬa growing complex:updates on newly dis ̄
covered components and low molecular mass pro ̄
teins[J] .Biochim Biophys Actaꎬ 2012ꎬ 1817: 13-
25.
[ 6 ]   Marder J BꎬChapman D JꎬTelfer AꎬNixon P JꎬBar ̄
634 植 物 科 学 学 报 第 31卷 
ber J. Identification of psbA and psbD Gene ̄Pro ̄
ductsꎬD1 and D2ꎬas reaction center proteins of
photosystem ̄2[ J] . Plant Mol Biolꎬ 1987ꎬ 9 (4):
325-333.
[ 7 ]   Diner B AꎬRappaport F. Structureꎬdynamicsꎬand
energetics of the primary photochemistry of photo ̄
system Ⅱ of oxygenic photosynthesis [ J] . Annu
Rev Plant Biolꎬ 2002ꎬ 53: 551-580.
[ 8 ]   Yang ZꎬBielawski J P. Statistical methods for de ̄
tecting molecular adaptation[J] .Trends Ecol Evolꎬ
2000ꎬ 15(12): 496-503.
[ 9 ]   Süel G MꎬLockless S WꎬWall M AꎬRanganathan
R. Evolutionarily conserved networks of residues
mediate allosteric communication in proteins [ J] .
Nature Struct Biolꎬ 2002ꎬ 10: 59-69.
[10]   吕品一ꎬ郑珩ꎬ劳兴珍.蛋白质共进化分析研究进展
[J] .生物信息学ꎬ 2010(1): 34-37.
[11]   Fares M A.Computational and statistical methods
to explore the various dimensions of protein evolu ̄
tion[J] .Current Bioinformaticsꎬ 2006ꎬ 1(2): 207-
217.
[12]   Smith A Rꎬ Pryer K Mꎬ Schuettpelz Eꎬ Korall Pꎬ
Schneider HꎬWolf P G. A classification for extant
ferns[J] .Taxonꎬ 2006ꎬ 55(3): 705-731.
[13]   刘红梅ꎬ王丽ꎬ张宪春ꎬ曾辉.石松类和蕨类植物研究
进展: 兼论国产类群的科级分类系统[J] .植物分类
学报ꎬ 2008ꎬ 46(6): 808-829.
[14]   Edgar R C. MUSCLE: a multiple sequence align ̄
ment method with reduced time and space com ̄
plexity[J] .BMC Bioinformaticsꎬ 2004ꎬ 5: 113.
[15]  Posada DꎬCrandall K. Modeltest: testing the model
of DNA substitution[ J] .Bioinformaticsꎬ 1998ꎬ 14
(9): 817-818.
[16]   Ronquist FꎬTeslenko MꎬVan Der Mark PꎬAyres D
LꎬDarling AꎬHohna SꎬLarget BꎬLiu LꎬSuchard M
AꎬHuelsenbeck J P. MrBayes 3􀆰 2:Efficient baye ̄
sian phylogenetic inference and model choice
across a large model space[J] .Syst Biolꎬ 2012ꎬ
61(3): 539-542.
[17]   Rambaut Aꎬ Drummond A. Tracer v1􀆰 5 [ CP ] .
http: / / tree. bio. ed. ac. uk / software / tracer / [ 2009 ̄
11 ̄30] .
[18]   Yang Z H. PAML 4: Phylogenetic analysis by max ̄
imum likelihood[J] .Mol Biol Evolꎬ 2007ꎬ 24(8):
1586-1591.
[19]   Yang Z H. Likelihood ratio tests for detecting posi ̄
tive selection and application to primate lysozyme
evolution[J] .Mol Biol Evolꎬ 1998ꎬ 15 (5): 568-
573.
[20]   Nielsen RꎬYang Z H. Likelihood models for detec ̄
ting positively selected amino acid sites and appli ̄
cations to the HIV ̄1 envelope gene[J] .Geneticsꎬ
1998ꎬ 148(3): 929-936.
[21]   Zhang J ZꎬNielsen RꎬYang Z H. Evaluation of an
improved branch ̄site likelihood method for detec ̄
ting positive selection at the molecular level [ J] .
Mol Biol Evolꎬ 2005ꎬ 22(12): 2472-2479.
[22]   Stern AꎬDoron ̄Faigenboim AꎬErez EꎬMartz EꎬBa ̄
charach Eꎬ Pupko T. Selecton 2007: advanced
models for detecting positive and purifying selec ̄
tion using a Bayesian inference approach[J] .Nu ̄
cleic Acids Resꎬ 2007ꎬ 35: 506-511.
[23]   Delport WꎬPoon A F YꎬFrost S D WꎬPond S L K.
Datamonkey 2010:a suite of phylogenetic analysis
tools for evolutionary biology [ J] . Bioinformaticsꎬ
2010ꎬ 26(19): 2455-2457.
[24]   Göbel UꎬSander CꎬSchneider RꎬValencia A. Cor ̄
related mutations and residue contacts in proteins
[J] . Protein:Struct Funct Genetꎬ 1994ꎬ 18 (4):
309-317.
[25]   Pollock D DꎬTaylor W RꎬGoldman N.Coevolving
protein residues:maximum likelihood identification
and relationship to structure[J] .J Mol Biolꎬ 1999ꎬ
287(1): 187-198.
[26]   Martin LꎬGloor GꎬDunn SꎬWahl L. Using informa ̄
tion theory to search for co ̄evolving residues in
proteins[J] .Bioinformaticsꎬ 2005ꎬ 21(22): 4116-
4124.
[27]   Fares M AꎬMcnally D. CAPS:coevolution analysis
using protein sequences[J] .Bioinformaticsꎬ 2006ꎬ
22(22): 2821-2822.
[28]   Poon A FꎬLewis F IꎬFrost S DꎬPond S L K. Spider ̄
monkey:rapid detection of co ̄evolving sites using
Bayesian graphical models [ J ] . Bioinformaticsꎬ
2008ꎬ 24(17): 1949-1950.
[29]   Gouveia ̄Oliveira Rꎬ Roque F Sꎬ Wernersson Rꎬ
Sicheritz ̄Ponten TꎬSackett P WꎬMolgaard AꎬPe ̄
dersen A G.InterMap3D: predicting and visualizing
734  第 5期                      许 可等: 蕨类植物 psbD基因的适应性进化和共进化分析
co ̄evolving protein residues [ J ] . Bioinformaticsꎬ
2009ꎬ 25(15): 1963-1965.
[30]   Pryer K MꎬSchuettpelz EꎬWolf P GꎬSchneider Hꎬ
Smith A RꎬCranfill R. Phylogeny and evolution of
ferns (monilophytes) with a focus on the early lep ̄
tosporangiate divergences [ J] . Am J Botꎬ 2004ꎬ
91(10): 1582-1598.
[31]   Rothfels C JꎬWindham M DꎬGrusz A LꎬGastony G
JꎬPryer K M. Toward a monophyletic Notholaena
(Pteridaceae): resolving patterns of evolutionary
convergence in xeric ̄adapted ferns [ J] . Taxonꎬ
2008ꎬ 57(3): 712-724.
[32]   Schuettpelz EꎬPryer K M. Evidence for a Cenozoic
radiation of ferns in an angiosperm ̄dominated
canopy[ J] .Proc Natl Acad Sci USAꎬ 2009ꎬ 106
(27): 11200-11205.
[33]   Korall PꎬSchuettpelz EꎬPryer K M. Abrupt deceler ̄
ation of molecular evolution linked to the origin of
arborescence in ferns [ J ] . Evolutionꎬ 2010ꎬ 64
(9): 2786-2792.
[34]   Wikstrom NꎬPryer K M. Incongruence between pri ̄
mary sequence data and the distribution of a mito ̄
chondrial atp1 group Ⅱ intron among ferns and
horsetails[J] .Mol Phylogenet Evolꎬ 2005ꎬ 36(3):
484-493.
[35]   Windisch P GꎬPereira ̄Noronha M. Notes on the e ̄
cology and development of Plagiogyria fialhoi[J] .
Am Fern Jꎬ 1983: 79-84.
[36]   Smith S AꎬDonoghue M J. Rates of molecular evo ̄
lution are linked to life history in flowering plants
[J] .Scienceꎬ 2008ꎬ 322(5898): 86-89.
[37]   Wang TꎬSu YꎬLi Y. Population genetic variation in
the tree fern Alsophila spinulosa (Cyatheaceae):
effects of reproductive strategy [ J ] . Plos Oneꎬ
2012ꎬ 7(7): e41780.
[38]   Umena YꎬKawakami KꎬShen J RꎬKamiya N. Crys ̄
tal structure of oxygen ̄evolving photosystem Ⅱ at
a resolution of 1.9 Å[J].Natureꎬ 2011ꎬ 473(7345):
55-60.
(责任编辑: 王豫鄂)
834 植 物 科 学 学 报 第 31卷