免费文献传递   相关文献

The Evolutionary Analysis of lea3 Gene in Bambusoideae

竹亚科lea3基因的进化分析



全 文 :竹亚科 lea3基因的进化分析∗
于丽霞ꎬ 李  斌ꎬ 黄海泉ꎬ 鄢  波∗∗
(西南林业大学园林学院ꎬ 云南 昆明  650224)
摘要: 选取竹亚科中两个超族、 六个族和三个亚族的 10 个竹种为材料ꎬ 分别是泰竹、 凤尾竹、 青皮竹、
大叶慈、 慈竹、 野龙竹、 毛竹、 香竹、 苦竹、 菲白竹ꎬ 分离克隆了它们的 lea3基因ꎬ 并将它们与外类群物
种水稻进行序列比对和进化分析ꎮ 结果发现在分支模型与分支位点模型的检测中ꎬ 不同竹种所含 lea3 基
因承受了不同的正选择压力ꎬ 清除选择作用在 lea3基因编码区中占主导地位 (ω<1)ꎮ 在位点模型的检测
中ꎬ 共检测出了 18个显著性正选择位点ꎬ 占总氨基酸数目的 11􀆰 1%ꎮ 对这 18个显著性正选择位点进行定
位后ꎬ 发现其中的 15个位于 11个氨基酸串联重复序列附近ꎮ 这说明 lea3基因中的 11个氨基酸串联重复
序列区比基因其它区域更容易受自然选择作用影响ꎮ 同时ꎬ 在位点模型检测结果的基础上ꎬ 通过对强烈清
除选择位点的定位ꎬ 发现在 11个氨基酸串联重复序列区内存在一长段无强烈清除位点的序列区ꎮ
关键词: 竹亚科ꎻ lea3基因ꎻ 基因克隆ꎻ 进化分析
中图分类号: Q 75            文献标识码: A                文章编号: 2095-0845(2014)06-707-08
The Evolutionary Analysis of lea3 Gene in Bambusoideae
YU Li ̄Xiaꎬ LI Binꎬ HUANG Hai ̄Quanꎬ YAN Bo∗∗
(Southwest Forestry Universityꎬ Faculty of Landscape Architectureꎬ Kunming 650224ꎬ China)
Abstract: The 10 bamboo species for cloning lea3 gene concern two superfamilyꎬ six families and three subtribesꎬ
they are Thyrsostachys siamensisꎬ Bambusa multiplexꎬ Bambusa textilisꎬ Dendrocalamus farinosusꎬ Neosinocalamus
affinisꎬ Dendrocalamus semiscandensꎬ Phyllostachys heterocyclaꎬ Chimonocalamus delicatesꎬ Pleioblastus amarusꎬ
Sasa fortunei. In the branch model and branch site model testꎬ found that different bamboo species containing lea3
gene under different selection pressureꎬ purifying selection function is in dominant ( omega<1). In the site model
testꎬ detected a total of 18 significant positive selection sitesꎬ account for 11􀆰 1% of the total amino acid number. Lo ̄
cating the 18 significant positive selection sitesꎬ found 15 sites located 11 amino acid tandem repeat sequences are ̄
asꎬ this means that 11 amino acid tandem repeat sequences areas of lea3 gene than in other regions more easily affected
by natural selection effect. At the same timeꎬ based on the results of the site model testꎬ through located these intence
purifying selected sitesꎬ found a long no purifying selection sites area in 11 amino acid tandem repeat sequences.
Key words: Bambusoideaeꎻ lea3 geneꎻ Gene cloningꎻ Evolutionary analysis
  随着对 LEA 蛋白研究的深入ꎬ 通过分子杂
交技术和免疫学方法ꎬ 可以将 LEA 蛋白分成 6
个族 (Battaglia 等ꎬ 2008ꎻ Dure 等ꎬ 1989ꎻ Dureꎬ
1993ꎻ Ingram和 Bartelsꎬ 1996)ꎮ 第 3 族 LEA 蛋
白含有多拷贝的由 11 个氨基酸组成的基元序列
(TAQAAKEKAGE) (Baker 等ꎬ 1988)ꎬ 可形成 α ̄
螺旋结构ꎮ 在不同物种之间ꎬ 第三组 LEA 蛋白
的同源性差异较大ꎮ 例如ꎬ 大麦与小麦在氨基酸
水平上同源性分别达 91%和 95%ꎬ 但它们与同
是禾本科的水稻、 玉米、 蒙古冰草的同源性却只
植 物 分 类 与 资 源 学 报  2014ꎬ 36 (6): 707~714
Plant Diversity and Resources                                    DOI: 10.7677 / ynzwyj201414038

∗∗
基金项目: 国家自然科学基金项目 (31160177ꎬ 31460202)ꎬ 云南省部级重点学科、 省高校重点实验室及校实验室共享平台资助
通讯作者: Author for correspondenceꎻ E ̄mail: yanbodr@yahoo􀆰 com􀆰 cn
收稿日期: 2014-03-13ꎬ 2014-06-13接受发表
作者简介: 于丽霞 (1981-) 女ꎬ 硕士ꎬ 助理实验师ꎬ 主要从事植物分子生物学研究ꎮ E ̄mail: yulixia2005@sohu􀆰 com
有 60%左右ꎮ 第三组 LEA蛋白在属内相对保守ꎬ
而在属间变化较大 (汤晓倩ꎬ 2010)ꎮ
中国竹亚科共含有 2 超族、 6 族、 5 亚族、
和 43属ꎻ 中国竹亚科分种 (含变种、 变型) 检
索表中ꎬ 有 708 种、 52 变种、 98 变型和 4 个杂
交竹种 (易同培等ꎬ 2009)ꎮ 本研究中所用到的
10个竹种分别属于竹亚科中的 2个超族、 6 个族
和 3个亚族ꎬ 它们分别是箣竹超族泰竹属的泰竹
(Thyrsostachys siamensis)ꎻ 箣竹超族箣竹族箣竹
属的凤尾竹 ( Bambusa multiplex ) 与青皮竹
(Bambusa textilis)ꎻ 箣竹超族牡竹族慈竹属的慈
竹 (Neosinocalamus affinis) 和牡竹属的大叶慈
(Dendrocalamus farinosus)ꎬ 箣竹超族牡竹族牡竹
属的野龙竹 (Dendrocalamus semiscandens)ꎬ 箣竹
超族倭竹族倭竹亚族刚竹属的毛竹 (Phyllostach ̄
ys heterocycla)ꎬ 北美箭竹超族丘斯夸竹族香竹属
的香竹 (Chimonocalamus delicates)ꎬ 北美箭竹超
族北美箭竹亚族苦竹属的苦竹 (Pleioblastus am ̄
arus)ꎬ 以及北美箭竹超族赤竹亚族赤竹属的菲
白竹 (Sasa fortunei)ꎮ
基因水平的适应性进化指一个遗传群体以一
种具有较高适合度的等位基因替代另一种等位基
因的过程ꎮ 检测适应性进化有助于理解生物进化
历史及相关生物结构与功能变异ꎮ 在自然选择作
用下ꎬ 基因的适应性进化方式通常有三种ꎬ 包括
正选择、 负选择和中性选择 (徐鹏ꎬ 2009)ꎮ 在
分子进化研究中ꎬ 有效检测达尔文正选择的统计
学方法是比较核苷酸序列上密码子的非同义替换
(nonsynonymous substitutionꎬ 氨基酸变化) 与同
义替换 ( synonymous substitutionꎬ 氨基酸不变)
比率 (ω=dN / dS)ꎮ 用比率可以检测编码蛋白序
列所受到的选择压力ꎬ 进而揭示三种不同的进化
选择情况: 当 dN<dS (ω<1) 时为负选择ꎻ 当
dN>dS (ω>1) 时为正选择ꎻ 当 dN = dS (ω = 1)
时为中性突变 (章张ꎬ 2007)ꎮ
1  材料与方法
1􀆰 1  材料
1􀆰 1􀆰 1  植物材料  实验所用材料为幼嫩叶片ꎬ 泰竹、 凤
尾竹、 青皮竹、 大叶慈、 慈竹、 野龙竹、 毛竹、 香竹、
苦竹、 菲白竹 10个实验竹种均采于西南林业大学竹园ꎬ
由该校孙茂盛老师鉴定ꎮ
1􀆰 1􀆰 2  主要试剂与菌种  TIANGEN 公司的植物总 RNA
提取试剂盒、 TIANGEN 公司的 PCR 产物回收纯化试剂
盒、 TAKARA 公司的 DL2000Markerꎻ 逆转录酶 M ̄MLV
(RNase H) RTase、 oligo (dT)、 dNTPs、 Taq DNA polymer ̄
ase、 TAKARA公司的克隆载体 pMD18 ̄T Vectorꎻ PCR 时
所用到的各种试剂均购自于北京鼎国生物公司与 TIAN ̄
GEN公司ꎬ 其它常规化学试剂购于北京鼎国生物公司ꎮ
大肠杆菌 DH5α为本实验室保存菌种ꎮ
1􀆰 2  方法
1􀆰 2􀆰 1  植物材料的处理  将所摘取的新鲜竹叶枝条放置
在室温下脱水 2~4 hꎮ
1􀆰 2􀆰 2  RT ̄PCR和序列拼接  对处理的竹子叶片采用液
氮研磨法ꎬ 利用 RNAsimple Total RNA kit (北京天根)
提取总 RNAꎬ 并用 First ̄Strand RT ̄PCR kit (大连宝生
物) 合成 cDNA第一链ꎬ 逆转录引物为 dTPꎬ 其他按操
作说明进行ꎮ
以上述合成的 cDNA 第一链为模板ꎬ 应用禾本科植
物 lea3基因保守区域通用引物 FP、 RP 扩增目的序列
(Yu等ꎬ 2010)ꎬ 扩增产物连接到 pMD18 ̄T 载体上并进
行测序ꎬ 根据测序结果设计出第一轮 3′ race 引物 F1
(上游): 5′-AARGCGYRSGAGGCCAAGGAC- 3′ꎬ 3′ race
引物 R1 (下游): 5′-CCAGTGAGCAGAGTGACGAGG-3′ꎻ
第二轮 3′ race 引物 F2 (上游): 5′ - GCCGGCAAGGA ̄
CAAAACCGGC-3′ꎬ 3′ race引物 R2 (下游): 5′-GACGA ̄
GGACTCGAGCTCAAGC-3′ꎮ 利用套式 PCR 对 3′端序列
进行扩增ꎬ 反应体系参照相关文献 (于丽霞等ꎬ 2010)ꎬ
两轮反应的退火温度均为 62 ℃ꎬ 模板为稀释 10 倍的第
一轮 PCR产物ꎮ 所获得的 3′端片段经克隆测序后ꎬ 与已
获得的相对保守片段拼接ꎬ 得出部分 cDNA序列ꎮ
1􀆰 2􀆰 3  基因树的构建与分析   用于建树的外类群为水
稻ꎮ 在建树之前ꎬ 先对序列进行适当处理ꎬ 具体方法如
下: 1) 将核苷酸序列经 MEGA 中的 “Translated Protein
Sequences” 转换成氨基酸序列ꎻ 2) 用其中的 “Align by
ClustalW” 进行序列比对ꎻ 3) 将比对结果转换成 “DNA
Sequences”ꎻ 4) 手动去除其中的 “Gap”ꎻ 5) 采用最大
似然法 (maximum likelihoodꎬ 简称 ML) 构建ꎮ 在构建树
之前ꎬ bootstrap值全部设成 1 000ꎮ 然后将 ML 树文件及
原有序列文件转入 PAML软件 (Yang 等ꎬ 2007) 中ꎮ 在
调试好各种参数后运行 “codeml􀆰 exe” 控制文件ꎮ
1􀆰 2􀆰 4  适应性进化检测   分别采用了 PAML4􀆰 1 (Nei
等ꎬ 2000) 中的 3个模型: 分支模型 (Yangꎬ 1998)、 位
点模型 (Nielsen和 Yangꎬ 1998ꎻ Yangꎬ 2000)ꎬ 及分支位
点模型 (Yang 和 Wongꎬ 2005ꎻ Zhang 等ꎬ 2005) 进行检
测分析ꎮ
在分支模型中ꎬ 进行了单比率 ( one ̄ratio) 和自由
比率 (free ̄ratio) 模型分析ꎮ 单比率模型假定进化树上
807                                  植 物 分 类 与 资 源 学 报                            第 36卷
所有分支的比率相同ꎬ 属于最简单模型ꎬ 用 ω0表示ꎻ 自
由比率模型是全类型模型ꎬ 在该模型下假定不同分支有
不同比率ꎮ 该模型的优势在于ꎬ 当缺少序列信息时ꎬ 估
测 ω值不受影响ꎬ 但由于参数较多ꎬ 可能导致不精确的
ω值出现ꎮ
在位点模型中ꎬ 假定不同位点经历了不同选择压
力ꎬ 而在系统树上的不同分支上则无差异ꎮ 在本研究中
将 3对模型的数据分别进行了似然比值检验 ( likelihood
ratio testꎬ LTR)ꎮ 这三对模型为M1 (近中性模型) vs M2
(正选择模型)、 M7 (beta模型) vs M8 (beta & ω模型)、
M8 a (beta) vs M8 ( beta & v) (Nielsen 和 Yangꎬ 1998ꎻ
Yangꎬ 2000)ꎮ 在对三对模型的数据进行 LRT 检验时ꎬ
使用统计量-2Δℓ (其中的 Δℓ = ℓ1-ℓ0ꎬ ℓ1和 ℓ0分别表示
两个模型下的似然值) 依 χ2卡方分布检验显著性ꎬ 自由
度为两个模型参数的数值之差ꎮ
在分支位点模型中ꎬ 根 dN / dS的四类比率区分不同
位点ꎮ 第一类由所有分支中高度保守的位点组成ꎬ 其中
的 dN / dS比率 ω0较小ꎻ 第二类由处于中性进化的位点组
成ꎬ 其 dN / dS比率 ω1等于 1ꎻ 第三类由背景分支高度保
守 (0<ω0<1)ꎬ 同时前景分支比率 ω2显著大于 1的位点
组成ꎻ 第四类指背景分支处于中性进化 (ω0 = 1)ꎬ 但前
景分支比率 ω2显著大于 1的位点组成ꎮ 其中第三类与第
四类中的 ω2数值相同ꎮ 分支位点模型包括 A和 B两个模
型 (Nielsen和 Yangꎬ 1998ꎻ Yangꎬ 2000)ꎬ A模型下又包
括 2个检验: 检验 1和检验 2ꎮ 通常采用检验 2ꎮ 在检验
2中ꎬ 零假设下假定所有分支中只有两类位点ꎬ 0<ω0 <1
和 ω0 = 1ꎮ 控制文件中需要设定 fix_omega = 1 及 omega =
1ꎮ 备选假设比零假设多 2 个参数 p2和 ω2ꎬ 其中的 ω2
大于或等于 1ꎬ 如结果 ω2 >1 就说明前分上存在正选择
位点ꎮ
2  结果与分析
2􀆰 1  竹亚科 lea3基因拼接序列的获得
利用通用引物 FP 和 RP 经 RT ̄PCR 成功地
从竹子的 cDNA中扩增出长度约为 500 bp左右的
片段ꎬ 与预计扩增的长度相符ꎮ 利用已获得的这
段序列设计了 3′RACE 引物ꎬ 第一轮 3′ ̄Race ̄
PCR扩增的产物经琼脂糖凝胶电泳检测ꎬ 结果
凝胶电泳图上的泳道中均显示出明亮的 “Smear”
状条带ꎬ 这说明了在 RACE ̄PCR 条件下用 3′端
引物扩展特异性差ꎬ 目的条带不明显ꎮ 以第一轮
扩增产物稀释 10 倍为模板ꎬ 进行第二轮 3′ ̄
Race ̄PCRꎬ 将扩增的产物分别回收、 纯化、 及
克隆测序ꎬ 与通用引物扩增的保守区域片段拼
接ꎬ 得到了部分 cDNA 序列ꎬ 大小分别为泰竹
540 bp、 凤尾竹 531 bp、 青皮竹 540 bp、 大叶慈竹
552 bp、 慈竹 552 bp、 野龙竹 552 bp、 毛竹 585 bp、
香竹 552 bp、 苦竹 552 bp、 菲白竹 546 bpꎮ
2􀆰 2  基因树的构建
最大似然法是根据特定替代模型分析既定的
一组序列数据ꎬ 从而使所获得的每一个拓扑结构
的似然值最大ꎬ 然后挑选出其中似然值最大的拓
扑结构作为最优系统树 (Huelsenbeck 和 Ranna ̄
laꎬ 1997ꎻ Yangꎬ 1998)ꎮ 根据已有资料显示ꎬ 如
果模型合适ꎬ ML效果较好 (Saiton 和 Neiꎬ 1987ꎻ
Hasegawa等ꎬ 1991)ꎮ 将用于比对的序列经 MEGA
中的 “Translated Protein Sequences” 转换后ꎬ 用
其中的 “Align by ClustalW “进行序列比对ꎬ 手
动去除 “Gap”ꎬ 最后将这些序列用于建树ꎮ 以
ML法构建的进化树为树文件ꎬ 利用 PAML 软件
对 11条 lea3基因序列进行进化分析 (图 1)ꎮ 从
图中可以看出ꎬ 禾本科稻属的水稻与任何一种竹
子的亲缘关系均较远ꎬ 慈竹和大叶慈亲缘关系较
近ꎬ 这与它们同属牡竹族相吻合ꎻ 而同属箣竹属
的凤尾竹和青皮竹亲缘关系却并不很近ꎬ 这可能
与它们的生境不同有关
2􀆰 3  竹亚科 lea3基因的选择压力检测结果
2􀆰 3􀆰 1  正选择压力检测结果  单比率模型 (onera ̄
tion) 假定所有分支都具有相同的 ω值ꎬ 涉及参数
21个ꎮ 在该模型下ꎬ 似然值为 ℓ0 = -2296􀆰 944859ꎬ
K= 1􀆰 63425ꎬ 估测 ω 值为 0􀆰 36203 (表 1)ꎮ 在
分支模型中ꎬ 自由比率模型 ( free ̄ratio) 假定每
个分支都有独立的 ω 值ꎬ 包括参数 39 个ꎬ 似然
值为 ℓ1 = -2289􀆰 125585ꎮ 因为自由比率模型比
单比率模型多 18个参数ꎬ 所以 2Δℓ = 2 (ℓ1-ℓ0)
= 15􀆰 65ꎬ 自由度 df = 18ꎮ 同时ꎬ 数据显示不同
分支所受选择压力各异ꎬ 多数分支处于强烈清除
选择压力下 (ω<1)ꎬ 少数分支处于正选择压力
下 (ω > 1)ꎮ 通过似然比值检验分析显示 (表
2)ꎬ 在自由比率模型 vs. 单比率模型的检测中ꎬ
2Δℓ= 15􀆰 64ꎬ P= 0􀆰 618ꎬ df= 18ꎮ
在分支位点模型中ꎬ a ̄s 表示分支ꎬ 当 p∗或
r∗表示前景分支时ꎬ 其它分支为背景分支ꎮ 在此模
型下ꎬ 分支 r 检测到两个正选择位点 (P > 0􀆰 9:
34K P > 0􀆰 6: 32 D) (表 1)ꎮ 通过似然比值检验分
析显示 (表 2)ꎬ 在以 r为前景分支的零假设 vs􀆰 备
选假设检测中ꎬ 2Δℓ=3􀆰 82ꎬ P=0􀆰 051≈5%ꎬ df=1ꎮ
9076期                              于丽霞等: 竹亚科 lea3基因的进化分析                               
图 1  用 PAML分析的 ML树ꎮ 1 000次重复的自展支持率ꎬ 分支上的数字表示自由比率模型 “free ̄ratio” 得到的 ω值ꎬ a ̄s为分支代号
Fig􀆰 1  ML tree of the PAML analysis. 1 000 replicates bootstrap support rate. Branch on the numbers indicate the
free ̄ratio model ω value in “ free ̄ratio”ꎬ a ̄s: the branch code
表 1  竹亚科植物 lea3基因片段在不同模型下的参数估计值以及对数似然值
Table 1  Parameter estimates and Log ̄Likelihood values of the lea3 gene in gymnosperm under different models
模型 Model 参数个数P
似然值
ℓ ts / tv 参数估测值 Estimates of parameters 正选择位点 Positively selected sites
M0: 单比率
(M0: one ̄ratio) 21
-2296􀆰 95 1􀆰 63 ω0 = 0􀆰 36 None
分支模型
自由比率 F:
(Free ̄ratio) 39
-2289􀆰 13 1􀆰 63 ωj=∞ ωi=∞ ωr=∞ ωp=∞ ωc=∞ None
位点模型
M1: 中性
(M1: neutral) 22
-2104􀆰 52 2􀆰 27 p0
= 0􀆰 60ꎬ (p1= 0􀆰 40)
ω0= 0􀆰 03ꎬ ω1= 1 Not allowed
M2: 选择
(M2: selection) 24
-2063􀆰 59 2􀆰 43 p0
= 0􀆰 53ꎬ p1= 0􀆰 29ꎬ p2= 0􀆰 18
ω0= 0􀆰 04ꎬ ω1= 1ꎬ ω2= 8􀆰 32
P > 0􀆰 99: 24 R、 29 T、 47 K、 54 A、
58 K、 59 A、 62 A、 69 R、 71 H、 76
Q、 81 I、 82 G、 104 Lꎻ P > 0􀆰 95:
50 G、 56 K、 79 S
M7: (beta) 22 -2101􀆰 34 2􀆰 25 p= 0􀆰 16ꎬ q= 0􀆰 29 Not allowed
M8: (beta & ω) 24 -2061􀆰 34 2􀆰 42
p0= 0􀆰 81ꎬ p= 0􀆰 18ꎬ q= 0􀆰 45ꎬ
(p1= 0􀆰 19)
ω= 6􀆰 74
P > 0􀆰 99: 24 R、 29 T、 47 K、 54 A、
58 K、 59 A、 62 A、 69 R、 71 H、 76
Q、 81 I、 82 G、 104 Lꎻ P > 0􀆰 95:
50 G、 56 K、 57 E、 60 F、 79 S
M8a 23 -2096􀆰 98 2􀆰 28
p0= 0􀆰 71ꎬ p= 0􀆰 31ꎬ q= 3􀆰 46ꎬ
(p1= 0􀆰 29)
ω= 1
None
分支位点模型
模型A (model A)
q∗ 24 -2104􀆰 52 2􀆰 27
p0= 0􀆰 60ꎬ p1= 0􀆰 40ꎬ (p2+p3= 0)
ω2= 1 None
r∗ 24 -2101􀆰 81 2􀆰 29
p0=0􀆰 57ꎬ p1=0􀆰 39ꎬ (p2+p3=0􀆰 04)
ω2= 12􀆰 72 P > 0􀆰 9: 34K P > 0􀆰 6: 32 D
注: P为模型中参数的数目ꎻ ω0是指所有分支上的 dN / dSꎬ ωq与 ωr分别是分支 q与 s分支上的 dN / dSꎻ q∗与 r∗表示在用分支位点模
型检测正选择位点时ꎬ 分支 q与分支 r是前景分支
Note: P number of parameters in the modelꎻ ω0 is the dN / dS ratio for all branchesꎬ ωq and ωr are the dN / dS ratios for branches q and rꎻ branches
q and r are the foreground branches
017                                  植 物 分 类 与 资 源 学 报                            第 36卷
表 2  似然比值检验统计量 (2Δℓ)
Table 2  Likelihood ratio statistics (2Δℓ)
模型对比 Comparison 2Δℓ 自由度 df 概率 P
F vs􀆰 M0 模型 15􀆰 64 18 0􀆰 618
M1 (中性) vs􀆰 M2 (选择) 81􀆰 85 2 1􀆰 68586E ̄18
M7 (beta) vs􀆰 M8 (beta & v) 80􀆰 01 2 4􀆰 23239E ̄18
M8a (beta) vs􀆰 M8 (beta & v) 71􀆰 28 1 3􀆰 0992E ̄17
q∗: 零假设 vs􀆰 备选假设 0  1 1
r∗: 零假设 vs􀆰 备选假设 3􀆰 82 1 0􀆰 051
注: 显著: P < 5%ꎬ χ2 = 3􀆰 84ꎻ 极显著: P < 1%ꎬ χ2 = 6􀆰 63ꎮ E ̄18= 10-18
Note: Significant: (P < 5%ꎬ χ2 = 3􀆰 84)ꎻ Extremely significant: (P < 1%ꎬ χ2 = 6􀆰 63) . E ̄18= 10-18
    在位点模型中ꎬ M2 模型和 M8 模型均检测
到 13个一样的极显著正选择位点 (ω > 1ꎬ P >
0􀆰 99ꎬ 占 8􀆰 02%) (表 1)ꎬ 及多个显著正选择位
点 (ω > 1ꎬ P > 0􀆰 95ꎬ 占 3􀆰 09%)ꎮ 这 18 个正选
择位点的定位见图 3ꎮ 同时ꎬ 在 M8 模型下还检
测到 62个强烈清除选择位点ꎬ 占总氨基酸位点
数的 38􀆰 3%ꎮ 经分析后发现ꎬ 在这些强烈清除
选择位点间存在一段长段无强烈清除选择位点
的区域 (图 2 中方框部分)ꎮ 似然比值检验结
果显示 (表 2): M1 vs􀆰 M2: 2Δℓ = 81􀆰 85ꎬ P =
1􀆰 68586E ̄18< 1%ꎬ df = 2ꎻ M7vs􀆰 M8: 2Δℓ = 80􀆰 01ꎬ
P= 4􀆰 23239E ̄18 < 1%ꎬ df = 2ꎻ M8a vs􀆰 M8: 2Δℓ
= 71􀆰 28ꎬ P= 3􀆰 0992E ̄17 < 1%ꎬ df= 1ꎮ
2􀆰 3􀆰 2  负选择压力检测结果  本研究中共检测
到了 65个后验平均 ω 值小于 0􀆰 1 的极强烈负选
择位点ꎬ 同时发现在 46D ̄74T之间存在一长段没
有极强烈负选择位点出现的区域 (结果如表 3
所示)ꎮ
表 3  M8模型下清除选择位点的后验平均 ω值
Table 3  Posterior mean ω for the purifying selected sites under M8 model
位点 Site 后验平均 ω值Posterior Mean ω 位点 Site
后验平均 ω值
Posterior Mean ω 位点 Site
后验平均 ω值
Posterior Mean ω
1 A 0􀆰 070 75 E 0􀆰 061 126 V 0􀆰 063
2 G 0􀆰 062 84 T 0􀆰 067 127 G 0􀆰 062
3 E 0􀆰 061 87 A 0􀆰 070 128 A 0􀆰 070
5 K 0􀆰 061 88 A 0􀆰 072 129 K 0􀆰 061
9 E 0􀆰 061 89 K 0􀆰 063 130 D 0􀆰 061
10 E 0􀆰 061 90 Q 0􀆰 081 131 A 0􀆰 071
11 K 0􀆰 061 91 K 0􀆰 061 132 V 0􀆰 063
13 G 0􀆰 063 96 A 0􀆰 071 133 M 0􀆰 069
17 G 0􀆰 062 98 Y 0􀆰 078 135 T 0􀆰 068
22 K 0􀆰 072 100 K 0􀆰 061 137 G 0􀆰 063
23 A 0􀆰 071 105 A 0􀆰 070 138 M 0􀆰 069
25 E 0􀆰 061 106 G 0􀆰 062 141 D 0􀆰 061
26 A 0􀆰 070 107 K 0􀆰 061 143 G 0􀆰 062
27 K 0􀆰 061 108 D 0􀆰 061 146 D 0􀆰 094
28 D 0􀆰 061 110 T 0􀆰 067 150 K 0􀆰 061
35 E 0􀆰 061 111 G 0􀆰 062 151 D 0􀆰 061
36 A 0􀆰 071 113 V 0􀆰 062 152 T 153 S
37 T 0􀆰 067 116 Q 0􀆰 081 154 A 0􀆰 070
38 K 0􀆰 061 117 A 0􀆰 070 155 T 0􀆰 078
41 A 0􀆰 070 119 E 0􀆰 061 156 E 0􀆰 061
46 D 0􀆰 061 120 Q 0􀆰 081 160 R 0􀆰 065
74 T 0􀆰 067 121 V 0􀆰 063
1176期                              于丽霞等: 竹亚科 lea3基因的进化分析                               
图 2  竹亚科与外类群水稻的氨基酸序列比对图
注: 方框内的为无强烈清除选择位点区域ꎻ “∗” 号为正选择位点ꎻ 底部的粗下划线部分代表含有 11个氨基酸的串联重复区ꎻ
双下划线代表含有 11个氨基酸的串联重复基元序列ꎻ 单下划线代表含有相对稳定结构的特殊序列ꎻ
三下划线代表有疑问的 11个氨基酸的串联重复基元序列
Fig􀆰 2  Bamboosubfamilies and outgroup Oryza sativa’s acid sequence comparing figure
Note: inside the box for strong clear select site regionꎻ “∗” for positive selection sitesꎻ underline the 11 amino acids by tandem repeatsꎻ
double underline representation containing 11 amino acids by tandem repeat sequence of primitive elementsꎻ single underline
representative contain relatively stable structure of insertion sequencesꎻ three underline on behalf of questionable 11
amino acids of the tandem repeat sequence of primitive elements
217                                  植 物 分 类 与 资 源 学 报                            第 36卷
2􀆰 4  竹亚科 lea3基因的检测结果定位
将检测到的正选择位点、 无强烈负选择位点
的长段区域、 11 个氨基酸的串联重复序列及特
殊序列在氨基酸序列比对图上进行定位ꎮ 定位后
的结果如图 2 所示ꎮ 图中 11 个氨基酸串联重复
序列区包括 91 个氨基酸ꎬ 占总长度 207 个氨基
酸的 44%左右 (图中加粗线的部分)ꎮ
本研究检测出的 18个正选择位点中 15 个位
于 11个氨基酸的串联重复序列区 (下图中加粗
线的部分)ꎬ 3 个位于插入片段区 (下图中加单
下划线的部分)ꎮ 检测到的无强烈负选择位点的
长段区域共含有 34个氨基酸位点ꎬ 位于 11 个氨
基酸串联重复序列中间位置 (下图中用方框标
记的部分)ꎮ
3  讨论
3􀆰 1  竹亚科 lea3基因中检测到的正选择分支
分支模型的检测结果显示ꎬ 不同竹种所含
lea3基因所承受的正选择压力不同ꎮ 原因可能是
由于不同竹种所处的生境不同ꎬ 从而经历了不同
的自然选择作用ꎮ 在分支位点模型中ꎬ 将分支 q
与分支 r进行配对检测ꎬ 在分支 q 上没有检测到
正选择位点ꎬ 在 r 分支上检测到两个正选择位
点ꎮ 这说明不同竹种因所处生境的不同而经历了
不同的自然选择作用ꎮ
3􀆰 2  竹亚科 lea3基因中检测到的正选择位点
在位点模型中共检测到 5个显著正选择位点
和 13个极显著正选择位点ꎮ 相比于其它基因ꎬ
lea3基因中所存在的正选择位点数目较多ꎮ 已有
研究结果表明ꎬ 抗病及抗旱类奢侈基因 ( luxury
gene) 中所检测到的正选择位点数明显多于与光
合作用有关的看家基因 ( house ̄keeping gene)
(罗莎ꎬ 2012)ꎮ 这显示抗病及抗旱类奢侈基因相
比于与光合作用有关的看家基因更容易受到自然
选择作用影响ꎮ 根据中性进化原理ꎬ 基因突变率
在没有受到强烈理化因子刺激时几乎不变ꎮ 针对
竹亚科 lea3 基因中存在较多正选择位点的现象ꎬ
可能是由于该基因属于奢侈基因ꎬ 相比于其它看
家基因所受到的自然选择压力较小ꎬ 位点突变更
容易被保留下来ꎮ
通过对 18个正选择位点进行定位ꎬ 发现其
中 15个极显著正位点位于 11个氨基酸串联重复
序列区内ꎬ 3个位点位于 7 个特殊的氨基酸序列
区ꎮ 这说明 11 个氨基酸串联重复序列区比基因
其它部分更容易受自然选择作用影响ꎮ 原因推测
可能与 11个氨基酸串联重复序列所形成的特殊
蛋白质结构有关ꎮ 11 个氨基酸串联重复序列可
以形成 α ̄螺旋结构ꎬ 而 α ̄螺旋的疏水界面又可
形成同型二聚体结构ꎬ 这种同型二聚体结构能在
植物受到干旱胁迫时保护生物大分子ꎬ 减轻水份
胁迫伤害ꎬ 与植物抗旱性密切相关ꎮ
3􀆰 3  竹亚科 lea3基因中检测到的强烈清除选择
位点
将负选择位点数目与正选择位点数目进行比
较ꎬ 发现前者远大于后者ꎮ 这说明 lea3 基因尽
管受到较强正选择压力ꎬ 但清除选择作用依然占
主导地位ꎮ 对所检测到的 65 个强烈清除选择位
点进行观察后ꎬ 发现其间存在一长段无强烈清除
选择位点的区域ꎮ 这段无强烈清除选择位点的区
域位于靠近 11 个氨基酸串联重复序列区中心部
位ꎬ 同时ꎬ 该区域也是正选择位点最集中的区域ꎮ
这说明这段无强烈清除选择位点的区域所受到的
清除选择压力极小ꎬ 正选择压力占主导地位ꎮ
〔参  考  文  献〕
易同培ꎬ 马丽莎ꎬ 史军义等ꎬ 2009. 中国竹亚科属种检索表
[M]. 北京: 科学出版社
章张ꎬ 2007. 基于进化选择核动力的算法研究 [D]. 北京: 中国
科学院计算技术研究所
徐鹏ꎬ 2009. 社会性昆虫抗菌肽基因的分子进化研究 [D]. 杭
州: 浙江大学
Baker Jꎬ Steele Cꎬ Dure LIIIꎬ 1988. Sequence and characterization of
6 lea proteins and their genes from cotton [ J] . Plant Molecular
Biologyꎬ 11: 277—291
Battaglia Mꎬ Olvera ̄Carrillo Yꎬ Garciarrubio A et al.ꎬ 2008. The e ̄
nigmatic lea proteins and other hydrophilins [J] . Plant Physiolo ̄
gyꎬ 14 (1): 6—24
Dure Lꎬ Crouch Mꎬ Harada J et al.ꎬ 1989. Common amino acid se ̄
quenc domains among the lea proteins of higher plants [ J] .
Plant Molecular Biologyꎬ 12 (5): 475—486
Dure Lꎬ 1993. A repeating 11 ̄mer amino acid motif and plant desicca ̄
tion [J] . The Plant Journalꎬ 3 (3): 363—369
Hasegawa Mꎬ Kishino Hꎬ Saitou Nꎬ 1991. On the maximum likeli ̄
hood method in molecular phylogenetics [J] . Journal of Molecu ̄
lar Evolutionꎬ 32 (5): 443—445
Huelsenbeck JPꎬ Rannala Bꎬ 1997. Phylogeny methods come of age:
3176期                              于丽霞等: 竹亚科 lea3基因的进化分析                               
testing hypotheses in an evolutionary context [ J] . Scienceꎬ 276
(5310): 227—232
Ingram Jꎬ Bartels Dꎬ 1996. The molecular basis of dehydration toler ̄
ance in plants [J] . Annual Review of Plant Physiology and Plant
Molecular Biologyꎬ 47: 377—403
Lu S (罗莎)ꎬ 2012. Evolutionary analysis of the NBS ̄LRR encoding
grnes in Poaseae (PhD) [D]. Wuhan: Huazhong Agricultural
University
Nielsen Rꎬ Yang Zꎬ 1998. Likelihood models for detecting positively
selected amino acid sites and applications to the HIV ̄1 envelope
gene [J] . Geneticsꎬ 148: 929—936
Saitou Nꎬ Nei Mꎬ 1987. The neighbor ̄joining method: a new method
for reconstructing phylogenetic trees [ J] . Molecular Biology and
Evolutionꎬ 4 (4): 406—425
Tang XQ (汤晓倩)ꎬ Yu LX (于丽霞)ꎬ Wu XL (武晓璐) et al.ꎬ
2010. Rseearch advance in the group three of late ̄embryogene ̄
sis ̄abundant proteins and genes [J] . Chinese Bulletin of Life Sci ̄
ence (生命科学)ꎬ 22 (6): 551—555
Yang Xꎬ Stojkovic EAꎬ Kuk J et al.ꎬ 2007. Crystal structure of the
chromophore binding domain of an unusual bacteriophyto ̄
chromeꎬ RpBphP3ꎬ reveals residues that modulate photoconver ̄
sion [J] . Proceedings of the National Academy of Sciences of the
United States of Americaꎬ 104 (30): 12571—12576
Yang Zꎬ 1998. Likelihood ratio tests for detecting positive selection
and application to primate lysozyme evolution [ J] . Molecular
Biology and Evolutionꎬ 15 (5): 568—573
Yang Zꎬ 2000. Maximum likelihood estimation on large phylogenies
and analysis of adaptive evolution in human influenza virus A
[J] . Journal of Molecular Evolutionꎬ 51: 423—432
Yang Zꎬ Wong WSWꎬ 2005. Nielsen Rꎬ Bayes empirical Bayes infer ̄
ence of amino acid sites under positive selection [J] . Molecular
Biology and Evolutionꎬ 22: 1107—1118
Yu Lꎬ Wu Xꎬ Tang X et al.ꎬ 2010. Simple and efficient method for i ̄
solating cDNA fragments of lea3 genes with potential for wide
application in the grasses (Poaceae) [J] . Genetics and Molecu ̄
lar Researchꎬ 9 (3): 1321—1325
Yu LX (于丽霞)ꎬ Wu XL (武晓璐)ꎬ Tang XQ (汤晓倩) et al.ꎬ
2010. Effect of new specificity and yield enhancer on amplifica ̄
tion of lea3 gene [J] . Acta Botanica Yunnanica (云南植物研
究)ꎬ 32 (6): 535—538
Zhang Jꎬ Nielsen Rꎬ Yang Zꎬ 2005. Evaluation of an improved
branch ̄site likelihood method for detecting positive selection at
the molecular level [ J] . Molecular Biology and Evolutionꎬ 22
(12): 2472—247
417                                  植 物 分 类 与 资 源 学 报                            第 36卷