全 文 :林业科学研究!"#$%!"&"$#$)) )* F;<029I:F6(
!"#$%&$%$(#)*
!!文章编号!$##$($)*&""#$%##$(##))(#-
毛白杨
!
L微管蛋白基因家族的克隆与序列分析
饶国栋$!"! 睢金凯$! 张建国$!"!
"$+国家林业局林木培育重点实验室!中国林业科学研究院林业研究所!北京!$###*$%
"+南京林业大学南方现代林业协同创新中心!江苏 南京!"$##,#
收稿日期$ "#$,(#%($#
基金项目$ 中央级公益性科研院所基本科研业务费专项资金项目"NO>"#$,($$#%国家自然科学基金青年项目",$)##%-*#%江苏高校协
同创新计划资助项目
作者简介$ 饶国栋"$*&,(#!男!助理研究员!博士!主要从事林木分子生物学和森林培育的研究+/(0123$ I1:M6:E:7M#"8$-,+9:0
!
通讯作者$研究员!博士!博士生导师!主要从事森林培育研究+
摘要!采用本地化软件L31KF`对杨树全基因组数据库和 B<7L174 数据进行搜索!根据搜索结果对毛白杨 K<,基因
家族进行克隆!并利用软件P36KF13U和Z/B.对K<,基因进行了核酸和氨基酸序列的比对分析和系统进化分析%
利用 DUODD(ZY^ /H服务器对JC.的蛋白质三维结构进行模拟) 结果显示$毛白杨
$
(微管蛋白由 & 个成员构成!&
个成员的氨基酸序列和其它植物
$
(微管蛋白序列的相似性在 d以上%K<,基因可分为 " 个家族!每个家族成员
都有其独特的内含子外显子特征%JC.蛋白的三维结构表现出极高的相似性) 毛白杨K<,基因在序列和结构上都
十分保守%& 个K<,基因起源于 " 个祖先K<,基因)
关键词!
$
(微管蛋白%生物信息学%系统进化%三维结构模拟
中图分类号!D$&+- 文献标识码!.
N/)*-*H .*8C#TO#*(+*./7(-()%
!
LO5O/-*3#*#(E.2-/7 -*
?-.616/"-:72"-/)
,J;?"0F"6A
$!"
! I<452603(2
$
! 89,:;52(60A?"
$!"
"$+N
+5(1.&$ O7 :IE
(F6@6327 M<7
$
(F6@6327% @2:27>:I01F29K% W;53:M<7
的作用!它不仅参与了细胞的分裂,细胞的运动,细
胞间的交流!还决定了细胞的形态*$+ ) 在植物中!微
管的作用显得尤为重要!它是细胞壁强度的主要提
供者!不仅如此!细胞壁的主要成分!纤维素也是沿
着微管的生成方向合成的*"+ ) 微管主要由
$
(微管
第 $ 期 饶国栋等$毛白杨
$
(微管蛋白基因家族的克隆与序列分析
蛋白"JC.#和
#
(微管蛋白"JCL#以二聚体的形式
聚合形成) 在植物中!微管蛋白的研究已成为热点)
现在已报道的拟南芥 ",#(72F"G%2%&*(12(6( "H+#
Q<57;+#中的 JC.蛋白为 - 个*,+ !JCL蛋白为 *
个*)+ %棉花";"%^G2?@*2#%?&?@H+#中至少分离鉴定
了 % 个JC.蛋白和 $* 个JCL蛋白*% [-+ %水稻"J#^0
C( %(&2_( H+#中有报道的JC.蛋白为 ) 个!JCL蛋白
为 & 个* [&+ %杨树"H"G?1?%#中的 JC.蛋白为 & 个
JCL蛋白为 "# 个**+ )
木本植物微管蛋白的研究非常缓慢!主要原因
是木本植物的生长周期长!不同基因的表达会随着
时间和生长的变化而发生改变!不易人工获得转基
因植株等) 本研究以我国特有的毛白杨"H[&"@$6&"0
%( P1I+#K<,基因为研究对象!采用生物信息的方
法!对K<,基因的碱基序列,氨基酸序列,系统进化
关系,基因结构,蛋白质三维结构进行研究)
$!材料与方法
9+9:材料与试剂
$+$+$!数据库和分析软件 !B<7L174$ ;FW$bb
VVV+79@2+730+72;+M:Tb%杨树全基因组数据库$;F(
FW$bbVVV+W;5F:S:0<+7
:IMb`:WFI$w$ b`:WFI$w$+27>:+;F03%拟南芥全基因组数
据库$;FW$bb1I1@2E:WK2K+:IMb%`^L蛋白组数据库$
;FW$bbVVV+I9K@+:IMbWE@b;:0列分析软件$L31KF`! ]^.Z.]!L2:/E2F) 系统进化分
析软件$Z/B.!P36KF13U) 内含子外显子分析$BD(
D^";FW$bbMKEK+9@2+W46+
$+$+"!克隆所用材料和试剂!)$ 毛白杨于 "#$,
年 - 月采自中国林科院内%Z(ZH\反转录试剂盒!
购买自 WI:0
丙醇!无水乙醇! /^`P等常规试剂为国产分析纯%
琼脂糖凝胶 ]^.回收试剂盒 !购买自康为世纪
公司)
9+;:方法
$+"+$!毛白杨 K<,基因序列的克隆!以 - 个拟南
芥K<,基因为种子序列!利用软件 L31KF` *$#+ !在杨
树基因组数据库,B<7L174等数据中搜索相关序列!
共得到 ," 条微管蛋白序列) 根据 K<,基因的保守
区域筛选这 ," 条序列!最后确定杨树 K<,基因为
& 个)
根据上述得到的 & 个预测序列!设计引物) 由
于微管蛋白在核酸序列的相似性很高!所以引物的
设计在 %.和 ,.非翻译区)
N].的提取!反转录获得 9^].第一链均按照
试剂盒操作严格执行) N].的提取主要采用的裂
解细胞和柱纯化总N].的方法) 9^].第一链是以
Y32M<^J为引物!在反转录酶的作用下获得) P`N克
隆所用试剂盒为J1X的Z2A) 引物序列见表 $)
表 9:克隆8A!基因所用INM引物
基因 引物 "%.(,.#
K<,+
.JB.B.B.BJBP.JJJPB.JJP
JP.JPJPPJJP.JP.PP.JPP
K<,Q
B..B.JB.B.B...J..JJ.BP
BBJJBBJ..JJ.PJJ.JJPBJ
K<,M
P.BPB....JB.B.B.BJBP
PBB.BP.PPJP.P.JBJ.PJP
K<,U
B.JB.B.B...J..J..BP.JJ
BBP..J..PJJ.JJB.J.BJP
K<,O
.JB.B.B.BJBP.JJJPB.JPP
JP.P.JBJ.PJPBJP.PP.J
K<,V
.JB.BBB.B.J..J..BP.J.P
PPJ.BJ..JPJJPPJPPJP.P
K<,R
.JB.B.B.BJBP.JPJP..J
PPJBBP.JJ.P.JBJ.JJPP
K<,W
P..JJ.JB.BBB.B.J..J..B
PJP.BJ..JPJJPBJPPJP.PP
$+"+"!毛白杨K<,基因的序列分析!毛白杨 K<,
基因序列的分析主要包括!毛白杨 K<,基因和 JC.
蛋白的序列分析) 首先!结合软件P36KF13U*$$+对毛
白杨K<,基因的 P^ D 序列和 ]^.序列进行比对!
确定毛白杨内含子和外显子的位置) 在 BD D^*$"+中
进一步获得毛白杨基因的结构图%其次!利用 L2:/2(
EF! ]^.Z.]等软件!将获得的 P^ D 序列翻译成氨
基酸序列!并对主要植物 K<,基因的氨基酸序列进
行比对!分析其相似性)
$+"+,!JC.系统进化树的构建!首先!将 JC.氨
基酸序列文件保存为 ?.DJ.的格式!用 P36KF13U
软件对所有JC.的氨基酸序列进行比对!生成软件
Z/B.可读的比对文件%然后!利用软件Z/B.对上
述文件进行进化树分析!外类群为衣藻 JC.) 计算
方法为距离依靠法中的邻接法"]<2M;@:Ik:2727M#!
迭代值为 $ ###) 最后生成无根树)
$+"+)!毛白杨 JC.蛋白三维结构的预测!采用
DUODD(ZY^ /H
*$,+对毛白杨JC.蛋白三维结构进行
预测) 首先!利用 L31KF`等软件搜索 `^L数据库!
%)
林!业!科!学!研!究 第 "& 卷
找到与JC.氨基酸序列的结构信息!并确定相似的
靶序列%其次!利用 DOZ软件!检查序列与模板的匹
配程度!这一步将序列相似性大于 "%d的序列或比
"# 个残基大的已构建模型选择出来%然后!利用 I`:(
Z:E O生成所有可能的模型) 最后!BI:0:K软件会
将所生成模型的能量最小化 "图 $ #) 接下来!
DUODD(ZY^ /H提供 , 种方法生成最终的蛋白结构!
分别为简捷模式"常规#,简捷模式"使用用户优化
模板#和 优化模式) 本研究采用了第 " 种方法)
图 $!DUODD(ZY^ /H蛋白三维结构预测流程
"!结果与分析
;>9:!B+氨基酸序列相似性分析
以拟南芥K<,基因为种子序列!在杨树基因组
数据库和B<7L174 等数据中搜索相关序列!共搜索
到 & 个杨树K<,基因) 以毛白杨为研究材料! P`N
克隆获得了这 & 个基因) 命名为 H&K<,+0H&K<,W)
利用软件P36KF13U对拟南芥".FJC.#,垂枝桦"-$&0
?1( G$6F?1( N:F;# "LWJC.#,牛筋草"E1$?%26$26F2)(
"H+# B1
A(#$H+#"QTJC.#,水稻"YKJC.#,李"H#?6?%%(12)20
6( H27E3+# " E`JC.#,黄杉"H%$?F"&%?A( @()#")(#G(
"J:I<5# Z15I# " 0`JC.#,狗尾草 " I$&(#2( _2#2F2%
"H+# +`L<16T+#"DTJC.#,洋芋"I"1(6?@&?7$#"%?@
H+#"DFJC.#,玉米"8$( @( %^H+# "j0JC.#以及衣
藻"D*1(@^F"@"6(%# "PIJC.#的 JC.K的氨基酸序
列进行比对) 从比对结果"图 " 和表 "#可以看出$
毛白杨
$
(微管蛋白的氨基酸和其它植物的 JC.氨
基酸序列的相似极高!在 d以上!其中!毛白杨 F`(
JC.$(`FJC.& 与 拟 南 芥 的 .FJC.$(.FJC.- 有
图 "!毛白杨" F`#,拟南芥".F#,垂枝桦"LW#,牛筋草"/2#,棉
花"B;#,苜蓿"ZF#,大麦"QT#,水稻"YK#,李" E`#,黄杉" 0`#,
狗尾草"DT#,洋芋"DF#,玉米"j0#和衣藻"PI#
$
[微管蛋白氨
基酸序列的比对
&&e-d *e$d的相似性!与牛筋草 /2JC.$(/2(
JC., 存在 &&e#d *e,d的相似性!与棉花
B;JC.$(B;JC.% 有 &&e-d *ed的相似性!与
苜蓿ZFJC.$(ZFJC., 存在 &"e#d *&e#d的相似
性!与大麦 QTJC.$(QTJC., 有 &e&d *&e#d的
相似 性! 与 水 稻 YKJC.$(YKJC.) 有 &-e%d
*e$d的相似性!与玉米 j0JC.$(j0JC.- 存在
&-e"d *e,d的相似性)
由于JC.K氨基酸在 ]端相似性极高!图 " 只
显示了P末端的结果) 微管蛋白的翻译后修饰有助
-)
第 $ 期 饶国栋等$毛白杨
$
(微管蛋白基因家族的克隆与序列分析
于维持微管的稳定和其它驱动蛋白的结构) P末端
氨基酸是微管蛋白翻译后修饰的作用位点!大部分
翻译后修饰都是以 JC.的脱酪氨酸起始*$)+ !所以
JC.氨基酸序列的末端大多以&a "酪氨酸#结尾
"图 "#)
;>;:!B+的系统进化分析
以衣藻 JC."PIJC.# 为外类群!利用软件
Z/B.,!采用 ]k" 7<2M;@:I(=:2727M#法对植物 JC.K
的氨基酸序列进行系统进化分析*$%+ ) 植物JC.K聚
为 " 个大类!命名为 P31KKO和 P31KKO!拟南芥,玉
米,杨树,水稻,棉花等物种的 JC.均匀的分布于这
" 个类群!其中!杨树的 F`JC.$, F`JC.,, F`JC.%, F`(
JC. 在 P31KKO!而 F`JC.", F`JC.), F`JC.-, F`(
JC.& 在P31KKO"图 ,#)
表 ;:毛白杨和其它植物
!
L微管蛋白氨基酸序列的相似性
植物 序列
相似性bd
F`JC.$ F`JC." F`JC., F`JC.) F`JC.% F`JC.- F`JC. F`JC.&
拟南芥 .FJC.$ &&+* *#+& &*+, *#+- &*+% *$+$ &&+- *$+,
拟南芥 .FJC."b) *+$ *$+$ *-+) *#+" *-+" &&+& *-+) &*+$
拟南芥 .FJC.,b% *$+ *-+# *$+% *%+, *$+, *%+$ *#+" *%+,
拟南芥 .FJC.- *-+& *#+& *-+- *#+# *-+# &&+- *-+- &&+&
垂枝桦 LWJC. *&+& *#+) *+$ &*+& *&+# &*+$ *+% &&+-
牛筋草 /2JC.$ *+, *#+# *-+" &*+% *-+) &&+" *-+" &&+)
牛筋草 /2JC." &*+, *#+# &&+* &*+, &*+$ &*+& &&+# &*+&
牛筋草 /2JC., *"+" *-+# *$+$ *%+% *$+, *%+$ *#+) *%+$
棉花 B;JC.$ *+$ *$+, *-+) *#+" *+$ &*+, *-+- *#+#
棉花 B;JC." *+ *#+) *-+- *#+" *+% &&+& *-+& &&+-
棉花 B;JC., *+, *$+$ *-+" *#+" *+$ &&+& *-+- &*+$
棉花 B;JC.) *+% *#+& *+, *#+" *+% &*+, *+, &*+%
棉花 B;JC.% *+$ *$+, *-+# *#+) *-+" &*+% *-+" &*+
苜蓿 ZFJC.$ *&+# *#+) *+, *#+# *+ &*+$ *+% &*+,
苜蓿 ZFJC." &,+$ &%+$ &"+% &)+) &"+% &-+" &"+# &%+%
苜蓿 ZFJC., *#+- *"+# &*+- *$+% *#+ *$+ &*+- *"+)
大麦 QTJC.$ *"+- *%+$ *$+, *%+$ *$+% *)+" *#+* *)+"
大麦 QTJC." *+ &*+& *%+ &&+* *-+# &&+# *-+- &+&
大麦 QTJC., *&+# *#+" *-+* &*+% *+$ &&+- *-+* &&+)
水稻 YKJC.$ *-+& &*+& *-+# &*+$ *-+" &&+# *%+ &&+"
水稻 YKJC." *+$ *#+# *%+ &*+, *-+" &&+) *%+% &&+#
水稻 YKJC., *"+* *%+ *$+, *)+* *"+# *)+" *$+$ *)+"
水稻 YKJC.) &+& &&+* &+& &*+$ &&+# &&+" &-+% &&+)
李 E`JC. *&+) *$+$ *&+# *#+) *&+" &*+% *&+# &*+,
黄杉 0`JC. *&+& *$+, *+% *#+- *&+" &*+% *+% &*+,
狗尾草 DTJC.$ *,+$ &&+) *"+* &&+) *"+) &+$ *"+- &-+&
狗尾草 DTJC." *+% *#+" *-+) &*+% *-+- &&+) *-+) &&+"
洋芋 DFJC.$ *%+ *#+) *-+& *#+" *-+" &*+$ *-+) &*+,
洋芋 DFJC." &+) *$+- &-+% *$+- &-+ &*+ &-+, *#+,
玉米 j0JC.$ *+, &*+% *-+" &*+$ *-+) &&+# *-+" &&+"
玉米 j0JC." *-+& &*+& *-+" &*+, *-+) &+& *-+" &&+)
玉米 j0JC., *"+# &+$ *$+% &-+" *$+ &-+) *$+% &-+"
玉米 j0JC.% *"+# *%+% *#+* *%+, *$+$ *)+) *#+" *)+)
玉米 j0JC.- *"+" *%+ *$+$ *%+ *$+, *)+& *#+) *)+&
衣藻 PIJC. *,+, &*+$ *,+, &&+# *,+$ &+$ *"+- &+,
杨树K<,基因在数量上的分化可能导致其功
能的分化!如棉花 B;JC."(B;JC.) 参与细胞壁纤
维素的沉积*%+ !而杨树 JC.$ 和这些基因聚在同一
亚类!说明杨树 JC.$ 也可能参与了细胞壁次生代
谢物的合成) 可以推测!杨树 K<,基因起源于 " 个
祖先K<,基因!其分化可能来自于真双子叶植物全
基因组复制事件"
)
事件#或杨柳科全基因组复制事
件"
,
事件#)
;><:毛白杨8A!基因的内含子外显子分析
将 & 个K<,基因的 P^ D 序列和 ]^.序列比对
)
林!业!科!学!研!究 第 "& 卷
图 ,!植物
$
(微管蛋白的系统进化分析
图 )!毛白杨
$
(微管蛋白基因的基因结构
作图后获得了杨树 K<,基因结构图"图 )#) 杨树
P31KKO基因和 P31KKO基因在外显子数量上表现出
差异) 其中!P31KKO基因亚家族成员含有 ) 个外显
子!, 个内含子!而 P31KKO基因亚家族成员含有 %
个外显子!) 个内含子) 在 " 个亚类中!每个亚类成
员的外显子大小相等!位置相当!这也证明 " 个亚类
成员可能起源于 " 个祖先!每个亚类中的成员分别
起源于相同的祖先) 从杨树 JC.的系统进化分析
中可以看出$ F`JC.,b%, F`JC.-b& 和 F`JC."b) 都
是以基因对的形式出现"图 )#%同时!内含子外显子
分析显示!每对基因在内含子外显子大小和位置上
极为相似!这证明 F`JC.,b%, F`JC.-b& 和 F`JC."b
) 可能来自于串联重复序列的复制)
;>=:毛白杨!B+蛋白三维结构的模拟
采用同源建模的方法!同时结合 DUODD(ZY^ /H
对毛白杨JC.蛋白的三维结构进行模拟*$-+ ) 毛白
杨JC.蛋白包含典型的
$
(螺旋和
#
(折叠!每个蛋白
都是由 $" 个
$
(螺旋和 $$ 个
#
(折叠构成!其间还有
部分转角作为
$
(螺旋和
#
(折叠的连接"图 %#) 从
图 % 可以看出$所有杨树 JC.蛋白表现出极高的结
构相似性!从结构上很难区分P31KKO和P31KKO家族
成员之间的区别) 这说明!微管蛋白作为细胞骨架
的组成部分在结构上极为保守!这种保守性可能是
细胞正常形态生成的保证)
图 %!毛白杨
$
(微管蛋白的三维结构模拟
,!结论与讨论
木本植物微管蛋白的研究目前还处在起步阶
段!主要原因有如下几点$第一!木本植物!特别是生
物量大的乔木!如杨树和柳树!生长周期长!这样就
造成了微管蛋白的研究周期也随着增长%第二!微管
蛋白是以基因家族的形式行使功能!而各个家族成
员的表达模式却不尽相同!有的是随着树木的生长
逐渐表达!这样就造成不能一次性克隆鉴定出所有
的微管蛋白!进一步导致了不能系统的研究微管蛋
白的整个家族%第三!木本植物转基因的难度大!周
期长) 与拟南芥,烟草,水稻等模式植物不同!木本
植物的转基因成功率低,周期长,假阳性高,表型不
&)
第 $ 期 饶国栋等$毛白杨
$
(微管蛋白基因家族的克隆与序列分析
明显!这造成了微管蛋白的研究停留在野生的本底
水平)
毛白杨K<,和 K<-微管蛋白基因的克隆鉴定
为研究植物微管蛋白在基因家族水平调控木本植物
生长的分子机理方面奠定了基础) 本文以毛白杨
K<,基因家族成员为研究对象!对 JC.的核酸和蛋
白序列进行了细致分析!推测杨树 K<,基因可能起
源于 , 种不同的复制事件!即真双子叶植物全基因
组复制事件"
&
事件#!杨柳科全基因组复制事件"
事件#以及串联重复复制事件) 毛白杨基因结构的
分析和系统进化分析都显示!杨树 K<,基因分为 "
个亚类!每个亚类有 ) 个成员!可以推测杨树 K<,
基因起源于 " 个祖先基因) 杨树 JC.氨基酸序列
的相似性分析和蛋白质三维结构模拟都证明!JC.
极为保守!这种保守不仅体现在蛋白质的一级结构
上!还体现在了蛋白的三级结构上) 毛白杨 JC.家
族的生物信息学分析将为细致研究木本植物微管蛋
白调控植物生长发育的分子机理奠定一定的基础)
参考文献!
*$+ H
["%#+
*"+ 1`I
3:K
,#(72F"G%2%9:7F127K1F3<1KFK2A
*)+ D76KF1E ^ !` Q11K].! G:W9S14 D !^ $&(1+J;
,#(72F"G%2%9:7F127K1F3<1KF727<
*%+ U;2F14299;17M
*-+ _P! r27 aZ! _6 a! $&(1+Z:3<9631I93:727M!
327M! 17E 5<1KF9:0W3<0<7F1F2:7 :>$* @
T<3:W27M9:F:7 :T63
*+ /:7 kD! H<
I29<13W;1(F6@6327 M<72IKF27FI:7*k++
3`17FW;5K2:3:M5! "###! $",",#$ $##% [$#$)+
*&+ YK;241V1Z! a17MB! G1V1M69;2G! $&(1+/AWI
@
**+ Y143<5N\! U17MaD! N1014I2K;71U! $&(1+^ 2>K2:7 17E
*$#+ k:@ .! H1791KF
F;
*$"+ B6:.a! j;6 rQ! P;<7 _! $&(1+BD D^$ 1M<7
*$,+ B617 <7T2I:70<7F>:I9:0W1I1F2T
*$)+ k174
@63<95F:K4<3
*$%+ G601ID! J106I1G! ]<2Z+Z/B.,$ O7F
3<9631I/T:36F2:71I5B<7
*$-+ .7:3E G! L:IE:32H! G:WW k! $&(1+J;
0:E<327M*k++L2:27>:I01F29K! "##-! """"#$ $*% ["#$+
*)