免费文献传递   相关文献

植物类防御素基因的预测和序列分析



全 文 :植物生理学通讯 第 44卷 第 2期,2008年 4月 229
收稿 2007-11-27 修定 2008-02-27
资助 国家自然科学基金(30 6 71 4 3 9)。
* 通讯作者(E-mail:hesheng_hou@126.com;Tel:0411-
8 2 4 9 0 8 0 2 )。
植物类防御素基因的预测和序列分析
李鑫,侯和胜 *
辽宁师范大学生命科学学院,辽宁大连 116029
提要:文章用已知的 9种植物防御素基因为对照,根据DFCI数据库中 28种植物的相关数据,进行BLAST同源性比对,
在24种植物中预测出115种新的类植物防御素基因。对它们进行序列比对、信号肽预测和进化树分析的结果表明:他们
与已知的植物防御素有很高的同源性,且具备植物防御素的基本特征。
关键词:植物防御素;基因预测;序列分析
Prediction and Sequence Analysis of Plant Defensin-like Genes
LI Xin, HOU He-Sheng*
College of Life Science, Liaoning Normal University, Dalian, Liaoning 116029, China
Abstract: With defined nine plant defensins as references, twenty eight plant species database had been searched
in the DFCI by BLAST to find the homologous sequences. One hundred and fifteen new plant defensin-like
genes had been found in twenty four species. The results of sequences alignment, signal P and phyligenetic
analysis indicated that all the one hundred and fifteen defensin-like genes showed high homology and had the
basic characteristics of plant defensin.
Key words: plant defensin; gene prediction; sequence analysis
植物防御素是一类小分子的(45~54个氨基酸
组成)、呈碱性、富含半胱氨酸、具有复杂三维
折叠结构的抗菌短肽。迄今发现的所有植物防御
素序列的氨基酸序列有高度的同源性,但又相当
有限,只有 8个半胱氨酸是完全保守的。它的空
间模型含有3股反平行的β折叠和一个平行的α螺
旋,其间以 8个半胱氨酸形成的 4个稳定的二硫
键连接,形成半胱胺酸稳定 αβ模型(cysteine-sta-
bilized αβ motif),又称 Csαβ结构模型。
一般来说,防御素基因在植物体内表达的是
一个包含信号肽序列的蛋白前体,此蛋白通过翻
译后加工而运输到细胞质外的空间后发挥防御素的
抗菌功能(Meyer等 1996)。植物防御素具有广谱
的抗菌性,起多种防御作用,包括抗真菌(Gao等
2000;Cabral等 2003;Lay等 2003a)、抗细菌
(Koike等2002)、抗虫(Chen等2002;Lay等2003b)
和蛋白酶抑制作用(Wijaya等 2000)。
以往曾认为防御素是一个相对较小的蛋白家
族,拟南芥(Arabidopsis thaliana)中有 15种防御素
蛋白(Thomma等 2002),人和小鼠则不到 50种
( S c hu t t e 等 2 0 0 2 )。但后来查明在蒺藜苜蓿
(Medicago truncatula)和拟南芥中各有 300多个类
防御素基因(defensin-like sequences,DEFLs)
(Silverstein 等 2005)。因而认为,防御素的数量
被低估了,它很可能是一个庞大的蛋白家族。
本文对多种植物的类防御素基因进行预测和
序列分析,以期为以后的基因克隆和功能研究以
及大规模生产的后续研究积累基础性资料。
材料与方法
从目前已发现的植物防御素中选取 9个为代
表,它们是:拟南芥防御素 PDF1.1 (GenBank登
录号为AY961376)、PDF1.2 (GenBank登录号为
NM_123809)、PDF1.3 ( GenBank登录号为
NM_128160)、PDF1.4 ( GenBank登录号为
NM_101817)、PDF2.1 ( GenBank登录号为
NM_126272)、PDF2.3 ( GenBank登录号为
NM_126273)、PDF2.5 ( GenBank登录号为
NM_125761)以及大豆(Glycine max)的一个防御素
(GenBank登录号为 u12150)和甜椒(Capsicum
a n n u u m )的一个防御素( G e n B a n k 登录号为
X95363),根据它们的核苷酸序列在DFCI数据库
植物生理学通讯 第 44卷 第 2期,2008年 4月230
中的 BLAST程序(http://compbio.dfci.harvard.edu/
tgi/cgi-bin/tgi/Blast/index.cgi)对数据库中 28种植物
进行同源性比较(拟南芥因其防御素的研究已经比
较透彻,所以未做比较),它们包括:矮牵牛花
(Petunia hybrida)、白杨(Populus sp.)、百脉根
( L o t u s j a p o n i c u s )、冰叶日中花(简称冰花)
(Mesembryanthemum crystallinum)、菜豆(Phaseolus
v u l ga r is )、大麦( H or d e um v u l g a re )、番茄
(Lycopersicon esculentum)、甘蔗(Saccharum
offic inarum)、高粱(Sorghum bicolor)、黑麦
(Secale cereale)、胡椒(Capsicum annuum)、莱菌
衣藻(Chlamydomonas re inhard t ii )、耧斗花
(Aquilegia sp.)、马铃薯(Solanum tuberosum)、棉
花( G o s s y p i u m s p . )、蒺藜苜蓿( M e d i c a g o
truncatula)、葡萄(Vitis vinifera)、水稻(Oryza
sativa)、松树(Pinus sp.)、甜菜(Beta vulgaris)、
莴苣(L a c t u c a s a t iv a )、向日葵( H e l i a n th u s
a n n u u s )、小麦( T r i t i c u m a e s t i v u m )、烟草
(Nicotiana tabacum)、洋葱(Allium cepa)、油菜
(Brassica napu)、玉米(Zea mays)、云杉(Picea
sp.)。将所得的同源性较高且功能未定的基因序
列,从 N C B I 中的开放阅读框( ope n r ea d i ng
frame,ORF)程序查找序列的ORF,筛选掉ORF
不完整或者不具备保守的 8个半胱氨酸的基因片
段,剩余的即为类防御素基因。
结果与讨论
1 植物中预测出的类防御素基因
在DFCI所有 28种植物数据库中,有 4种植
物尚未发现与作为对照的9种已知植物防御素同源
性较高的基因,它们分别是黑麦、莱菌衣藻、棉
花和洋葱。在剩余的 24种植物中,发现少则 1种
(如高粱),多则 15种(小麦)的共计 115种类植物
防御素基因(表 1)。它们ORF的核苷酸长度分布
的范围为 165~255 bp。只有 53号基因(蒺藜苜蓿
5,TC107866)的长度为 411 bp,ORF的氨基酸
序列分析表明,它的成熟端是由连续的 2个防御
素组成,这在以前是未被报道的,很可能有其特
定的功能。
所有发现的类防御素基因,最少由 1个,最
多由 390个 EST拼接而成。通过在GenBank中查
找组成该基因的 EST序列的来源信息,进而确定
植物类防御素的表达部位。在所有的类植物防御
素基因中,其表达部位主要分布在种子(45种)、
花(21种)、根(21种)、茎(15种)、叶片(11种)
和芽(7种)中。植物防御素的作用主要是抵抗病原
微生物(特别是真菌),而种子的胚、花的花粉
囊、根尖、茎的分生组织、幼小的叶片和芽等
部位均是植物营养最充足的部分,也是真菌等最
容易入侵的部分。因此,这可能是植物防御素在
上述部位中大量表达的原因。
2 类植物防御素基因间的氨基酸序列比对
将拟南芥防御素 PDF1.1、PDF1.2、PDF1.3、
PDF1.4、PDF2.1、PDF2.3、PDF2.5以及大豆
防御素、甜椒防御素分别编号为 116~124。另将
115种类植物防御素的和9种用作比对的植物防御
素一起,用软件 Clustalx 1.81对ORF成熟端的氨
基酸序列进行比对的结果(图 1和 2)显示,所有的
类防御素基因都具有 8个保守的半胱氨酸,形成
稳定的 4个二硫键,进而构成植物防御素的Csαβ
结构模型。此外,绝大多数的类防御素基因还有
一个谷氨酸、一个丝氨酸和一个甘氨酸也是保守
的。用信号肽分析软件 Signal P v3.0分析 115个
类植物防御素基因,从其中 105个类防御素中可
以找到信号肽序列,长度为 30个氨基酸左右。据
此认为,它们编码的是带有信号肽的分泌型防御
素蛋白。信号肽一般与蛋白质的细胞定位有关,
在跨模运输的过程中,最终为信号肽酶除去。与
成熟端相比,信号肽序列的保守性明显低。有 10
个类植物防御素基因未见有信号肽序列,它们的
编号分别为:30 (番茄 1,TC180416)、38 (耧
斗花 1,TC12418)、39 (耧斗花 2,TC12418)、
4 1 (马铃薯 2,C V4 7 53 7 7 )、4 6 (马铃薯 7,
CX161560)、54 (葡萄 1,CF608231)、72 (向日
葵 1,TC24016)、76 (小麦 2,CD885314)、100
(油菜 7,CX280672)和 113 (云杉 1,CO487050)。
其中,耧斗花中的 2种类植物防御素都没有信号
肽。这种没有信号肽的植物防御素也曾有人报道
过(Thomma等 2002)。
3 不同植物间类防御素的进化关系
用软件MWGA 3.1将氨基酸序列比对结果绘
制成的进化树(图略,用NJ算法,同时去掉同源
性50%以下的分支)显示,根据115种类植物防御素
的成熟端序列差异可以分为两个大类,一类与拟
植物生理学通讯 第 44卷 第 2期,2008年 4月 231
图 1 类植物防御素基因的氨基酸序列比对(上半部分)
Fig.1 Comparison on the amino acid sequences of plant defensin-like genes (upper half)
*表示 8 个保守的半胱氨酸及其组成的 4 个二硫键的位置;:表示为保守性极高的谷氨酸;.表示为保守性较高的丝氨酸和甘
氨酸。下图同此。
植物生理学通讯 第 44卷 第 2期,2008年 4月232
图 2 类植物防御素基因的氨基酸序列比对(下半部分)
Fig.2 Comparison on the amino acid sequences of plant defensin-like genes (lower half)
植物生理学通讯 第 44卷 第 2期,2008年 4月 233
表 1 115种类植物防御素基因的特征以及它们的序列分析
Table 1 Characteristics of 115 denfensin-like genes and their sequence analysis
编号 植物种类 DFCI序列号 EST 表达部位 ORF核苷 编号 植物种类 DFCI序列号 EST 表达部位 ORF核苷
编号 数量 酸长度 /bp 编号 数量 酸长度 /bp
1 牵牛花 1 CV292901 1 花 207
2 牵牛花 2 TC116 1 0 花 237
3 白杨 1 DN499117 1 茎 210
4 白杨 2 TC76671 7 叶 210
5 白杨 3 TC58802 6 茎、根 225
6 白杨 4 TC82601 390 茎、根 225
7 白杨 5 TC57538 1 1 茎、根 225
8 白杨 6 TC57242 1 1 根 228
9 白杨 7 TC77776 2 茎 228
1 0 白杨 8 TC50322 120 茎 225
1 1 百脉根 1 TC8334 1 7 种子、芽 237
1 2 冰花 1 TC4916 3 8 叶 237
1 3 冰花 2 TC6662 5 叶 237
1 4 冰花 3 BE033609 1 根 234
1 5 冰花 4 BE033674 1 根 234
1 6 冰花 5 TC6355 4 0 叶 237
1 7 菜豆 1 TC147 1 6 种子、叶 237
1 8 菜豆 2 CV539405 5 种子 222
1 9 大麦 1 TC132493 7 种子 249
2 0 大麦 2 TC132392 2 7 种子 249
2 1 大麦 3 TC139487 1 6 种子 255
2 2 大麦 4 TC138795 1 7 种子 231
2 3 大麦 5 TC138828 6 2 种子 237
2 4 大麦 6 BM369430 1 种子 246
2 5 大麦 7 TC139486 5 3 种子 255
2 6 大麦 8 TC132634 1 7 芽、花 252
2 7 大麦 9 TC136100 3 花 228
2 8 大麦 10 TC138080 2 根 255
2 9 大麦 11 TC139365 5 1 花 249
3 0 番茄 1 TC180416 2 种子、茎 171
3 1 番茄 2 TC186391 2 花 240
3 2 番茄 3 TC180152 4 果实 231
3 3 番茄 4 TC183739 3 细胞悬浮 231
培养
3 4 甘蔗 1 TC69866 3 根、种子 243
3 5 甘蔗 2 TC68601 4 茎、叶、 243

3 6 高粱 1 TC97293 4 茎 249
3 7 胡椒 1 TC3779 9 叶 237
3 8 耧斗花 1 TC8037 3 茎、花、 174
芽、叶、
根混合
3 9 耧斗花 2 TC12418 2 茎、花、 168
芽、叶、
根混合
4 0 马铃薯 1 CV502686 1 芽 225
4 1 马铃薯 2 CV475377 1 茎 171
4 2 马铃薯 3 TC151936 1 9 茎 237
4 3 马铃薯 4 TC134856 3 0 茎 237
4 4 马铃薯 5 CV477110 1 茎 225
4 5 马铃薯 6 BM110496 1 根 222
4 6 马铃薯 7 CX161560 1 芽 171
4 7 马铃薯 8 TC157995 4 花 237
4 8 马铃薯 9 TC153847 1 4 花、茎 231
4 9 蒺藜苜蓿 1 TC94214 6 7 叶 231
5 0 蒺藜苜蓿 2 TC103627 4 种子 225
5 1 蒺藜苜蓿 3 TC98064 2 根、种子 243
5 2 蒺藜苜蓿 4 TC101060 2 3 种子 240
5 3 蒺藜苜蓿 5 TC107866 1 3 种子 411
5 4 葡萄 1 CF608231 1 芽 186
5 5 葡萄 2 TC63237 2 茎 234
5 6 葡萄 3 TC70167 1 3 果实 219
5 7 葡萄 4 TC60445 132 花 228
5 8 水稻 1 TC307948 4 花 237
5 9 水稻 2 TC323311 3 花 237
6 0 水稻 3 CR279359 1 幼苗 225
6 1 松树 1 TC57183 3 7 根 252
6 2 松树 2 TC57204 8 根 252
6 3 松树 3 TC57263 3 根 255
6 4 松树 4 TC57354 1 2 根 252
6 5 松树 5 TC57415 6 根 252
6 6 松树 6 TC59219 1 7 根 252
6 7 松树 7 TC57413 1 2 根 252
6 8 甜菜 1 CK136502 1 根 237
6 9 甜菜 2 CK136545 1 根 228
7 0 莴苣 1 TC12064 2 花 222
7 1 莴苣 2 BQ855350 1 花 219
7 2 向日葵 1 TC24016 4 芽 171
7 3 向日葵 2 TC26453 2 花 240
7 4 向日葵 3 TC22337 1 4 种子 210
7 5 小麦 1 CA618928 1 叶 240
7 6 小麦 2 CD885314 1 种子 183
7 7 小麦 3 TC234450 1 0 叶 249
7 8 小麦 4 TC234452 6 种子 249
7 9 小麦 5 TC247298 1 1 种子 237
8 0 小麦 6 TC252901 1 2 种子 246
8 1 小麦 7 TC257095 5 种子 231
8 2 小麦 8 TC265486 5 种子 249
8 3 小麦 9 TC252413 1 5 种子 228
8 4 小麦 10 TC252415 8 种子 228
8 5 小麦 11 TC249900 1 2 种子 234
8 6 小麦 12 TC254866 1 0 种子 231
8 7 小麦 13 TC252414 9 种子 228
8 8 小麦 14 TC252354 2 种子 246
8 9 小麦 15 TC267965 1 9 种子 225
9 0 烟草 1 TC8608 3 8 叶 234
9 1 烟草 2 TC10253 3 花 234
9 2 烟草 3 TC9002 159 花 237
9 3 烟草 4 TC9865 7 花 237
                         
植物生理学通讯 第 44卷 第 2期,2008年 4月234
续表
编号 植物种类 DFCI序列号 EST 表达部位 ORF核苷 编号 植物种类 DFCI序列号 EST 表达部位 ORF核苷
编号 数量 酸长度 /bp 编号 数量 酸长度 /bp
9 4 油菜 1 TC11847 72 种子 234
9 5 油菜 2 CD830012 1 种子 231
9 6 油菜 3 CD820815 1 种子 234
9 7 油菜 4 CD832452 1 种子 234
9 8 油菜 5 TC12974 168 种子 243
9 9 油菜 6 CD829429 1 种子 243
100 油菜 7 CX280672 1 种子 165
101 油菜 8 TC13832 3 花 243
102 油菜 9 CD841438 1 花 246
103 油菜 10 TC12277 3 花 243
104 油菜 11 CD841657 1 花 246
105 玉米 1 TC342652 5 种子 240
106 玉米 2 CO457585 1 种子 240
107 玉米 3 TC342666 8 种子 240
108 玉米 4 TC350193 2 种子 240
109 玉米 5 CO452938 1 种子 237
110 玉米 6 CO451935 1 种子 237
111 玉米 7 TC343609 6 种子 243
112 玉米 8 CO468260 1 种子 240
113 云杉 1 CO487050 1 根 180
114 云杉 2 TC39500 1 0 树皮 252
115 云杉 3 TC31775 1 4 根 252
南芥 pdf1家族同源性较高,包括油菜和蒺藜苜蓿
的多个基因以及番茄和耧斗花的各一个基因,共
计 12个;另一类与拟南芥 pdf2家族同源性较高,
绝大多数的类防御素基因都包括在此类当中。这
种基于序列差异的分类,很可能是与其抗菌作用
不同有联系。除此之外,各大类中的亚类分化不
是那么明显,这可能与植物防御素的序列本身很
短、保守序列较少有关。有意思的是,同一种
植物的不同类防御素在进化树上的分布规律性不是
很强,如松树的不同类防御素都集中在一起,同
源性很高,这说明其进化的时间比较晚,而番茄
的不同类防御素遍布在整个进化树上,说明其同
源性很低,进化发生比较久远。这一现象也同样
存在在昆虫防御素中。一般来说,进化关系较近
的基因,其功能也较为相似,如油菜 5 ( T C
12974)、油菜 6 (CD829429)的两种类植物防御素
与拟南芥防御素pdf1.4的进化关系极为密切,这也
意味着它们可能有同样的功能。
参考文献
Cabral KM, Almeida MS, Valente AP, Almeida FC, Kurtenbach E
(2003). Production of the active antifungal Pisum sativum
defensin 1 (Psd1) in Pichia pastoris: overcoming the ineffi-
ciency of the STE13 protease. Pro Expr Purif, 31: 115~122
Chen KC, Lin CY, Kuan CC, Sung HY, Chen CS (2002). A novel
defensin encoded by a mungbean cDNA exhibits insecticidal
activity against bruchid. J Agric Food Chem, 50: 7258~7263
Gao AG, Hakimi SM, Mittanck CA, Wu Y, Woerner BM, Stark DM,
Shah DM, Liang J, Rommens CM (2000). Fungal pathogen
protection in potato by expression of a plant defensin
peptide. Nat Biotechnol, 18: 1307~1310
Koike M, Okamoto T, Tsuda S, Imai R (2002). A novel plant
defensin-like gene of winter wheat is specifically induced
during cold acclimation. Biochem Biophys Res Commun,
298: 46~53
Lay FT, Brugliera F, Anderson MA (2003a). Isolation and prop-
erties of floral defensins from ornamental tobacco and
petunia. Plant Physiol, 131: 1283~1293
Lay FT, Schirra HJ, Scanlon MJ, Anderson MA, Craik DJ (2003b).
The three-dimensional solution structure of NaD1, a new
floral defensin from Nicotiana alata and its application to a
homology model of the crop defense protein alfAFP. J Mol
Biol, 325: 175~188
Meyer B, Houlné G, Pozueta-Romero J, Schantz ML, Schantz R
(1996). Fruit-specific expression of a defensin-type gene
family in bell pepper. Upregulation during ripening and upon
wounding. Plant Physiol, 112: 615~622
Schutte BC, Mitros JP, Bartlett JA, Walters JD, Jia HP, Welsh
MJ, Casavant TL, McCray Jr PB (2002). Discovery of five
conserved β-defensin gene clusters using a computational
search strategy. Proc Natl Acad Sci USA, 99: 2129~2133
Silverstein KAT, Graham MA, Paape TD, VandenBosch KA
(2005). genome organization of more than 300 defensin-
like genes in Arabidopsis. Plant Physiol, 138: 600~610
Thomma BP, Cammue BP, Thevissen K (2002). Plant defensins.
Planta, 216: 193~202
Wijaya R, Neumann GM, Condron R, Hughes AB, Polya GM
(2000). Defense proteins from seed of Cassia fistula include
a lipid transfer protein homologue and a protease inhibitory
plant defensin. Plant Sci, 159: 243~255