全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2012年第4期
收稿日期 : 2011-09-27
基金项目 : 贵州省烟草专卖局(公司)科技专项(200911), 贵州省科学技术基金项目(黔科合 J 字[2012]2256 号 )
作者简介 : 林世锋 , 男 , 博士 , 研究方向 : 烟草遗传育种与分子生物学 ; E-mail: linshifeng1978@163.com
通讯作者 : 王仁刚 , 男 , 硕士 , 研究方向 : 烟草病虫害及抗病育种 ; E-mail: rengangwang@126.com
烟草蛋白酶抑制剂基因的电子克隆及生物信息学分析
林世锋 王仁刚 任学良
(贵州省烟草科学研究所,贵阳 550081)
摘 要: 蛋白酶抑制剂可以增强植物对病虫害的抵抗能力,为了深入研究蛋白酶抑制剂在烟草中的作用机制,利用生物信息
学的方法,成功获得了烟草品种 K326中的 4种蛋白酶抑制剂 cDNA序列(NtPI-1、NtPI-2、NtPI-3和 NtPI-4)并对其进行了序列分析。
它们编码的氨基酸序列都具有典型的马铃薯蛋白酶抑制剂Ⅰ家族功能结构域,属于马铃薯蛋白酶抑制剂Ⅰ家族成员。序列分析表明,
4种蛋白酶抑制剂基因 cDNA序列均具有完整的开放读码框,依次编码 128、95、94和 72个氨基酸残基,它们的氨基酸序列一致
性在 31%-38%之间。系统树分析表明,烟草品种 K326中的 4种蛋白酶抑制剂分散在进化树的不同位置,形成不同亚群。
关键词: 烟草 蛋白酶抑制剂 电子克隆 生物信息学
In Silicon Cloning and Bioinformatic Analysis of Proteinase Inhibitor
Genes in Tobacco
Lin Shifeng Wang Rengang Ren Xueliang
(Guizhou Tobacco Research Institute, Guiyang 550081)
Abstract: Proteinase inhibitors (PIs) have been found to induce plant defense response. For further studying the physiological functions
and mechanisms of PIs in tobacco (Nicotiana tabacum), we got four distinct PI cDNAs (NtPI-1, NtPI-2, NtPI-3 and NtPI-4) successfully from
tobacco cultivar K326 using in silicon cloning technique, and then they were analyzed by the method of bioinformatics. The results showed that
four of them had a complete open reading frame and encoded 128, 95, 94 and 72 amino acid residues, respectively, including the conserved
domains of the potato protease inhibitor I family. The identity of their deduced amino acid sequences varied from 31% to 38%, and phylogenetic
analysis indicated they belonged to different subgroups and scattered across the evolutionary tree.
Key words: Nicotiana tabacum Proteinase inhibitor In silicon cloning Bioinformatics
电子克隆(In silico cloning)是近年来伴随着
基因组计划和 EST 计划而发展起来的基因克隆新方
法[1],它依赖于各种生物信息数据库,利用生物软
件拼接延伸 EST 序列,获得目的基因的部分乃至全
长的 cDNA 序列。
蛋白酶抑制剂(proteinase inhibitor,PI)是植
物体内自然存在的病程相关蛋白,当植物受到病原
侵袭时所发生的最为普遍的抗病防御反应就是激活
这些基因来赋予植物自然抵抗能力[2],同时这些
基因的表达量也将随之变化。迄今为止,已有不同
学者分别从烟草属的粉蓝烟草与郎氏烟草的杂交
种(Nicotiana glauca × N. Langsdorffii)[3]、毛叶烟
(N. sylvestris)[4] 和 三 生 烟(N. tabacum Samsun
NN)[5, 6]中克隆到马铃薯蛋白酶抑制剂Ⅰ型 PI 基
因,从烟草属的花烟草(N. alata)[7]、皱叶烟草(N.
plumbaginifolia)[8]和渐狭叶烟草(N. attenuata)[9]
中克隆到马铃薯蛋白酶抑制剂Ⅱ型 PI 基因,从烟
草属的心叶烟(N. glutinosa)[10]和普通烟草(N.
tobaccum NC89)[11]中克隆到 Kunitz 型 PI 基因。
本研究采用电子克隆的方法获得烟草栽培品种
K326(N. tobaccum K326)的 4 种马铃薯蛋白酶抑制
剂Ⅰ型 PI 基因 cDNA 序列并进行生物信息学分析,
2012年第4期 81林世锋等 :烟草蛋白酶抑制剂基因的电子克隆及生物信息学分析
以期为进一步研究该类基因的进化关系和功能差异,
比较其在烟草抗病防御反应中的作用。
1 材料与方法
1.1 烟草蛋白酶抑制剂基因的电子克隆
以从马铃薯高抗青枯病二倍体基因型材料中
获得的蛋白酶抑制剂 StPI 基因的全长 cDNA 序列
(GenBank 登 录 号 :DQ822994)[12] 为 信 息 探 针,
对 GenBank 中 EST_others 数 据 库 指 定 物 种 烟 草
(Nicotiana tabacum)进行 tblastx 同源性检索,将
检索到的来自于烟草栽培品种 K326 的全部 EST 序
列利用 DNAMAN 6.0 软件进行拼接,形成连接体
(contig)。然后用此连接体再次进行同源检索、拼接,
重复以上过程直至无更多烟草栽培品种 K326 的重叠
EST 检出,最终获得烟草栽培品种 K326 蛋白酶抑制
剂 cDNA 序列片段。再以此片段在 GenBank 中进行
blastx 同源搜索,与其他物种的蛋白酶抑制剂进行序
列比较,进而判断拼接得到的烟草蛋白酶抑制剂基
因的 cDNA 的正确性以及其 ORF 序列完整性。
1.2 蛋白结构预测与分析
用 ORF finder 软件(http://www.ncbi.nlm.nih.gov/
gorf/gorf.html)对开放阅读框进行分析并翻译成蛋
白 质 ;利 用 SMART 在 线 服 务(http://smart.embl-
heidelberg.de/)进行蛋白质结构功能域的预测 ;利用
ProtParam 软 件(http://web.expasy.org/protparam/) 进
行编码蛋白的基本特性分析 ;利用 SOPMA 软件
(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=
npsa_sopma.html)对其蛋白质二级结构组成形式进
行分析。
1.3 氨基酸序列比对和进化分析
采用 DNAMAN 6.0 软件对获得的烟草蛋白酶抑
制剂氨基酸序列进行比对,并用 blastp 双重比对程
序计算各序列之间的一致性 ;运用 Mega 3.1 软件,
采用 Neighbor-Joining 法构建植物蛋白酶抑制剂的系
统进化树。
2 结果
2.1 烟草蛋白酶抑制剂基因的电子克隆结果
利用已知的马铃薯蛋白酶抑制剂基因的核苷酸
序列对 GenBank 中烟草 EST 数据库进行 tBlastx 同
源性检索分析,发现 6 条序列均来自烟草品种 K326
cDNA 文库(图 1)。对它们进行序列比对分析,结
果显示,6 条 EST 可拼接成 4 个独立的 cDNA 序
列,长度为 595、508、510 和 345 bp,代表 4 种不
同的烟草蛋白酶抑制剂基因,分别命名为 NtPI-1、
NtPI-2、NtPI-3 和 NtPI-4。经 NCBI ORF finder 分析,
四者分别包括一个长度 387、288、285 和 219 bp 的
开放读码框,依次编码由 128、95、94 和 72 个氨基
酸组成的蛋白酶抑制剂(图 2)。
图 1 用马铃薯蛋白酶抑制剂基因搜索 GenBank中烟草
EST数据库的结果
2.2 烟草4种蛋白酶抑制剂的结构特征分析
利用 SMART 在线服务(http://smart.emblheidel-
berg.de/)对推导出的 4 种蛋白酶抑制剂氨基酸序列
进行结构功能域分析,发现 4 种蛋白均含有一个典
型的马铃薯蛋白酶抑制剂Ⅰ家族结构域(图 2)。此
外,在 NtPI-1 和 NtPI-2 蛋白 N 端各具有一个信号肽,
长度分别为 27 和 22 个氨基酸,而 NtPI-3 和 NtPI-4
蛋白不具备相应序列。
2.3 烟草蛋白酶抑制剂的基本特性分析
利用 ProtParam 软件对 4 种烟草蛋白酶抑制剂
成熟蛋白进行基本特性分析,结果显示,NtPI-1 成
熟蛋白的分子式为 C527H843N131O140S5,分子量约为
生物技术通报 Biotechnology Bulletin 2012年第4期82
11.41 kD,理论等电点 pI8.98。该蛋白含 Val(V)最
多(表 1),占 12.9% ;不含 His(H)。总的带正电
残基(Arg +Lys)为 14,负电残基(Asp+Glu)为 11。
总的亲水性平均系数(Grand average of hydropathicity,
GRAVY)为 0.060,预测该蛋白属于疏水性蛋白。
该蛋白预测不稳定指数是 28.60,属于稳定蛋白。
NtPI-2 成熟蛋白的分子式为 C368H593N107O108S2,
分子量约为 8.31 kD,理论等电点 pI8.03。该蛋白含
Val(V)最多,占 15.1% ;不含 His(H)、Met(M)
和 Tyr(Y)。总的带正电残基为 10,负电残基为 9。
总的亲水性平均系数为 -0.355,预测该蛋白属于亲
水性蛋白。该蛋白预测不稳定指数是 25.42,属于稳
定蛋白。
NtPI-3 成熟蛋白的分子式为 C463H755N121O142S4,
分子量约为 10.42 kD,理论等电点 pI5.20。该蛋白
含 Glu(E)最多,占 11.0% ;不含 Cys(C)和 His
(H)。总的带正电残基为 14,负电残基为 16。总的
亲水性平均系数为 -0.569,预测该蛋白属于亲水性
5和 3端非翻译区以小写字母表示,编码区以大写字母表示,方框部分为预测的信号肽,
* 表示终止密码子,阴影部分为马铃薯抑制子Ⅰ家族结构域
图 2 烟草蛋白酶抑制剂 1(A)、2(B)、3(C)和 4(D)
cDNA序列及推导的氨基酸序列
2012年第4期 83林世锋等 :烟草蛋白酶抑制剂基因的电子克隆及生物信息学分析
蛋白。该蛋白预测不稳定指数是 48.63,属于不稳定
蛋白。
NtPI-4 成熟蛋白的分子式为 C339H557N95O106S2,
分子量约为 7.72 kD,理论等电点 pI5.56。该蛋白含
Val(V)最多,占 16.9%;不含 Met(M)和 Tyr(Y)。
总的带正电残基为 5,负电残基为 6。总的亲水性平
均系数为 0.065,预测该蛋白属于疏水性蛋白。该蛋
白预测不稳定指数是 39.53,属于稳定蛋白。
表 1 烟草蛋白酶抑制剂成熟蛋白的氨基酸组成
氨基酸组成
数目
氨基酸组成
数目
NtPI-1 NtPI-2 NtPI-3 NtPI-4 NtPI-1 NtPI-2 NtPI-3 NtPI-4
Ala 5 2 5 3 Leu 7 7 9 6
Arg 3 7 4 2 Lys 11 3 10 3
Asn 4 3 2 7 Met 3 0 4 0
Asp 4 4 5 3 Phe 6 3 1 1
Cys 2 2 0 2 Pro 9 5 10 5
Gln 4 5 2 5 Ser 3 1 9 7
Glu 7 5 11 3 Thr 4 7 2 3
Gly 5 5 4 2 Trp 2 2 2 1
His 0 0 0 1 Tyr 1 0 1 0
Ile 8 1 6 5 Val 13 11 5 12
蛋白酶抑制剂 α-螺旋(%) 延伸直链(%) β-转角(%) 无规则卷曲(%)
NtPI-1 21.78 29.70 13.86 34.65
NtPI-2 20.55 24.66 10.96 43.84
NtPI-3 30.11 25.81 6.45 37.63
NtPI-4 22.54 26.76 12.68 38.03
表 2 烟草蛋白酶抑制剂成熟蛋白的二级结构组成
2.4 烟草蛋白酶抑制剂的二级结构分析
用 SOPMA 软件分析 4 种蛋白的二级结构,结
果(表 2)表明,4 种蛋白酶抑制剂成熟蛋白主要
形成 4 种二级结构形式 :α-螺旋、延伸直链、β-
转角和无规则卷曲。其中,以无规卷曲的区间
居多。
2.5 氨基酸序列比对和同源性分析
基于氨基酸序列的同源性分析(图 3)表明,
来自烟草品种 K326 的 4 种蛋白酶抑制剂的一致性
较低,仅为 31%-38%,但在马铃薯蛋白酶抑制剂Ⅰ
家族结构域处相对保守,同属丝氨酸蛋白酶抑制剂
家族成员。
将获得的序列进行 NCBI 比对,发现 NtPI-1 与
马铃薯二倍体栽培种(Solanum phureja)的蛋白酶抑
制剂 I(登录号 :ABG49145)[4]和四倍体普通栽培
种(Solanum tuberosum)的蛋白酶抑制剂 I 前体(登
录号 :AAZ94182)具有较高的一致性(图 4),分别
为 65% 和 64%。该类蛋白存在共同的分子特征,具
有 1 个典型的蛋白酶抑制剂 N 端信号肽序列和构成
1 个二硫键所需的 1 对半胱氨酸残基。
NtPI-2 与 烟 草 杂 交 种(N. glauca × N. langs-
dorffii)的蛋白酶抑制剂 I 前体(登录号 :BAA0-
2823) [3]、毛叶烟(N. sylvestris)的胰蛋白酶抑制剂 I
(登录号:AAA34067)[4]和三生烟(N. tabacum Sam-
sun NN)的蛋白酶抑制剂 I(登录号:CAA78269)[5, 6]
具有较高的一致性,分别为 77%、76% 和 69%。此外,
NtPI-2 与番茄(Solanum lycopersicum)的蛋白酶抑制
剂 I(登录号 :AAA60745)[13]的一致性为 52%。该
生物技术通报 Biotechnology Bulletin 2012年第4期84
类蛋白同样共同具有 1 个典型的 N 端信号肽序列和
构成 1 个二硫键所需的 2 个半胱氨酸残基。
NtPI-3 与多种植物的枯草杆菌蛋白酶抑制剂或
糜蛋白酶抑制剂具有较高的一致性,其中包括蓖麻
(Ricinus communis)的枯草杆菌蛋白酶抑制剂(登
录号 :XP_002532999)、葡萄(Vitis vinifera)的枯
草杆菌蛋白酶抑制剂(登录号 :XP_002269887)和
大麦(Hordeum vulgare)的糜蛋白酶抑制剂(登录
图 3 四种烟草蛋白酶抑制剂氨基酸序列比较
各种植物蛋白酶抑制子序列均来自 GenBank 数据库,采用 Mega 3.1 软件(Neighbor-Joining 法)构建,
图中各分支数值代表置信度(%)
图 4 部分植物蛋白酶抑制剂进化树分析
号 :ABW71721)[14],其一致性分别为 47%、52%
和 51%。该类蛋白的分子特征是不具备大多数蛋白
酶抑制剂普遍存在的信号肽序列和构成二硫键所需
的半胱氨酸残基。
NtPI-4 与拟南芥(Arabidopsis thaliana)的蛋白
酶抑制剂(登录号 :NP_199171)、麻疯树(Jatropha
curcas)的蛋白酶抑制剂(登录号 :ADB85100)和
橡胶树(Hevea brasiliensis)的蛋白酶抑制剂(登录号:
2012年第4期 85林世锋等 :烟草蛋白酶抑制剂基因的电子克隆及生物信息学分析
ABZ88804)具有较高的一致性,均为 44%。该类蛋
白同样不具备大多数蛋白酶抑制剂普遍存在的信号
肽序列,但具有构成 1 个二硫键所需的 2 个半胱氨
酸残基。
3 讨论
电子克隆与传统的基因克隆方法相比较,因其
具有投入低、速度快、技术要求低和针对性强等优
点而日益受到关注。在人类基因组图谱公布之后,
迄今为止已有很多学者利用电子克隆的方法获得了
人的功能基因[15]。由于受到序列资料丰富度的限制,
在植物领域基因克隆仍以常规的试验方法为主。但
随着 EST 数据库的不断完善,利用生物信息学的方
法进行某些植物基因的电子克隆已经成为可能[16]。
蛋白酶抑制剂是植物中存在最为广泛,研究得
最多的一种防御蛋白。其参与植物的抗病防御主要
是通过抑制外来病原的蛋白酶或消化酶活性,导致
外来病原在寄主体内缺乏必需氨基酸的供应而达到
抗病防御的目的[17]。植物蛋白酶抑制剂也可通过干
扰外来病原的生理生化过程,如干扰病毒的复制、
消化酶的活性等来起作用[18]。自第一个蛋白酶抑制
剂从大豆中分离出来后,现已有数百个蛋白酶抑制
剂从多种不同的植物中被相继分离和鉴定[19],其中
包括从马铃薯高抗青枯病二倍体基因型材料中获得
的马铃薯蛋白酶抑制剂 StPI 基因(GenBank 登录号:
DQ822994),该基因可能参与了马铃薯的抗青枯病
反应[12]。
烟草具有丰富的 EST 数据库,为电子克隆带来
了极大的方便。本研究根据烟草与马铃薯同属茄科
植物,物种间同源基因序列相对保守,以马铃薯高
抗青枯病二倍体栽培品种 StPI 基因 cDNA 序列为探
针,通过电子克隆方法获得了烟草 4 种蛋白酶抑制
剂基因。在电子克隆检索过程中,目标物种锁定烟草,
全部 EST 序列来源于同一品种 K326,避免了品种
间基因多态性造成序列拼接工作的复杂性,进而增
加了电子克隆的准确性。同时,由于烟草品种 K326
本身对烟草青枯病及其他一些病害具有抗性,便于
深入研究探讨获得的 PI 基因在烟草抗病防御反应中
的潜在作用。本研究的结果充分证明,利用不同物
种间基因的高度保守性,采用现代生物信息学的技
术方法,可以快速筛选到一些具有重要功能的主效
及候选基因,为开展相应的基因功能研究奠定基础。
4 结论
本研究通过电子克隆的方法从烟草抗青枯病基
因型 K326 中克隆到 4 种蛋白酶抑制剂 cDNA 序列
(NtPI-1、NtPI-2、NtPI-3 和 NtPI-4)。这些 cDNA 序
列均包含完整的开放读码框,分别编码 128、95、
94 和 72 个氨基酸残基,具备典型的马铃薯蛋白酶
抑制剂Ⅰ家族功能结构域,属于马铃薯蛋白酶抑制
剂Ⅰ家族成员 ;系统树分析表明,烟草品种 K326
中的 4 种蛋白酶抑制剂在进化上存在明显差异,它
们分散在进化树的不同位置,形成不同亚群。这些
结果为进一步研究蛋白酶抑制剂基因的进化关系和
功能差异,比较其在烟草抗病防御反应中的作用奠
定基础。
参 考 文 献
[1] Gill RW, Sanseau P. Rapid in silico cloning of genes using expressed
sequence tags (ESTs). Biotechnology Annual Review, 2000, 5:
25-44.
[2] Fan SG, Wu GJ. Characteristics of plant proteinase inhibitors and
their applications incombating phytophagous insects. Botanical
Bulletin of Academia Sinica, 2005, 46(4): 273-292.
[3] Fujita T, Kouchi H, Ichikawa T, et al. Isolation and characterization
of a cDNA that encodes a novel proteinase inhibitor I from a tobacco
genetic tumor. Plant Cell Physiology, 1993, 34(1): 137-142.
[4] Criqui MC, Plesse B, Durr A, et al. Characterization of genes
expressed in mesophyll protoplasts of Nicotiana sylvestris before
the re-initiation of the DNA replicational activity. Mechanisms of
Development, 1992, 38 (2): 121-132.
[5] Linthorst HJ, Brederode FT, van der Does C, et al. Tobacco
proteinase inhibitor I genes are locally, but not systemically induced
by stress. Plant Molecular Biology, 1993, 21 (6): 985-992.
[6] Heitz T, Geoffroy P, Stintzi A, et al. cDNA cloning and gene
expression analysis of the microbial proteinase inhibitor of tobacco.
The Journal of Biological Chemistry, 1993, 268 (23): 16987-16992.
[7] Atkinson AH, Heath RL, Simpson R, et al. Proteinase inhibitors in
Nicotiana alata stigma are derived from a precursor protein which is
processed into five homologous inhibitors. Plant Cell , 1993, 5(2):
生物技术通报 Biotechnology Bulletin 2012年第4期86
203-213.
[8] Ausloos GRJ, Proost P, Van Damme J, et al. Proteinase inhibitor
II is developmentally regulated in Nicotiana flowers. Physiologia
Plantarum, 1995, 94(4): 701-707.
[9] Zavala JA, Patankar AG, Gase K, et al. Manipulation of endogenous
trypsin proteinase inhibitor production in Nicotiana attenuata demon-
strates their function as antiherbivore defenses. Plant Physiology,
2004, 134 (3): 1181-1190.
[10] Park KS, Cheong JJ, Lee SJ, et al. A novel proteinase inhibitor gene
transiently induced by tobacco mosaic virus infection. Biochimica
et Biophysica Acta, 2000, 1492(2-3): 509-512.
[11] Huang H, Qi SD, Qi F, et al. NtKTI1, a Kunitz trypsin inhibitor with
antifungal activity from Nicotiana tabacum, plays an important role
in tobacco’s defense response. The FEBS journal, 2010, 277(19):
4076-4088.
[12] Li GC, Jin LP, Xie KY, et al. Cloning of proteinase inhibitor gene
StPI in diploid potato and its expression analysis. Agricultural
Sciences in China, 2007, 6(11): 1315-1321.
[13] Margossian LJ, Federman AD, Giovannoni JJ, et al. Ethylene-
regulated expression of a tomato fruit ripening gene encoding a
proteinase inhibitor I with a glutamic residue at the reactive site.
Proceedings of the National Academy of Sciences of the United
States of America, 1988, 85 (21): 8012-8016.
[14] Zeng XH, Wei YM, Jiang QT, et al. SNP Analysis and haplotype
identification in chymotrypsin inhibitor-2 (CI-2) gene of barley.
Agricultural Sciences in China, 2009, 8 (1): 8-14.
[15] OBrien KP, Tapia-Paez I, Stahle-Backdahl M, et al. Charac-
terization of five novel human genes in the 11q13-q22 region. Bioc-
hemical and Biophysical Research Communications, 2000, 273
(1): 90-94.
[16] 唐向荣 , 吴昊 , 贾明 , 等 . 水稻双链 RNA 结合蛋白同源基因
OsRBP 的克隆及其表达的分析 . 植物生理与分子生物学学报 ,
2002, 28(1): 41-45.
[17] De Leo F, Gallerani R. The mustard trypsin inhibitor 2 affects the
fertility of Spodoptera littoralis larvae fed on transgenic plants.
Insect Biochemistry and Molecular Biology, 2002, 32(5):
489-496.
[18] Gutierrez-Campos R, Torres-Acosta JA, Saucedo-Arias LJ, et al. The
use of cysteine proteinase inhibitors to engineer resistance against
potyviruses in transgenic tobacco plants. Nature Biotechnology,
1999, 17(2): 1223-1226.
[19] De Leo F, Volpicella M, Licciulli F, et al. PLANT-PIs: a database
for plant protease inhibitors and their genes. Nucleic Acids
Research, 2002, 30(1): 347-348.
(责任编辑 马鑫)