免费文献传递   相关文献

用生物信息学软件分析风信子HPI1基因及其产物蛋白



全 文 :用生物信息学软件分析风信子HPI1基因及其产物蛋白
曹阳 ,郑媛媛 ,方柏山
(华侨大学生物工程与技术系 ,福建 泉州, 362011)
摘要:利用生物信息学方法对风信子 HPI1基因及其产物蛋白进行序列 、结构分析和功能预测。所研究的
HPI1基因与许多植物的花器官决定基因具有较高的相似性 ,推测它们可能为同源基因 ,具有相似的生物学
功能 ,即可预测 HPI1基因与花器官的形成有关 。
关键词:HPI1基因;转录因子;MADS盒;生物信息学
中图分类号:Q949.71+8.23  文献标识码:B  文章编号:1672-5565(2004)-04-0025-05
收稿日期:2004-03-11;修回日期:2004-09-01
作者简介:曹阳(1979-),男 ,长沙人 ,硕士研究生 ,研究方向:酶定向进化。
*联系作者:方柏山 , Tel:0595-2691560 , Fax:0595-2691560 , E-mail:fangbs@hqu.edu.cn。
Using bioinfomatics to analyze the HPI 1
(Hyacinthus PI 1)gene and its product protein
CAO Yang ,ZHENG Yuan-yuan ,FANG Bai-shan
(Department of Bioengineering , Hua Qiao University , Quanzhou ,Fujian ,362011)
Abstract:Using bioinformatics methods to analyze the sequences of HPI1 gene and its product protein inHyacinthus ori-
entalis , and predict the function of this gene.The HPI1 gene was similar to the determinate genes of floral organs of many
plants , so we could presume that they had been homologous genes and had the same biological function.Finally ,we pre-
dicted that the HPI1 gene was related to the development of floral organ.
Key words:HPI1 gene;transcription factor;MADS BOX;bioinformatics
  风信子是一种百合科风信子属多年生球根花卉
植物 ,原产于南欧 、中东一带 ,属于温带型植物 。由
于其具有较高的观赏价值 ,在荷兰的大力倡导下而
闻名于世界 。用生物信息学方法对风信子中名为
HPI1的基因及其产物蛋白进行序列及结构分析和
功能预测 。
1 实验材料与方法
1.1 材料
装有WINDOWS 操作系统的 PC 机(联有 Inter-
net)。
HPI1基因的mRNA序列从GenBank中获得 。
1.2 方法
1.2.1 HPI1基因序列的分析及氨基酸序列的生成
GENSCAN是用来预测核酸序列中可能的外显子及
其聚 A信号的程序。该程序还能生成所提交核酸
序列的氨基酸序列 ,网址是 http://genes.mit.edu/
GENSCAN.html。
1.2.2  HPI1 基因或氨基酸序列的同源性比较
BLAST(Basic Local Alignment Search Tool)是一个在拥
有大量序列信息的数据库中查找一个核酸或者氨基
酸序列同源性的程序 ,网址是 http://www.ncbi.nlm.
nih.gov/BLAST。
1.2.3 HPI1基因产物蛋白的疏水区预测生物学软
件ANTHEPROT V5.0是一个蛋白质分析软件包 ,
生 物 信 息 学 China Journal of Bioinformatics                    研究论文
可以提供蛋白的一些物化参数 、进行二级结构预测 、
找出亲疏水区域等。
下载地址:http://biosoft.biosino.org/protein.
html。
1.2.4 蛋白质 coiled-coil结构预测:登陆服务器 ,
将序列粘贴在序列框中 ,点击“run pepcoil”按钮 ,即
可得到预测结果 。
服务器网址如下:
http://bioinfo.pbi.nrc.ca:8090/cgi -bin/em-
boss.pl ? action=input& app=pepcoil。
1.2.5 蛋白质的亚细胞定位:登陆服务器 ,首先在
“输入序列来源”栏选择所要分析的序列的类型 ,如
革兰氏阳性菌 、革兰氏阴性菌 、酵母 、动物及植物 ,然
后将序列粘贴在序列框中 ,点击“submit”按钮 ,即可
得到预测结果 。
服务器网址是 http://psort.nibb.ac.jp/form.
html。
2 实验结果与分析
2.1 HPI1基因 mRNA序列的获得
从GenBank数据库中获得 HPI1基因 mRNA 序
列 ,如下:
2.2 HPI1基因核苷酸序列的分析
用GENSCAN[ 1 ,2]对所获得的 mRNA序列进行分
析 ,结果如下:
(1)43-651bp为 Single-exon gene 区域;
(2)864-869bp(aaaaaa)为 Poly(A)signal ,得分
为:-0.45。
由结果可知:该 mRNA中 43-651bp 为单一外
显子基因区域 ,即我们通常所说的开放阅读框ORF ,
但是聚A信号并不明显 ,其置信度不高。
2.3 HPI1基因的序列比较和同源性分析
将该序列用 BLAST[ 3]与核苷酸数据库进行同源
比较 ,其结果如下(所列只是部分):
  由上述比较结果可以知道:这些与 HPI1基因具
有较高的同源性的基因大多都属于 MADS 基因家
族。可以推测 HPI1基因也属于 MADS 基因家族 。
该家族的蛋白产物都是转录因子[ 4] ,具有调控其它
基因转录的能力 ,故进一步推测HPI1的蛋白质产物
也是转录因子 。
2.4 HPI1基因产物蛋白的序列分析
2.4.1 氨基酸序列的生成:由 GENSCAN可以得到
其编码的氨基酸序列 ,如下:
26                生  物  信 息  学              第 2卷
2.4.2  搜索序列的保守区域:将氨基酸序列用
BLAST在 SWISS-PROT 数据库进行相似性比较时 ,
得到图 1。
图 1 HPI1基因产物蛋白的保守区域
  该氨基酸序列的前 60aa 为 MADS 区域 ,其中还
包含一个由59aa组成的SRF-TF 区域 ,其后还接有
一个由102aa 组成的K-BOX区域。
SRF-TF 是一种 SRF 类型的转录因子(SRF-
type transcription factor),它是 DNA 结合和形成二聚
体结构的区域。
K-BOX区域一般被认为与SRF-TF 相关联 ,K
-BOX可能为 coiled-coil结构 ,常常形成多聚体。
由上图可知:HPI1基因属于 MADS 基因家族 ,
其蛋白产物是能结合 DNA 的转录因子。从而进一
步验证了 2.3的预测结果。
2.4.3 疏水区预测分析:由 2.4.2 可知 ,该氨基酸
序列中有一段能结合 DNA ,并能形成二聚体结构的
区域 。蛋白质之间形成二聚体 ,一般是依靠其疏水
介面间的相互作用力结合的 ,也就是说在能形成二
聚体的区域中 ,一般都存在疏水区 。用蛋白质分析
软件包 ANTHEPROT V5.0对其进行疏水区预测分
析 ,得到图2 。
图 2 HPI1产物蛋白亲水性/疏水性的分析结果
  N ? 35 AA:KKAKEISVLCE Hydrophobicity 6 Window:7
  由图 2可以知道 ,该序列的第 35个残基到第 51
个残基为一明显的疏水区 。它正好是在上述的那个
能结合 DNA和形成二聚体结构的区域内 。可知该
软件的预测结果和前面得到的结果相吻合。
2.4.4 蛋白质 coiled-coil 结构的分析:用 PEP-
COIL
[ 5]对该序列的 coiled-coil结构进行预测分析 ,
得到如下结果(如图 3)。
可以知道:在整个这条 202aa的多肽链中 ,77-
112aa这段区域形成 coiled -coil 结构的可能性为
100%。从而可预测 coiled-coil结构存在于从第 77
到112这 35个残基之间 。而 77-112aa这段区域正 图 3 HPI1产物蛋白 coiled-coil结构的预测结果
27第 4期        曹阳 ,等:用生物信息学软件分析风信子HPI1基因及其产物蛋白       
好包含于 K-BOX中 ,可知该软件的预测结果和前
面得到的结果相吻合 。
2.4.5 蛋白质的亚细胞定位分析:用 PSORT 对该
氨基酸序列进行定位分析 ,其结果如图 4。
图 4 HPI1 产物蛋白亚细胞定位的预测结果
  由上面的结果可知 ,该蛋白最终定位于细胞核
的可能性为76%,而定位于线粒体的矩阵空间和叶
绿体的类囊体(植物叶绿体中的蛋白质和脂肪膜皮 ,
光合化学作用在此进行)膜的可能性均为 10%,定
位于内质网膜的可能性为零。从而推断该蛋白最终
定位于细胞核内 ,即这种蛋白为核靶向蛋白 。而前
面已经知道 HPI1基因的产物是转录因子 ,它能与
DNA结合而调控 DNA的转录 。转录是在细胞核中
完成的 ,因此该蛋白肯定只能最终定位于细胞核 ,
PSORT的预测结果与前面得到的结论一致。
2.4.6 HPI1基因氨基酸序列比较和同源性分析:
将该氨基酸序列用 BLAST 在 SWISS-PROT 数据库
进行同源比较 ,其结果如下(所列只是部分):
  由上述结果可知:这些与 HPI1基因产物蛋白具
有较高的同源性的蛋白大多是花的同源异型蛋白 。
用鼠标左键点击gi 729976 sp Q07474 MAD2
PETHY即可得到如下信息(所列只是部分):
  一般认为蛋白质的结构和功能比序列具有更大
的保守性 ,因此粗略地说 ,如果序列之间的相似性超
过 30%,它们就很可能是同源的。因此 ,由上面的
结果可以进一步推测 ,HPI1基因的产物蛋白的生物
学功能与花器官的形成有关。
3 结论
综上所述 ,所研究的风信子HPI1基因满足:
(1)HPI1 基因属于 MADS 基因家族 ,其蛋白产
物是能结合 DNA的转录因子;
(2)HPI1 基因所编码的产物蛋白是核靶向蛋
白 ,与许多植物花的同源异型蛋白(均是核靶向蛋
白)具有较高的相似性 ,是同源基因。
从而最终得出推论:风信子HPI1基因的生物学
功能可能与花器官的形成有关 ,即 HPI1基因可能是
28                生  物  信 息  学              第 2卷
风信子花器官形成的一个决定基因 。
参考文献(References):
[ 1]  Burge CB , Karlin S.Prediction of complete gene structures in human
genomic DNA[ J] .J Mol Biol , 1997, 268:78-94.
[ 2]  Burge CB, Karlin S.Finding the genes in genomic DNA[ J] .Curr
Opin Struct Biol , 1998 , 8:346-354.
[ 3]  Altschul SF ,Madden TL , Schaffer AA , et al.Gapped BLAST and PSI
-BLAST:a new generat ion of protein database search programs[ J] .
Nucleic Acids Res ,1997 , 25:3389-3402.
[ 4]  Pramila T , Miles S , Thakurta DG , et al.Conserved homeodomain pro-
teins interact with MADS box protein Mcm1 to restrict ECB-depen-
dent transcription to the M/G1 phase of the cell cycle[ J] .Genes &
Development , 2002 , 16:3034-3045.
[ 5]  Lupas A , Van Dyke M , Stock.Predicting Coiled Coils from Protein Se-
quences[ J] .Science , 1991 , 252:1162-1164.
(上接第 4页)
遗传互作关系的两个蛋白质间的相互作用可能是间
接的 。这种互作类型的优点在于直接从功能相关的
定义出发 ,因此不同于物理互作那样仅仅反映蛋白
质间的可结合性 。复合物的亚基间发生直接的互
作 ,本实验出于使结果更具有可比性的考虑 ,选用蛋
白质物理互作类型进行分析。关于发生遗传互作的
蛋白质的基因表达相关是值得进一步研究的问题 。
Pearson相关系数度量的是基因间的线性相关
程度 ,Spearman秩相关系数度量的是基因间的表达
趋势的一致性程度 ,不同的相关测度反映不同的生
物学意义 。为了从多个角度考察基因间的表达相关
性 ,我们采用 Spearman 秩相关系数进行了重复实
验 ,得到了相同的分析结果。由于篇幅所限 ,实验结
果未列出 。
参考文献(References):
[ 1]  Zhu , T.Global analysis of gene expression using GeneChip microarrays
[ J] .Curr Opin Plant Biol ,2003 , 6(5):418-425.
[ 2]  Uetz P , Giot L , Cagney G , et al.A comprehensive analysis of protein-
protein interactions in Saccharomyces cerevisiae[ J] .Nature , 2000, 403
(6770):623-627.
[ 3]  Ito T , Chiba T ,Ozawa R , et al.A comprehensive two-hybrid analysis
to explore the yeast protein interactome[ J] .Proc Natl Acad Sci USA ,
2001 ,98(8):4569-4574.
[ 4]  Ronald Jansen , Dov Greenbaum , Mark Gerstein.Relating whole -
genome expression data with protein-protein interactions[ J] .Genome
Res, 2002 , 12(1):37-46.
[ 5]  Gavin Sherlock , Tina Hernandez-Boussard , Andrew Kasarskis , et al.
The Stanford Microarray Database[ J] .Nucleic Acids Research , 2001,
(29):152-155.
[ 6]  Bader GD , Betel D ,Hogue CWV.BIND-The Biomolecular Interaction
Network Database[ J] .Nucleic Acids Research , 2003 , 31(1):248-
250.
[ 7]  Olga Troyanskaya , Michael Cantor , Gavin Sherlock , Pat Brown , Trevor
Hastie , Robert Tibshi rani , David Botstein and Russ B.Altman1.Missing
value estimation methods for DNA microarrays[ J] .Bioinformatics ,
2001 ,(17):520-525.
[ 8]  王磊 ,郭政 ,李霞 ,等.互作蛋白质对应基因在 mRNA水平的表
达相关性分析[ J] .哈尔滨医科大学学报 , 2003 , 37(6):50-53.
(上接第 9页)
  在认识的基础上 ,将缺铁胁迫下被诱导的和被
抑制的基因进行了初步分类。其中被诱导的通讯信
号和细胞周期调控上调基因数(分别是 17和 20)多
于被抑制的(都是 6)基因 ,见表1和表 2。已知生物
对外界的胁迫反应 ,受控于信号的转导 ,而缺铁诱导
的信号很可能调控着质膜上铁吸收系统改变和根构
型的适应变化。根构型的变化又受控于细胞周期的
调控 。所以信号转导和细胞周期调控的研究受到世
界分子细胞生物学家的极大重视。
希望在理解铁吸收机理 I和机理 II 的基础上 ,
对水稻缺铁诱导后 ,在信号流 、膜泡流[ 6] 、物质能量
流以及为适应环境变化而发生的控制根形态变化的
基因 、蛋白有一个全新的认识和深入的了解。
参考文献(References):
[ 1]  孙彤 ,闫莉婕 ,黄勤妮 ,等.缺铁水稻根转录本微点阵分析[ J] .
生物信息学 , 2004, 2(3):1-5.
[ 2]  Yu J , Hu S-N ,Wang J , et al.A Draf t Sequence of the rice Genome
(Oryza sativa L.ssp.indica)[ J] .Science ,2002 , 296:79-92.
[ 3]  Goff SA , Ricke D , Lan T-H , et al.A Draft Sequence of the rice
genome(Oryza sativa L.ssp.japonica)[ J] .Science , 2002 , 296:92-
100.
[ 4]  Thimm O , Essigmann B , Kloska S , et al.Response of Arabidopsi s to
iron deficiency stress as revealed by microarray analysis [ J] .Plant
Physiol , 2001 ,127(3):1030-1043.
[ 5]  Negishi T , Nakanishi H , YazakinJ , et al.cDNA microarray analysis of
gene expression during Fe-deficiency stress in barley suggests that po-
lar transport of vesicles is implicated in phytosiderophore secretion in
Fe-deficient barley roots[ J] .Plant J , 2002, 30(1):83-94.
[ 6]  印莉萍 ,孙彤 ,李伟 ,等.缺铁诱导的水稻根转录本组和蛋白质
组分析与膜泡运输[ J] .自然科学进展 , 2004, 14(4):79-84.
29第 4期        曹阳 ,等:用生物信息学软件分析风信子HPI1基因及其产物蛋白