全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2016, 32(3):155-165
细菌生长在不同的自然环境里,在某个特定的
温度下,它的生长速度最快,这个温度被称为其最
适生长温度。根据最适生长温度的不同,细菌可以
被分为嗜热菌、中温菌及嗜冷菌,其中嗜热菌的最
适生长温度一般在 40℃以上,嗜冷菌的最适生长温
度在 20℃以下,而大多数中温菌最适生长温度在
30℃左右。细菌适应不同最适生长温度的机制一直
是人们针对细菌研究的热点。2003 年,Makarova 等[1]
通过系统发生学分析方法寻找到一些可能对嗜热起
关键作用的基因,并找到了一些与嗜热表型特征相
关的同源基因簇。2007 年,Li 等[2]发现了部分原
核生物基因序列与其最适生长温度的关系。2011 年,
Kim 等[3]发现了某一藻类中的耐热基因,该基因
的表达使其在高温下有更好的生存能力。2012 年,
Jensen 等[4]基于全基因组序列,利用贝叶斯的统计
方法对细菌的最适生长温度范围进行了预测,得到
收稿日期 :2015-05-19
基金项目 :国家自然科学基金项目(31371748)
作者简介 :丛华剑,男,硕士,研究方向 :生物信息学 ;E-mail :conghuajian1991@163.com
通讯作者 :武栓虎,教授,硕士生导师, 研究方向 : 数字图像处理,数字信号处理,基因信息学,模式识别, 视频图像压缩,小波分析与应
用,E-mail :wushuanhu@163.com ;田健,博士,副研究员,硕士生导师,研究方向 :蛋白质分子设计与改良、微生物重要基因
资源挖掘等,E-mail :tianjian@caas.cn
基于细菌同源蛋白预测细菌最适生长温度的研究
丛华剑1,2 武栓虎1 田健2 初晓宇2 伍宁丰2
(1. 烟台大学,烟台 264005 ;2. 中国农业科学院生物技术研究所,北京 100081)
摘 要 : 不同细菌有不同的最适生长温度,而基因序列与其最适生长温度密切相关。为探究其相关性,选取 92 个具有不同
最适生长温度的细菌的全基因组序列为研究材料,通过寻找 92 个细菌共有的同源蛋白,并计算共有同源蛋白中氨基酸的频率,发
现共有同源蛋白的氨基酸频率特征与其最适生长温度存在着显著的相关关系,其中蛋白质序列中的螺旋结构与其最适生长温度关
系最大。该研究为揭示细菌对温度的适应机制,以及对蛋白质稳定性相关的分子设计具有重要的意义。
关键词 : 细菌 ;最适生长温度 ;同源蛋白 ;氨基酸频率
DOI :10.13560/j.cnki.biotech.bull.1985.2016.03.025
Prediction of Optimal Growth Temperature of Bacterium Based on the
Homologous Proteins
CONG Hua-jian1,2 WU Shuan-hu1 TIAN Jian2 CHU Xiao-yu2 WU Ning-feng2
(1. Yantai University,Yantai 264005 ;2. Biotechnology Research Institute,Chinese Academy of Agricultural Sciences,Beijing 100081)
Abstract: The optimal temperature for each bacterium differs,which is related to its gene sequence. In order to explore the correlation
between them,the known genome sequences of 92 bacteria with own different optimal temperatures were selected as the study material,then
the common homologous protein from 92 bacteria were searched,and frequencies of the amino acids in homologous protein were calculated.
A significant correlation between the frequency of the amino acid in homologous protein and the optimal growth temperature was realized. The
analysis of the sites in homologous genes showed that the helix regions in the protein sequence were the most correlated with its optimal growth
temperature. This study presents important significance on understanding the mechanism of the bacterial adaption to the temperature as well as
designing the mutation to improve the protein stability.
Key words: bacterium ;optimal growth temperature ;homologous protein ;amino acid frequency
生物技术通报 Biotechnology Bulletin 2016,Vol.32,No.3156
了准确的结果。2014 年,Hu[5]发现了对细菌在低
温下正常生长起关键作用的酶。通过大量研究表明,
细菌在最适生长温度方面的差异,与其基因序列的
差异密切相关,然而对于影响其最适生长温度的序
列特征,目前仍缺乏有效的研究和分析,需要从基
因组学的层面对其进行系统挖掘。
本研究为了探究基因序列与其最适生长温度的
关系,将运用生物信息学的方法确定不同细菌间共
有的同源蛋白,并对这些共有同源蛋白进行序列分
析,从中分析与其最适生长温度相关的分子特征,
为揭示细菌对温度的适应机制以及利用蛋白质的分
子设计来提高其稳定性等方面奠定基础。
1 材料与方法
1.1 材料
数据集采用 Jensen 等[4]在实验中采用的 92 个
细菌(表 1),其全基因组序列和最适生长温度均来
自 NCBI 数据库(http://www.ncbi.nlm.nih.gov/)。
表 1 92 个细菌的详细信息
序号 菌种 最适生长温度 /℃ NCBI 登录号 基因数目 / 个 基因组大小 /bp GC 含量 /%
1 Psychromonas ingrahamii 37 uid58521 -12 NC_008709 4098 4559598 40.09
2 Psychrobacter arcticus 273 4 uid58021 -3 NC_007204 2257 2650701 42.80
3 Psychrobacter cryohalolentis K5 uid58373 3 NC_007969 2549 3059876 42.29
4 Shewanella baltica OS223 uid58775 4 NC_011663 4413 5145902 46.31
5 Colwellia psychrerythraea 34H uid57855 8 NC_003910 4585 5373180 38.01
6 Desulfotalea psychrophila LSv54 uid58153 10 NC_006138 3329 3523383 46.81
7 Aliivibrio salmonicida LFI1238 uid59251 12 NC_011312 3244 3325165 39.23
8 Photobacterium profundum SS9 uid62923 15 NC_006370 3637 4085304 41.97
9 Pseudoalteromonas haloplanktis TAC125 uid58431 15 NC_007481 2947 3214944 40.23
10 Renibacterium salmoninarum ATCC 33209 uid58899 15 NC_010168 3591 3155250 56.27
11 Heliobacterium modesticaldum Ice1 uid58279 15 NC_010337 2837 3075407 56.98
12 Flavobacterium psychrophilum JIP02 86 uid61627 15 NC_009613 2591 2860382 32.53
13 Polaromonas naphthalenivorans CJ2 uid58273 20 NC_008781 4210 4410291 62.53
14 Polaromonas JS666 uid58207 20 NC_007948 5050 5200264 62.47
15 Vibrio cholerae O1 biovar El Tor N16961 uid57623 20 NC_002505 2645 2961149 47.70
16 Tolumonas auensis DSM 9187 uid59395 22 NC_012691 3250 3471292 49.03
17 Vibrio cholerae M66 2 uid59355 25 NC_012578 2554 2892523 47.83
18 Rhodoferax ferrireducens T118 uid58353 25 NC_007908 4424 4712337 59.88
19 Kribbella flavida DSM 17836 uid43465 28 NC_013729 7170 7579488 70.57
20 Nitrosospira multiformis ATCC 25196 uid58361 28 NC_007614 3059 3184243 53.94
21 Salinispora tropica CNB 440 uid58565 28 NC_009380 4736 5183331 69.46
22 Verminephrobacter eiseniae EF01 2 uid58675 28 NC_008786 5055 5566749 65.28
23 Leptospira interrogans serovar Lai 56601 uid57881 28 NC_004342 3940 4338762 35.02
24 Desulfobacterium autotrophicum HRM2 uid59061 28 NC_012108 5240 5589073 48.85
25 Arcobacter nitrofigilis DSM 7299 uid49001 30 NC_014166 3183 3192235 28.36
26 Corynebacterium glutamicum ATCC 13032 uid57905 30 NC_003450 3067 3309401 53.81
27 Delftia acidovorans SPH 1 uid58703 30 NC_010002 6158 6767514 66.48
28 Geobacter bemidjiensis Bem uid58749 30 NC_011146 4142 4615150 60.27
29 Geobacter metallireducens GS 15 uid57731 30 NC_007517 3632 3997420 59.51
30 Marinobacter aquaeolei VT8 uid59419 30 NC_008740 3991 4326849 57.27
31 Pelobacter carbinolicus DSM 2380 uid58241 30 NC_007498 3345 3665893 55.11
32 Pelobacter propionicus DSM 2379 uid58255 30 NC_008609 3630 4008000 59.02
33 Teredinibacter turnerae T7901 uid59267 30 NC_012997 4330 5193164 50.89
34 Kangiella koreensis DSM 16069 uid59209 30 NC_013166 2661 2852073 43.69
35 Haliangium ochraceum DSM 14365 uid41425 30 NC_013440 6971 9446314 69.48
36 Neisseria gonorrhoeae FA 1090 uid57611 35 NC_002946 2400 2153922 52.69
37 Anaeromyxobacter dehalogenans 2CP 1 uid58989 35 NC_011891 4579 5029329 74.72
38 Fibrobacter succinogenes S85 uid161919 37 NC_017448 3214 3843004 48.05
39 Francisella philomiragia ATCC 25017 uid59105 37 NC_010336 1999 2045775 32.57
2016,32(3) 157丛华剑等:基于细菌同源蛋白预测细菌最适生长温度的研究
序号 菌种 最适生长温度 /℃ NCBI 登录号 基因数目 / 个 基因组大小 /bp GC 含量 /%
40 Paenibacillus Y412MC10 uid41127 37 NC_013406 6470 7121665 51.24
41 Ralstonia pickettii 12D uid58859 37 NC_012856 3493 3647724 63.56
42 Spirochaeta caldaria DSM 7334 uid68753 37 NC_015732 2946 3239340 45.58
43 Syntrophobacter fumaroxidans MPOB uid58177 37 NC_008554 4427 4990251 59.95
44 Bacillus pseudofirmus OF4 uid45847 37 NC_013791 3985 3858997 40.27
45 Salinibacter ruber DSM 13855 uid58513 37 NC_007677 2977 3551823 66.22
46 Methylococcus capsulatus Bath uid57607 45 NC_002977 3117 3304561 63.58
47 Geobacillus C56 T3 uid49467 45 NC_014206 3811 3650813 52.49
48 Isosphaera pallida ATCC 43644 uid62207 45 NC_014962 4392 5472964 62.44
49 Chlorobium tepidum TLS uid57897 48 NC_002932 2112 2154946 56.53
50 Acidimicrobium ferrooxidans DSM 10331 uid59215 48 NC_013124 2158 2158157 68.29
51 Exiguobacterium AT1b uid59093 50 NC_012673 3074 2999895 48.46
52 Kyrpidia tusciae DSM 2912 uid48361 50 NC_014098 3426 3384766 59.11
53 Mahella australiensis 50 1 BON uid66917 50 NC_015520 3039 3135972 43.45
54 Meiothermus ruber DSM 1279 uid46661 50 NC_013946 3105 3097457 63.38
55 Chloroflexus aurantiacus J 10 fl uid57657 52 NC_010175 4261 5258541 56.70
56 Calditerrivibrio nitroreducens DSM 19672 uid60821 55 NC_014758 2122 2157835 35.75
57 Chloroflexus aggregans DSM 9485 uid58621 55 NC_011831 3922 4684931 56.43
58 Clostridium thermocellum DSM 1313 uid161989 55 NC_017304 3267 3561619 39.15
59 Geobacillus WCH70 uid59045 55 NC_012793 3661 3464618 42.84
60 Geobacillus Y412MC52 uid55381 55 NC_014915 3768 3628883 52.43
61 Geobacillus Y412MC61 uid41171 55 NC_013411 3772 3622844 52.42
62 Geobacillus Y4 1MC1 uid55779 55 NC_014650 4142 3840330 44.02
63 Hippea maritima DSM 10411 uid65267 55 NC_015318 1787 1694430 37.47
64 Acidothermus cellulolyticus 11B uid58501 55 NC_008578 2236 2443540 66.91
65 Moorella thermoacetica ATCC 39073 uid58051 58 NC_007644 2744 2628784 55.79
66 Hydrogenobaculum Y04AAS1 uid58857 58 NC_011126 1662 1559514 34.85
67 Anoxybacillus flavithermus WK1 uid59135 60 NC_011567 3066 2846746 41.78
68 Clostridium thermocellum ATCC 27405 uid57917 60 NC_009012 3595 3843301 38.99
69 Geobacillus kaustophilus HTA426 uid58227 60 NC_006510 3737 3544776 52.09
70 Halothermothrix orenii H 168 uid58585 60 NC_011899 2576 2578146 37.88
71 Methylacidiphilum infernorum V4 uid59161 60 NC_010794 2533 2287145 45.48
72 Alicyclobacillus acidocaldarius DSM 446 uid59199 60 NC_013205 2945 3018755 62.33
73 Coprothermobacter proteolyticus DSM 5265 uid59253 63 NC_011295 1437 1424912 44.77
74 Geobacillus thermodenitrificans NG80 2 uid58829 65 NC_009328 3702 3550319 49.01
75 Spirochaeta thermophila DSM 6192 uid53037 65 NC_014484 2284 2472645 61.88
76 Thermobaculum terrenum ATCC BAA 798 uid42011 65 NC_013525 1916 2026947 48.07
77 Caldicellulosiruptor lactoaceticus 6A uid60575 68 NC_015949 2858 2674809 36.13
78 Marinithermus hydrothermalis DSM 14884 uid65783 68 NC_015387 2264 2269167 68.08
79 Ammonifex degensii KC4 uid41053 70 NC_013385 2270 2129237 59.45
80 Caldicellulosiruptor saccharolyticus DSM 8903 uid58289 70 NC_009437 3106 2970275 35.25
81 Desulfurobacterium thermolithotrophum DSM 11699 uid63405 70 NC_015185 1606 1541968 34.95
82 Fervidobacterium nodosum Rt17 B1 uid58625 70 NC_009718 1884 1948941 34.99
83 Hydrogenobacter thermophilus TK 6 uid159875 70 NC_017161 1949 1742932 44.00
84 Thermoanaerobacter italicus Ab9 uid46241 70 NC_013921 2561 2451061 34.15
85 Thermotoga neapolitana DSM 4359 uid59065 70 NC_011978 1950 1884562 46.94
86 Dictyoglomus turgidum DSM 6724 uid59177 75 NC_011661 1939 1855560 33.96
87 Thermoanaerobacter tengcongensis MB4 uid57813 75 NC_003869 2878 2689445 37.57
88 Caldicellulosiruptor bescii DSM 6725 uid59201 75 NC_012034 3069 2919718 35.17
89 Caldicellulosiruptor owensensis OL uid60165 79 NC_014657 2486 2428903 35.44
90 Caldicellulosiruptor obsidiansis OB47 uid51501 79 NC_014392 2558 2532343 35.24
91 Thermotoga maritima MSB8 uid179902 80 NC_023151 1881 1869644 46.25
92 Aquifex aeolicus VF5 uid57765 95 NC_000918 1749 1551335 43.48
续表
生物技术通报 Biotechnology Bulletin 2016,Vol.32,No.3158
1.2 方法
1.2.1 提取共有同源蛋白 在 NCBI 数据库中,获
取全部 92 个细菌的全部基因组信息,选取基因数
目最多的一个细菌,通过 RSD[6]软件(Reciprocal
Smallest Distance,https://github.com/todddeluca/
reciprocal_smallest_distance/)找到该菌与其他所有细
菌之间共有的同源蛋白,参数 divergence 和 E-value
thresholds 分别取值 0.2 和 1e-20,divergence 是散度
阈值,用来判断基因之间的“距离”,E-value 是期
望值阈值,用来判断结果的显著性。通过整理之后
可以得到所有细菌的共有的同源蛋白,然后对其进
行序列比对[7]确定蛋白质的功能。
1.2.2 计算氨基酸频率 提取共有同源蛋白中每一
种氨基酸的频率,并把其频率值作为特征,采用随
机森林的方法来模拟其与最适生长温度的相关性。
相关系数采用 20- 倍的交叉验证的方法进行,首先
把数据分为 20 份,每一次交叉验证选取其中一份作
为测试集,其余 19 份数据作为训练集,通过训练集
建立随机森林模型,然后用测试集进行验证,通过
20 次交叉验证后,可以得到最终的相关系数,相关
系数计算公式如下 :∑X 2 ∑X2
N
∑Y 2 ∑Y2
N
∑XY ∑ X∑Y
N
ρX, Y
式中,ρ 表示相关系数值,X 与 Y 分别表示同源蛋
白的氨基酸频率与温度值,N 为样本数量。通过计
算可以得到每一个同源蛋白的氨基酸频率与最适生
长温度之间的相关系数。
1.2.3 进化树的构建 利用与最适生长温度相关性
最高的同源蛋白的序列、全部共有同源蛋白序列以
及菌株的 16S rDNA 来构建进化树,采用的工具为
MEGA[8](Molecular Evolutionary Genetics Analysis,
http://www.megasoftware.net/),先对所有的同源蛋白
进行序列比对,然后选择构建 Maximum Likelihood
Tree,因为根据最大似然估计的方法,概率总和最
大的那棵树最有可能是反映真实情况的系统发生树。
Bootstrap replications 值选择 1 000,1 000 次重复可
以充分保证结果的可靠性。其他参数为默认值,以
此可以构建出反应进化关系的进化树。
1.2.4 确定对与最适生长温度关系最大的序列位置
选取与最适生长温度相关性最高的 10 个共有同
源蛋白,采用 ClusterW[9,10](http://www.clustal.org/)
对其序列进行比对后,逐列分析确定与其最适生长
温度相关的关键位置。具体方法是根据比对结果,
一次删除一列,计算相关系数,与原相关系数进行
比较,得到差值,差值的绝对值越大,说明这个位
置与最适生长温度的关系越大。
从与最适生长温度相关性最高的前 10 个同源蛋
白中,提取每个同源蛋白中对最适生长温度影响较
大的前 5% 的位置,每个同源蛋白合并可得到 92 个
“子序列”,将 10 个同源蛋白的“子序列”合并成
92 个“特征序列”,“特征序列”中的每一个位置都
是影响细菌最适生长温度的关键序列。我们将对得
到的“特征序列”进行后续的氨基酸指数和蛋白质
二级结构方面的分析。
1.2.5 计算氨基酸指数 氨基酸指数[11]是代表每
种氨基酸物理或化学性质的一套定量值标,现每种
氨基酸已有 544 个氨基酸指数,分别代表某种氨基
酸的 544 种性质。在获取全部 544 种氨基酸指数后,
分别计算每个“特征序列”在每种氨基酸指数下的
加权平均值,这样可以获取一个 92 行 544 列的矩
阵,然后计算某种氨基酸指数与最适生长温度的相
关性,共可获取 544 个氨基酸指数与最适生长温度
的相关指数。
2 结果
2.1 共有同源蛋白的提取
不同的微生物通常含有不同的基因数量,为
了使不同微生物间具有可比性,本研究首先提取
了不同物种间共有的直系同源基因,这些基因一
般 是 由 共 同 的 祖 先 进 化 而 来。 不 同 物 种 间 的 直
系同源基因一般具有类似的功能,通常编码生命
必需的酶、辅酶或关键调控蛋白的基因,往往具
有 功 能 保 守、 进 化 缓 慢 的 特 征[12,13], 这 样 的 特
点便于利用其来分析基因序列与最适生长温度的
关 系 等 相 关 研 究。 表 2 为 提 取 的 53 个 共 有 的 同
源基因信息,这些基因是生物中的看家基因,如
methionyl-tRNA formyltransferase、glutamine-fructose-
2016,32(3) 159丛华剑等:基于细菌同源蛋白预测细菌最适生长温度的研究
6-phosphate aminotransferase、Polyribonucleotide
nucleotidyltransferase 等都是细菌中非常重要的转移
酶,30S ribosomal protein S13、50S ribosomal protein
L13 等都是参与细胞翻译过程的核糖体亚单位的重
要组成蛋白。它们在维持生命的过程中起到关键的
作用。
2.2 氨基酸频率与最适生长温度的相关性
53 个 共 有 同 源 蛋 白 中 氨 基 酸 的 频 率 与 最 适
生长温度的相关系数,并按相关系数大小进行排
序,结果(图 1)显示,与温度相关性最高的同
源蛋白,相关系数为 0.86,对应的蛋白质名称为 :
Polyribonucleotide nucleotidyltransferase,相关性最低
的同源蛋白,相关系数为 0.67,对应蛋白质名称为:
Ribulose-phosphate 3-epimerase,全部 53 个共有同源
蛋白的相关系数都在 0.65 以上,说明共有同源蛋白
表 2 53 个共有同源基因信息
编号 同源蛋白 平均长度 /bp 编号 同源蛋白 平均长度 /bp
1 methionyl-tRNA formyltransferase 316 28 30S ribosomal protein S13 118
2 glutamine-fructose-6-phosphate aminotransferase 614 29 30S ribosomal protein S11 129
3 Ribulose-phosphate 3-epimerase 229 30 50S ribosomal protein L13 142
4 Tryptophan--tRNA ligase 361 31 GMP synthase[glutamine-hydrolyzing] 531
5 DNA primase 716 32 Ditrans,polycis-undecaprenyl-diphosphate synthase 252
6 tRNA N6-adenosine threonylcarbamoyltransferase 352 33 Ribosome-recycling factor 184
7 Phosphoglycerate kinase 400 34 Bifunctional purine biosynthesis protein PurH 526
8 Valine--tRNA ligase 880 35 Adenylosuccinate synthetase 429
9 GTPase Obg 405 36 Chaperone protein ClpB 865
10 Elongation factor 4 601 37 Isoleucine--tRNA ligase 947
11 CTP synthase 544 38 Alanine--tRNA ligase 890
12 Enolase 438 39 Elongation factor Tu 396
13 ATP-dependent zinc metalloprotease FtsH 649 40 Elongation factor Tu 396
14 Polyribonucleotide nucleotidyltransferase 700 41 30S ribosomal protein S7 157
15 Ribosome-binding ATPase YchF 363 42 DNA-directed RNA polymerase subunit beta 1399
16 tRNA-specific 2-thiouridylase MnmA 408 43 50S ribosomal protein L11 143
17 Tryptophan synthase beta chain 424 44 30S ribosomal protein S11 129
18 UvrABC system protein B 662 45 30S ribosomal protein S13 118
19 3-oxoacyl-[acyl-carrier-protein]reductase FabG 242 46 Protein translocase subunit SecY 443
20 DNA gyrase subunit A 883 47 30S ribosomal protein S5 171
21 Ribosomal RNA small subunit methyltransferase H 383 48 50S ribosomal protein L5 178
22 Leucine--tRNA ligase 934 49 50S ribosomal protein L16 137
23 Serine hydroxymethyltransferase 418 50 30S ribosomal protein S3 242
24 Peptide chain release factor 1 362 51 50S ribosomal protein L2 275
25 Serine--tRNA ligase 428 52 30S ribosomal protein S10 103
26 Cysteine--tRNA ligase 488 53 Chromosomal replication initiator protein DnaA 480
27 D-erythrose-4-phosphate dehydrogenase 391
0.90
0.85
0.80
0.75
0.70
0.65
0.60
0 10 20 30 40 50 60
ޣ㌫ᮠ٬ ਼Ⓚ㳻ⲭ
图 1 53 个同源蛋白中氨基酸频率与温度的相关系数
的氨基酸频率与其最适生长温度具有很高的相关性。
我们把 53 个共有同源蛋白相连,计算氨基酸频率与
生物技术通报 Biotechnology Bulletin 2016,Vol.32,No.3160
其最适生长温度的相关系数为 0.90,再次验证了共
有同源蛋白中氨基酸频率与最适生长温度之间具有
较高的相关性。
2.3 氨基酸指数分析
图 2 为相关系数最高的前 30 个氨基酸指数(图
2-A)和最低的后 30 个氨基酸指数(图 2-B)的对比图,
图中颜色越深的点表示相关系数值越大。图 2-A 显
示,除了排在第 9 位的氨基酸指数呈现负相关的关
系,具体表现为随着“特征序列”最适生长温度的
增加,氨基酸指数值逐渐变小,其他的氨基酸指数
均呈现正相关的关系,表现为随着“特征序列”最
适生长温度的增加,氨基酸指数值逐渐变大。由此
可见,蛋白质中与其最适生长温度相关的特征序列
中的氨基酸选择性有明显的倾向性,在相关系数最
高的前 30 个氨基酸指数中,其相关系数绝对值均在
0.70 以上。10 个与最适生长温度相关性最高的氨基
酸指数(表 3)显示,最适生长温度较高的微生物
中蛋白质中的特征序列倾向选择分子量大,且疏水
0
20
40
60
80
0 5 10 2015 25
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
A 0
20
40
60
80
0 5 10 2015 25
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
B
横坐标为 30 个氨基酸指数,纵坐标为 92 个“特征序列”,自上而下,按对应的细菌的最适生长温度由小到大排序。图中
的每一个点代表在某氨基酸指数下,某个“特征序列”的氨基酸指数值的加和平均值。颜色越深,表示值越大
图 2 相关系数最高的前 30 个氨基酸指数(A)和最低的 30 个氨基酸指数(B)
表 3 相关性最大的前 10 个氨基酸指数
序号 氨基酸指数 相关系数
1 Relative preference value at N1(Richardson-Richardson,1988) 0.82
2 Size(Dawson,1972) 0.82
3 Linker propensity from 2-linker dataset(George-Heringa,2003) 0.82
4 Hydrophobicity index(Argos et al.,1982) 0.81
5 Hydrophobicity(Jones,1975) 0.81
6 van der Waals parameter R0(Levitt,1976) 0.79
7 Transfer free energy(Simon,1976) 0.79
8 N.m.r. chemical shift of alpha-carbon(Fauchere et al.,1988) 0.79
9 Hydrophobicity(Zimmerman et al.,1968) 0.79
10 Alpha-helix propensity derived from designed sequences(Koehl-Levitt,1999) -0.79
性强的氨基酸。
2.4 蛋白质二级结构信息
对于蛋白质二级结构上的分析,本研究主要探
究“特征序列”的每个氨基酸位于蛋白质的区域,
观察其是否有明显的位置特征。对蛋白质的二级结
构的预测,采用的工具是 PSIPRED[14](http://bioinf.
cs.ucl.ac.uk/psipred/)。
对最适生长温度的影响比较大的氨基酸主要分
布于 α 螺旋及 loop 区,比例分布分别为 46.10% 和
37.13%,β 折叠部分只占了 16.77%。而“特征序列”
2016,32(3) 161丛华剑等:基于细菌同源蛋白预测细菌最适生长温度的研究
45Geobacillus C56 T3 uid49467 297530556
55Geobacillus Y412MC52 uid55381 319766284
55Geobacillus Y412MC61 uid41171 261419469
60Geobacillus kaustophilus HTA426 uid58227 56419804
65Geobacillus thermodenitrificans NG80 2 uid58829 138894789
55Geobacillus WCH70 uid59045 239826663
55Geobacillus Y4 1MC1 uid55779 312111628
60Anoxybacillus flavithermus WK1 uid59135 212639515
37Bacillus pseudofirmus OF4 uid45847 288556936
50Exiguobacterium AT1b uid59093 229918674
37Paenibacillus Y412MC10 uid41127 261407930
50Kyrpidia tusciae DSM 2912 uid48361 295696164
60Alicyclobacillus acidocaldarius DSM 446 uid59199 258511422
15Heliobacterium modesticaldum Ice1 uid58279 167630367
58Moorella thermoacetica ATCC 39073 uid58051 83589904
50Mahella australiensis 50 1 BON uid66917 332981620
55Clostridium thermocellum DSM 1313 uid161989 385779145
60Clostridium thermocellum ATCC 27405 uid57917 125972939
70Thermoanaerobacter italicus Ab9 uid46241 289578380
75Thermoanaerobacter tengcongensis MB4 uid57813 20807834
70Caldicellulosiruptor saccharolyticus DSM 8903 uid58289 146297069
68Caldicellulosiruptor lactoaceticus 6A uid60575 344995762
75Caldicellulosiruptor bescii DSM 6725 uid59201 222529049
79Caldicellulosiruptor obsidiansis OB47 uid51501 302872107
79Caldicellulosiruptor owensensis OL uid60165 312134904
60Halothermothrix orenii H 168 uid58585 220931634
70Ammonifex degensii KC4 uid41053 260893502
65Thermobaculum terrenum ATCC BAA 798 uid42011 269926894
52Chloroflexus aurantiacus J 10 fl uid57657 163847604
55Chloroflexus aggregans DSM 9485 uid58621 219849396
50Meiothermus ruber DSM 1279 uid46661 291296202
68Marinithermus hydrothermalis DSM 14884 uid65783 328950321
63Coprothermobacter proteolyticus DSM 5265 uid59253 206895816
48Acidimicrobium ferrooxidans DSM 10331 uid59215 256371446
30Corynebacterium glutamicum ATCC 13032 uid57905 19553179
15Renibacterium salmoninarum ATCC 33209 uid58899 163839428
28Kribbella flavida DSM 17836 uid43465 284030886
28Salinispora tropica CNB 440 uid58565 145593929
55Acidothermus cellulolyticus 11B uid58501 117928715
30Arcobacter nitrofigilis DSM 7299 uid49001 296273302
55Hippea maritima DSM 10411 uid65267 327399809
70Hydrogenobacter thermophilus TK 6 uid159875 384129236
95Aquifex aeolicus VF5 uid57765 15605776
58Hydrogenobaculum Y04AAS1 uid58857 195952523
70Desulfurobacterium thermolithotrophum DSM 11699 uid63405 325294385
75Dictyoglomus turgidum DSM 6724 uid59177 217967533
70Fervidobacterium nodosum Rt17 B1 uid58625 154249089
70Thermotoga neapolitana DSM 4359 uid59065 222100220
80Thermotoga maritima MSB8 uid179902 568319277
37Spirochaeta caldaria DSM 7334 uid68753 339499977
65Spirochaeta thermophila DSM 6192 uid53037 307718799
55Calditerrivibrio nitroreducens DSM 19672 uid60821 313673255
45Isosphaera pallida ATCC 43644 uid62207 320104995
60Methylacidiphilum infernorum V4 uid59161 189220135
15Flavobacterium psychrophilum JIP02 86 uid61627 150026085
48Chlorobium tepidum TLS uid57897 21674467
37Salinibacter ruber DSM 13855 uid58513 83814865
37Fibrobacter succinogenes S85 uid161919 385791604
30Geobacter bemidjiensis Bem uid58749 197117696
30Geobacter metallireducens GS 15 uid57731 404496453
30Pelobacter propionicus DSM 2379 uid58255 118579404
30Pelobacter carbinolicus DSM 2380 uid58241 404493180
30Haliangium ochraceum DSM 14365 uid41425 262197030
35Anaeromyxobacter dehalogenans 2CP 1 uid58989 220916341
37Syntrophobacter fumaroxidans MPOB uid58177 116748674
10Desulfotalea psychrophila LSv54 uid58153 51246460
28Desulfobacterium autotrophicum HRM2 uid59061 224367585
28Leptospira interrogans serovar Lai 56601 uid57881 24213647
37Francisella philomiragia ATCC 25017 uid59105 167626449
28Verminephrobacter eiseniae EF01 2 uid58675 121609766
30Delftia acidovorans SPH 1 uid58703 160900616
25Rhodoferax ferrireducens T118 uid58353 89900282
20Polaromonas JS666 uid58207 91789120
20Polaromonas naphthalenivorans CJ2 uid58273 121604326
37Ralstonia pickettii 12D uid58859 241663489
28Nitrosospira multiformis ATCC 25196 uid58361 82703668
35Neisseria gonorrhoeae FA 1090 uid57611 59800780
45Methylococcus capsulatus Bath uid57607 53804618
-3Psychrobacter arcticus 273 4 uid58021 71064655
3Psychrobacter cryohalolentis K5 uid58373 93004911
30Marinobacter aquaeolei VT8 uid59419 120556251
30Teredinibacter turnerae T7901 uid59267 254787145
30Kangiella koreensis DSM 16069 uid59209 256821536
22Tolumonas auensis DSM 9187 uid59395 237808986
4Shewanella baltica OS223 uid58775 217972320
15Pseudoalteromonas haloplanktis TAC125 uid58431 77359947
-12Psychromonas ingrahamii 37 uid58521 119944587
8Colwellia psychrerythraea 34H uid57855 71278713
12Aliivibrio salmonicida LFI1238 uid59251 209694194
15Photobacterium profundum SS9 uid62923 54307819
20Vibrio cholerae O1 biovar El Tor N16961 uid57623 15640667
25Vibrio cholerae M66 2 uid59355 227080828
99
99
99
83
85
86
99
99
99
97
99
79
39
99
24
99
25
99
75
99
97
99
99
74
47
99
99
99
97
59
99
75
99
98
69
99
99
76
50
98
99
99
66
99
98
99
88
83
77
50
60
55
59
93
98
91
47
50
54
25
25
99
44
98
76
99
79
69
75
64
48
73
50
33
57
17
33
58
10
17
15
29
2
5
16
24
8
9
6 儈㧼˗ѝ㧼˗վ㧼˗л਼
图 3 利用 Polyribonucleotide nucleotidyltransferase 所建的进化树
生物技术通报 Biotechnology Bulletin 2016,Vol.32,No.3162
12 Aliivibrio salmonicida LFI1
15 Photobacterium profundum SS
20 Vibrio cholerae O1 biovar E
25 Vibrio cholerae M66 2 uid59
22 Tolumonas auensis DSM 9187
-12 Psychromonas ingrahamii 37
4 Shewanella baltica OS223 uid
8 Colwellia psychrerythraea 34
15 Pseudoalteromonas haloplank
30 Kangiella koreensis DSM 160
30 Marinobacter aquaeolei VT8
30 Teredinibacter turnerae T79
45 Methylococcus capsulatus Ba
-3 Psychrobacter arcticus 273
3 Psychrobacter cryohalolentis
35 Neisseria gonorrhoeae FA 10
28 Nitrosospira multiformis AT
37 Ralstonia pickettii 12D uid
28 Verminephrobacter eiseniae
30 Delftia acidovorans SPH 1 u
25 Rhodoferax ferrireducens T1
20 Polaromonas naphthalenivora
20 Polaromonas JS666 uid58207
37 Francisella philomiragia AT
30 Haliangium ochraceum DSM 14
35 Anaeromyxobacter dehalogena
10 Desulfotalea psychrophila L
28 Desulfobacterium autotrophi
37 Syntrophobacter fumaroxidan
30 Pelobacter carbinolicus DSM
30 Pelobacter propionicus DSM
30 Geobacter bemidjiensis Bem
30 Geobacter metallireducens G
30 Arcobacter nitrofigilis DSM
55 Hippea maritima DSM 10411 u
55 Calditerrivibrio nitroreduc
70 Desulfurobacterium thermoli
58 Hydrogenobaculum Y04AAS1 ui
70 Hydrogenobacter thermophilu
95 Aquifex aeolicus VF5 uid577
45 Isosphaera pallida ATCC 436
28 Leptospira interrogans sero
60 Methylacidiphilum infernoru
37 Spirochaeta caldaria DSM 73
65 Spirochaeta thermophila DSM
37 Fibrobacter succinogenes S8
48 Chlorobium tepidum TLS uid5
37 Salinibacter ruber DSM 1385
15 Flavobacterium psychrophilu
70 Thermotoga neapolitana DSM
80 Thermotoga maritima MSB8 ui
70 Fervidobacterium nodosum Rt
63 Coprothermobacter proteolyt
75 Dictyoglomus turgidum DSM 6
15 Renibacterium salmoninarum
28 Kribbella flavida DSM 17836
28 Salinispora tropica CNB 440
55 Acidothermus cellulolyticus
30 Corynebacterium glutamicum
48 Acidimicrobium ferrooxidans
50 Meiothermus ruber DSM 1279
68 Marinithermus hydrothermali
65 Thermobaculum terrenum ATCC
52 Chloroflexus aurantiacus J
55 Chloroflexus aggregans DSM
55 Geobacillus Y412MC52 uid553
55 Geobacillus Y412MC61 uid411
45 Geobacillus C56 T3 uid49467
60 Geobacillus kaustophilus HT
65 Geobacillus thermodenitrifi
55 Geobacillus WCH70 uid59045
55 Geobacillus Y4 1MC1 uid5577
60 Anoxybacillus flavithermus
37 Bacillus pseudofirmus OF4 u
50 Exiguobacterium AT1b uid590
37 Paenibacillus Y412MC10 uid4
50 Kyrpidia tusciae DSM 2912 u
60 Alicyclobacillus acidocalda
60 Halothermothrix orenii H 16
15 Heliobacterium modesticaldu
58 Moorella thermoacetica ATCC
70 Ammonifex degensii KC4 uid4
55 Clostridium thermocellum DS
60 Clostridium thermocellum AT
50 Mahella australiensis 50 1
70 Thermoanaerobacter italicus
75 Thermoanaerobacter tengcong
70 Caldicellulosiruptor saccha
68 Caldicellulosiruptor lactoa
75 Caldicellulosiruptor bescii
79 Caldicellulosiruptor owense
79 Caldicellulosiruptor obsidi
100
100
100
100
100
100
100
100
100
100
99
100
100
100
100
100
99
100
100
100
100
100
100
100
100
100
100
56
100
100
100
100
100
100
100
99
53
92
100
100
100
100
100
100
100
100
100
70
100
95
100
100
100
100
100
100
94
100
72
100
100
56
100
99
100
100
100
100
100
99
43
99
100
100
64
100
47
65
94
56
86
52
82
35
99
57
99
86
41
图 4 全部同源蛋白构建的进化树
2016,32(3) 163丛华剑等:基于细菌同源蛋白预测细菌最适生长温度的研究
55 Geobacillus Y412MC52 uid55381 16s
55 Geobacillus Y412MC61 uid41171 16s
60 Geobacillus kaustophilus HTA426 uid58227 16s
45 Geobacillus C56 T3 uid49467 16s
65 Geobacillus thermodenitrificans NG80 2 uid58829 16s
55 Geobacillus WCH70 uid59045 16s
55 Geobacillus Y4 1MC1 uid55779 16s
60 Anoxybacillus flavithermus WK1 uid59135 16s
50 Exiguobacterium AT1b uid59093 16s
37 Bacillus pseudofirmus OF4 uid45847 16s
37 Paenibacillus Y412MC10 uid41127 16s
50 Kyrpidia tusciae DSM 2912 uid48361 16s
60 Alicyclobacillus acidocaldarius DSM 446 uid59199 16s
15 Heliobacterium modesticaldum Ice1 uid58279 16s
70 Thermoanaerobacter italicus Ab9 uid46241 16s
75 Thermoanaerobacter tengcongensis MB4 uid57813 16s
58 Moorella thermoacetica ATCC 39073 uid58051 16s
70 Ammonifex degensii KC4 uid41053 16s
75 Dictyoglomus turgidum DSM 6724 uid59177 16s
55 Clostridium thermocellum DSM 1313 uid161989 16s
60 Clostridium thermocellum ATCC 27405 uid57917 16s
50 Mahella australiensis 50 1 BON uid66917 16s
70 Caldicellulosiruptor saccharolyticus DSM 8903 uid58289 16s
68 Caldicellulosiruptor lactoaceticus 6A uid60575 16s
75 Caldicellulosiruptor bescii DSM 6725 uid59201 16s
79 Caldicellulosiruptor owensensis OL uid60165 16s
79 Caldicellulosiruptor obsidiansis OB47 uid51501 16s
60 Halothermothrix orenii H 168 uid58585 16s
37 Spirochaeta caldaria DSM 7334 uid68753 16s
65 Spirochaeta thermophila DSM 6192 uid53037 16s
52 Chloroflexus aurantiacus J 10 fl uid57657 16s
55 Chloroflexus aggregans DSM 9485 uid58621 16s
65 Thermobaculum terrenum ATCC BAA 798 uid42011 16s
60 Methylacidiphilum infernorum V4 uid59161 16s
50 Meiothermus ruber DSM 1279 uid46661 16s
68 Marinithermus hydrothermalis DSM 14884 uid65783 16s
70 Thermotoga neapolitana DSM 4359 uid59065 16s
80 Thermotoga maritima MSB8 uid179902 16s
70 Fervidobacterium nodosum Rt17 B1 uid58625 16s
45 Isosphaera pallida ATCC 43644 uid62207 16s
63 Coprothermobacter proteolyticus DSM 5265 uid59253 16s
70 Desulfurobacterium thermolithotrophum DSM 11699 uid63405 16s
58 Hydrogenobaculum Y04AAS1 uid58857 16s
70 Hydrogenobacter thermophilus TK 6 uid159875 16s
95 Aquifex aeolicus VF5 uid57765 16s
48 Acidimicrobium ferrooxidans DSM 10331 uid59215 16s
55 Acidothermus cellulolyticus 11B uid58501 16s
30 Corynebacterium glutamicum ATCC 13032 uid57905 16s
28 Salinispora tropica CNB 440 uid58565 16s
15 Renibacterium salmoninarum ATCC 33209 uid58899 16s
28 Kribbella flavida DSM 17836 uid43465 16s
55 Calditerrivibrio nitroreducens DSM 19672 uid60821 16s
55 Hippea maritima DSM 10411 uid65267 16s
28 Leptospira interrogans serovar Lai 56601 uid57881 16s
15 Flavobacterium psychrophilum JIP02 86 uid61627 16s
37 Salinibacter ruber DSM 13855 uid58513 16s
48 Chlorobium tepidum TLS uid57897 16s
37 Fibrobacter succinogenes S85 uid161919 16s
30 Geobacter bemidjiensis Bem uid58749 16s
30 Pelobacter propionicus DSM 2379 uid58255 16s
30 Geobacter metallireducens GS 15 uid57731 16s
30 Pelobacter carbinolicus DSM 2380 uid58241 16s
37 Syntrophobacter fumaroxidans MPOB uid58177 16s
10 Desulfotalea psychrophila LSv54 uid58153 16s
28 Desulfobacterium autotrophicum HRM2 uid59061 16s
30 Haliangium ochraceum DSM 14365 uid41425 16s
35 Anaeromyxobacter dehalogenans 2CP 1 uid58989 16s
30 Arcobacter nitrofigilis DSM 7299 uid49001 16s
37 Francisella philomiragia ATCC 25017 uid59105 16s
20 Polaromonas naphthalenivorans CJ2 uid58273 16s
20 Polaromonas JS666 uid58207 16s
25 Rhodoferax ferrireducens T118 uid58353 16s
28 Verminephrobacter eiseniae EF01 2 uid58675 16s
30 Delftia acidovorans SPH 1 uid58703 16s
37 Ralstonia pickettii 12D uid58859 16s
28 Nitrosospira multiformis ATCC 25196 uid58361 16s
35 Neisseria gonorrhoeae FA 1090 uid57611 16s
-3 Psychrobacter arcticus 273 4 uid58021 16s
3 Psychrobacter cryohalolentis K5 uid58373 16s
30 Kangiella koreensis DSM 16069 uid59209 16s
30 Marinobacter aquaeolei VT8 uid59419 16s
45 Methylococcus capsulatus Bath uid57607 16s
30 Teredinibacter turnerae T7901 uid59267 16s
8 Colwellia psychrerythraea 34H uid57855 16s
-12 Psychromonas ingrahamii 37 uid58521 16s
15 Pseudoalteromonas haloplanktis TAC125 uid58431 16s
4 Shewanella baltica OS223 uid58775 16s
22 Tolumonas auensis DSM 9187 uid59395 16s
12 Aliivibrio salmonicida LFI1238 uid59251 16s
15 Photobacterium profundum SS9 uid62923 16s
20 Vibrio cholerae O1 biovar El Tor N16961 uid57623 16s
25 Vibrio cholerae M66 2 uid59355 16s
99
87
99
99
99
99
99
68
92
99
49
99
99
86
40
89
99
57
99
65
25
15
30
99
33
99
37
29
89
70
72
43
94
53
99
89
48
98
98
97
99
88
38
57
35
54
45
93
87
92
99
20
99
73
42
71
89
99
82
54
54
81
84
42
65
79
74
15
76
55
31
30
14
14
31
14
2
17
24
6
55
20
26
16
21
25
29
15
20
图 5 基于 16 S 基因构建的进化树
生物技术通报 Biotechnology Bulletin 2016,Vol.32,No.3164
所在的完整的蛋白序列中,α 螺旋、loop 区及 β 折
叠所占的比例分别为 :35.30%、46.37% 及 18.33%。
研究发现,“特征序列”中 α 螺旋所占比例增加,
loop 区所占比例减少,β 折叠部分基本保持不变,可
见对最适生长温度有较大影响的位置对 α 螺旋部分
有一定选择偏好性。
2.5 进化分析
我们选取与最适生长温度相关性最高的同源蛋
白以及全部蛋白来构建进化树(图 3,图 4)。通过
观察与最适生长温度相关性最高的同源蛋白所建的
进化树(图 3),发现较为明显的异常值有 8 个,分
别占总数的 8.7%。全部共有同源蛋白相连所建的以
及进化树(图 4),可以发现较为明显的异常值有 5
个,占总数的 5.4%。利用 92 个细菌的 16S rDNA 构
建的进化树(图 5),其明显的异常值有 7 个,占总
数的 7.6%,其值均不足 10%。因此通过进化树很好
地将高温、中温以及低温 3 类细菌进行了分类,且
3 个进化树分类效果相当。
3 讨论
本研究通过氨基酸频率特征来探究共有同源蛋
白中一些对温度有影响的关键位置,并对其进行分
析发现,细菌中的一些特殊基因序列对其最适生长
温度有较大影响,这对蛋白质热稳定性相关实验有
比较重要的指导意义。然而,实际上仍有很多因素
对蛋白质热稳定性有较大影响,国内外学者都对其
进行了大量的研究。其中 Zeldovich 等[15]的研究发
现、Ile、Val、Tyr、Trp、Arg、Glu 及 Leu(IVYWREL)
在蛋白序列中的比例与蛋白质的最适生长温度有较
高的相关性,说明氨基酸的组成比例与蛋白质的最
适生长温度具有相关性。除了基因序列的影响之外,
蛋白质的空间结构作用力的影响也是一个重要的因
素[16],通过分析蛋白质的三级结构,并对其进行分
子动力学模拟,可以更直观地分析在高温情况下蛋
白质的热稳定性情况。Mitra 等[17]的研究就是通过
这样的方法对蛋白质进行设计,提高了纤维素酶的
热稳定性,Akcapinar 等[18]则是对突变后的耐高温
蛋白质进行分析,从蛋白质活性中心空间作用力改
变的角度解释了突变对其热稳定性的提高的机制。
在国内,对细菌最适生长温度以及蛋白质热稳定性
的研究也正不断开展[19-21],在基因组的热稳定性机
制,蛋白质稳定性的机理,理性设计蛋白质热稳定
性等方面都取得了不错的研究成果。所以,在后续
工作中将对这些因素进行更深入的研究,同时也将
选取一个更大的数据库来获取影响最适生长温度的
特征,通过生物信息学的方式来对蛋白质的热稳定
性进行系统的预测分析。利用生物信息学的方法,
可以更高效地获得并处理大量的基因组数据,这将
对理解蛋白质的热稳定性以及蛋白质的分子设计具
有重要的意义。
4 结论
本研究通过利用生物信息学的方法,从基因组
的层面上对细菌的最适生长温度进行了分析,利用
氨基酸频率作为特征,发现了同源蛋白的氨基酸频
率与细菌最适生长温度有较高的相关性 ;通过构建
进化树分析发现,共有同源蛋白可以更好地对不同
最适生长温度的细菌进行分类。通过分析氨基酸指
数发现,不同最适生长温度的细菌中,同源蛋白对
氨基酸的选择有偏好性。通过分析蛋白质二级结构
发现,对细菌最适生长温度影响较大的位置的氨基
酸普遍位于 α 螺旋以及 loop 区,并且偏好选择于 α
螺旋部位。
参 考 文 献
[1]Makarova KS, Wolf YI, Koonin EV. Potential genomic determinants
of hyper thermophily[J]. Trends Genet, 2003, 19 :172-176.
[2]Li W, Zou H, Tao M. Sequences downstream of the start codon and
their relations to G02+02C content and optimal growth temperature
in prokaryotic genomes[J]. Antonie Van Leeuwenhoek, 2007, 92
(4):417-427.
[3]Kim E, Park H S, Jung Y, et al. Identification of the high-temperature
response genes from Porphyra seriata(rhodophyta)expression
sequence tags and enhancement of heat tolerance of Chlamydomonas
(chlorophyta)by expression of the Porphyra htr2 gene 1[J].
Journal of Phycology, 2011, 47(4):821-828.
[4] Jensen DB, Vesth TC, Hallin TC, et al. Bayesian prediction of bact-
erial growth temperature range based on genome sequences[J].
BMC Genomics, 2012, 13(suppl7):53.
[5]Hu J. Polynucleotide phosphorylase is required for Escherichia coli
2016,32(3) 165丛华剑等:基于细菌同源蛋白预测细菌最适生长温度的研究
O157 :H7 growth above refrigerated temperature[J]. Foodborne
Pathogens & Disease, 2014, 11(3):177-185.
[6] Wall DP, Deluca T. Ortholog detection using the reciprocal smallest
distance algorithm[J]. Methods In Molecular Biology, 2007, 396 :
95-110.
[7]Altschul SF. Basic local alignment search tool[J]. J Mol Biol,
1990, 215 :403-410.
[8] Tamura K, Stecher G, Peterson D, et al. MEGA6 :molecular
evolutionary genetics analysis version 6.0[J]. Molecular Biology
and Evolution, 2013, 30 :2725-2729.
[9]Thompson JD, Higgins DG, Gibson TJ. CLUSTAL W :improving
the sensitivity of progressive multiple sequence alignment through
sequence weighting, position-specific gap penalties and weight
matrix choice[J]. Nucleic Acids Res, 1994, 22 :4673-4680.
[10]Larkin MA, Blackshields G, Brown NP, et al. Clustal W and Clustal
X version 2. 0[J]. Bioinformatics, 2007, 23 :2947-2948.
[11] Kawashima S, Kanehisa M. AAindex :amino acid index database
[J]. Nucleic Acids Res, 2000, 28(1):374.
[12] Sonnhammer EL, Koonin EV. Orthology, paralogy and proposed
classification for paralog subtypes[J]. Trends in Genetics, 2002,
18(12):619-620.
[13]Gabaldn T, Dessimoz C, Huxley-Jones J, et al. Joining forces in the
quest for orthologs[J]. Genome Biology, 2009, 10(9):403.
[14]Jones DT. Protein secondary structure prediction based on position-
specific scoring matrices[J]. J Mol Biol, 1999, 292 :195-202.
[15]Zeldovich KB, Berezovsky IN, Shakhnovich EI. Protein and DNA
sequence determinants of thermophilic adaptation[J]. Plos
Computational Biology, 2007, 3(1):62-72.
[16]Ratakonda S, Anand A, Dikshit K, et al. Crystallographic structure
determination of B10 mutants of Vitreoscilla hemoglobin :role of
Tyr29(B10)in the structure of the ligand-binding site[J]. Acta
Crystallographica Section F-Structural Biology and Crystallization
Communications, 2013, 69 :215-222.
[17]Mitra S, Mukhopadhyay BC, Mandal AR, et al. Cloning,
overexpression, and characterization of a novel alkali-thermostable
xylanase from Geobacillus sp. WBI[J]. Journal of Basic
Microbiology, 2015, 55(4):527-537.
[18]Akcapinar GB, Venturini A, Martelli PL, et al. Modulating the
thermostability of Endoglucanase I from Trichoderma reesei using
computational approaches[J]. Protein Engineering Design &
Selection, 2015, 28(5):127-135.
[19]田健 , 王平 , 伍宁丰 , 范云六 . 理性设计提高蛋白质热稳定性
的研究进展[J]. 生物技术进展 , 2012, 4 :233-239.
[20]张健 , 张琳 , 王维 . 通过蛋白质序列比对探讨细菌的热适应机
制[J]. 安徽农业科学 , 2011, 21 :12646-12648.
[21] 盛多红 . 超嗜热古菌基因组的热稳定性[J]. 生命科学 ,
2014, 1 :64-71.
(责任编辑 李楠)