全 文 :生物技术通报
BIOTECHNOLOGY BULLETIN·研究报告· 2008年第3期
收稿日期:2007-12-12
作者简介:万祥辉(1982-),男,硕士研究生,研究方向:生物医学信息学
通讯作者:曾照芳,教授,电话:023-68485095;E-mail:zeng000@126.com
丙型肝炎病毒(HCV)属黄病毒科,基因组(HCVRNA)为单正链 RNA(ssRNA),易变异,在不同国家,不
同地区 HCV基因型分布不同[1]。有研究报道 HCV基因与干扰素治疗丙型肝炎的疗效及肝移植后再感染有
关[2,3]。目前 HCV基因分型的方法有多种,没有建立“金标准”,最准确的分型方法是全基因组测序,但这在
临床难以实现。本研究从 Genbank中筛选出 15条对各成熟肽区域有注释来源于不同国家地区的丙型肝炎
病毒全基因组序列,对序列的 5′UTR区,core蛋白区,E1蛋白区,E2蛋白区及 NS5B蛋白区建系统进化树,
找出最能替代全基因组分型的区域。
1 材料与方法
从 Genbank(htp:/www.ncbi.nlm.nih.gov/)中筛选出 15条对各成熟肽区域有注释来源于不同国家地区
的 HCVRNA全基因组序列,序列的接受号、基因型和国家(表 1)。根据注释分别选取全基因组序列的 5′
UTR区,core区,E1区,E2区及NS5B区的基因序列,用MEGA4[4](Neighbor-Joining法,Kimura-2-parameter模
用生物信息学方法确定丙型肝炎病毒基因分型的最佳区域
万祥辉 曾照芳 杨细媚
(重庆医科大学检验系 临床检验诊断学省部共建教育部重点实验室 重庆市重点实验室,重庆 400016)
摘 要: 从Genbank中筛选出15条对各成熟肽区域有注释来源于不同国家地区的丙型肝炎病毒全基因组序列,
分别对5′UTR区,core区,E1区,E2区及NS5B区建系统进化树。结果发现以5′UTR区建树,基因分型不完全正确而
以core区、E1区、E2区及NS5B区建树,基因分型均完全正确,但同一基因型间的核苷酸演化距离存在差异。计算5条1a
型序列的core区、E1区、E2区、NS5B区的核苷酸演化距离并和全基因组序列核苷酸演化距离比较。结果发现NS5B蛋白
区基因分型最能反映病毒株的演化关系。用生物信息学方法,比较丙型肝炎病毒的5个常用的基因分型区域,确定NS5B
区为丙型肝炎病毒基因分型的最佳区域。
关键词: 丙型肝炎病毒 基因型 NS5B蛋白 生物信息学
AscertaintheBestGenotypingRegionofHepatitisCby
Bioinformatics
WanXianghuiZengZhaofang YangXimei
(KeyLaboratoryofLaboratoryMedicalDiagnostics,MinistryofEducation,ChongqingMedicalUniversity,Chongqing400016)
Abstract: FifteencompletegenomesequencesofhepatitisC whichhadbeengiventheannotationaboutevery
regionandderivedfrom diferentcountryweredownloadedfrom Genbank.Phylogenetictreeson5′UTR region,core
region,E1region,E2regionandNS5Bregionwereestablished.Theresultsdemonstratedthatgenotypinggroupwasnot
alcorecton5′UTR regionwhilegenotypinggroupswerewholycorectoncoreregion,E1region,E2regionand
NS5B region.Comparingphylogeneticdistanceoncoreregion,E1region,E2regionandNS5B regionwiththaton
completegenomesequencedemonstratedthattheNS5Bregionwasthebestregioninsteadofthecompletegenome
sequence.ComparingfiveregionsequencesofhepatitisC,ascertainthebestgenotypingregionofhepatitisCwasNS5B
regionsequencesbybioinformatics.
Keywords: HepatitisCvirusGenotype NS5Bprotein Bioinformatics
生物技术通报Biotechnology Bulletin2008年第3期
型,1 000次 Bootstrap检验)对上述区域分别
建系统进化树。根据结果比较分析,用
MEGA4(Kimura-2-parameter模型)计算 5条
1a型序列的 core区、E1区、E2区、NS5B区
的核苷酸演化距离并和全基因组序列核苷
酸演化距离比较。
2 结果
2.1 5′UTR区,core区,E1区,E2区及 NS5B区的系统进化树
5′UTR区的系统进化树见图 1,core区的系统进化树见图 2,E1区的系统进化树见图 3,E2区的系统
进化树见图 4,NS5B区的系统进化树 (图 5)。从图 1中可以看出 5′UTR区分型未能将 D14853株 和
EU155355株分开,存在分型错误。图 2、图 3、图 4、图 5显示 core区、E1区、E2区、NS5B区均能正确分型,
但同一基因型不同病毒株的核苷酸演化距离不同。
表 1 15条全基因组序列的接受号和基因型
图 1 5′UTR区的系统进化树 图 2 core蛋白区的系统进化树 图 3 E1区系统进化树
图 4 E2区系统进化树 图 5 NS5B区系统进化树
2.2计算 5条 1a型序列的 core区、E1区、E2区、NS5B区及全基因组序列的核苷酸演化距离
core区和 E1区的核苷酸演化距离(表 2),E2区和 NS5B区的核苷酸演化距离(表 3),全基因组核苷酸
演化距离 (表 4)。全基因组演化距离计算显示 EU260396株与 EU155355株的演化距离最远,而与
EU155380株的演化距离比 EU260395株接近。core区和 E2区演化距离计算均显示 EU260396株与
EU260395株的演化距离最远,E1区演化距离计算未能将 EU155380株和 EU260395株区分开,而 NS5B区
82
2008年第3期
演化距离计算显示的各病毒株的演化关系与全基因组序列演化距离计算完全一致,所以以 NS5B区最能
代替全基因组序列进行基因分型,最能反映病毒株间的演化距离。
表 2 HCV 1a基因型序列 core区(左下)和
E1区(右上)的演化距离
表 3 HCV 1a基因型序列 E2区(左下)和
NS5B区(右上)的演化距离
表 4 HCV 1a基因型全基因组序列演化距离3 讨论
目前丙型肝炎病毒基因分型主要是以核苷酸序
列为基础,主要有基因特异探针杂交法(LIPA),PCR-
RFLP基因分型法,型特异引物扩增 HCV基因组特异
区段法(T-S PCR),特异引物错配延伸法(PSMEA),
异源分子迁移率法(HMA)和直接测序法。直接测序
法中目前常用的区段是 5′UTR区、core区和 NS5B
区,这 3个区段相对保守,将高变区 E1区、E2区与 3个相对保守区段一起分析,结果发现 E1区、E2区对
15株不同国家地区来源的序列分型是正确的。国际上一些著名的病毒学家推荐以 HCV基因组的 C区、E1
区或 NS5B区基因来反映全基因组序列的变异情况,对多株 HCV NS5B区的序列分段发现,此区的变异足
以区分不同系、不同型和亚型及株[6]。从生物信息学的角度,比较丙型肝炎病毒 5′UTR区、core区、E1区、
E2区和 NS5B区 5个区域的基因分型结果及演化距离,确定最能反映丙型肝炎病毒株的演化关系的区域
是 NS5B区,为丙型肝炎病毒基因分型确定“金标准”奠定理论基础。
参考 文献
1 J Mellor,ECHolmes,LMJarvis,et al.J Gen Virol,1995,76:2493~2507.
2 谢尧,徐道振,陆志檬,等.中华肝脏病杂志,2004,12(2) :72~75.
3 Cyrille Féray,Michelle Gigou,Didier Samuel,et al.Gastroenterology,1995,108(4) :1088~1096.
4 Tamura K,DudleyJ,Nei M&Kumar S.Molecular Biologyand Evolution,2007,24:1596~1599.
5 Thompson J,Gibson T,Plewniak F,et al.Nucleic Acids Research,1997,24:4876~4882.
6 Pawlotsky.Gastroenterology,2002,122(6) :1554~1568.
注:粗体为区分点 注:粗体为区分点
注:粗体为区分点
万祥辉等:用生物信息学方法确定丙型肝炎病毒基因分型的最佳区域 83