全 文 :广 西 植 物 Guihaia Mar.2014,34(2):242-247 http://journal.gxzw.gxib.cn
DOI:10.3969/j.issn.1000G3142.2014.02.020
魏翔莺,张春英,付海辉,等.云锦杜鹃NRT 基因序列的生物信息学分析[J].广西植物,2014,34(2):242-247
WeiXY,ZhangCY,FuHH,etal.BioinformaticsanalysisofNRTgenesequencesinRhododendronfortunei[J].Guihaia,2014,34(2):242-247
云锦杜鹃NRT基因序列的生物信息学分析
魏翔莺1,2,张春英2,付海辉3,潘东明1∗
(1.福建农林大学 园艺学院,福州350002;2.上海市园林科学研究所,
上海200232;3.厦门大学 环境与生态学院,厦门361101)
摘 要:通过转录组测序,获得在接种ERM真菌的云锦杜鹃苗根系中显著差异表达的基因,其中硝酸根转运
蛋白(NRT)基因是硝态氮吸收转运的关键基因.利用生物信息学方法,分析云锦杜鹃根转录组的硝酸根转
运蛋白(NRT)基因序列,对其推导的氨基酸的理化性质、亲水性/疏水性、跨膜结构、导肽、二级结构、高级结
构进行预测,并对硝酸根转运蛋白的氨基酸做进化发育分析.为进一步了解NRT 基因在云锦杜鹃接种苗根
系氮素吸收的作用奠定了基础.
关键词:云锦杜鹃;硝酸根转运蛋白;生物信息学;进化树
中图分类号:Q81 文献标识码:A 文章编号:1000G3142(2014)02G0242G06
BioinformaticsanalysisofNRTgenesequences
inRhododendronfortunei
WEIXiangGYing1,2,ZHANGChunGYing2∗,FUHaiGHui3,PANDongGMing1∗
(1.CollegeofHorticulture,FujianAgricultureandForestryUniversity,Fuzhou350002,China;2.Shanghai
LandscapeandGardeningResearchInstitute,Shanghai200232,China;3.Collegeof
EnvironmentandEcology,XiamenUniversity,Xiamen361101,China)
Abstract:Weusednextgenerationsequencingtechnologytoinvestigatethetranscriptomesbetweeninoculatedrootsand
uninoculatedrootsoftheRhododendronfortuneiandobtainedmanydiferentialyexpressedgenes.Inthispaper,thenuG
cleicacidsequencesandaminoacidsequencesofnitratetransportersfromR.fortunei,wereanalyzedbybioinformatics
tools.Severalparametersofthesesequences,includingsequencescomposition,physicochemicalproperty,leaderpeptide,
topologicalstructureoftransmembraneregions,hydrophobicityorhydrophilicity,secondarystructures,functionaldomains
andproteinstructures,werepredicted.Phylogenetictreewasreconstructedforthenitratetransportersproteinfamily.
ProvidethebioinformaticsfoundationtounderstandNRTgene’sfunctionininoculatedseedlingroots.
Keywords:Rhododendronfortunei;NRT;bioinformatics;phylogenetictree
云锦杜鹃(Rhododendronfortunei)属杜鹃花科
常绿灌木,生于海拔400~1900m山间林中,花大
艳丽,极具观赏价值,主要产于浙江、江西、福建、广
东、广西、湖南等省区(方云亿,1989).目前对云锦
杜鹃的研究主要在药用成分(李钧敏等,2004)、育种
(朱春艳等,2006;边才苗等,2005)、遗传多样性(金则
新等,2006)、杜鹃花类菌根(王剑敏等,2011;张春英,
2008;杨兵等,2010)等方面,而在分子生物学方面的
研究较少.
硝酸盐转运体(Nitratetransporters,NRTs)的
主要作用是完成根系中 NO-3G的吸收与转运(Zhen
etal.,1991;Walkeretal.,1995).番茄(Lauter,et
收稿日期:2013G10G22 修回日期:2013G11G25
基金项目:国家自然科学基金(30972409)
作者简介:魏翔莺(1987G),女,福建建瓯人,在读博士,主要从事花卉育种和分子生物学等研究,(EGmail)weixiangying_cool@126.com.
∗通讯作者:潘东明,教授,主要从事园艺产品采后生理生化和分子生物学等研究,(EGmail)pdm666@126.com.
al.,1996;vonWirenetal.,2000)、油菜(Pearsonet
al.,2002)、水 稻 (Suenagaetal.,2003)、白 菜
(DApuzzoetal.,2004)等许多物种中克隆了该基
因,积累了许多序列数据.目前,如何对这些序列数
据进行科学的分析已经成为生物学工作者亟待解决
的主要问题.随着生物信息学的出现给序列数据分
析带来了极大的便利.本研究用生物信息学方法对
云锦杜鹃根转录组的硝酸根转运蛋白基因的核苷酸
序列以及所对应的氨基酸序列的理化性质、疏水性/
亲水性、导肽、跨膜区域、二级结构及高级结构等进
行预测和分析,并对NRT 蛋白构建系统进化树,为
研究硝酸转运蛋白的工作机制奠定分子基础.
1 材料与方法
1.1植物材料及NRT序列来源
植物材料来自浙江华顶山的云锦杜鹃种子.消
毒后播种于1/2read琼脂培养基中培养两个月,将
小苗转接至混合 MMN(氮源为Ca(NO3)2)营养液
的基质中(草炭∶沙子=2∶1),其中一半实生苗转
接时接种菌株19(杜鹃花类菌根真菌),另一半不进
行接种处理.接种6周采集植物根系,进行转录组
测序.然后对接种与未接种的根系转录组做差异分
析,得到接种苗根系中显著差异表达的基因.
NRT(硝酸根转运蛋白)基因序列即来源于云
锦杜鹃根系接种苗中显著差异表达的基因,unigeG
neID:CL5793.Contig1_Al.
1.2方法
预测:NRT 基因编码蛋白的理化性质采用
Protparam程序;疏水性/亲水性采用ProtScale程
序;导肽采用SignalP程序;跨膜结构域采用 TMG
Pred程序;蛋白质二级结构采用GOR4程序;蛋白
质亚细胞定位采用 WOLFPSORT程序;蛋白质功
能域搜索用BLAST程序;蛋白质三维结构分析用
Phyre2程序和PyMOL软件;核苷酸序列和氨基酸
序列搜索用在线分析工具blastn;进化树的构建采
用软件clustalX和 MEGA4.1.
2 结果与分析
2.1氨基酸序列的理化性质分析
利用在线分析程序 Protparam(Gasteigeret
al.,2005)对云锦杜鹃的硝酸根转运蛋白基因所对
应的氨基酸序列的理化性质进行分析.结果表明,
硝酸根转运蛋白基因所对应的氨基酸数目为200
个,分子量为22073.0,理论等电点为8.15,氨基酸
组成如图1所示,负电荷氨基酸残基总数(Asp+
Glu)为16,正电荷氨基酸残基总数(Arg+Lys)为
18.不稳定系数为23.53,此等级认为是稳定蛋白.
脂肪系数为77.45,总平均输水性为G0.068.
图1 云锦杜鹃硝酸根转运蛋白的氨基酸组成
Fig.1 AminoacidcompositionofthededucedNRT
peptidesegmentfromRhododendronfortunei
2.2疏水性/亲水性的预测和分析
氨基酸的亲疏水性在一定程度上反映蛋白质的
折叠情况,此外,蛋白质疏水区域可以作为评判潜在
跨膜区的参考依据.因而对氨基酸的疏水性/亲水
性的预测和分析具有重要的意义.利用在线分析程
序 ProtScale(Gasteigeretal.,2005)的 Kyte &
Doolittle算法对云锦杜鹃硝酸根转运蛋白的进行亲
水/疏水性分析(正值表示疏水性,负值表示亲水性,
介于+0.5~-0.5之间主要为两性氨基酸).图2
预测结果表明,云锦杜鹃硝酸根转运蛋白有两个明
显的疏水区,分别为5~21,174~191;4个明显的亲
水区,分别为58~71,85~101,112~114,151~
158.
2.3导肽的预测和分析
利用在线分析工具 SignalP(Henriketal.,
1997)的神经网络算法对云锦杜鹃的硝酸根转运蛋
白进行预测.表1结果表明,云锦杜鹃的硝酸根转
运蛋白序列包含信号肽,长度为22个氨基酸,为分
泌途径蛋白.
2.4跨膜结构的预测和分析
利用在线工具TMPred(Hofmannetal.,1993)
对云锦杜鹃硝酸根转运蛋白序列进行跨膜结构分析,
3422期 魏翔莺等:云锦杜鹃NRT 基因序列的生物信息学分析
图2 云锦杜鹃硝酸根转运蛋白的亲疏水性分析
Fig.2 Predictedhydrophobicity/hydrophilicity
forNRTinRhododendronfortunei
表1 云锦杜鹃硝酸根转运蛋白序列导肽的预测
Table1PredictedsignalpeptideofNRT
proteininRhododendronfortunei
Name Len cTP mTP SP other Loc RC TPlen
Sequence 200 0.007 0.065 0.968 0.063 S 1 22
Cutoff 0.000 0.000 0.000 0.000
结果表明(图3),该蛋白序列存在一种可靠的跨膜
结构模型.该模型认为,N端处在膜里面,第1个跨
膜螺旋从第3位氨基酸开始,到第21位氨基酸结
束,相对膜的取向是由里到外;第2个跨膜螺旋从第
175位氨基酸开始,到第194位氨基酸结束,相对膜
的取向是由外到里.
2.5亚细胞定位预测
利用程序wolfpsort分别对云锦杜鹃的NRT
蛋白的亚细胞定位进行分析,结果表明如表2所示,
NRT 蛋白在细胞质中的分值最高,推测该蛋白定
位细胞质膜,行使氮转运功能.
表2 云锦杜鹃的NRT蛋白的亚细胞定位进行分析
Table2 Proteinsubcelularlocalizationanalysis
ofNRTfromRhododendronfortunei
Loc plas nucl chlo vacu extr
Score 5.0 3.0 2.0 2.0 1.0
2.6蛋白质二级结构的预测和分析
采用GOR4(Garnieretal.,1978)分析葡萄的
类黄酮GOG葡萄糖基转移酶蛋白的二级结构,结果表
明(图 4),该蛋白由 11%αG螺旋(alphahelix)、
29.50%延伸链(extendedstrand)和59.50%无规则
卷曲(randomcoil)所组成.
图3 云锦杜鹃NRT 蛋白的跨膜区域预测
Fig.3 Predictedtransmembranesegmentsfor
NRTinRhododendronfortunei
2.7蛋白质三维结构分析
利用在线分析工具 Phyre2(Keleyetal.,
2009),对云锦杜鹃NRT 蛋白的氨基酸序列进行线
串法预测(该方法是将待测序列“穿”入已知蛋白质
的基本骨架内,通过计算各种折叠的概率,来预测蛋
白质核心结构)蛋白质折叠,用PyMOL对建模结果
进行处理,结果如图5:A所示.
2.8植物中NRT 核苷酸序列相似性比对与蛋白系
统进化分析
通过blastn对NRT 核苷酸序列在NCBI上进
行同源性搜索,结果表明(图6)云锦杜鹃的NRT 核
苷酸序列与杨毛果(Populustrichocarpa)、蓖麻
(Ricinuscommunis)、野草莓(FragariavescasubG
sp.Vesca)、葡萄(Vitisvinifera)、黄瓜(CucumissaG
tivus)、大豆(Glycinemax)、鹰嘴豆(CicerarietiG
num)、百脉根(Lotusjaponicas)和二柄蕙叶草
(Brachypodiumdistachyon)等植物的 NRT 核苷
酸序列有较高的同源性,分别为69%、68%、67%、
70%、67%、68%、67%、67%、76%.用 clustalX
(Thompsonetal.,1997)和 MEGA4.0(Tamuraet
al.,2007)对云锦杜鹃、杨毛果 (XM_002336362)、
蓖麻(XM_002511259)、野草莓(XM_004300968)、
葡萄(XM_002279825)、黄瓜(XM_004157728)、大
豆(XM_003549774)、鹰嘴豆(XM_004515804)、百
脉根(AB353299)和二柄蕙叶草 (XM_003575234)
的NRT 氨基酸进行多序列比对,构建系统进化树,
采用default参数,自检举1000次,结果如图7所
示.10个物种的NRT 基因分为3个大类.其中杨
毛果、蓖麻、野草莓、葡萄和云锦杜鹃聚为一大类,在
442 广 西 植 物 34卷
图4 云锦杜鹃NRT 蛋白的二级结构预测 h.αG螺旋;e.βG折叠延伸链;L.βG转角;c.无规则卷曲.
Fig.4 SecondarystructurepredictionofNRTinRhododendronfortunei
h.Alphahelix;e.BetasheetExtendedstrand;L.Betaturn;c.Randomcoil.
这个大类中又分为两个亚类,云锦杜鹃和葡萄为一
亚个类,杨毛果和蓖麻为一个亚类.黄瓜、大豆、鹰
嘴豆以及百脉根聚为另一大类,其中大豆、鹰嘴豆以
及百脉根为大类里面的一个亚类.而禾本科的二柄
蕙叶草单独为一类.
3 结论与讨论
硝酸盐转运体蛋白在植物体内行使硝酸根吸收
与转运的功能,因而被广泛的研究和关注.本研究
用生物信息学方法对云锦杜鹃根转录组的硝酸根转
运蛋白基因的核苷酸序列以及所对应的氨基酸序列
进行分析.结果表明云锦杜鹃NRT 蛋白为稳定蛋
白,推测主要因为该蛋白在植物根系充当硝酸盐转
运功能.跨膜结构分析表明,该蛋白存在两个跨膜
结构,一个位于N端第3至第21个氨基酸内,另一
个位于175~194个氨基酸内.跨膜结构分析结果
与Phyre2分析结果一致,亲疏水分析表明,两个跨
膜区域的位置存在两个明显的疏水区;此外,预测的
信号肽也落在了N端的跨膜结构区域,四个分析软
件的结果相互支持.Brianetal.(2000)曾对大麦的
NRT 蛋白做过预测分析,认为大麦的NRT 蛋白存
在12个跨膜结构.最近,我国著名结构生物学家施
一公研究团队,解析细菌硝酸盐转运蛋白晶体结构,
认为细菌硝酸盐转运蛋白存在10个跨膜结构共同
组成硝酸盐运输路径(Hanchietal.,2013).本次
数据分析与大麦以及细菌的NRT 蛋白的跨膜结构
存在如此差异,推测可能由于NRT 蛋白是一个家
族蛋白,由于可变剪切的结果.二级结构分析表明,
云锦杜鹃NRT 蛋白质二级结构元件主要由αG螺
旋、延伸链和无规则卷曲所组成,这一分析结果跟用
Phyre2在二级结构分析结果比较一致.通过
blastn对NRT 核苷酸序列在NCBI上进行同源性
搜索,结果表明云锦杜鹃的NRT 核苷酸序列与杨
毛果、蓖麻、野草莓、葡萄、黄瓜、大豆、鹰嘴豆、百脉
根和二柄蕙叶草等植物的NRT 核苷酸序列有很高
的同源性.系统进化分析表明,云锦杜鹃的 NRT
蛋白在进化上与葡萄关系最近,与禾本科的单子叶
5422期 魏翔莺等:云锦杜鹃NRT 基因序列的生物信息学分析
图5 利用Phyre2程序对推导的云锦杜鹃NRT 蛋白结构预测 A.3D模型;B.二级结构;C.跨膜结构
Fig.5 StructurepredictionofthededucedNRTproteinsfromRhododendronfortuneiusingPhyre2 A.3DMODEL;B.SecG
ondarystructure;C.Transmembranestructure
植物关系最远,这一点与植物学传统分类相似.
本文通过对NRT 基因的分析,得到了该基因
的蛋白结构特征信息,初步了解了该基因在云锦杜
鹃根系中行驶的功能,这预示了该基因在根系中主
要从事对硝酸盐的转运,对云锦杜鹃根系吸收硝酸
盐的意义重大.而硝酸盐是旱作土壤中的主要无机
氮源,可以推测该基因可能是植物对生命元素———
氮素吸收的关键基因,对植物的生长发挥举足轻重
的作用.为后续基因功能验证提供了有力的生物信
息学基础.
642 广 西 植 物 34卷
图6 利用blastn对云锦杜鹃NRT 核苷酸序列比对结果
Fig.6 ResultsofalignmentofNRTfromRhododendronfortuneiusingblastn
图7 植物中NRT 蛋白系统进化分析
Fig.7 PhylogeneticanalysisofNRTproteinsinplants
参考文献:
BianCM(边才苗),JinZX(金则新).2005.StudiesonfloraldyG
namicandbreedingsystemofRhododendronfortunei(云锦杜鹃
的开花动态与繁育系统研究)[J].Guihaia(广西植物),25(2):
169-173
BrianG.Forde.2000.Nitratetransportersinplants :strucG
ture,functionandregulation[J].Biochem BiophysActa,
1465:219-235
DApuzzoE,RogatoA,SimonGRosinU,etal.2004.CharacterizaG
tionofthreefunctionalhighGaffinityammoniumtransportersin
Lotusjaponicuswithdifferentialtranscriptionalregulationand
spatialexpression[J].PlantPhysiol,134:1763-1774
FangYY(方云亿).1989.TheFloraofZhejiangVol.5(浙江植物
志第5卷)[M].Hangzhou(杭州):ZhejiangScienceandTechG
nologyPress(浙江科学技术出版社):9210
GarnierJ,OsguthorpeDJ,RobsonB.1978.AnalysisoftheacG
curacyandimplicationsofsimplemethodsforpredictingthe
secondarystructureofglobularproteins[J].J MolBiol
Mar,120(1):97-120
GasteigerE,HooglandC,GattikerA,etal.2005.ProteinIdentifiG
cationand AnalysisToolsontheExPASyServer//John M,
Walker(ed).TheProteomicsProtocolsHandbook[M].Humana
Press:571-607
HenrikN,JacobE,SØren,etal.1997.Identificationofprokaryotic
andeukaryoticsignalpeptidesandpredictionoftheircleavage
sites[J].ProtEng,10:1-6
HofmannK,StoffelW.1993.TMbaseGAdatabaseofmemG
branespanningproteinssegments[J].BiolChem,374:166
JinZX(金则新),LiJM(李钧敏),GuQP(顾奇萍).2006.GeG
neticdiversityinthenaturalpopulationsofrhododendron
fortuneirevealedbyISSRmolecularmarkers(云锦杜鹃自然
居群遗传多样性的ISSR分析)[J].ActaHortSin(园艺学
报),33(6):1263-1267
KeleyLA,SternbergMJE.2009.Proteinstructurepredictionon
theweb:acasestudyusingthePhyreserver[J].NatureProtoG
cols,4:363-371
LauterFR,NinnemannO,BucherM,etal.1996.PreferentialexG
pressionofanammoniumtransporterandoftwoputativenitrate
transportersinroothairsoftomato[J].ProcNatAcadSci
(USA),93:8139-8144
LiJM(李钧敏),JinZX(金则新),YangBF(杨蓓芬).2004.The
contentandanalysisofthecomponentsofflavonoidsinRhodoG
dendronfortunei(云锦杜鹃总黄酮含量及成分分析)[J].J
NorthwestForUniv(西北林学院学报),19(1):110-112
PearsonJN,FinnemannJ,SchjoerringJK .2002.Regulationof
thehighGaffinityammoniumtransporter(BnAMT1,2)inthe
leavesofBrassicanapusbynitrogenstatus[J].PlantMol
Biol,49:483-490
SuenagaA,MoriyaK,SonodaY,etal.2003.ConstitutiveexpresG
sionofanoveltypeammoniumtransporterOsAMT2inrice
plants[J].PlantCellPhysiol,44:206-211
TamuraK,DudleyJ,NeiM,etal.2007.MEGA4:MolecularEvoG
lutionaryGeneticsAnalysis(MEGA)softwareversion4.0[J].
MolBiolEvol,24:1596-1599
YanHC,HuangWY,YanCY,etal.2013.StructureandmechaG
nismofanitratetransporter[J].CellReports3,28:716-723
(下转第147页Continueonpage147)
7422期 魏翔莺等:云锦杜鹃NRT 基因序列的生物信息学分析