免费文献传递   相关文献

毛竹细胞色素P450的基因组学分析



全 文 :植物生理学报 Plant Physiology Journal 2014, 50 (9): 1387~1400  doi: 10.13592/j.cnki.ppj.2014.0205 1387
收稿 2014-04-28  修定 2014-07-29
资助 国家自然科学基金(31270645和31170565)和浙江省自然科
学基金杰出青年项目(LR12C16001)。
* 通讯作者(E-mail: zmbin@163.com; Tel: 0571-63743869)。
毛竹细胞色素P450的基因组学分析
林翩翩1, 白有煌2, 周明兵1,*
1浙江农林大学亚热带森林培育国家重点实验室培育基地, 浙江临安311300; 2浙江大学生命科学学院生物信息学系, 杭州
310000
摘要: 细胞色素P450单加氧酶(P450s)是一类在450 nm处有特征吸收峰的血红素硫蛋白基因超家族, 在许多物质代谢中至关
重要, 还与解毒代谢密切相关。在毛竹基因组中鉴定出41个P450家族, 共197个成员, 涉及10个基因簇(clan)。通过基因结
构与进化树的比较, 进一步了解结构与进化之间的联系。通过与水稻和拟南芥一起构建的进化树, 分析了毛竹P450基因家
族的差异性。二级结构分析表明, 毛竹P450蛋白序列同样具备有P450蛋白特征性结构域。在毛竹中, 共有104个P450基因
能够在不同生长发育时期有不同程度的表达。
关键词: 毛竹; 细胞色素P450; 基因结构; 系统进化树; 进化
Genomics Analysis of Cytochrome P450 Monooxygenase Genes in Phyllostachys
heterocycla
LIN Pian-Pian1, BAI You-Huang2, ZHOU Ming-Bing1,*
1The Nurturing Station for the State Key Laboratory of Subtropical Sil-Viculture, Zhejiang A & F University, Lin’an, Zhejiang
311300, China; 2Bioinformatics Department, College of Life Sciences, Zhejiang University, Hangzhou 310000, China
Abstract: Cytochrome P450 monooxygenase is theheme-sulfur protein’s gene superfamily, with the character-
istic absorption peak in 450 nm, which palys an important role in the metabolism of many substrates and is in-
volved into the metabolism of detoxification. The 197 P450 genes that belonged to 41 families and 10 clans
were identified in Phyllostachys heterocycla genome. The comparison between gene structure and tree showed
the relation between them. The tree of P450 in P. heterocycla, Oryza sativa and Arabidopsis thaliana indicated
the differences of P. heterocycla’s P450 superfamily. The secondary structure showed that all P. heterocycla
P450 sequences also contained the typical conserved domains. In P. heterocycla, there were 104 P450 genes
with different expression levels in different growth periods.
Key words: Phyllostachys heterocycla; cytochrome P450 monooxygenase; gene structure; phylogenetic tree; evolution
细胞色素P450单加氧酶(cytochrome P450
monooxygenases, P450s)在生物进化的过程中, 广
泛存在于各种形式的生命体中 , 包括动物、植
物、真菌和细菌, 其单一的祖先蛋白已实现了多
元化(Omura 1999)。植物P450参与许多植物体内
的初级和次级代谢反应 , 并发挥重要的催化作
用。其催化反应的底物包括内源性物质 , 如脂
类、黄酮类、萜类、生物碱类等以及外源性物质,
如农药、除草剂等(涂珺等2003)。其主要的功能
是参与植物次生物质合成以及代谢解毒的过程,
另外一些P450可能可以催化某些无毒性物质转变
为有毒性物质(解敏敏等2013)。P450底物与功能
的多样性是为了适应各种组织中不同的代谢途径
和环境胁迫而进化的结果(Fu 2009)。
P450s的命名系统是基于各成员之间蛋白质
序列的相似程度以及在系统进化树中的进化关系,
且以后者为主(Nelson 2006)。名称中的第1个数字
为家族编号, 第1个大写英文字母为亚家族编号。
氨基酸序列相似性大于40%的序列可被归入同一
家族, 相似性大于55%的序列可被归入同一亚家族
(Nelson 2006)。单子叶植物纲中有48个CYP家族:
CYP51、CYP71~79、CYP81、CYP84~90、
CYP92~94、CYP96~99、CYP701、CYP703~704、
CYP706~707、CYP709~711、CYP714~715、
CYP721~724和CYP727~735 (Nelson等2004)。其
植物生理学报1388
中, CYP71是植物中最大的家族, 水稻中的该家族
有84个成员; CYP51和CYP74均被认为是植物中起
源较早的P450家族之一。
毛竹属竹亚科刚竹属植物 , 是我国栽培悠
久、面积最广和经济价值最重要的竹种。Peng等
(2013)发布了毛竹基因组序列, 为毛竹基因功能的
研究提供了重要基础性数据。本研究以毛竹基因
组数据为基础, 利用生物信息学技术和手段, 对毛
竹基因组中的P450基因家族进行系统的鉴定, 并
对毛竹P450基因家族的类别、结构、进化以及表
达特性开展了系统的研究, 以期为研究毛竹P450
基因的功能奠定基础。
材料与方法
1 毛竹P450基因的鉴定
从Genome of Moso Bamboo数据库(http://202.
127.18.221/bamboo/down.php)下载毛竹(Phyl-
lostachys heterocycla Carr.)的基因序列数据和氨基
酸序列数据。根据植物P450基因的分类原则, 每
个亚家族选择代表性P450蛋白序列与毛竹基因组
数据进行TBLASTN比对, 得到的P450基因组区域
采用基因预测软件Fgenesh预测可能的毛竹P450s
基因。对所获得的P450s基因通过blastp比对进一
步确认。将预测的P450s基因提交国际P450s命名
委员会给予正式命名。
2 毛竹基因组P450基因结构分析与进化树构建
根据毛竹P450基因CDS序列(coding sequence),
可计算出每条P450基因序列中的内含子数并获得
其在序列中的精确位置, 从而获得P450基因的“内
含子-外显子”基因组织方式。通过MUSCLE对所
鉴定的P450氨基酸序列比对(Edgar 2004), 利用
MEGA 5.2软件测试毛竹P450基因的氨基酸序列构
建系统发育树的最佳模型, 根据最佳模型(Nei和
Kumar 2000), 分别采用MEGA 5.2软件中最大似然
法(maximum likelihood, ML) (Tamura等2011)和mr-
bayes软件(3.2.1版本)贝叶斯法(Bayesian) (Graha和
Peterson 1999)构建了进化树, 重复次数为1 000次。
3 毛竹、水稻和拟南芥P450系统进化树的构建
从P450数据库下载水稻(Oryza sativa L.) P450
蛋白氨基酸序列299条和拟南芥(Arabidopsis thaliana
L.)蛋白氨基酸序列257条(http://drnelson.uthsc.edu/
CytochromeP450.html, Nelson 2009), 利用MEGA
5.2软件测试水稻、拟南芥和毛竹P450蛋白氨基酸
序列构建系统发育树的最佳模型, 根据最佳模型
(Nei和Kumar 2000), 分别采用MEGA 5.2软件中最
大似然法(Tamura等2011)和mrbayes软件(3.2.1版
本)贝叶斯法(Graha和Peterson 1999)构建了进化树,
重复次数为1 000次。
4 多序列比对及毛竹二级结构元件分析
拟南芥P450基因AtAOS (CYP74A)是植物界中
第1个晶体结构已被解析的P450家族(Nelson和
Werck-Reichhart 2011)。对该基因结构与功能的研
究已经比较透彻和全面, 所以我们以该基因的氨
基酸序列为模板, 对毛竹P450基因的二级结构进
行分析。选择代表性的毛竹P450基因氨基酸序列
和拟南芥P450基因AtAOS氨基酸序列, 使用Clust-
alW软件进行多序列比对, 以AtAOS的二级结构作
为模板分析毛竹P450基因氨基酸序列二级结构
元件。
5 毛竹P450s家族基因的表达谱分析
用于分析表达谱的有关的RNA-seq数据从
EMBL网站下载(检索号为ERP001341)。RNA-seq
数据分别来自7个毛竹组织的转录本: 嫩叶、根
茎、根、高度为20 cm幼笋、高度为50 cm幼笋和2
个开花组织(早期圆锥花序和开花期的圆锥花序),
前5个组织来源同一棵毛竹, 后2个材料来自不同
棵的毛竹。
通过FastQC对RNA-seq数据质量进行评估;
使用Bowite将高质量的读段序列定位匹配到毛竹
基因组上(Langmead等2009), 然后将形成的SAM
文件用于评估每个文库中双端测序的插入片段大
小。基于已评估的插入序列的大小, 使用Tophat2
将序列与毛竹基因组重新定位匹配(Kim等2011);
用转录组从头拼接软件Cufflinks将分离的定位匹
配到毛竹基因组上的读段序列拼接成转录本 ,
并将该转录本整合到参考的转录本中(Trapnell等
2013); 利用Cluter 3.0进行层次聚类分析 , 用
Treeview软件将数据结果可视化(Eisen等1998)。
实验结果
1 毛竹基因组P450的鉴定
在毛竹基因组数据中搜索, 共得到198条预测
林翩翩等: 毛竹细胞色素P450的基因组学分析 1389
的P450s基因序列, 剔除一些过短片段(26条, 氨基
酸序列<239)、12条干扰序列和2条错误预测序
列。Blastp比对发现有2个基因序列(序列号为
PH01004659G0030和PH01002432G0280)含2个不
同家族的P450s基因, 更新它们基因区域, 最终获得
160个预测P450s基因(表1)。
在毛竹中并未出现新的P450家族。这160个
P450s归属于38个家族和25个亚家族, 分布于144个
scaffolds, 在每个scaffold中不超过3个成员(几乎所
有的P450s基因都位于不同的scaffolds)。序列号为
PH01004659G0030和PH01002432G0280的基因阅
读框中均存在2个P450基因(分别是CYP71K24和
CYP71K25; CYP71P3a和CYP71P4)。但是也有一
些P450在基因组会串联分布 , 如 : 在scaffo ld
PH01002113上, CYP72A284和CYP72A285毗邻相
连; 这样分布模式的还有CYP72A286、CYP72A287
和CYP72A288 (PH01001647), CYP81A30、CY-
P81A31和CYP81A32 (PH01001042), CYP89B21和
CYP89B22 (PH01000230), CYP92A67、CYP92A68
和CYP92A69 (PH01000533) , CYP709E6和
CYP709E7 (PH01001981)。
2 毛竹基因组P450基因结构与进化
基于毛竹160个P450基因的氨基酸序列, 以
WAG+G+F为模型, 采用最大似然法和贝叶斯法构
建了P450s系统进化树。2种方法构建的进化树非
常相似, 图1显示的是通过ML法构建的进化树。
该进化树包含已报道的陆生植物界9个P450基因
簇(Nelson 2004), 无CYP746基因簇和CYP711基因
簇。其中, CYP71基因簇含15个家族, 是毛竹中所
含家族类型最多的一个基因簇; CYP85基因簇次
之 , 含9个家族; CYP51、CYP710、CYP711、
CYP727、CYP74和CYP97为单家族基因簇。在毛
竹38个家族中, 最大的家族为CYP71, 含22个P450
基因; CYP94和CYP72次之, 分别含12个和9个P450
基因 ; 而最小的家族仅含1个P 4 5 0基因 (家族
CYP87、CYP703、CYP722和CYP733)。
根据P450s基因在毛竹基因组分布, 获得P450
基因的“内含子-外显子”基因组织方式(图2)。同一
亚家族中的P450s基因结构较相似, 内含子分布较
保守, 其中还存在基因结构几乎完全相同的序列
(CYP72A284和CYP72A285; CYP78A102和CY-
P78A103; CYP94E6和CYP94E7; CYP99A30和CY-
P99A31; CYP714B8和CYP714B9)。另外, 进化距离
相近的P450基因所含内含子数目相对稳定。总观
可知, 内含子数目较少的序列在进化树中聚集在
一块(图2中蓝色表示部分), 内含子数目较多的同
样聚集在一块(图2中紫色标记部分)。CYP97家族
平均每个成员所含内含子数最多, 为11个, 其中,
CYP97B31基因序列中含13个内含子, 是毛竹中含
内含子数目最多的一个成员; 不含内含子的P450s
基因共27个。CYP86基因簇有12个P450基因不含
内含子, 是不含内含子基因的数量最大的一个基
因簇。
3 毛竹与水稻和拟南芥P450基因的比较
从毛竹、水稻和拟南芥3个物种构建的系统
进化树(图3)可看出 , 与双子叶植物纲的拟南芥
P450家族相比较, 单子叶植物纲的水稻和毛竹中
均不存在CYP702、CYP705、CYP708、CYP716、
CYP712、CYP718、CYP720和CYP82这8个P450家
族(已用蓝色字体标注), 表明这些基因可能是单双
子叶物种分化后在毛竹和水稻中发生了缺失。拟
南芥中不存在CYP727、CYP728、CYP733、
CYP92和CYP99这5个家族(已用深红色字体标注),
同样表明这些基因可能是单双子叶物种分化后在
拟南芥中发生了缺失。毛竹中不存在CYP715、
CYP723、CYP729和CYP735这4个家族(已用橙色
字体标注), 而这4个家族都存在于水稻中。可能原
因是毛竹基因组草图不如水稻基因组草图精细,
遗漏了这些家族, 或者毛竹在进化过程中基因组
丢掉这些家族。
直系同源基因是由最近的祖先经过种系发生
而形成(时硕永和丁达夫2002)。根据毛竹、水稻
和拟南芥P450家族的系统进化树, 毛竹和水稻之
间可找出54对直系同源基因, 水稻和拟南芥之间
可找出4对直系同源基因, 在毛竹和拟南芥之间可
找出1对直系同源基因。该直系同源基因数目表
明, 在3个物种的进化中, 毛竹与水稻有较近的亲
缘关系, 而与拟南芥的亲缘关系较远。
4 毛竹P450s序列的功能结构域分析
为了更好的理解毛竹P450s结构和功能的相
关性, 本研究选择了毛竹5个P450s基因家族的5个
P450s基因(CYP71C101、CYP75B75、CYP78A102、
植物生理学报1390
表1 160个毛竹P450基因的ID、类别以及在scaffold位置
Table 1 The information of 160 P450 genes in P. heterocycla, including gene ID, classification, and scaffold location
编号 序列号 细胞色素P450命名 scaffold号 scaffold位置 正(+)/负(-)链
1 PH01004659G0030*(b) CYP71K24 PH01004659 4853~6940 +
2 PH01004659G0030*(a) CYP71K25 PH01004659 7594~9869 +
3 PH01002988G0090 CYP71K27 PH01002988 72283~77345 -
4 PH01001515G0010 CYP71AM3 PH01001515 12574~13202 -
5 PH01002630G0210 CYP71X19 PH01002630 133766~137875 -
6 PH01002965G0180 CYP71W10 PH01002965 110232~114274 +
7 PH01000781G0820 CYP71AA11 PH01000781 481705~483549 -
8 PH01001325G0220 CYP71Z15 PH01001325 139022~143813 -
9 PH01000677G0610 CYP99A30 PH01000677 446400~448987 +
10 PH01000100G1750 CYP99A31 PH01000100 1201203~1203983 +
11 PH01006029G0090 CYP71V15 PH01006029 22983~26207 +
12 PH01003573G0090 CYP71Q6 PH01003573 61534~64936 -
13 PH01004889G0110 CYP71AK3 PH01004889 69149~72304 -
14 PH01000809G0460 CYP71P3b PH01000809 291984~293709 +
15 PH01002432G0280*(a) CYP71P3a PH01002432 203403~204824 +
16 PH01002432G0280*(b) CYP71P4 PH01002432 204857~207885 +
17 PH01000050G0080 CYP71BU5 PH01000050 36012~36514 +
18 PH01001074G0340 CYP71T20 PH01001074 217363~228774 -
19 PH01000641G0630 CYP71T23 PH01000641 446091~447096 -
20 PH01001124G0320 CYP71R7 PH01001124 240334~243213 -
21 PH01004998G0110 CYP71AD2 PH01004998 67733~72354 +
22 PH01001643G0210 CYP71C102 PH01001643 156772~164078 +
23 PH01000487G0060 CYP71C96 PH01002020 28804~31953 -
24 PH01005995G0020 CYP71C101 PH01005995 12474~14409 +
25 PH01000012G2270 CYP84A54 PH01000012 1484592~1488754 -
26 PH01003824G0130 CYP84A55 PH01003824 114472~116970 +
27 PH01220725G0010 CYP84A56 PH01220725 5~586 -
28 PH01001046G0290 CYP703A17 PH01001046 201859~204447 -
29 PH01001536G0090 CYP98A71 PH01001536 63336~69544 -
30 PH01001724G0360 CYP98A72 PH01001724 220013~225561 +
31 PH01001637G0210 CYP98A73 PH01001637 147057~151091 +
32 PH01002615G0190 CYP92C7 PH01002615 112373~114663 -
33 PH01000926G0660 CYP92A65 PH01000926 445294~447135 +
34 PH01000052G1210 CYP92A66 PH01000052 834773~836655 -
35 PH01000533G0270 CYP92A67 PH01000533 174931~180641 +
36 PH01000533G0200 CYP92A68 PH01000533 124580~126972 +
37 PH01000533G0230 CYP92A69 PH01000533 147474~149423 +
38 PH01000052G1300 CYP92A70 PH01000052 906748~910093 -
39 PH01000926G0600 CYP92A71 PH01000926 387321~390171 -
40 PH01001162G0240 CYP93G8 PH01001162 148498~152784 +
41 PH01000832G0680 CYP93G9 PH01000832 417545~419544 +
42 PH01002037G0040 CYP76Q3 PH01002037 19392~21800 +
43 PH01000516G0700 CYP76P10 PH01000516 599532~604984 +
44 PH01002485G0110 CYP76H22 PH01002485 80142~84454 -
45 PH01001730G0080 CYP75B75 PH01001730 54145~56111 +
46 PH01002200G0250 CYP75B76 PH01002200 217459~218542 +
47 PH01000427G0130 CYP706C32 PH01000427 90886~93011 +
48 PH01001430G0300 CYP706C33 PH01001430 214218~216548 +
49 PH01000960G0590 CYP78A104 PH01000960 356043~358795 +
50 PH01000278G0620 CYP78A106 PH01000278 528840~533291 -
林翩翩等: 毛竹细胞色素P450的基因组学分析 1391
编号 序列号 细胞色素P450命名 scaffold号 scaffold位置 正(+)/负(-)链
51 PH01002138G0280 CYP78A105 PH01002138 219110~221274 -
52 PH01000894G0770 CYP78A102 PH01000894 438478~441059 -
53 PH01004339G0030 CYP78A103 PH01004339 5341~7713 -
54 PH01000488G0690 CYP81M2 PH01000488 588426~590894 -
55 PH01000549G0160 CYP81A33 PH01000549 99730~101897 -
56 PH01001042G0270 CYP81A32 PH01001042 197156~200164 +
57 PH01001042G0220 CYP81A30 PH01001042 172330~176619 -
58 PH01001042G0320 CYP81A31 PH01001042 238004~241727 +
59 PH01004292G0050 CYP73A116 PH01004292 29707~32060 -
60 PH01201886G0010 CYP73A117 PH01201886 41~358 +
61 PH01000112G1050 CYP73A113 PH01000112 770363~773428 -
62 PH01000009G1900 CYP73A112 PH01000009 1222274~1225004 -
63 PH01003632G0100 CYP73A114 PH01003632 93425~98193 +
64 PH01002285G0270 CYP73A115 PH01002285 206983~211938 +
65 PH01000378G0230 CYP77A25 PH01000378 129917~134153 -
66 PH01001785G0160 CYP77B16b PH01001785 93900~96300 -
67 PH01003941G0030 CYP77B16a PH01003941 19020~20485 +
68 PH01000304G0910 CYP89H2 PH01000304 709009~711501 +
69 PH01000508G0300 CYP89C6 PH01000508 221343~223377 -
70 PH01000833G0540 CYP89B20 PH01000833 430971~434929 -
71 PH01000230G0880 CYP89B21 PH01000230 642675~644401 +
72 PH01000230G1090 CYP89B22 PH01000230 753774~755982 +
73 PH01003541G0100 CYP94B42 PH01003541 53123~54950 +
74 PH01001230G0110 CYP94B43 PH01001230 76944~78859 +
75 PH01000956G0430 CYP94B44 PH01000956 324169~326632 -
76 PH01000029G0270 CYP94D42 PH01000029 147415~149017 +
77 PH01001281G0070 CYP94D43 PH01001281 56808~58876 +
78 PH01001183G0080 CYP94E6 PH01001183 53511~56565 +
79 PH01001355G0430 CYP94E7 PH01001355 311665~314650 -
80 PH01001318G0180 CYP94C43 PH01001318 101638~103793 +
81 PH01000870G0140 CYP94C44 PH01000870 70637~72315 -
82 PH01002614G0060 CYP94C45 PH01002614 41169~44969 +
83 PH01003363G0020 CYP94C46 PH01003363 12466~14256 -
84 PH01002709G0230 CYP94C47 PH01002709 152204~153924 +
85 PH01000010G0990 CYP96B19 PH01000010 686342~689497 +
86 PH01000344G0730 CYP96B20 PH01000344 695694~697901 +
87 PH01000010G0850 CYP96B21 PH01000010 596552~600018 +
88 PH01005298G0050 CYP96D4 PH01005298 21014~23231 +
89 PH01000004G3680 CYP86A79 PH01000004 2364600~2366603 -
90 PH01000000G5960 CYP86A81 PH01000000 3871966~3873864 +
91 PH01001872G0340 CYP86A78 PH01001872 218230~220288 +
92 PH01225068G0010 CYP86A80 PH01225068 16~585 +
93 PH01000272G0400 CYP86A82 PH01000272 244627~247094 -
94 PH01000708G0750 CYP704A88 PH01000708 452825~459584 -
95 PH01004214G0120 CYP704A89 PH01004214 55768~59343 +
96 PH01000505G0440 CYP704A90 PH01000505 275426~279199 +
97 PH01000123G0400 CYP97B31 PH01000123 280129~287640 -
98 PH01000170G0690 CYP97C25 PH01000170 443043~449722 +
99 PH01000826G0610 CYP97A36 PH01000826 385161~390114 +
100 PH01001580G0080 CYP97A37 PH01001580 38452~45224 +
101 PH01000436G0130 CYP727A9 PH01000436 108716~114659 -
102 PH01000182G1280 CYP727A11 PH01000182 840676~843766 -
表1 (续1)
植物生理学报1392
编号 序列号 细胞色素P450命名 scaffold号 scaffold位置 正(+)/负(-)链
103 PH01000591G0920 CYP727A10 PH01000591 602704~610419 -
104 PH01000542G0390 CYP714B8 PH01000542 309682~312205 -
105 PH01001459G0370 CYP714B9 PH01001459 264527~268055 -
106 PH01000261G0580 CYP714D4 PH01000261 329974~331405 +
107 PH01000009G1290 CYP714D5 PH01000009 820681~823392 -
108 PH01004063G0180 CYP714C10 PH01004063 93247~96196 +
109 PH01003063G0300 CYP714C8 PH01003063 167845~171849 -
110 PH01004732G0010 CYP714C9 PH01004732 8437~11566 -
111 PH01002113G0300 CYP72A284 PH01002113 207581~210634 -
112 PH01002113G0350 CYP72A285 PH01002113 230430~234300 -
113 PH01001008G0510 CYP72A290 PH01001008 404424~406640 -
114 PH01004361G0080 CYP72A292 PH01004361 58514~67962 +
115 PH01001647G0320 CYP72A288 PH01001647 217654~221134 +
116 PH01001647G0020 CYP72A286 PH01001647 21629~24440 +
117 PH01001647G0300 CYP72A287 PH01001647 208033~210593 +
118 PH01003892G0010 CYP72A289 PH01003892 1702~7464 +
119 PH01003047G0150 CYP72A291 PH01003047 81039~84544 -
120 PH01001981G0270 CYP709E6 PH01001981 174365~178989 +
121 PH01001981G0280 CYP709E7 PH01001981 181551~184606 +
122 PH01000286G0010 CYP709C18 PH01000286 5263~8759 +
123 PH01001059G0450 CYP709C19 PH01001059 279908~284459 -
124 PH01000212G0800 CYP709C20 PH01000212 593691~598144 -
125 PH01000011G2710 CYP721B5 PH01000011 1795443~1799279 -
126 PH01002248G0320 CYP721B6 PH01002248 198317~203367 -
127 PH01002803G0230 CYP734A27 PH01002803 136914~140006 +
128 PH01001169G0340 CYP734A28 PH01001169 210566~214335 -
129 PH01001881G0030 CYP734A29 PH01001881 20644~24269 -
130 PH01001930G0270 CYP710A55 PH01001930 237747~239764 +
131 PH01005955G0010 CYP710A56 PH01005955 4988~6762 +
132 PH01000559G0940 CYP707A87 PH01000559 611928~616778 +
133 PH01000700G0300 CYP707A89 PH01000700 257431~263258 +
134 PH01000149G1190 CYP707A88 PH01000149 843547~848065 +
135 PH01000931G0650 CYP707A86 PH01000931 466634~470080 -
136 PH01000694G0750 CYP728C13 PH01000694 463702~467058 -
137 PH01002190G0080 CYP728A6 PH01002190 70250~74860 +
138 PH01006418G0010 CYP728B25 PH01006418 9784~11658 +
139 PH01000078G1830 CYP722B1 PH01000078 1193219~1197353 +
140 PH01004629G0100 CYP733A1 PH01004629 46975~50440 -
141 PH01000083G0900 CYP88A44 PH01000083 538700~547209 +
142 PH01000246G0620 CYP88A46 PH01000246 449153~452042 -
143 PH01003454G0070 CYP88A45 PH01003454 32644~36544 +
144 PH01000200G1170 CYP87B18 PH01000200 921406~926075 -
145 PH01000278G0580 CYP85A1a PH01000278 503019~506969 +
146 PH01001995G0390 CYP85A1b PH01001995 260556~265003 +
147 PH01002605G0130 CYP90D23 PH01002605 75474~83283 +
148 PH01003429G0090 CYP90D24 PH01003429 52593~63848 -
149 PH01003419G0030 CYP90A36 PH01003419 14923~17892 +
150 PH01001012G0570 CYP90B22 PH01001012 439198~445796 -
151 PH01000041G0270 CYP724B21 PH01000041 207640~211864 +
152 PH01000035G0830 CYP724B22 PH01000035 622368~626989 +
153 PH01002020G0360 CYP51H20 PH01002020 227522~230889 +
154 PH01001546G0080 CYP51G1a PH01001546 64798~69908 -
表1 (续2)
林翩翩等: 毛竹细胞色素P450的基因组学分析 1393
编号 序列号 细胞色素P450命名 scaffold号 scaffold位置 正(+)/负(-)链
155 PH01001298G0150 CYP51G1b PH01001298 77869~81790 +
156 PH01002899G0230 CYP74A32 PH01002899 160304~162263 -
157 PH01002490G0270 CYP74E5 PH01002490 207786~209490 +
158 PH01000019G1400 CYP74F4 PH01000019 1010842~1013815 +
159 PH01000193G0210 CYP74A30 PH01000193 158680~163596 +
160 PH01100083G0010 CYP74A31 PH01100083 148~996 +
相同scaffold号以同一颜色标记。既被标记为相同颜色, 又上下相连的是在基因组中串联的P450基因。
图1 毛竹P450基因的系统进化树
Fig.1 The phylogenetic tree of P450 in P. heterocycla
9个基因簇以不同的颜色表示。顺时针方向依次为紫红色: 基因簇CYP71; 蓝色: 基因簇CYP86; 橄榄色: 基因簇CYP97; 灰色: 基因
簇CYP727; 紫色: 基因簇CYP72; 青色: 基因簇CYP710; 酸橙色: 基因簇CYP85; 红色: 基因簇CYP51; 水绿色: 基因簇CYP74。
表1 (续3)
植物生理学报1394
图2 毛竹P450基因的进化树与基因结构比较
Fig.2 Phylogenetic tree and secondary structure comparison of P450 in P. heterocycla
右图中黑色条带代表外显子, 白色条带代表内含子。条带的长度代表碱基序列的长度, 蓝色的序列表示所含内含子数目较少, 紫色
的序列表示所含内含子数目较多。
林翩翩等: 毛竹细胞色素P450的基因组学分析 1395
CYP84A54和CYP89B20)与拟南芥P450s基因AtAOS
(CYP74A)进行多序列比对, 并以该拟南芥AtAOS
(CYP74A)基因的二级结构为模板, 来预测毛竹
P450s基因蛋白序列的二级结构域。
根据图4可知, P450典型的保守结构域也存在
于毛竹P450序列中。这些典型的保守结构域包括
PERF结构域(PXRX)、K螺旋(EXXR)和C末端的
血红素结合域(FXXGXXXCXG)。血红素结合域
是P450蛋白的特征结构, 该结构域中存在与铁元
素形成硫醇盐离子键的绝对保守的半胱氨酸残基
(Lee等2008)。多序列比对结果说明毛竹P450氨基
酸序列间存在严格一致性的氨基酸残基, 这些残
基通常分散于P450氨基酸序列中的5个区域。
P450中预测的6个底物识别位点(substrate recogni-
tion sites, SRS)通过诱导-契合机制识别底物并参
与接触配体, SRS的点突变会在很大程度上影响
P450s的识别与结合能力(王斌和李德远2009)。
5 毛竹P450s家族基因表达分析
在160个P450基因中, 有104个检测到在2个或
2个组织以上中表达, 以在叶中的表达量为参比(统
一标记为黑色), 7个样品的P450表达数据聚类分析
显示, 毛竹P450基因表达谱模式大致形成了4个不
同的类群(图5)。第一类基因在组织中的整体表达
水平较低, 但其中有17个基因在在早期花蕾和晚
图3 毛竹、水稻和拟南芥的P450系统进化树
Fig.3 The phylogenetic tree of P450 in P. heterocycla, O. sativa and Arabidopsis
红色树枝为毛竹的P450基因; 绿色树枝为水稻的P450基因; 蓝色树枝为拟南芥P450基因。蓝色字体标注的是毛竹和水稻中均不存
在的8个家族; 深红色字体标注的是拟南芥中不存在的5个家族; 橙色字体标注的是毛竹中不存在的4个家族。
植物生理学报1396
期花蕾中有非常高的表达量, 以CYP51H20、CY-
P71C96、CYP81A30和CYP96B20最为显著。第二
类基因在各个组织中痕量表达, 其中CYP92A66、
CYP76H22、CYP89C6、CYP94D42、CYP99A30、
图4 毛竹代表性P450s和AtAOS的多序列比对
Fig.4 Alignment of representive P450s in P. heterocycla and AtAOS
第一行基于AtAOS的结构标注毛竹代表性P450序列的二级结构元件。灰色覆盖区表示严格一致性的氨基酸残基。粗线黑框表示
预测的SRSs区域。
林翩翩等: 毛竹细胞色素P450的基因组学分析 1397
图5 毛竹P450基因表达模式的聚类分析图
Fig.5 Cluster analysis of the expression patter of P450 in P. heterocycla
LF: 叶; P1: 早期花蕾; P2: 晚期花蕾; RH: 竹鞭; RT: 根; S20: 20 cm笋; S50: 50 cm笋。颜色标尺代表的是基因表达水平, 从蓝色到
红色代表基因表达水平从低到高, 亮蓝色为最低水平表达, 亮红色为最高水平表达。灰色代表CYP基因在该组织中未检测出表达量。
植物生理学报1398
CYP81M2和CYP72A289除外。第三类基因的表达
对组织具有选择性, 例如CYP87B18只在早期花蕾
中有较高水平的表达; CYP94E6和CYP98B9只在晚
期花蕾中有较高水平的表达。第四类基因在大部
分组织中均有较高水平的表达, 但CYP71V5、CY-
P73A116、CYP73A115、CYP73A114、CYP714C10、
CYP94B43、CYP707A89、CYP734A27、CYP84A55、
CYP71P3b在笋中的表达量很低或未能检测到。
讨  论
到目前为止, 细胞色素P450单加氧酶基因超
家族是支持植物代谢的最大酶家族之一。P450种
类的多样性以及底物的广泛性决定了其功能的多
样性。植物生物学的各个方面几乎都依赖P450。
从2004年开始, 被子植物中再没有新的CYP家族出
现 , CYP家族多样性的样本也逐渐达到最大值
(Nelson等2008)。
单家族基因簇CYP51和CYP74分别含家族
CYP51和家族CYP74, 这两个被认为是植物界P450
基因进化中较原始的家族在毛竹系统进化树中分
别占据了一个明显的分支。CYP51是需要电子转
移的甾醇类14-α-脱甲基酶, 是甾醇生物合成的关
键酶之一(Choi等2012)。该酶广泛存在于动物、
植物和真菌中, 但在原核生物被发现的极少。目
前, CYP51被认为是从原核生物中转移至真核生物
中的最原始的细胞色素P450。但Rezen等(2004)研
究者对CYP51的进化提出了不一样的观点: 细菌中
最古老的CYP基因并不是CYP51, 而可能是与原核
生物和真核生物起源相关的基因的混合体。
CYP74即丙二烯氧化物合成酶(allene oxide synthase,
AOS), 是一种非典型的CYP酶, 它不需要分子氧和
电子供体(Hughes等2009)。该酶是植物合成茉莉
酮酸和其它茉莉酮酸酯的羟脂途径中的一种关键
酶(Oh和Murofushi 2002), 以异常高的周转率催化
脂肪酸氢过氧化物的重排(Nelson和Werck-Reich-
hart 2011)。
在毛竹基因组P450中, 最大的P450基因簇是
CYP71。植物界最大的基因簇也是CYP71。该基
因簇包揽了超过50%的P450基因, 具有丰富的功
能。芳香族和脂肪族氨基酸衍生物、小异戊二烯
(单萜和倍半萜)、某些三萜衍生物、生物碱类、
脂肪酸类和激素前体的代谢都与CYP71相关。作
为毛竹中的最大家族, CYP71以物种特异性方式迅
速扩张, 该家族的功能通常是与小分子物质的氧
化有关。鳄梨中的CYP71A1与单萜的代谢有关。
来自于其他植物的CYP71A和CYP71D与萜类的代
谢有关, 通常是单萜和倍半萜的氧化(Nelson和
Werck-Reichhart 2011)。
毛竹中不存在CYP715、CYP723、CYP729和
CYP735这四个家族, 可能原因是测序不够完整, 遗
漏了这些家族或毛竹进化过程中丢掉了这些家
族。其中, CYP715在拟南芥和水稻中均为单基因
家族, 具有基础的、保守的生物学功能, 是一个非
常保守的P450家族(Morant等2007)。因此, 毛竹中
该家族的缺失, 是其基因组测序不够完整而造成
的可能性更大。CYP723是双子叶植物分离后进化
而来的, 是单子叶植物所特有的一个P450家族。
Nelson和Werck-Reichhart (2011)认为CYP723与
CYP77、CYP89可能具有共同的祖先。在3个物种
的系统进化树中, CYP723家族分布在CYP89家族
中, 我们推测CYP723可能与CYP89具有共同的祖
先。在毛竹中, CYP87、CYP703、CYP722和
CYP733家族均只含一个P450成员。其中, 属于
CYP86基因簇的家族CYP87、CYP722和CYP733也
存在于许多双子叶植物中 , 而拟南芥中缺失了
CYP733 (Langmead等2009)。Chaban等(2003)讨论
了CYP87A3对胚芽鞘生长的调节作用。CYP722和
CYP733在大多数植物中由单拷贝基因代表, 这表
明了其很强的净化选择能力, 并且可能在植物发
育中发挥作用(Nelson和Werck-Reichhart 2011)。
CYP724在拟南芥和水稻中均只含一个基因(Nelson
等2004)。该家族参与陆生植物普遍存在的芸苔素
内酯生物合成过程中早期的C-22羟基化。芸苔素
内酯是甾体化合物中生物活性较高的一种, 广泛
存在于广泛存在于植物的花粉、种子、茎和叶等
器官中。在植物生长发育各阶段中, 既可促进营
养生长, 又能利于受精作用。在毛竹中, CYP724家
族具有两个成员CYP724B21和CYP724B22。该P450
家族是否能在毛竹中特异性大量扩张, 这有待时
间和研究来准确回答。我们推测, 这可能是因为
毛竹对CYP724所表现出的功能有更大的需求造成
的。造成这一现象的准确原因需要进一步的研究
林翩翩等: 毛竹细胞色素P450的基因组学分析 1399
分析给予解释。
基因结构中的内含子含有与古老基因进化相
关的信息(Gilbert 1987)。目前, 对内含子的起源存
在两种假说。第一个假说认为, 编码蛋白的基因
一开始就是不连续的, 也就是说编码蛋白的基因
一开始就含内含子; 第二个假说认为, 最初编码蛋
白的基因是连续的, 也就是说最初编码蛋白的基
因本不含内含子。这两个假说都存在支持的证据,
但实际上关于内含子的起源很可能是两个假说的
结合, 即有些内含子一开始就存在, 而有些内含子
是在进化过程中才出现的 ( P l o m i n和S p i n a t h
2004)。一些分析表明, P450基因在进化过程中, 内
含子的丢失和获得事件频繁发生(Gotoh 1998)。不
同P450家族间, 内含子的位置几乎不保守, 所以内
含子的保守情况与亚家族成员间的进化有良好的
相关性(Tijet等2001)。在毛竹的P450基因中, 最早
出现的基因所含内含子数极少; 随着进化过程的
不断进行, 内含子数目逐渐增多; 但达到最大值时,
内含子数目又开始减少。在内含子数目下降的初
期, 甚至频繁出现不含内含子的现象。在毛竹基
因组P450基因中, 属于CYP97B亚家族的CYP97B31
所含内含子数目最多。在进化树中, CYP97B的出
现早于CYP97A和CYP97C, 这与CYP97B是CY-
P97A、CYP97B和CYP97C三个高度保守的亚家族
中最古老的亚家族的事实相一致 ( N e l s o n等
2008)。在毛竹的160条P450基因所属的9个基因簇
中, CYP86和CYP71不含内含子的P450基因数占据
了所有不含内含子的P450基因总数的75%。这两
个基因簇在所有陆生植物中具有保守家族成员
(Nelson等2008)。由此, 我们推测内含子缺失的
P450基因在进化的过程中具有更好的保守性。另
外, 进化距离近的P450基因具有相似的基因结构,
在进化树中成群存在。这与家蚕基因结构的研究
相一致, 即基因结构的相似程度与系统进化树中
进化距离的远近存在密切的联系——进化距离越
近, 基因结构的相似程度越大(艾均文等2011)。
植物P450基因编码的酶根据参与的反应和代
谢, 可分为四类。第一类保守地存在于所有植物
中, 参与基础反应, 如CYP51、CYP710和CYP97家
族; 第二类保守地存在于所有陆生植物中, 参与核
心代谢, 如CYP86和CYP94家族, CYP73A和CY-
P98A亚家族; 第三类出现在开花植物的进化中, 参
与基础代谢 , 与植物激素动态平衡有关 , 如CY-
P707A、CYP88A、CYP85A、CYP90A、CYP90B、
CYP90D和CYP724B等; 第四类参与不同物种中的
次级代谢, 如只存在于红豆杉中的CYP725家族, 产
生物碱植物所特有的C Y P 8 0和C Y P 7 1 9家族
(Mizutani 2012)。从毛竹P450基因的表达数据聚
类分析可知一些家族的基因有较保守的表达模式,
这可能是因为该家族的成员具有相似的蛋白结构
和功能, 催化相似底物的代谢, 如家族CYP74中的
基因的表达模式均属于第一类, 在组织中表达的
整体水平较低; 家族CYP77中的基因的表达模式均
属于第二类, 在各个组织中的表达水平较低。有
些家族同时具有第一类和第二类的表达模式, 如
CYP72、CYP89和CYP92。有更多的家族的基因
表现出表达模式的多样性, 如CYP71、CYP73、
CYP714、CYP81、CYP86和CYP94等家族具有三
种或三种以上的表达模式。另外, 有许多进化距
离较远的CYP家族成员具有相同的表达模式, 这可
能是是因为他们催化相似或相同的代谢途径, 如
第一类表达模式中的CYP71和CYP81家族都可参
与苯丙烷代谢途径(贺丽虹等2008)。表达模式属
于第四类的P450基因中, 有8个基因在所有组织中
都有较高水平的表达, 这些基因参与毛竹生长发
育中的基础代谢, 如CYP88A参与赤霉素的生物合
成, 催化内根-贝壳杉烯酸形成赤霉素, 而赤霉素是
重要的植物生长调节物质, 控制种子的萌发和根
的生长(Mizutani 2012)。表达模式属于第一类的
P450基因中, 有17个基因在花蕾中有非常高的表
达水平, 这些基因可能与毛竹的开花密切相关。
能开花的毛竹一般情况下不开花, 只有当毛竹所
处环境过于恶劣或竹子过于老化时, 它才以开花
结子的方式来繁延后代, 而毛竹的开花, 便意味着
其生命的终结 , 这将给竹林造成很大的经济损
失。因此, 对这些可能与毛竹开花相关的P450基
因功能的进一步研究有着非常重要的意义。
参考文献
艾均文, 薛宏, 何行健, 孟繁利, 朱勇, 向仲怀(2011). 家蚕细胞色素
P450基因的研究进展. 昆虫学报, 54 (8): 918~926
贺丽虹, 赵淑娟, 胡之璧(2008). 植物细胞色素P450基因与功能研
究进展. 药物生物技术, 15 (2): 142~147
植物生理学报1400
涂珺, 朱平, 程克棣(2003). 植物细胞色素P450基因的异源表达系
统研究进展. 中国生物工程杂志, 23 (7): 32~37
时硕永, 丁达夫(2002). 判定直系同源关系的进化分析方法. 生物化
学与生物物理学报, 34 (1): 88~94
王斌, 李德远(2009). 细胞色素P450的结构与催化机理. 有机化学,
29 (4): 658~662
解敏敏, 龚达平, 李凤霞, 刘贯山, 孙玉合(2013). 烟草细胞色素
P450的基因组学分析. 遗传, 35 (3): 379~387
Chaban C, Waller F, Furuya M, Nick P (2003). Auxin responsiveness
of a novel cytochrome P450 in rice coleoptiles. Plant Physiol,
133 (4): 2000~2009
Choi KY, Jung EO, Jung DH, Pandey BP, Lee N, Yun H, Park HY,
Kim BG (2012). Novel iron-sulfur containing NADPH-reductase
from Nocardia farcinica IFM10152 and fusion construction with
CYP51 lanosterol demethylase. Biotechnol Bioeng, 109 (3):
630~636
Edgar RC (2004). MUSCLE: a multiple sequence alignment method with
reduced time and space complexity. BMC Bioinf, 5: 113~131
Eisen MB, Spellman PT, Brown PO, Botstein D (1998). Cluster anal-
ysis and display of genome-wide expression patterns. Proc Natl
Acad Sci USA, 95 (25): 14863~14868
Fu C, Xiong J, Miao W (2009). Genome-wide identification and char-
acterization of cytochrome P450 monooxygenase genes in the
ciliate Tetrahymena thermophila. BMC Genomi, 10: 208
Gilbert W (1987). The exon theory of genes. Cold Spring Harb Sym,
52: 901~905
Gotoh O (1998). Divergent structures of Caenorhabditis elegans
cytochrome P450 genes suggest the frequent loss and gain
of introns during the evolution of nematodes. Mol Biol Evol, 15
(11): 1447~1459
Graham SE, Peterson JA (1999). How similar are P450s and what can
their differences teach us? Arch Biochem Biophys, 369 (1): 24~29
Hughes RK, De DS, Santino A (2009). Plant cytochrome CYP74 fam-
ily: biochemical features, endocellular localisation, activation
mechanism in plant defence and improvements for industrial
applications. ChemBioChem, 10 (7): 1122~1133
Kim D, Pertea G, Trapnell C, Pimentel H, Kelley R, Salzberg SL
(2011). TopHat2: accurate alignment of transcriptomes in the
presence of insertions, deletions and gene fusions. Genome Biol,
14 (4): R36
Langmead B, Trapnell C, Pop M, Salzberg SL (2009). Ultrafast and
memory-efficient alignment of short DNA sequences to the hu-
man genome. Genome Biol, 10: R25
Lee DS, Nioche P, Hamberg M, Raman CS (2008). Structural insights
into the evolutionary paths of oxylipin biosynthetic enzymes.
Nature, 455 (7211): 363~368
Mizutani M (2012). Impacts of diversification of cytochrome P450 on
plant metabolism. Biol Pharm Bull, 35 (6): 824~832
Morant M, Jrgensen K, Schaller H, Pinot F, Mller BL, Werck-Reich-
hart D, Bak S (2007). CYP703 is an ancient cytochrome P450
in land plants catalyzing in-chain hydroxylation of lauric acid
to provide building blocks for sporopollenin synthesis in pollen.
Plant Cell, 19 (5): 1473~1487
Nei M, Kumar S (2000). Molecular Evolution and Phylogenetics.
New York: Oxford University Press
Nelson DR (2006). Cytochrome P450 nomenclature, 2004. Methods
Mol Biol, 320: 1~10
Nelson DR, Ming R, Alam M, Schuler MA (2008). Comparison of
cytochrome P450 genes from six plant genomes. Tropic Plant
Biol, 1 (3): 216~235
Nelson DR, Schuler MA, Paquette SM, Werck-Reichhart D, Bak S
(2004). Comparative genomics of rice and Arabidopsis. Analysis
of 727 cytochrome P450 genes and pseudogenes from a monocot
and a dicot. Plant Physiol, 135 (2): 756~772
Nelson DR, Werck-Reichhart D (2011). A P450-centric view of plant
evolution. Plant J, 66 (1): 194~211
Oh K, Murofushi N (2002). Design and synthesis of novel imidazole
derivatives as potent inhibitors of allene oxide synthase (CYP74).
Bioorg Med Chem, 10 (12): 3707~3711
Omura T (1999). Forty years of cytochrome P450. Biochem Biophys
Res Commun, 266 (3): 690~698
Peng ZH, Lu Y, Li LB, Zhao Q, Feng Q, Gao ZM, Lu HY, Hu T, Yao
N, Liu KY et al (2013). The draft genome of the fast-growing
non-timber forest species moso bamboo (Phyllostachys hetero-
cycla). Nat Gen, 45 (4): 456~461
Plomin R, Spinath FM (2004). Intelligence: genetics, genes, and
genomics. J Pers Soc Psychol, 86 (1): 112~129
Rezen T, Debeljak N, Kordis D, Rozman D (2004). New aspects on
lanosterol 14α-demethylase and cytochrome P450 evolution:
lanosterol/cycloartenol diversification and lateral transfer. J Mol
Evol, 59 (1): 51~58
Tamura K, Peterson D, Peterson N, Stecher G, Nei M, Kumar S (2011).
MEGA5: molecular evolutionary genetics analysis using maxi-
mum likelihood, evolutionary distance, and maximum parsimo-
ny methods. Mol Biol Evol, 28: 2731~2739
Tijet N, Helvig C, Feyereisen R (2001). The cytochrome P450
gene superfamily in Drosophila melanogaster: annotation,
intron-exon organization and phylogeny. Gene, 262 (1-2):
189~198
Trapnell C, Hendrickson D,Sauvageau S, Goff L, Rinn JL, Pachter L
(2013). Differential analysis of gene regulation at transcript reso-
lution with RNA-seq. Nat Biotechnol, 31 (1): 46~53