免费文献传递   相关文献

Bio-informatics analysis of 2-C-methyl-D-erythritol 4-phosphate cytidylytransferase gene in Picrorhiza kurrooa

胡黄连2-C-甲基-D-赤藓糖-4-磷酸胞苷转移酶基因的生物信息学分析



全 文 :中草药 Chinese Traditional and Herbal Drugs 第 45 卷 第 15 期 2014 年 8 月

·2218·
• 药材与资源 •
胡黄连 2-C-甲基-D-赤藓糖-4-磷酸胞苷转移酶基因的生物信息学分析
郑玉娟 1, 2,陈 容 1, 2,周文化 1, 2*
1. 稻谷及副产物深加工国家工程实验室,湖南 长沙 410004
2. 中南林业科技大学食品学院,湖南 长沙 410004
摘 要:目的 研究胡黄连 Picrorhiza kurrooa 2-C-甲基-D-赤藓糖-4-磷酸胞苷转移酶(MCT)基因特征并预测 MCT 结构与
功能位点。方法 以胡黄连 MCT 基因为研究对象,利用 NCBI 网站及生物信息学软件对其碱基分布、氨基酸组成、亲疏水
性、保守区及二级结构和三级结构进行预测和分析;并对 9 个物种的 MCT 基因进行多重比对与进化分析。结果 胡黄连
MCT 基因的 mRNA 序列长为 1 216 bp(GenBank JQ991625.1),编码由 399 个氨基酸组成的蛋白质,该蛋白质相对分子质量
为 44 448.5,其中量最高的为 Ser(10.0%);整个多肽中疏水性氨基酸占 59.5%,平均疏水值为 0.050;与丹参 Salvia miltiorrhiza
MCT 氨基酸序列对比同源性最高,达 99%。结论 胡黄连 MCT 基因处于稳定状态,编码的蛋白为疏水性蛋白,在进化过
程中是相对保守的,获得的保守区段序列信息为其他物种 MCT 基因的克隆奠定了基础。
关键词:2-C-甲基-D-赤藓糖-4-磷酸胞苷转移酶;胡黄连;丹参;生物信息学;蛋白质结构
中图分类号:R282.12 文献标志码:A 文章编号:0253 - 2670(2014)15 - 2218 - 06
DOI: 10.7501/j.issn.0253-2670.2014.15.019
Bio-informatics analysis of 2-C-methyl-D-erythritol 4-phosphate cytidylytransferase
gene in Picrorhiza kurrooa
ZHENG Yu-juan1, 2, CHEN Rong1, 2, ZHOU Wen-hua1, 2
1. National Engineering Laboratory for Rice and Byproducts Processing, Changsha 410004, China
2. School of Food Science and Engineering, Center South University of Forestry and Technology, Changsha 410004, China
Abstract: Objective To study the characteristics of 2-C-methyl-D-erythritol 4-phosphate cytidylytransferase (MCT) gene and to
predict the structure and function site of MCT. Methods Based on MCT gene of Picrorhiza kurrooa, NCBI website and
bio-informatics software were used to predict and analyze the base distribution, amino acid composition, hydrophilicity or
hydrophobicity, and secondary and three-level structures of hyper-conservative region. The results were compared with MCT gene
sequences in other eight species and the related evolution analysis was followed. Results The mRNA sequence of MCT gene in P.
kurrooa was 1 216 bp (GenBank: JQ991625.1), coding the protein containing 399 amino acids, and the relative molecular mass of
protein was 44 448.5 with 10.0% Ser in volume; In polypeptide, hydrophobic amino acid was 59.5% in volume, and the average
hydropathicity was 0.050; The homology was found as high as 99% compared with MCT gene in Salvia miltiorrhiza. Conclusion
The MCT gene in P. kurrooa was quite stable and the coded protein was hydrophobic, which was quite conservative in evolution; The
sequence information in conservative region gained in the test provides the basis for clone ofnovel gene in other species.
Key words: 2-C-methyl-D-erythritol 4-phosphate cytidylytransferase; Picrorhiza kurrooa Pennel; Salvia miltiorrhiza Alexander Bunge;
bio-informatics; protein structure

胡黄连 Picrorhiza kurrooa Pennel 为玄参科胡
黄连属的多年生草本植物,分布区比较狭窄,特产
于横断山区和东喜马拉雅。其具有保肝利胆、抗菌
消炎、抗哮喘、降血糖、神经保护、免疫调节等多
种药理作用,临床上应用非常广泛,环烯醚萜苷类
成分是其主要作用成分之一[1-2]。近些年,由于过
度采挖,野生胡黄连资源濒临枯竭,其作为国家二
级保护植物,已被列入《中国珍稀濒危保护植物名

收稿日期:2014-02-22
作者简介:郑玉娟(1990—),女,山东东营人,硕士,研究方向为特色农林产品深加工。E-mail: zhengyujuan9003@163.com
*通信作者 周文化(1969—),男,湖南澧县人,教授,博士,研究方向为特色农林产品深加工,传统食品工业化研究。
Tel: (0731)85623240 E-mail: zhouwenhua@126.com
中草药 Chinese Traditional and Herbal Drugs 第 45 卷 第 15 期 2014 年 8 月

·2219·
录》[3],对其继续科学保护和合理利用已刻不容缓。
萜类化合物(terpenoids)又称类异戊二烯,是自然
界中分布最广泛、结构最复杂的一类次生代谢化合
物[4-8]。其在植物生理过程中发挥着重要作用,部分
萜类化合物还具有重要的药用价值和较高的经济价
值。随着分子生物学和生物信息学等学科的发展,
萜类化合物的合成途径及合成过程中的关键酶成为
植物次生代谢研究领域的热点之一。绝大多数萜类
化合物的合成前体是异戊烯基焦磷酸(IPP),植物
体内 IPP 的生物合成主要存在 2 条不同的代谢途径:
一是位于细胞质中的甲羟戊酸(MVA)途径,另一
条是位于质体中的 2-甲基 -D-赤藓糖醇 -4-磷酸
(MEP)途径[9]。2-C-甲基-D-赤藓醇-4-磷酸胱氨酸转
移酶(MCT)催化 MEP 途径中的第 3 个反应,即催
化 CDP 和 EP 在胞苷三磷酸(CP)的参与下合成
CDP-ME,是 IPP 合成的关键酶之一[10-13]。
Rohdich 等[14]使用同位素标记法验证了 MCT
在大肠杆菌萜类前体物质生物合成中的重要作
用。此外,MCT 缺失型 E. coil 菌株 NMW33 人为
添加 MVA,可以在 LB 平板上生长,而缺失型不
生长,这说明了 MCT 是 IPP 生物合成所必需的[15]。
近年来,相继有文献报道多个物种的 MCT 基因得
到解析,但尚未有报道利用生物信息方法系统研
究这些基因,这制约其他物种中该基因的克隆与
功能验证。生物信息学是生命科学和信息科学的
交叉学科,是后基因组时代的重要研究工具之
一。本实验利用生物信息学的方法对胡黄连 MCT
基因以及 GenBank 上已发表的其他植物 MCT 基
因进行序列分析和功能预测,旨在为其他植物
MCT 基因的克隆、功能验证提供理论和实践参
考依据。
1 材料
样品采自印度罗唐山隘和 Palampur 研究所保
护地收集,经笔者鉴定为胡黄连 Picrorhiza kurrooa
Pennel。
2 方法
参 照 NCBI 数 据 中 报 道 的 胡 黄 连
(JQ991625.1)、拟南芥 Arabidopsis thaliana Carl
Linnaeus(NM_126305.2)、丹参 Salvia miltiorrhiza
Alexander Bunge(JN831096)、蓖麻 Ricinus communis
James A. Duke(XM_002540422.1)、罗汉果 Siraitia
grosvenorii C. Jeffrey ex Lu et Z. Y. Zhang
(HQ128560.1)、萝芙木 Rauvolfia verticillata Henri
Ernest Baillon ( JX104650.1 )、毛 果 杨 Populus
trichocarpa John Torrey & Asa Gray(EU693021.1)、
橡胶 Hevea brasiliensis Johannes Müller Argoviensis
(AB294703.1)和银杏 Ginkgo biloba Carl Linnaeus
(DQ102360.1)的 MCT 基因的 mRNA 序列以及其
编码的蛋白质序列。
胡黄连 MCT 基因 mRNA 序列由叶组织中提
取获得的 RNA 反转录合成 cDNA 特异性扩增获
得[16-18]。利用 BioEdit 软件分析胡黄连 MCT 基因
mRNA 序列和氨基酸序列的相对分子质量、碱基;
利用 NCBI 网站的 ORF Finder 程序(http://www.ncbi.
nlm.nih.gov/projects/gorf/orfig.cgi)预测开放阅读框
(ORF)利用 BioEdit 软件对胡黄连 MCT 基因的氨
基酸序列进行初步疏水性分析,再通过 Expasy 的
Protscale 程序(http://expasy.org/csibin/ protscale.pl/),
使用 Hphob./Kyte & Doolittle 方法对其进行详细的
疏水性分析,并获得氨基酸组成、碱基分布、氨基
酸比例等;将获得的氨基酸序列利用 Clustal X 软件
进行氨基酸序列之间的多重比对分析;利用
DNAman 软件对 9 种植物 MCT 基因的氨基酸序列
构建进化树;在 NCBI 中对胡黄连 MCT 蛋白的保
守序列进行预测,以及二级结构、三级结构的预测
分析[19-22]。
3 结果与分析
3.1 胡黄连 MCT 基因 mRNA 序列的分析
通过 BioEdit 软件和 NCBI 网站分析发现,胡黄
连 MCT 基因 mRNA 序列长为 1 216 bp,其含有多个
复制起始位点,ORF 在 148~1 083 bp,共编码 311
个氨基酸,相对分子质量为 367 599.00。从表 1 可以
看出,A+T 量较高为 62.09%;G+C 量较少为
37.91%。
3.2 胡黄连MCT基因编码的蛋白质氨基酸组成分析
由表 2 可知,胡黄连 MCT 基因编码的蛋白质
中共有 20 种氨基酸,共计 399 个氨基酸,相对分子
表 1 胡黄连 MCT 基因 mRNA 序列的碱基组成
Table 1 Base composition of mRNA sequence of MCT
gene in P. kurrooa
碱基类型 数目 含量 / %
A 357 29.36
C 224 18.42
G 237 19.49
T 398 32.73
中草药 Chinese Traditional and Herbal Drugs 第 45 卷 第 15 期 2014 年 8 月

·2220·
质量为 44 448.5,其中量最高的为 Ser,为 10.0%;
Leu、Val、Lys、Ile 也较多,分别为 9.8%、8.0%、
7.8%、7.3%;而量最低的是 Trp,为 0.5%。N 端第
一个氨基酸为 Gly。
表 2 胡黄连 MCT 编码的蛋白质的氨基酸组成
Table 2 Composition of amino acid of MCT protein
in P. kurrooa
氨基酸名称 数目 含量 / %
Ala 21 5.3
Cys 13 3.3
Asp 18 4.5
Glu 21 5.3
Phe 24 6.0
Gly 20 5.0
His 9 2.3
Ile 29 7.3
Lys 31 7.8
Leu 39 9.8
Met 6 1.5
Asn 16 4.0
Pro 22 6.0
Gln 12 3.0
Arg 11 2.8
Ser 40 10.0
Thr 19 4.8
Val 32 8.0
Trp 2 0.5
Tyr 14 3.5

3.3 胡黄连MCT基因编码的氨基酸序列疏水性分析
组成蛋白质的氨基酸分子都具有一定的极性,
这些氨基酸分子的极性对蛋白质高级结构及功能性
结构域的形成有重要的影响。分析可知该蛋白为稳
定蛋白。从图 1 可知,疏水值最大为 3.167,375 bp
处的疏水性最强,疏水值最小为−2.244,88 bp 处亲
水性最强。整个多肽中含 59.5%的疏水性氨基酸,
疏水性平均值为 0.050,推断该蛋白为疏水性蛋白。

图 1 胡黄连 MCT 基因编码氨基酸的疏水性预测
Fig. 1 Hydrophobicity prediction of amino acid sequence
of MCT gene in P. kurrooa
3.4 氨基酸序列之间的多重比对分析
对 MCT 的氨基酸序列进行同源性分析(图 2),
结果表明胡黄连与丹参、拟南芥、罗汉果、萝芙木、
橡胶、银杏具有较高同源性,保守区主要集中在中
部和尾部,而 N 端变异性比较大。由于基因进化
82胡黄连
75丹参
11毛果杨
99银杏
81萝芙木
73拟南芥
74罗汉果
65蓖麻
77橡胶
Consensus
.
.
.
M
.
.
.
.
.
.
.
.
A
.
.
.
.
.
.
.
.
L
.
.
.
.
.
.
.
.
A
.
.
.
.
.
.
.
.
C
.
.
.
.
.
.
.
.
N
.
.
.
.
.
.
.
.
T
.
.
.
.
.
.
.
.
V
.
.
.
.
.
M
M
.
P
.
.
.
.
.
m
P
S
.
S
M
M
M
M
M
T
T
.
S
S
A
A
G
G
I
L
.
L
I
M
S
H
H
Q
Q
.
S
L
L
V
H
H
L
I
.
P
Q
Q
S
L
L
G
T
.
H
L
T
H
L
L
A
N
.
K
S
N
F
H
H
S
L
.
S
P
L
P
L
L
L
P
.
K
P
G
R
N
N
P
P
.
L
L
F
M
L
L
T
S
.
C
S
.
N
T
T
S
A
.
I
L
I
C
A
I
S
A
.
S
S
T
S
V
I
s
F
S
.
S
S
S
F
S
S
p
P
P
.
P
P
P
P
S
P
L
S
.
Q
I
T
S
S
S
F
V
.
S
L
F
.
A
A
L
S
.
R
L
L
.
S
S
E
P
.
H
G
C
S
S
F
T
S
.
N
S
P
P
S
K
N
S
.
L
N
K
S
S
S
S
.
.
.
.
.
.
S
S
I
.
.
Y
Y
L
.
S
N
K
.
.
E
Q
K
K
.
S
F
F
.
F
I
V
F
.
L
P
P
.
V
S
K
P
.
F
I
L
.
G
E
L
I
.
P
K
F
.
A
R
N
K
.
C
L
L
.
K
S
S
Q
S
N
C
G
.
T
L
Y
R
S
H
S
A
.
S
P
L
M
S
P
L
T
.
F
L
W
I
I
Q
F
L
.
Q
L
F
A
I
I
S
G
.
A
S
S
A
S
P
L
L
.
E
H
Y
K
S
T
n
N
P
.
L
N
R
N
N
N
P
T
.
C
S
.
G
S
S
N
K
.
I
T
.
Q
L
F
S
F
.
L
L
.
S
F
H
Y
R
.
S
T
.
I
P
L
K
P
.
P
P
.
S
.
P
N
S
.
Q
S
S
H
.
S
Y
F
.
R
H
Q
F
.
L
S
A
.
R
F
V
S
.
S
F
L
.
H
K
Q
L
.
K
N
T
.
N
K
K
Q
.
S
A
T
.
L
S
L
L
.
S
K
V
.
N
S
D
T
C
V
Y
Y
.
A
L
F
G
H
H
T
N
.
F
S
S
H
K
K
H
N
.
P
T
K
Q
L
I
.
R
.
S
E
R
H
T
S
K
K
.
A
K
V
K
W
W
I
I
.
R
S
N
F
I
I
S
D
.
R
N
R
R
Q
Q
s
S
S
.
S
S
S
R
K
K
F
L
.
F
F
Y
N
L
L
K
K
.
Q
R
K
E
P
P
N
N
.
T
S
R
K
R
R
P
P
.
V
P
D
I
I
I
R
R
.
A
E
A
L
A
A
F
F
.
R
L
L
K
T
T
F
S
.
F
S
.
S
T
A
H
.
.
R
.
.
.
.
.
.
.
.
G
.
.
.
.
.
.
.
.
Y
.
.
.
.
.
.
.
.
G
.
.
.
.
.
.
.
.
F
.
.
.
.
.
.
.
.
V
.
.
.
.
.
.
.
.
P
.
.
.
.
.
.
.
.
K
.
.
.
.
.
.
.
.
R
.
.
.
.
.
A
.
.
R
L
L
.
.
.
R
.
.
P
L
L
.
.
.
N
R
.
L
R
S
V
T
T
i
I
I
.
L
V
I
I
I
I
T
S
.
R
T
K
K
K
K
c
C
C
S
A
C
C
C
C
C
s
S
S
S
F
S
S
S
S
S
a
A
A
A
A
A
S
A
A
A
D
G
Q
D
V
S
A
K
K
.
.
V
K
P
T
E
T
I
A
G
D
G
G
G
V
E
E
A
T
D
A
E
F
G
N
N
A
D
I
D
S
D
E
S
S
s
Q
.
S
S
K
N
S
S
S
G
.
G
G
S
S
S
.
.
S
T
.
T
P
.
.
.
.
E
Q
.
D
D
N
.
.
.
v
V
V
.
V
V
V
E
A
A
v
V
V
V
V
V
V
F
T
A
182胡黄连
175丹参
111毛果杨
199银杏
181萝芙木
173拟南芥
174罗汉果
165蓖麻
177橡胶
Consensus v
V
V
V
V
V
V
V
V
A
k
K
K
K
P
K
K
K
K
K
e
E
E
E
E
E
E
E
E
E
k
K
K
K
K
K
K
K
K
K
s
S
S
S
G
S
S
S
S
S
v
V
V
V
V
V
V
V
V
V
s
S
S
S
S
S
S
S
S
S
v
V
V
V
V
V
V
V
V
V
i
V
I
I
V
I
I
I
I
I
l
L
L
L
L
L
L
L
L
L
l
L
L
L
L
L
L
L
L
L
a
A
A
A
A
A
A
A
A
A
g
G
G
G
G
G
G
G
G
G
g
G
G
G
G
G
G
G
G
G
k
K
K
Q
K
K
Q
K
K
K
g
G
G
G
G
G
G
G
G
G
k
K
K
K
K
K
K
K
K
K
r
R
R
R
R
R
R
R
R
R
m
M
M
M
M
M
M
M
M
M
g
G
G
G
G
G
K
G
G
G
a
A
A
A
A
A
M
A
A
A
s
S
S
N
S
S
S
S
S
S
m
M
M
M
M
M
M
M
M
M
p
P
P
P
P
P
P
P
P
P
k
K
K
K
K
K
K
K
K
K
q
Q
Q
Q
Q
Q
Q
Q
Q
Q
y
Y
Y
Y
Y
Y
Y
Y
Y
Y
l
L
L
L
L
L
I
L
L
L
p
P
P
P
P
P
P
P
P
P
l
L
L
L
L
L
L
L
L
L
l
L
L
L
L
L
L
L
L
L
g
G
G
G
G
G
G
G
G
G
q
Q
Q
Q
Q
Q
Q
Q
Q
Q
p
P
P
P
P
P
P
P
P
P
i
I
I
I
I
I
I
I
I
I
a
A
A
A
A
A
A
A
A
A
l
L
L
L
L
L
L
M
L
L
y
Y
Y
Y
Y
Y
Y
Y
Y
Y
s
S
S
S
S
S
S
S
S
S
f
F
F
L
F
F
F
L
L
F
y
Y
Y
Y
Y
Y
F
Y
Y
Y
t
T
T
T
T
T
T
T
T
T
f
F
F
F
F
F
F
F
F
F
s
S
S
S
S
A
S
S
S
S
K
K
E
R
R
R
R
K
K
m
M
M
M
M
M
M
L
M
M
P
P
D
S
L
P
V
I
I
e
E
E
E
E
E
E
E
E
E
v
V
V
V
V
V
V
V
V
V
k
K
K
K
K
K
K
K
K
K
e
E
E
E
E
E
E
E
E
E
i
I
I
I
I
I
I
I
I
I
v
V
I
I
I
V
V
I
V
V
v
V
V
V
T
V
V
V
V
V
v
V
V
V
V
V
V
V
V
V
c
C
C
C
C
C
C
C
C
C
d
D
D
D
D
D
D
D
D
D
p
P
P
P
P
P
P
P
P
P
s
S
S
S
S
S
F
S
S
S
y
Y
Y
Y
Y
Y
F
Y
Y
Y
q
Q
Q
K
R
Q
R
Q
Q
Q
d
D
D
D
D
D
D
D
D
D
i
I
I
I
I
I
I
I
V
I
f
F
F
F
F
F
F
F
F
F
e
E
E
E
E
E
E
E
E
E
d
D
D
D
E
G
E
D
D
D
a
A
A
S
A
A
Y
A
A
A
k
K
R
Q
R
K
E
K
K
K
e
D
D
E
N
E
E
E
E
E
N
N
Q
S
K
S
K
N
N
i
I
I
I
V
I
I
I
I
I
Q
H
N
K
E
D
D
N
N
v
V
I
V
I
V
V
I
V
V
d
D
D
D
N
D
D
E
D
D
l
L
L
L
L
L
L
L
L
L
k
K
K
K
K
K
R
K
K
K
f
F
F
F
F
F
F
F
F
F
a
A
A
A
A
A
A
T
A
A
l
L
L
L
L
L
I
L
L
L
p
P
P
P
P
P
P
P
P
P
g
G
G
G
G
G
G
G
G
G
k
K
K
K
K
K
K
K
K
K
e
E
E
E
E
E
E
E
E
E
r
R
R
R
R
R
R
R
R
R
q
Q
Q
Q
Q
Q
Q
Q
Q
Q
d
D
D
D
D
D
D
D
D
D
s
S
S
S
S
S
S
S
S
S
v
V
V
V
V
V
V
V
V
V
y
Y
Y
Y
F
Y
Y
Y
Y
Y
s
S
S
S
N
S
S
S
S
S
g
G
G
G
G
G
G
G
G
G
l
L
L
L
L
V
L
L
L
L
q
E
E
Q
Q
Q
Q
Q
Q
H
e
A
E
E
E
A
E
A
A
E
v
I
I
V
V
V
I
I
V
V
d
D
D
D
D
D
D
D
D
D
l
S
L
L
Q
L
V
L
S
L
n
N
D
N
A
S
N
N
N
N
s
S
S
S
T
A
S
S
S
S
e
E
E
E
E
E
E
E
E
E
282胡黄连
275丹参
211毛果杨
299银杏
281萝芙木
273拟南芥
274罗汉果
256蓖麻
277橡胶
Consensus l
L
L
L
L
L
L
L
L
L
v
V
V
V
V
V
V
V
V
V
c
C
C
C
C
C
C
C
C
C
i
V
I
I
V
I
I
I
V
V
h
H
H
H
H
H
H
H
H
H
d
D
D
D
D
D
D
D
D
D
s
S
S
S
S
T
S
S
S
S
a
A
A
A
A
A
A
A
A
A
r
R
R
R
R
R
R
R
R
R
p
P
P
P
P
P
P
P
P
P
l
L
L
L
L
L
L
L
L
L
v
V
V
V
V
V
V
V
V
V
l
L
L
L
L
L
N
L
S
S
T
T
S
S
A
T
A
S
S
e
E
S
E
E
E
E
E
A
A
d
D
D
D
D
D
D
D
D
D
v
V
V
V
V
A
V
I
I
V
e
A
T
E
E
E
E
K
E
K
k
K
K
K
K
K
K
K
K
K
v
V
V
V
A
V
V
V
V
V
l
L
L
L
L
L
L
L
L
I
k
K
K
K
Q
K
K
K
K
E
d
D
D
D
D
D
D
D
D
D
g
G
G
G
A
G
G
A
A
A
w
W
K
W
W
L
S
R
W
W
L
R
I
I
L
A
L
V
I
I
I
N
H
I
V
N
N
N
g
G
G
G
G
G
G
G
G
G
a
A
A
A
A
A
A
A
A
A
a
A
A
A
A
A
A
A
A
A
v
V
V
V
V
V
V
V
V
V
l
V
L
L
L
L
L
L
L
L
g
G
G
G
G
G
G
G
G
G
v
V
V
V
V
V
V
V
V
V
p
P
P
P
P
P
P
P
P
P
a
A
A
V
V
A
A
V
V
A
k
K
K
K
K
K
K
K
K
K
a
A
A
A
A
A
A
A
A
A
t
T
T
T
T
T
T
T
T
T
i
I
I
I
I
I
I
I
I
I
k
K
K
K
K
K
K
K
K
K
e
E
E
E
E
E
E
E
E
E
a
A
A
A
A
A
V
A
N
A
n
N
N
D
S
D
N
N
A
N
s
T
S
G
S
S
S
N
L
S
E
E
E
D
K
D
D
G
E
s
S
S
S
G
F
S
R
N
S
f
F
F
F
F
F
L
F
A
F
v
V
V
V
V
V
V
V
Y
V
v
V
V
V
V
V
V
Q
P
V
K
K
R
K
R
K
R
T
R
t
T
T
T
T
T
T
T
G
T
l
L
L
L
L
L
L
L
L
L
d
D
D
D
N
D
D
D
K
D
r
R
R
R
R
R
R
R
L
R
k
K
K
K
Q
K
K
K
K
K
t
T
T
T
T
K
T
T
D
T
l
L
L
L
L
L
L
L
F
L
w
W
W
W
W
W
W
W
T
W
e
E
E
E
E
E
E
E
S
E
m
M
M
M
M
M
M
M
S
M
q
Q
Q
Q
Q
Q
Q
Q
K
Q
t
T
T
T
T
T
T
T
G
T
p
P
P
P
P
P
P
P
T
P
q
Q
Q
Q
Q
Q
Q
Q
S
Q
v
V
V
V
V
V
V
V
I
V
i
I
I
M
I
I
I
I
L
I
k
K
E
K
K
K
K
K
.
K
p
P
P
P
P
P
P
P
.
P
D
D
E
N
D
E
E
.
D
l
L
L
L
L
L
L
L
.
L
l
L
L
L
L
L
L
L
.
L
k
K
K
K
R
K
K
R
.
K
k
K
K
K
K
K
K
K
.
K
g
G
G
G
G
G
G
G
.
G
f
F
F
F
F
F
F
F
.
F
e
E
E
E
E
E
E
E
E
E
l
H
Y
L
L
L
L
L
Q
L
v
V
V
V
V
V
V
V
L
V
n
N
N
N
H
N
K
N
F
N
r
R
R
R
R
R
S
R
I
R
e
E
E
E
E
E
E
E
D
D
g
G
G
G
G
N
G
G
G
G
l
L
L
L
L
L
L
L
L
L
e
E
E
E
E
E
E
E
E
E
v
V
V
V
V
V
V
V
V
V
t
T
T
T
T
T
T
T
T
T
d
D
D
D
D
D
D
D
D
D
d
D
D
D
D
D
D
D
D
D
v
V
V
V
V
V
V
V
V
V
s
S
S
S
S
S
S
S
S
S
i
I
I
I
I
I
I
I
I
I
v
V
V
V
V
V
V
V
V
V
e
E
E
E
E
E
E
E
E
E
h
H
H
H
H
H
Y
Y
H
H
l
L
L
L
L
L
L
L
L
L
k
K
K
K
K
K
K
E
K
K
h
H
H
H
H
H
H
H
H
H
p
P
P
P
P
P
P
P
P
P
v
V
V
V
V
V
V
V
V
V
311胡黄连
304丹参
240毛果杨
327银杏
314萝芙木
302拟南芥
303罗汉果
285蓖麻
310橡胶
Consensus y
Y
Y
Y
Y
Y
Y
F
F
Y
i
I
I
I
I
I
V
I
I
I
t
T
T
T
T
T
S
T
T
T
e
E
E
E
E
E
Q
E
E
E
g
G
G
G
G
G
G
G
G
G
s
S
S
S
S
S
S
S
S
S
y
Y
Y
Y
Y
Y
Y
Y
Y
Y
t
T
T
T
T
T
T
T
T
T
n
N
N
N
N
N
N
N
N
N
i
I
I
I
I
I
I
I
I
I
k
E
K
K
K
K
K
K
K
K
v
V
V
V
V
V
V
V
V
V
t
T
T
T
T
T
T
T
T
T
t
T
T
T
T
T
T
T
T
T
p
P
P
P
P
P
P
P
P
P
d
D
D
D
D
D
D
D
D
D
d
D
D
D
D
D
D
D
D
D
l
L
L
L
L
L
L
L
L
L
l
L
L
L
L
L
L
L
L
L
l
L
L
L
L
L
L
L
L
L
a
A
A
A
A
A
A
A
A
A
e
E
E
E
E
E
E
E
E
E
r
R
R
R
R
R
R
R
R
R
i
I
I
I
I
I
I
I
I
I
l
L
L
L
L
L
L
L
L
L
n
N
N
S
K
N
S
N
N
N
P
P
T
Q
P
E
L
M
L
D
E
S
S
T
D
D
D
N
s
S
D
S
.
S
S
S
S
S
.
.
.
.
A
.
.
.
E
.
.
.
.
K
.
.
.
E
.
.
.
.
S
.
.
.
S
.
.
.
.
S
.
.
.
S

图 2 MCT 序列氨基酸的多重比对分析
Fig. 2 Multiple comparison analysis of amino acid of MCT sequence
0 40 80 120 160 200 240 280 320 360 400
位置 / bp
3.0
2.4
1.8
1.2
0.8
0
-0.8
-1.2
-1.8




胡黄连
丹参
毛果杨
银杏
萝芙木
拟南芥
罗汉果
蓖麻
橡胶
相同部分
胡黄连
丹参
毛果杨
银杏
萝芙木
拟南芥
罗汉果
蓖麻
橡胶
相同部分

胡黄连
丹参
毛果杨
银杏
萝芙木
拟南芥
罗汉果
蓖麻
橡胶
相同部分
胡黄连
丹参
毛果杨
银杏
萝芙木
拟南芥
罗汉果
蓖麻
橡胶
相同部分
中草药 Chinese Traditional and Herbal Drugs 第 45 卷 第 15 期 2014 年 8 月

·2221·
等原因,也存在较大差异的区段,这些区段可能为
基因进化理论研究提供一些参考依据。BlastP 的结
果表明 MCT 属于糖基转移酶(GT-A)家族。
3.5 进化树的构建与分析
由图 3 可知,胡黄连与丹参亲缘关系最近,属
于同一目即唇形目,与萝芙木分支较近,与蓖麻、

图 3 MCT 基因编码氨基酸序列进化树
Fig. 3 Evolutionary tree of amino acid sequence
of MCT gene
橡胶、罗汉果、银杏较远。
3.6 MCT 基因的保守区预测
保守序列(conserved sequence)对推测进化结
果有特殊意义。在 NCBI 的蛋白保守结构域数据库
(conserved domain database,CDD)中对 MCT 进
行蛋白保守区预测,结果表明(图 4)与该基因匹
配的蛋白为 MCT,保守序列在中间和 C 端,这也
印证了不同物种的氨基酸序列之间的多重比对分
析结果。
3.7 MCT 编码基因的二级结构分析与三级结构预测
用 SOPMA 对胡黄连 MCT二级结构分析表明
(表 3 和图 5),该蛋白由 20.58%的 α-螺旋、29.26%
的延伸链、9.65%的 β-转角及 30.51%的无规则卷
曲组成。无规则卷曲是胡黄连 MCT 中最多的结构
元件。
氨基酸的排列顺序即蛋白质的一级结构决定了
蛋白质的高级结构,而该蛋白的生物学功能由高级



图 4 胡黄连 MCT 保守结构区域的预测
Fig. 4 Prediction of conserved domain of MCT protein in P. kurrooa
表 3 SOPMA 对胡黄连 MCT 二级结构分析
Table 3 Analysis on secondary structure of MCT in
P. kurrooa by SOPMA
折叠方式 数目 比例 / %
α-螺旋(Hh) 64 20.58
延长带(Ee) 91 29.26
β-转角(Tt) 30 9.65
无规则卷曲(Cc) 126 30.51
结构所决定。采用 Swiss-Model 得到 MCT 蛋白的三
级结构(图 6),结果表明 MCT 包含 13 个 α-螺旋
和 20 个 β-片层,有助于理解蛋白质结构与功能之
间的相关性。所有已知植物 MCT 中都具有 2 个保
守的活性位点:(1)底物 MEP 结合位点;(2)依
赖于 Mg2+的底物 CTP 结合位点,不同植物来源的
MCT 在 N 端非催化区域的氨基酸序列差异很大,在
催化区域序列非常保守,萝芙木 MCT 中,CTP 结
丹参
胡黄连
萝芙木
拟南芥
毛果杨
银杏
罗汉果
蓖麻
橡胶
0.02
1 75 150 225 300 375 405
Query seq.
Specific hits
Superfanilies
Hulti-donains
中草药 Chinese Traditional and Herbal Drugs 第 45 卷 第 15 期 2014 年 8 月

·2222·

蓝色代表 Hh,红色代表 Ee,绿色代表 Tt,橙色代表 Cc
Blue one is Hh, Red one is Ee, Green one is Tt, Orange one is Cc
图 5 胡黄连 MCT 二级结构预测
Fig. 5 Secondary structure prediction of MCT in P. kurrooa

图 6 胡黄连 MCT 三级结构预测
Fig. 6 Prediction of three-level structure of MCT
in P. kurrooa
合位点由 Arg99-Lys106 组成,MEP 结合位点是
Arg236-Lys292,由此可以推测胡黄连 MCT CTP 结
合位点和 MEP 结合位点分别由 Arg99-Lys106 和
Arg236-Lys292 组成,CTP 和 MEP 结合位点在一级
结构上距离较远,由于 MCT 全酶结构是一个二聚
体,所以 2 个酶活性中心在一级结构是可能存在距
离的[20-26]。
4 讨论
通过 NCBI 网站和生物信息学软件研究胡黄
连 MCT 基因的碱基分布、氨基酸组成,结果发
现,该基因中 G+C 的碱基量约为 37.91%,低于
50%,表明发生错配的概率较低,核苷酸处于稳
定状态。通过 Clustal X 等生物信息学软件将胡
黄连 MCT 与其他物种基因序列进行多重性比对
和进化分析,序列同源性较高,部分区段同源性
达 100%,说明其在进化中是十分保守的,也有
助于其他物种 MCT 基因的克隆与分离。这些保
守区基因信息为其他物种中该基因的克隆提供
了十分有价值的序列信息,为加快基因克隆及
MCT 基因的分子调控研究奠定基础。较大差异
的基因区段可能与基因的进化与变异相关,这些
仍待确定。通过 NCBI 对该基因的蛋白质进行二
级和三级结构预测,也有助于未来该基因在生物
体内的调控研究。
参考文献
[1] 何希瑞, 李 倩, 张春玲, 等. 胡黄连化学成分及单体
化合物药理活性研究新进展 [J]. 环球中医药, 2012,
5(9): 708-713.
[2] Lauris E K, Charles S B, William N H. Structure of a
tetragonal crystal form of Escherichia coli
2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase
[J]. Biol Crystallogr, 2003, 59: 607-610.
[3] 国家环境保护局. 中国珍稀濒危保护植物名录 (第 1
册) [M]. 北京: 科学出版社, 1987.
[4] Ma Y M, Yuan L C, Wu B, et al. Genome-wide
identification and characterization of novel genes
involved in terpenoid biosynthesis in Salvia miltiorrhiza
[J]. J Exp Bot, 2012, 63(7): 2809-2823.
[5] Liu L H, Li C H, Yang J L, et al. Bioinformatics analysis
of 4-hydroxy-3-methyl-2-buten1yl diphosphate synthase
(HDS) in Populus trichocarpa [J]. Agric Sci Technol,
2012, 13(1): 24-28.
[6] 黄 瑛, 曾庆平. 萜类生物合成的基因操作 [J]. 中国
生物工程杂志, 2006, 26(1): 60-64.
[7] 刘 娟, 刘 斌, 折改梅, 等. 单萜苷类化合物及其药
理活性研究进展 [J]. 现代药物与临床, 2010, 25(2):
81-93.
[8] 郭建华, 田成旺, 刘 晓, 等. 中药环烯醚萜类化合物
研究进展 [J]. 药物评价研究, 2011, 34(4): 293-297.
[9] 马 靓, 丁 鹏, 杨广笑, 等. 植物类萜生物合成途径
及关键酶的研究进展 [J]. 生物技术通报 , 2006(1):
22-30.
[10] 李 莉, 高凌云, 董 越, 等. 植物类异戊二烯生物合
成相关酶基因研究进展 [J]. 浙江师范大学学报: 自然
科学版, 2008, 31(4): 461-466.
[11] 郑 月. 萝芙木 MCT、HDS、SCG 基因的克隆与遗传
转化体系的建立 [D]. 重庆: 西南大学, 2011.
[12] 张长波, 孙红霞, 巩中军, 等. 植物萜类化合物的天然
合成途径及其相关合酶 [J]. 植物生理学通报, 2007,
43(4): 779-786.
[13] 汪婉宜, 申 业, 黄璐琦, 等. 萜类合成甲羟戊酸途径
的关键基因的克隆及表达分析 [J]. 中国食物与营养,
2011, 17(9): 24-28.
50 100 150 200 250
中草药 Chinese Traditional and Herbal Drugs 第 45 卷 第 15 期 2014 年 8 月

·2223·
[14] Rohdich F, Wungsintaweekul J, Fellermeier M, et al.
Cytidines 5′-triphosphate-dependent biosynthesis of
isoprenoids: YgbP Protein of Escherichia coli catalyzes
the formation of 4-diphosphocytidyl-2-C-methylerythritol
[J]. Proc Natl Acad Sci USA, 1999, 96(21): 11758-1163.
[15] Kim S M, Kuzuyama T, ChangY J, et al. Cloning and
functional characterization of 2-C-methyl-D-erythritol
4-phosphate cytidyltransferase (GbMECT) gene from
Ginkgo biloba [J]. Phytochemistry, 2006, 67(14):
1435-1441.
[16] Gahlan P, Singh H R, Shankar R, et al. De novo
sequencing and characterization of Picrorhiza kurrooa
transcriptome at two temperatures showed major
transcriptome adjustments [J]. BMC Genomics, 2012,
13(1): 1-21.
[17] Singh H, Gahlan P, Kumar S. Cloning and expression
analysis of ten genes associated with picrosides
biosynthesis in Picrorhiza kurrooa [J]. Gene, 2013,
515(2): 320-328.
[18] Kawoosa T, Singh H, Kumar A, et al. Light and temperature
regulated terpene biosynthesis: hepatoprotective
monoterpene picroside accumulation in Picrorhiza kurrooa
[J]. Justice Peace, 2010, 10(3): 393-404.
[19] 张慧敏, 李剑芳, 邬敏辰. 圆弧青霉脂肪酶基因序列的
生物信息学分析 [J]. 食品与生物技术学报 , 2010,
29(4): 602-608.
[20] 张文红, 刘新平, 王 琰, 等. Ndrg2 基因及 NDRG2
蛋白的生物信息学分析 [J]. 第四军医大学学报, 2003,
24(17): 1537-1539.
[21] 石鸥燕, 李艳云, 蔡春泉, 等. FZ6 基因及其蛋白的生物信
息学分析 [J]. 现代生物医学进展, 2010, 10(6): 1052-1054.
[22] 侯 琳, 钱敏平, 朱云平, 等. 转录因子结合位点生物
信息学研究进展 [J]. 遗传, 2009, 31: 365-373.
[23] Martinelli F, Tonutti P. Flavonoid metabolism and gene
expression in developing olive (Olea europaea L.) fruit
[J]. Plant Biosystems, 2012, 146: 164-170.
[24] Serrano I, Olmedilla A. Histochemical location of key
enzyme activities involved in receptivity and
self-incompatibility in the olive tree (Olea europaea L.)
[J]. Plant Sci, 2012, 197: 40-49.
[25] 刘亮伟, 秦天苍, 王 宝, 等. 木聚糖酶的分子进化
[J]. 食品与生物技术学报, 2007, 26(6): 110-116.
[26] Gabrielsen M, Kaiser J, Rohdich F, et al. The crystal
structure of a plant 2C-methyl-D-erythritol 4-phosphate
cytidylyltransferase exhibits a distinct quaternary
structure compared to bacterial homologues and a
possible role in feedback regulation for cytidine
monophosphate [J]. FEBS J, 2006, 273(5): 1065-1073.