免费文献传递   相关文献

Bioinformatic Aanlysis of IDD Gene Family in Phyllostachys heterocycla

毛竹IDD基因家族的生物信息学分析


IDD基因家族编码一种混合型的转录因子,本文通过本地Blast从毛竹(Phyllostachys heterocycla)基因组数据库获取到了9个IDD家族基因,并命名为PhID1PhIDD1-8,其氨基酸序列均具IDD-domain结构特征,一个假定的核定位信号、2个C2H2和2个C2HC。氨基酸理化性质分析发现,PhIDD蛋白均为亲水性蛋白,含量较多是丙氨酸(Ala)、丝氨酸(Ser)和甘氨酸(Gly),全序列等电点分布在8.8~9.7之间,仅PhIDD2蛋白的等电点为5.6。除PhIDD2外,IDD-domain的等电点与全序列等电点基本一致。PhIDD蛋白二级结构含量分析发现无规则卷曲和α-螺旋含量最多,β-转角和延伸链分布在整个蛋白中。蛋白磷酸化位点预测结果显示磷酸化位点数量在20~29个不等。三维结构分析显示,PhIDD1在63-175氨基酸处,会形成α-螺旋,β-折叠及无规则卷曲及明显的锌原子结合位点。


全 文 :核 农 学 报  2014,28(6):0998 ~ 1005
Journal of Nuclear Agricultural Sciences
收稿日期:2013⁃09⁃12  接受日期:2014⁃03⁃07
基金项目:国家自然科学基金(30901155),“973”项目(2012CB723008),浙江省自然科学基金(Y307499)
作者简介:关鹰,男,主要从事植物分子生物学研究。 E⁃mail:648726552@ qq. com
通讯作者:郭小勤,副教授,主要从事为植物生物技术。 E⁃mail:xqguo@ zafu. edu. cn
文章编号:1000⁃8551(2014)06⁃0998⁃08
毛竹 IDD基因家族的生物信息学分析
关  鹰  许在恩  郭小勤
(浙江农林大学亚热带森林培育国家重点实验室培育基地,浙江 临安  311300)
摘  要:IDD基因家族编码一种混合型的转录因子,本文通过本地 Blast从毛竹(Phyllostachys heterocycla)
基因组数据库获取到了 9 个 IDD 家族基因,并命名为 PhID1 和 PhIDD1 - 8,其氨基酸序列均具 IDD⁃
domain结构特征,一个假定的核定位信号、2 个 C2H2 和 2 个 C2HC。 氨基酸理化性质分析发现,PhIDD
蛋白均为亲水性蛋白,含量较多是丙氨酸(Ala)、丝氨酸(Ser)和甘氨酸(Gly),全序列等电点分布在 8􀆰 8
~ 9􀆰 7 之间,仅 PhIDD2 蛋白的等电点为 5􀆰 6。 除 PhIDD2 外,IDD⁃domain的等电点与全序列等电点基本
一致。 PhIDD蛋白二级结构含量分析发现无规则卷曲和 α -螺旋含量最多,β -转角和延伸链分布在整
个蛋白中。 蛋白磷酸化位点预测结果显示磷酸化位点数量在 20 ~ 29 个不等。 三维结构分析显示,
PhIDD1 在 63 - 175 氨基酸处,会形成 α -螺旋,β -折叠及无规则卷曲及明显的锌原子结合位点。
关键词:毛竹;IDD基因家族; 转录因子;生物信息学
DOI:10􀆰 11869 / j. issn. 100⁃8551􀆰 2014􀆰 06. 0998
    转录因子(反式作用因子)是可以与真核生物启
动子中特定 DNA 序列结合的蛋白质,包括 DNA 结合
域和转录激活结构域。 通过与启动子顺式元件作用来
激活或抑制基因的表达,在调控植物发育的基因网络
中起着非常重要的作用[1 - 3]。 IDD基因家族编码一种
混合型的转录因子,包含 2 个 C2H2 和 2 个 C2HC 两种
锌指结构。 这两个锌指结构与一个核定位信号及其周
围的序列构成 IDD⁃domain 的结构特征[4 - 8]。 研究表
明,IDD家族各基因在同物种中行使不同的生物学功
能,多数参与植物生长发育。 水稻 OsID1 / Ehd2 / RID1
和玉米 ZmID1 基因在各自物种的成花发育中对成花
转变起着决定性的作用[5 - 9]。 拟南芥 AtIDD8、14、15
均参与蔗糖和淀粉代谢[10],AtIDD15 还调控重力感应、
根的发育[11]。 AtIDD5 正调节淀粉的合成,也调控花
发育。 AtIDD4 和 6 调节赤霉素合成。 AtIDD3、8、10 与
根发育有关[10]。 IDD 基因家族特殊的结构和多样的
生物学功能为了解植物的生长发育提供一个切入点。
毛竹(Phyllostachys heterocycla)属禾本科植物,但
与普通禾本科植物的生长发育特性相距甚远,如其日
生长量可达 121cm,有些地区的毛竹每年可以开花,但
有些地区的毛竹 120 年也不开花。 鉴于 IDD 家族各
基因多数参与植物生长发育,基于 peng 等[12 - 13]先后
测序的毛竹全长 cDNA和基因组 DNA序列,本文利用
生物信息学方法,鉴定出毛竹中 IDD 基因家族,分析
该家族基因的保守性、氨基酸序列特征、一二三级结
构,以期为深入研究毛竹 IDD 基因家族及其参与生长
发育等方面提供更多的理论基础。
1  材料与方法
1􀆰 1  材料
从毛竹数据库( http: / / 202􀆰 127􀆰 18􀆰 221 / bamboo /
down. php)中下载毛竹全基因组序列、cDNA 序列及氨
基酸序列,构建本地 Blast 数据库,以本课题组从孝顺
竹中克隆得到的 BmID1 基因完整的 cDNA 序列和基
因组序列进行本地 Blast(1e - 003)搜索,获得 IDD 同
源基因。 同时,用已克隆的 IDD 基因编码氨基酸序列
在 NCBI数据库中进行搜索,分别获取玉米、水稻及拟
南芥中的 IDD同源基因。
899
  6 期 毛竹 IDD基因家族的生物信息学分析
1􀆰 2  方法
1􀆰 2􀆰 1  IDD基因家族氨基酸序列获取及系统发生树
的构建  采用 ExPaSy的 Prosite 数据库 (http:∥www.
expasy. org / prosite / )和 NCBI 的 Conserved Domains
数 据 库(http:∥www. ncbi. nlm. nih. gov / Structure /
cdd / wrpsb. cgi)(Marchler⁃Bauer et al. ,2004 )对所获
得的毛竹、拟南芥、水稻和玉米 IDD 基因家族编码的
氨基酸序列进行氨基酸保守位点等分析。 利用在线
ClustalW程序,进行氨基酸序列多重比对,寻找氨基酸
保守区。 采用 Mega5􀆰 8 对 ClustalW 产生的多重比对
结果构建系统发生树, 进化树生成算法采用邻接法
(Neighbor⁃Joining,NJ),校验参数 Bootstrap 重复 1 000
次。
表 1  玉米、水稻、拟南芥和毛竹中 IDD基因家族成员
Table1  IDD gene family members in Zea mays, Oryza sativa, Arabidopsis thaliana and Phyllostachys heterocycla
基因名称
Name of gene
登录号
Accession number
基因名称
Name of gene
登录号
Accession number
基因名称
Name of gene
登录号
Accession number
ZmIDD1 NP_001146099􀆰 1 OsIDD3 EEE70201􀆰 1 AtIDD7 AAG50836􀆰 1
ZmIDD2 DAA52992􀆰 1 OsIDD4 NP_001047703􀆰 1 AtIDD8 NP_199229􀆰 1
ZmIDD3 AFW80524􀆰 1 OsIDD5 BAC79830􀆰 1 AtIDD9 NP_566877􀆰 1
ZmIDD4 AFW80524􀆰 1 OsIDD6 NP_001062466􀆰 1 AtIDD10 BAF00785􀆰 1
ZmIDD5 DAA52992􀆰 1 OsIDD7 EAY86055􀆰 1 AtIDD11 NP_187997􀆰 1
ZmIDD6 NP_001169368􀆰 1 OsIDD8 EEC70289􀆰 1 AtIDD12 NP_192176􀆰 1
ZmIDD7 AFW71600􀆰 1 OsIDD9 EAY77125􀆰 1 AtIDD13 BAB08230􀆰 1
ZmIDD8 NP_001169281􀆰 1 OsIDD10 NP_001053580􀆰 1 AtIDD14 XP_002888637􀆰 1
ZmIDD9 NP_001159309􀆰 1 OsIDD11 EEE54841􀆰 1 AtIDD15 AAD20087􀆰 1
ZmIDD10 DAA63323􀆰 1 OsIDD12 EAZ09317􀆰 1 AtIDD16 BAH30314􀆰 1
ZmIDD11 DAA58632􀆰 1 OsIDD13 EAZ44937􀆰 1 PhIDD1 PH01001338
ZmIDD12 AFW83090􀆰 1 OsIDD14 AFS60115􀆰 1 PhIDD2 PH01001048
ZmIDD13 DAA40726􀆰 1 AtIDD1 NP_201474􀆰 1 PhIDD3 PH01002674
ZmIDD14 DAA40219􀆰 1 AtIDD2 NP_190639􀆰 1 PhIDD4 PH01000878
ZmIDD15 DAA48401􀆰 1 AtIDD3 XP_002892182􀆰 1 PhIDD5 PH01002807
ZmIDD16 AFW89068􀆰 1 AtIDD4 XP_002876795􀆰 1 PhIDD6 PH01000000
OsIDD1 EEE58506􀆰 1 AtIDD5 XP_002875111􀆰 1 PhIDD7 PH01004070
OsIDD2 NP_001042288􀆰 1 AtIDD6 NP_172910􀆰 2 PhIDD8 PH01002348
PhID1 PH01000194
1􀆰 2􀆰 2  PhIDD基因家族蛋白的一、二、三级结构分析
  采用 ProtScale 软件分别一级结构中氨基酸残基组
成、蛋白质分子质量和亲 /疏水性及等电点等特性的在
线分析。 采用 NetPhos2􀆰 0 预测 PhIDD 蛋白中的磷酸
化位点。 采用 SOPMA软件在线预测分析 α -螺旋(α
- helix,H)、 β - 转角 ( β - turn, T)、无规则卷曲
(random coil,C)以及延伸链(extended strand,E)。 采
用 Swiss⁃Model程序预测蛋白质的三维结构。
2  结果与分析
2􀆰 1  PhIDD家族基因编码氨基酸的序列分析
通过本地 Blast分析,从毛竹 cDNA 文库中获得 2
个 PhIDD基因,分别命名 PhIDD1 和 PhIDD2,从毛竹
基因组文库中获得 9 个 PhIDD 基因,其中 2 个为
PhIDD1 和 PhIDD2 基因所对应的基因组序列,另外 7
个分别命名为 PhIDD3 - 8 和 PhID1。 通过在线 Blast,
获得 16 个 ZmIDD 基因、14 个 OsIDD 基因和 16 个
AtIDD 基因(表 1)。
利用在线 ClustalW 对 9 个 PhIDD 基因所编码的
氨基酸进行序列多重比对,彼此间的同源性为
42􀆰 5% ,且 N 端的同源性最高,结果如图 1 所示。
PhID1 蛋白与 OsID1 和 ZmID1 的一致性分别达到
64􀆰 52%和 62􀆰 39% ,说明这几个基因可能具类似的功
能。 根据比对结果发现,这 8 个 PhIDD 基因和 PhID1
999
核  农  学  报 28 卷
图 1  PhIDD家族氨基酸序列的同源性比对
Fig. 1  Alignment of Amino acid sequence from the deduced PhIDD family in Ph heterocycla
所编码的氨基酸序列均具有 IDD⁃domain 的特征,即包
含一个核定位信号和 4 个锌指蛋白结构域(C2H2C2H2
C2HC C2HC),其中前 2 个锌指结构域为 TFIIIA 类型
的锌指结构。 第一个锌指单元与另外 3 个锌指单元之
间的间隔区最长(20 - 25 个氨基酸),其余 3 个锌指单
元间隔较短 (6 - 7 个氨基酸),说明 8 个 PhIDD 和
PhID1 蛋白均属于转录因子,且很可能均在细胞核中
起作用。
在 IDD之外,在 PhIDD4、PhIDD5、PhIDD 6、PhIDD
7 和 PhIDD 8 氨基酸序列靠近 C末端发现一个明显的
保守区域 TRDFLG,这一保守结构域是高等植物 IDD
基因所特有的,而在 PhID1 中,这一保守区域突变为
TRNFLG。 且在 PhIDD2、PhIDD4、PhIDD 6 和 PhIDD 7
中发现了 MSATALLQKAA保守结构域。
2􀆰 2  PhIDD家族基因系统发育树的构建
利用 Mega5􀆰 8 软件构建毛竹 8 个 IDD 蛋白及
PhID1、水稻 14 个 IDD 蛋白及 OsID1、玉米 16 个 IDD
蛋白及 Zm ID1 及拟南芥 16 个 IDD蛋白的系统发生树
(图 2)。 由图可知,系统发生树中的 IDD 蛋白主要聚
为两 类: PhIDD3、 OsIDD12、 OsIDD 13、 OsIDD 14、
ZmIDD14、ZmIDD 15、ZmIDD 16、AtIDD14、AtIDD 15、
AtIDD 16 聚为一类,进一步分析序列发现,这一类中
0001
  6 期 毛竹 IDD基因家族的生物信息学分析
的蛋白均缺失 MSATALLQKAA 保守域与 TRDFLG 保
守域。 其他的蛋白聚为第二类,这一类中,PhID1 与
OsID1 和 ZmID1 的亲缘关系最近,推测 PhID1 蛋白可
能也在毛竹成花转变过程中起重要作用。 毛竹
PhIDD2 和 PhIDD4 与 OsIDD5、ZmIDD8 和 ZmIDD10 的
亲缘关系最近。 而 PhIDD1、 PhIDD6、 PhIDD7 和
PhIDD8 与 OsIDD3、 OsIDD4、 OsIDD6、 OsIDD10、
ZmIDD13、ZmIDD9、AtIDD4、AtIDD5、 AtIDD6 聚为一
类。 更深入仔细分析发现,毛竹中 IDD 家族 8 个基因
的序列与水稻和玉米该家族基因的序列有对应关系,
如 PhID1 与 OsID1、 ZmID1; PhIDD3 与 OsIDD12、
OsIDD13; PhIDD2 与 ZmIDD8、 ZmIDD10、 OsIDD5;
PhIDD5 与 ZmIDD11、 ZmIDD12、 OsIDD11; PhIDD7 与
OsIDD10;PhIDD1 与 OsIDD6。
图 2  毛竹、水稻、玉米及拟南芥 IDD基因家族的聚类分析
Fig. 2  The unrooted neighbor joining phylogenetic tree of IDD genes in moso bamboo, rice, maize and Aranbidopsis
2􀆰 3  PhIDD家族基因编码氨基酸序列的成分组成与
理化性质
采用 Protparam 预测 PhIDD 家族蛋白的理化性
质,结果显示(表 2),PhIDD 蛋白的分子量差别较大,
PhIDD1 的分子量最小(40􀆰 98),PhIDD6 的分子量最大
(61􀆰 33)。 氨基酸残基组成上,除了 PhIDD4 蛋白外,
其它蛋白中丙氨酸(Ala)和丝氨酸(Ser)的含量均较
高。 亲缘关系最近的 PhIDD6 和 PhIDD7 的氨基酸组
成也极其相似。 在 8 个 PhIDD 蛋白和 PhID1 中,只有
PhIDD2 蛋白的等电点为酸性等电点 5􀆰 6,其它的均为
碱性等电点,进一步分析 IDD结构域等电点发现,9 个
保守结构域的等电点较相似,最小的 9􀆰 4 (PhIDD3),
最大的 10􀆰 2(PhIDD4)。 9 个蛋白中,除 PhIDD2 蛋白
全序列与保守结构域序列等电点差异很大外,其余 8
个蛋白都比较接近(表 2)。 从预测结果看,所有 9 个
蛋白的不稳定指数均高于 40,均属于不稳定蛋白。 平
均疏水性(GRAVY)值均为负值,表示这 9 个蛋白均为
亲水性蛋白。
转录因子最重要的功能是调节核内基因的表达,
有些转录因子还会受到磷酸化酶及去磷酸化酶的调控
从而影响其对基因表达的调节。 从氨基酸含量的分析
看,除了 PhIDD4 蛋白外,其它 8 个蛋白中丝氨酸的含
量都比较高,位列前 3(表 2)。 因此,采用 NetPhos 2􀆰 0
Server 预测了 9 个毛竹 PhIDD 蛋白中的磷酸化位点,
1001
核  农  学  报 28 卷
            表 2  毛竹 IDD家族基因的氨基酸序列的组成成分及理化性质
Table 2  Comparison of composition and physical and chemical characters of amino acid sequence of among
PhIDD family in P. heterocycla
蛋白名称
Name of protein PhIDD1 PhIDD2 PhIDD3 PhIDD4 PhIDD5 PhIDD6 PhIDD7 PhIDD8 PhID1
氨基酸数
Number of amino acid /个 373 461 492 387 512 591 560 552 390
蛋白质分子量
Molecular weight / kD 40. 98 49. 49 52. 91 41. 64 54. 65 61. 33 58. 52 58. 18 42. 57
等电点
Isoelectric point 9. 7(9. 7) 5. 6(9. 9) 8. 8(9. 4) 9. 3(10. 2) 9. 1(9. 6) 8. 8(9. 7) 9. 2(9. 7) 9. 5(9. 8) 8. 7 (9. 8)
蛋白质不稳定指数
Instability index 56. 2 67. 5 62. 2 62. 7 60. 0 43. 1 44. 3 48. 1 52. 2
平均疏水性
hydrophobicity - 0. 7 - 0. 6 - 0. 5 - 0. 6 - 0. 5 - 0. 4 - 0. 4 - 0. 5 - 0. 4
氨基酸含量
Content of major amino acid
A(10. 5% )
P(9. 7% )
S(7. 8% )
P(11. 5% )
A(10. 4% )
S(8. 0% )
A(15. 9% )
R (8. 5% )
S(7. 9% )
A(11. 6% )
G(10. 1% )
R(9. 0% )
A(12. 1% )
G(9. 6% )
S(9. 6% )
G(13. 7% )
A(12. 5% )
S(9. 8% )
G(13. 9% )
A(11. 4% )
S(9. 8% )
G(12. 9% )
A(9. 4% )
S(12. 1% )
L(10. 5% )
S(9. 7% )
A(8. 5% )
正电 /负电残基数
Positive / negative residues 46 / 26 60 / 49 52 / 61 37 / 50 34 / 50 46 / 53 39 / 50 39 / 57 42 / 35
脂肪指数
Aliphatic index 56. 2 62. 8 65. 9 61. 9 54. 1 62. 3 59. 4 54. 4 73. 3
膜外 /膜内的概率
Probability of transmembrane 0. 9 / 0. 1 1 / 0 1 / 0 0. 9 / 0. 1 1 / 0 1 / 0 1 / 0 1 / 0 1 / 0
丝氨酸磷酸化位点数
Phosphorylation sites of Ser 14 18 22 17 22 24 18 20 17
苏氨酸磷酸化位点数 Thr
Phosphorylation sites of Thr 5 7 6 3 2 2 1 1 2
酪氨酸磷酸化位点数
Phosphorylation sites of Tyr 2 1 1 0 5 1 1 1 2
酸磷酸化位点总数
Total number of
phosphorylation site
21 26 29 20 29 27 20 22 21
    注:A:丙氨酸;P:脯氨酸;S:丝氨酸;R:精氨酸;G:甘氨酸;L:亮氨酸。 括号中的等电点为保守结构域的等电点。
Note: A,Ala; P, Pro; S, Ser; R, Arg; G, Gly; L, Leu. The pI in the bracket dicates the pI of domains.
结果显示,不同的多肽链中可能的丝氨酸磷酸化位点,
苏氨酸磷酸化位点,以及酪氨酸磷酸化位点的数目各
不相同(表 2),总的可能被磷酸化的位点数均达到 20
个以上,其中,PhIDD3 和 PhIDD5 中可能被磷酸化的
位点最多,达到 29 个,而 PhIDD4 和 PhIDD7 的最少,
20 个。 推测前两个蛋白被磷酸化的可能性更高,后两
者更低些。
2􀆰 4  PhIDD 家族基因编码氨基酸的二、三级结构分

蛋白质二级结构主要有 α -螺旋、β -折叠、β -
转角,常见的有 α -螺旋和 β -折叠。 用 SOPMA软件
分析这 9 蛋白二级结构(表 3),结果显示无规则卷曲
含量约占到 50%左右。 其次是 α - 螺旋,占 20%左
右,其中 PhIDD3 中 α -螺旋的含量高达 44􀆰 9% 。 相
对而言,β -转角含量最少。 从图 3 也可以看出,9 个
PhIDD蛋白,大量的 α -螺旋和无规则卷曲散布于整
个蛋白结构中,β -转角仅零星分布在其中。 β -转角
是一种简单的非重复性结构,其结构比较稳定,多处在
蛋白质分子的表面,在 β -转角处比较容易改变多肽
链的方向。 从表 3 的数据来看,在这 9 个 PhIDD 蛋白
中,PhIDD5 中 β - 转角的含量最高 ( 7􀆰 8% ),而
PhIDD3 最低,仅 2􀆰 6% ,推测,PhIDD5 多肽链转变的方
向更多,结构可能更复杂些。 而在 PhIDD3 蛋白结构
中,在多肽链的 C 端,有一大段 α - 螺旋结构,推测
PhIDD3 蛋白在此处可能也会与下游基因结合,虽然此
处无明显的锌指结构域。
2001
  6 期 毛竹 IDD基因家族的生物信息学分析
表 3  毛竹 IDD家族基因氨基酸序列的二级结构元件组成
Table 3  Composition of predicted secondary structure among PhIDD family in P. heterocycla
蛋白名称
Name of protein / % PhIDD1 PhIDD2 PhIDD3 PhIDD4 PhIDD5 PhIDD6 PhIDD7 PhIDD8 PhID1
α -螺旋 α⁃helix 25􀆰 5 21􀆰 9 44􀆰 9 30􀆰 5 31􀆰 6 26􀆰 7 24􀆰 5 20􀆰 3 20􀆰 3
延伸链 Extended strand 11􀆰 8 14􀆰 1 8􀆰 1 11􀆰 9 12􀆰 7 13􀆰 0 13􀆰 6 14􀆰 3 20􀆰 8
β -转角 β⁃turn 3􀆰 8 6􀆰 7 2􀆰 6 7􀆰 0 7􀆰 8 5􀆰 1 7􀆰 1 6􀆰 0 7􀆰 7
无规则卷曲 Random coil 58􀆰 9 57􀆰 2 44􀆰 3 50􀆰 7 47􀆰 9 55􀆰 2 54􀆰 8 59􀆰 4 51􀆰 3
图 3  毛竹 IDD家族基因二级结构的分布
Fig. 3  Predicted secondary structure among PhIDD family in P. heterocycla.
    蛋白质在形成立体结构时,其多肽链部分首先折
叠成 α -型螺旋和 β -型结构,并由此进一步可折叠
成球形从而发挥生物学功能。 为更深入了解蛋白质的
作用机制,常常需要测定蛋白质的三维结构。 利用
Swiss⁃model workspace 进行这 9 个蛋白的三级结构预
测,三级结构比较相似,其中 PhIDD1 的三维结构预测
见图 4。 结果显示,在 63 ~ 175 氨基酸处,会形成 α -
螺旋,β -折叠及无规则卷曲及明显的锌原子结合位
点。 在 145 - 202 处,也形成 α -螺旋和 β -折叠为主
的结构。
3  讨论
IDD基因家族编码植物特有的锌指转录因子,包
3001
核  农  学  报 28 卷
图 4  PhIDD锌指蛋白的结构预测
Fig. 4  the predicted structure of PhIDD1 protein
含 4 个锌指结构和一个假定的核定位信号。 生物信息
学分析发现,玉米中至少存在 20 个 ZmIDD基因,水稻
中含有 14 个 OsIDD 基因,拟南芥中 16 个 AtIDD 基
因[4]。 拟南芥中这一家族的大部分基因参与其生长
发育,如 AtIDD8、 14、 15 与蔗糖和淀粉代谢相关,
AtIDD3、8、10 与根发育有关[10]。 基于 peng 等[13]公布
的毛竹基因组数据库,本文采用本地 Blast在毛竹基因
组数据库中发现 1 个 ID基因和 8 个 IDD基因,仅在其
cDNA数据库中发现了 2 个 IDD 基因,且这 2 个 IDD
cDNA分别由基因组数据库中的两个 IDD基因转录而
来。 其余 7 个基因的转录产物在 cDNA 文库中未找
到,究其原因可能是这 7 个基因的表达量过低或者是
这 7 个基因表达的时空性与构建 cDNA文库时所取样
品的时空不吻合。
从氨基酸序列的一级结构看,PhIDD2 蛋白的等电
点与其他 8 个的等电点差异较大, PhIDD2 蛋白为
5􀆰 6,其余的都在 8􀆰 8 以上。 且 PhIDD2 蛋白全序列与
保守结构域的等电点也存在较大差异,全序列的为
5􀆰 6,保守结构域的为 9􀆰 9。 9 个不同多肽链中可能的
丝氨酸磷酸化位点,苏氨酸磷酸化位点,以及酪氨酸磷
酸化位点的数目各不相同,但均达到 20 个以上,表明
该家族转录因子可能参与信号转导过程。 三维结构模
型预测显示, 9 个蛋白的三级结构比较相似,以
PhIDD1 为例,在 63 - 175 氨基酸处,会形成 α -螺旋,
β -折叠及无规则卷曲及明显的锌原子结合位点。
进一步对其氨基酸序列进行了分析,这 9 个蛋白
的氨基酸序列均存在一个核定位信号序列和 4 个锌指
结构,表明的确为锌指转录因子。 将这 9 个蛋白与拟
南芥、水稻和玉米的 IDD 家族进行聚类, PhID1 与
ZmID1 和 OsID1 的亲缘关系最近,推测其生物学功能
比较接近,即在毛竹从营养生长向生殖生长转变的过
程中起非常重要的作用。 而 PhIDD3 与 AtIDD14 和
AtIDD 15 聚为一类,而拟南芥中,AtIDD14 和 AtIDD 15
均参与蔗糖和淀粉代谢[10],且协同调节生长素的合成
和转运[14]。 AtIDD15 还调控重力感应、根的发育[11],
预示着 PhIDD3 在糖代谢、激素代谢、感应重力及根发
育等方面可能发挥着作用。 PhIDD7 与 OsDD 10 关系
最近,而水稻 OsDD 10 参与铵吸收与 N 代谢,PhIDD7
可能参与毛竹根吸收养分及代谢过程[15]。 加拿大罗
瑞尔大学植物发育协会 2012 年工作会议的研究结果
显示,植物 IDD基因家族的全部基因可能调节一些重
要发育过程的 C平衡,但相关数据未正式发表。
4  结论
基于毛竹基因组数据,通过本地 Blast 获得 9 个
IDD家族基因,将其命名为 PhID1 及 PhIDD1 - 8,氨基
酸序列比对发现,该 9 个蛋白均含一个核定位信号序
列和 4 个锌指结构,用生物信息学手段对获得的蛋白
的理化性质、二三级结构进行了分析,发现该家族基因
存在明显的锌原子结合位点。 表明这 9 个蛋白均为转
录因子。 此外,根据聚类结果分析预测了毛竹中 IDD
各基因的生物学功能,此项结果还有待于进一步的实
验证实。
参考文献:
[ 1 ]   朱玉贤,李毅,郑晓峰,郭红卫. 现代分子生物学(第四版)[M].
4001
Journal of Nuclear Agricultural Sciences
2014,28(6):0998 ~ 1005
北京:高等教育出版社,2013
[ 2 ]  鄂志国,王磊.水稻 WRKY基因家族功能研究进展[ J] . 核农学
报,2012,26(5) : 750 - 755
[ 3 ]  向建华,李灵之,陈信波. 植物非生物逆境相关锌指蛋白基因的
研究进展[J] . 核农学报,2012,26(4) : 666 - 672
[ 4 ]  Colasanti J, Tremblay R, Wong A Y, Coneva V, Kozaki A, Mable
B K. The maize INDETERMINATE1 flowering time regulator defines
a highly conserved zinc finger protein family in higher plants [ J] .
BMC Genomics, 2006, 7: 1 - 15
[ 5 ]  Wu C, You C, Li C, Long T, Chen G, Byrne ME, Zhang Q.
RID1, encoding a Cys2 / His2 - type zinc finger transcription factor,
acts as a master switch from vegetative to floral development in rice
[J] . Proceedings of the National Academy of Sciences of the United
States of America, 2008,105(35):12915 - 12920
[ 6 ]  Wong A, Colasanti J. Maize floral regulator protein
INDETERMINATE1 is localized to developing leaves and is not
altered by light or the sink / source transition [ J ] . Journal of
Experimental Botany, 2007,58:403 - 414
[ 7 ]  Matsubara K, Yamanouchi U, Wang Z, Minobe Y, Izawa T, Yano
M. Ehd2, a rice ortholog of the maize INDETERMINATE1 gene,
promotes flowering by up⁃regulating Ehd1 [ J] . Plant Physiology,
2008,148:1425 - 1435
[ 8 ]  Park S, Kim S, Lee S, Je B, Piao H, Park S, Kim C, Ryu C, Park
S, Xuan Y, Colasanti J, An G, Han C. Rice indeterminate1
(OsId1) is necessary for the expression of Ehd1 ( Early heading
date1) regardless of photoperiod[J] . The Plant Journal, 2008, 56:
1018 - 1029
[ 9 ]  Colasanti J, Yuan Z, Sundaresan V. The indeterminate gene
encodes a zinc finger protein and regulates a leaf⁃generated signal
required for the transition to flowering in maize [ J] . Cell, 1998,
93:593 - 603
[10]  Ingkasuwan P, Supatcharee Netrphan, Sukon Prasitwattanaseree,
Morakot Tanticharoen, Sakarindr Bhumiratana, Asawin Meechai,
Jeerayut Chaijaruwanich, Hideki Takahashi, and Supapon
Cheevadhanarak. Inferring transcriptional gene regulation network of
starch metabolism in Arabidopsis thaliana leaves using graphical
Gaussian model [J] . BMC Systems Biology 2012, 6:100
[11]   Tanimoto M, Trembiay R, Colasanti J. Altered gravitropic response,
amyloplast sedimentation and circumnutation in the Arabidopsis shoot
gravitropism 5 mutants are associated with reduced starch levels [J] .
Plant Molecular Biology, 2008, 67: 57 - 66
[12]  Peng Z, Lu Y, Li L, Zhao Q, Feng Q, Gao Z, Lu H, Hu T, Yao
N, Liu K, Li Y, Fan D, Guo Y, Li W, Lu Y, Weng Q, Zhou C,
Zhang L, Huang T, Zhao Y, Zhu C, Liu X, Yang X, Wang T,
Miao K, Zhuang C, Cao X, Tang W, Liu G, Liu Y, Chen J, Liu
Z, Yuan L, Liu Z, Huang X, Lu T, Fei B, Ning Z, Han B, Jiang
Z. The draft genome of the fast⁃growing non⁃timber forest species
moso bamboo ( Phyllostachys heterocycla) [ J] . Nature Genetics,
2013, 13: 216 - 224
[13]  Peng Z, Lu T, Li L, Liu X, Gao Z, Hu T, Yang X, Feng Q, Guan
J, Weng Q, Fan D, Zhu C, Lu Y, Han B, Jiang Z. Genome⁃wide
characterization of the biggest grass, bamboo, based on 10, 608
putative full⁃length cDNA sequences [ J ] . BMC Plant Biology,
2010, 10: 116 - 122
[14]  Cui D, Zhao J, Jing Y, Fan M, Liu J, Wang Z, Xin W, Hu Y.
The Arabidopsis IDD14, IDD15, and IDD16 Cooperatively Regulate
Lateral Organ Morphogenesis and Gravitropism by Promoting Auxin
Biosynthesis and Transport[ J] . PLoS Genetics 9 (9): e1003759.
doi:10􀆰 1371 / journal. pgen. 1003759
[15]   Xuan Y, Priatama R, Huang J, Je B, Liu J, Park S, Piao H, Son
D, Lee J, Park S, Jung K, Kim T, Han C. Indeterminate domain
10 regulates ammonium⁃mediated gene expression in rice roots[ J] .
New Phytologist. 2013,197(3):791 - 804
Bioinformatic Aanlysis of IDD Gene Family in
Phyllostachys heterocycla
GUAN Ying  XU Zai⁃en  GUO Xiao⁃qin
(The Nurturing Station for the State Key Laboratory of Subtropical Silviculture, Zhejiang A&F University, Lin’an, Zhejiang  311300)
Abstract: IDD gene family encode hybrid transcription factor. In this study, nine IDD genes in Phyllostachys
heterocycla, named PhIDD1 and PhIDD1 - 8 were obtained by local blast. They all contain IDD⁃domain which is a
putative nuclear location signal and four zinc finger motifs. All nine putative proteins were hydrophilic, and their
isoelectric point distributed between 8􀆰 8 and 9􀆰 7 except for PhIDD2 (5􀆰 6). Ala, Ser and Gly were abundant in these
proteins. Constructions of α - helixs and random coils in these proteins were dominant elements, β - turns and extended
strains interspersing over the whole proteins. The prediction of these proteins showed that the number of phosphorylation
sites were from 20 to 29, α - helixs, β - turns and random coils of PhIDD1 were formed at 63 - 175amino acid and
there is a zinc binding site at this space.
Key words:Phyllostachys heterocycla; IDD Gene Family;Transcription Factor; Bioinformatics
5001