免费文献传递   相关文献

Cloning and Phylogenetic Analysis of cDNA Sequences Coding for ARC1 and Exo70A1 in Brassica oleraces var. capitata L.

结球甘蓝ARC1与Exo70A1编码区cDNA的克隆及进化分析



全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2016, 32(6):76-88
芸薹属植物自交不亲和反应(self-incompatibil-
ity,SI)是沿着 SCR(S cysteine-rich,S-富含半胱
氨酸蛋白[1])→ SRK(S receptor kinase,S-受体激
酶[2]) → ARC1(armadillo-repeat containing protein 
收稿日期:2015-10-07
基金项目:国家自然科学基金项目(31572127),重庆市自然基金重点项目(cstc2012jjB80010)
作者简介:杨丹,女,硕士研究生,研究方向:分子作物育种;E-mail :yangdan042561@163.com
通讯作者:朱利泉,教授,研究方向:植物分子生物学;E-mail :zhuliquan@swu.edu.cn
结球甘蓝 ARC1 与 Exo70A1 编码区 cDNA 的克隆及
进化分析
杨丹  廉小平  周燕  张贺翠  杜丹  高启国  任雪松  朱利泉
(西南大学  农学部植物生理生化实验室,重庆  400715)
摘 要 : 在甘蓝自交不亲和信号传导过程中,ARC1 与 Exo70A1 的相互作用起着承上启下的关键作用。为了研究 10 种自交
不亲和结球甘蓝材料 ARC1 和 Exo70A1 的进化关系,对其编码区 cDNA 进行了克隆和测序 ;在此基础上采用生物信息学方法,对
这 10 种材料和前人已发表的 83 条 ARC1 和 73 条 Exo70A1 的相关序列的 ARC1-Exo70A1 的互作区和非互作区编码序列进行了变异
和进化分析。结果发现 :(1)所选育的 10 种结球甘蓝材料的 ARC1 与 Exo70A1 的编码区核酸序列存在平行进化关系,且均聚类于
芸薹属分支下 ;(2)ARC1 比 Exo70A1 编码区序列进化速率快 ;(3)ARC1 和 Exo70A1 互作编码区核酸序列存在明显的协同进化,
而 ARC1 和 Exo70A1 非互作编码区核酸序列则在进化上呈现明显分异 ;(4)ARC1 和 Exo70A1 互作编码区 cDNA 的进化均快于非
互作编码区。
关键词 : ARC1 ;Exo70A1 ;自交不亲和 ;进化关系 ;协同进化
DOI :10.13560/j.cnki.biotech.bull.1985.2016.06.012
Cloning and Phylogenetic Analysis of cDNA Sequences Coding for
ARC1 and Exo70A1 in Brassica oleraces var. capitata L.
YANG Dan  LIAN Xiao-ping  ZHOU Yan  ZHANG He-cui  DU Dan  GAO Qi-guo   
REN Xue-song  ZHU Li-quan
( Laboratory of Physiology and Biochemistry,Southwest University,Chongqing 400715)
Abstract:  Interaction between ARC1 and Exo70A1 in Brassica is a key point of self-incompatibility(SI)signal transduction. In order 
to study the evolutionary relationship of ARC1 and Exo70A1 from 10 cultivars of SI head cabbages developed in recent years,we successfully 
cloned and sequenced cDNAs of ARC1 and Exo70A1. Furthermore,by bioinformatics,we had mutation and evolutionary analysis of  those 
coding region sequences,including interaction region and non-interaction regions of ARC1-Exo70A1 from the 10 cabbages and prior published 
83 ARC1 and 73 Exo70A1 sequences. The results revealed that :1)The coding nucleic acid sequences of ARC1 and Exo70A1 from the 10 
cabbage materials presented parallel evolutionary relationships,and belonged to the Brassica branch. 2)The evolution rate of coding sequence 
of ARC1 was faster than Exo70A1. 3)The interaction coding region of ARC1-Exo70A1 was obviously in the progress of co-evolution,while the 
non-interaction coding area of ARC1-Exo70A1 showed significant differentiation rate in evolution. 4)The evolutionary rate of interaction coding 
area was faster than non-interaction coding region. 
Key words:  ARC1 ;Exo70A1 ;self-incompatibility ;evolutionary relationship ;co-evolution
2016,32(6) 77杨丹等 :结球甘蓝 ARC1 与 Exo70A1 编码区 cDNA 的克隆及进化分析
1)→ Exo70A1 → MOD[3]的途径进行的。SRK 作为
柱头 S 基因,由胞外 S 结构域、跨膜结构域和激酶
结构域的编码区构成,其同 SCR 识别的胞外 S结构
域编码区变异性较大[4-6],而 SRK 蛋白完整的胞外
域包括 B-Lection 结构域,SLG 结构域,PAN-APPLE
结构域。在 SI 反应途径中,ARC1 与 Exo70A1 的相
互作用起着承上启下的关键作用。研究表明,ARC1
的 C 端含有一个由 6-7 个臂重复区组成的 ARM 功
能域,N端含有一个 UND功能域,中间有一个 U-box
功能域[7]。ARC1 的 C 端结构域是与 SRK 激酶域发
生相互作用的区域[7],而 U-box 保守结构域是 70 多
个氨基酸残基构成的 UFD2(泛素融合蛋白质),其
主要作为泛素连接酶 -E3 起作用,在泛素化系统中
特异性识别底物蛋白质[8]。Exo70A1 是 SI 信号传导
途径中 ARC1 的下游底物,是 Samuel 等[9]运用酵
母双杂交文库筛选技术从甘蓝型油菜的柱头细胞中
分离出的一种新型 SI 信号传导元件。Exo70A1 蛋白
的 C 端含有一个典型的 Exo70 结构域[10]。油菜的
Exo70A1 基因含有 12 个外显子及 11 个内含子,研
究表明 Exo70Al 可能是促进花粉水合、萌发及花粉
管生长的亲和因子,在 SI 反应途径中被 ARC1 参与
的泛素 /26S 蛋白酶体途径降解,从而导致柱头对自
花花粉的拒绝[11]。
Stone 等的研究表明[7],在 ARC1 和 Exo70A1
发生互作时,ARC1 蛋白质 N 端的 U-box 是不可缺
少的结构域;而杨佳等[11]的研究进一步表明羽衣
甘蓝 ARC1 与 Exo70A1 相互作用区段是 ARC1 的 N
端(UND 区段)和 Exo70A1 的 N 端(此蛋白质的
1-270 个氨基酸)。而目前根据 S 位点基因序列构建
基因树做进化分析的文章也日益增多[12-14]。在这些
研究的基础上,本研究以高度自交不亲和的结球甘
蓝为研究对象,并利用其编码区序列分别对 ARC1-
Exo70A1互作区和非互作区编码DNA进行进化分析,
以期为选育的甘蓝自交不亲和材料在整个植物中初
步建立起进化位置和进化关系。
1 材料与方法
1.1  材料
近年来选育的高度自交不亲和结球甘蓝(表 1),
由西南大学园艺园林学院蔬菜实验室提供;大肠杆
菌感受态 DH5α、EasyPfu Taq DNA polymerase、胶
回收试剂盒和 TranScript First-strand cDNA Synthesis 
SuperMix、Mark III( 目 录 号:MD103) 购 自 北
京全式金生物技术有限公司;T4 DNA  连接酶、
pMDTM19-T Vector、Sac I 与 Sma I 购自 TaKaRa 大连
公司;RNA 提取试剂盒 RNAprep Pure Plant Kit(目
录号:DP432)购自天根生化科技(北京)有限公司;
其他常规试剂均为国产分析纯;引物合成与序列测
定由北京华大基因公司完成。
表 1 甘蓝材料及其亲和指数
序号 材料名称 亲和指数
1 E1 0
2 C 0.02
3 B3 0.08
4 M1 0.05-0.1
5 F 0.19
6 G3 0.23
7 A4 0.3
8 278 0.43
9 284 0.85
10 K2 1.28
注:亲和指数 = 籽粒数 / 自交花(或蕾)数,其值为 0-1 时为强自交不亲
和系,1-3 为弱自交不亲和系[15]
1.2  方法
1.2.1  结 球 甘 蓝 ARC1 与 Exo70A1 CDS(Coding 
sequence,编码区序列)的克隆及测序 运用 Primer 
Premier 6.0 软件,依照 Genbank 中 ARC1 和 Exo70A1
已有的序列分别设计结球甘蓝 ARC1 引物和 Exo-
70A1 引物。所选择的 ARC1 上游引物是(F-primer)
5-CCGGAATTCCCGATGGCCACTGATTCAGCAATGT
TCGCAT-3,下游引物是(L-primer)5-ACGCGTCG
ACGTTATCTCTGTGTTTTCTGGTCGCAC-3 ;Exo70A1
上游引物是(F-primer)5-GGGAACATATGTACATG
GCCGTCGATAGCGGAAT-3,下游引物是(L-primer)
5-ACGCGTCGACCTTTACCGTCGTGGTTCATTCATAG
ACT-3。
收集开花前 1 d 结球甘蓝花蕾的雌蕊,提取总
RNA。以 TranScript First-strand cDNA Synthesis Supe-
rMix 反转录合成进 cDNA 第一链;再选用引物对,
以所得 cDNA 为模板,对应的扩增 ARC1 和 Exo70A1
生物技术通报 Biotechnology Bulletin 2016,Vol.32,No.678
基因。扩增体系均为 50 μL :模板 4 μL,2 mmol/L 
dNTPs 5 μL,上下游引物各 2 μL,10×Easypruf Bu-
ffer 5 μL,ddH2O 31 μL,TransTaq 酶 1 μL。PCR 扩
增程序参数为:94℃预变性 2 min ;94℃预变性 30 
s,退火 30 s,72℃延伸 90 s,35 个循环;于 72℃
反应 5 min 后再 4℃ 5 min,反应终止(T:ARC1 为
60℃,Exo70A1 为 62℃),反应结束后,置于 4℃冰
箱。PCR 产物经 1%(W/V)琼脂糖凝胶电泳,凝
胶成像仪拍照,切胶,试剂盒回收纯化产物。胶回
收产物(ARC1、Exo70A1)分别进行 TA 克隆,连
接到 pMDTM19-T 载体;重组载体转化感受态细胞
DH5α,LB 固体培养基培养过夜,蓝白斑筛选阳性
克隆子,挑取阳性克隆并经 PCR 鉴定后,分别抽提
质粒 pMDTM19-T-ARC1、pMDTM19-T-Exo70A1,抽提
质粒送北京华大科技公司测序。将测序的结果进行
拼接获取结球甘蓝材料的序列。
1.2.2  ARC1-Exo70A1 互作区与非互作区编码 DNA
的确定  不包括 U-box 区域的 N 端编码序列(UND
结构域)是 ARC1-Exo70A1 的互作编码区段[8,10,11]。 
结合 NCBI 在线网站查询序列的结构域,利用
MEGA5.05 软件对 ARC1 序列和 Exo70A1 序列进行剪
切,分别保留所需的互作编码区和非互作编码区于
本地文件夹中。
1.2.3  结球甘蓝 ARC1 和 Exo70A1 序列生物信息学
分析  利用 CLUATAL-W,Vector NTI Advance 10 进
行多重序列比对分析;dnasp5 软件进行序列多态性
分析。采用 MEGA5.05 构建 N-J 模型进化树,仅在
构建进化树时将 the bootstrap probabilities 此项参数
修改为 1 000,其他步骤均采用默认设置。
1.2.4  ARC1 和 Exo70A1 相似序列的获取  NCBI 及
Brassica Database(http://brassicadb.org/) 等 网 站 分
别获取与结球甘蓝 ARC1 和 Exo70A1 核酸或氨基
酸序列相似性(Similarity)大于 70% 的 ARC1(表
2),Exo70A1 核酸序列(表 3)。结球甘蓝所得材
料序列命名为序列名称加基因名,如 E1-ARC1,
E1-Exo70A1。对于同一种属的不同序列在名称后加
上大写字母 A,B,C 等加以区分,如序列 1 命名
1Arabidopsis thaliana A,简称为 1At-A。根据聚类情
况来反映树的可信度。
2 结果
2.1  结球甘蓝ARC1与Exo70A1编码区DNA的克
隆、测序及序列分析
提取 RNA 后,经反转录后获得 10 种材料的
cDNA。以 cDNA 为模板,分别扩增获得相应 10 种
材料的 ARC1 和 Exo70A1 的 CDS(图 1);分别连接
到 pMDTM19-T 载体进行测序,拼接后获得所需序列
数据,经过 Vector NTI 分析可知,ARC1 均为 1 992 
bp 和 Exo70A1 均为 1 918 bp,与图 1 中电泳结果条
带约在 2 000 bp 处相符。
4500
bp
3000
2000
1200
600
500
200
M1A 1 2 3 4 5 6 7 8 9 10
4500
bp
3000
2000
1200
600
500
200
B 11M2 12 13 14 15 16 17 18 19 20
M1,M2 :Marker III ;1-10 :ARC1 基因;11-20 :Exo70A1 基因
图 1 ARC1 和 Exo70A1 基因 PCR 电泳图
10 种材料的 ARC1 核酸序列相似度均高达 97%
以上,存在 84 个差异位点,氨基酸差异位点 37 个,
且多为同义突变;10 种材料的 Exo70A1 核酸序列
相似度则均高于 98%,有 62 个差异位点,氨基酸
差异位点为 23,也多为同义突变。图 2 为 ARC1 与
Exo70A1 编码区核酸序列与氨基酸序列局部比对图
(此部分为该序列差异位点最多的100 bp碱基区段),
可以看出 ARC1 的核酸序列变异位点更多。综上说
明在自交不亲和的结球甘蓝中 ARC1 和 Exo70A1 序
列高度相似,且 Exo70A1 比 ARC1 更为保守。
在线网站共收集获得现有的 83 条 ARC1 和 73
2016,32(6) 79杨丹等 :结球甘蓝 ARC1 与 Exo70A1 编码区 cDNA 的克隆及进化分析
表 2 ARC1 序列 GI 号
名称 GI number 简称 名称 GI number 简称
1小白菜 521312227 1Br 43 毛果杨 D 224112454 43Pt-D
2 甘蓝型油菜 2558937 2Bn 44 鹰嘴豆 B 502097551 44Ca-B
3 羽衣甘蓝 164470359 3Bo 45 驯化大麦 C 326496383 45Hv-C
4 琴叶拟南芥 A 297823212 4Al-A 46 蓖麻 B 255574829 46Rc-B
5 盐芥 312283440 5Eh 47 葡萄 E 225448504 47Vv-E
6 琴叶拟南芥 B 297845853 6Al-B 48 蒺藜苜蓿 C 313569760 48Mt-C
7 拟南芥 A 30690687 7At-A 49 黄瓜 D 449441579 49Cs-D
8 拟南芥 B 17381177 8At-B 50 番茄 B 460401516 50Sl-B
9 蓖麻 A 255562519 9Rc-A 51 野草莓 C 470146677 51Fv-C
10 大豆 A 356549179 10Gm-A 52 蒺藜苜蓿 D 357492770 52Mt-D
11 毛果杨 A 224116779 11Pt-A 53 大豆 E 356499212 53Gm-E
12 葡萄 A 359483782 12Vv-A 54 大豆 F 356495118 54Gm-F
13 番茄 A 460374470 13Sl-A 55 蒺藜苜蓿 E 357477380 55Mt-E
14 蒺藜苜蓿 A 357447092 14Mt-A 56 粳稻 C 115464474 56Os-C
15 烟草 30013678 15Nt 57 粳稻 D 29367590 57Os-D
16 蒺藜苜蓿 B 217074981 16Mt-B 58 番茄 C 460391004 58Sl-C
17 大豆 B 356512540 17Gm-B 59 鹰嘴豆 C 502152286 59Ca-C
18 鹰嘴豆 A 502078400 18Ca-A 60 二穗短柄草 B 357125657 60Bd-B
19 毛果杨 B 224079028 19Pt-B 61 葡萄 F 359473438 61Vv-F
20 马铃薯 118490014 20St 62 黄瓜 E 449469686 62Cs-E
21 野草莓 A 470115581 21Fv-A 63 江南卷柏 C 302804615 63Sm-C
22 大豆 C 356525310 22Gm-C 64 小立碗藓 C 168018590 64Pp-C
23 黄瓜 A 449459307 23Cs-A 65 拟南芥 C 145357524 65At-C
24 黄瓜 B 449500789 24Cs-B 66 蓖麻 C 255540716 66Rc-C
25 葡萄 B 225457072 25Vv-B 67 鹰嘴豆 D 502146391 67Ca-D
26 大豆 D 356555448 26Gm-D 68 小立碗藓 D 168063475 68Pp-D
27 高粱 A 242061093 27Sb-A 69 江南卷柏 D 302753311 69Sm-D
28 谷子 A 514707698 28Si-A 70 琴叶拟南芥 C 297810216 70Al-C
29 二穗短柄草 A 357140651 29Bd-A 71 北美假大麻 459680681 71Dg
30 驯化大麦 A 326514381 30Hv-A 72 毛果杨 E 224139333 72Pt-E
31 葡萄 C 359485456 31Vv-C 73 粳稻 E 115440766 73Os-E
32 粳稻 A 115445198 32Os-A 74 小立碗藓 E 168005551 74Pp-E
33 粳稻 B 32972610 33Os-B 75 黄瓜 F 449522481 75Cs-F
34 驯化大麦 B 326523964 34Hv-B 76 毛果杨 F 224098721 76Pt-F
35 小立碗藓 A 168016287 35Pp-A 77 二穗短柄草 C 357128966 77Bd-C
36 小立碗藓 B 168002111 36Pp-B 78 高粱 B 242059094 78Sb-B
37 野草莓 B 470127953 37Fv-B 79 谷子 B 514783664 79Si-B
38 葡萄 D 359481243 38Vv-D 80 谷子 C 514748996 80Si-C
39 江南卷柏 A 302786897 39Sm-A 81 小立碗藓 F 168026331 81Pp-F
40 毛果杨 C 224087844 40Pt-C 82 粳稻 F 32975325 82Os-F
41 江南卷柏 B 302791722 41Sm-B 83 驯化大麦 D 326533995 83Hv-D
42 黄瓜 C 449466525 42Cs-C
生物技术通报 Biotechnology Bulletin 2016,Vol.32,No.680
表 3 Exo70A1 序列 ACCESSION 号
名称 ACCESSIO 号 简称 名称 ACCESSION 号 简称
1拟南芥 A NM_120434.4 1At-A 38 苜蓿 XM_003591640.1 38Mt
2 拟南芥 B AY072155.1 2At-B 39 黄瓜 A XM_004134992.1 39Cs-A
3 拟南芥 C AY133751.1 3At-C 40 黄瓜 B XM_004162685.1 40Cs-B
4 拟南芥 D NM_001125690.1 4At-D 41 黄瓜 C XM_004159186.1 41Cs-C
5 拟南芥 E NM_124613.3 5At-E 42 黄瓜 D XM_004159219.1 42Cs-D
6 拟南芥 F NM_001203287.1 6At-F 43 草莓属 A XM_004303387.1 43Fv-A
7 羽衣甘蓝 JF919716.1 7Bo 44 草莓属 B XM_004307023.1 44Fv-B
8 小白菜 JX997396.1 8Br 45 北美云杉 EF085736.1 45Ps
9 甘蓝型油菜 GQ503256.1 9Bn 46 白云杉 BT116031.1 46Pg
10 深山拟南芥 A XM_002864119.1 10Bl-A 47 粳稻 A NM_001072333.1 47Os-A
11 深山拟南芥 B XM_002870996.1 11Bl-B 48 粳稻 B AK066482.1 48Os-B
12 葡萄 A XM_002280509.1 12Vv-A 49 粳稻 C NM_001072744.2 49Os-C
13 葡萄 B XM_003632607.1 13Vv-B 50 二穗短柄 A XM_003577738.1 50Bd-A
14 葡萄 C FQ382906.1 14Vv-C 51 二穗短柄 B XM_003576970.1 51Bd-B
15 葡萄 D FQ395723.1 15Vv-D 52 大麦 A AK363904.1 52Hv-A
16 葡萄 E XM_002268074.2 16Vv-E 53 大麦 B AK365240.1 53Hv-B
17 番茄 A XM_004236759.1 17Sl-A 54 高粱 A XM_002450273.1 54Sb-A
18 番茄 B XM_004249899.1 18Sl-B 55 高粱 B XM_002442800.1 55Sb-B
19 番茄 C AK326542.1 19Sl-C 56 高粱 C XM_002448761.1 56Sb-C
20 番茄 D AK325721.1 20Sl-D 57 栗 A XM_004978676.1 57Si-A
21 马铃薯 A XM_006365627.1 21St-A 58 栗 B XM_004959941.1 58Si-B
22 马铃薯 B XM_006367092.1 22St-B 59 栗 C XM_004978272.1 59Si-C
23 毛果杨 A XM_002311899.1 23Pt-A 60 玉米 A NM_001154342.1 60Zm-A
24 毛果杨 B XM_002315386.1 24Pt-B 61 玉米 B NM_001196530.1 61Zm-B
25 毛果杨 C XM_002315386.2 25Pt-C 62 玉米 C BT041886.1 62Zm-C
26 毛果杨 D XM_002311899.2 26Pt-D 63 玉米 D NM_001136838.1 63Zm-D
27 毛果杨 E XM_002309211.2 27Pt-E 64 玉米 E BT017949.1 64Zm-E
28 毛果杨 F XM_002322754.2 28Pt-F 65 玉米 F AY108407.1 65Zm-F
29 蓖麻 A XM_002532497.1 29Rc-A 66 小立碗藓 XM_001759136.1 66Pp
30 蓖麻 B XM_002516590.1 30Rc-B 67 鹰嘴豆 XM_004496057.1 67Ca
31 大豆 A XM_003536231.1 31Gm-A 68 柑橘 A XM_006445711.1 68Cc-A
32 大豆 B XM_003535900.1 32Gm-B 69 柑橘 B XM_006445710.1 69Cc-B
33 大豆 C AK244814.1 33Gm-C 70 荠菜 A XM_006280112.1 70Cr-A
34 大豆 D XM_003555648.1 34Gm-D 71 荠菜 B XM_006287193.1 71Cr-B
35 大豆 E XM_003543620.1 35Gm-E 72 山萮菜属 A XM_006401773.1 72Es-A
36 大豆 F XM_003543621.1 36Gm-F 73 山萮菜属 B XM_006398743.1 73Es-B
37 大豆 G XM_003556265.1 37Gm-G
2016,32(6) 81杨丹等 :结球甘蓝 ARC1 与 Exo70A1 编码区 cDNA 的克隆及进化分析
条 Exo70A1 本身及类似序列(表 2,表 3)。ARC1 序
列来自 21 个不同种属,如芸薹属,拟南芥等;而
Exo70A1 则来自 24 个不同种属。两种基因的序列均
可分为 3大类:单子叶(水稻、小麦和玉米等),双
子叶植物(甘蓝、白菜、拟南芥和大豆等)和低等
植物(小立碗藓和江南卷柏),但是未收集到江南卷
柏的 Exo701 序列。序列比对结果表明:83 条 ARC1
核酸序列相似度在 41%-100% 之间,存在 677 个
差异位点;73 条 Exo70A1 核酸序列相似度在 43%-
100% 之间且大部分高于 ARC1 的相似度,有 529 个
差异位点。
2.2  ARC1-Exo70A1互作、非互作编码区DNA的 
确定
在所获得的 73 条 Exo70A1 的 CDS 序列中,其
C-端均含有一个保守的 Exo70 结构域。由文献[11]
可知:用 ARC1 N 端的 UND 功能域与 Exo70A1 的
1-85氨基酸或1-270氨基酸互作均可激活报告基因,
但与 1-270 氨基酸互作时其相互作用强度更大。据
此认为所获得的 Exo70A1 序列 CDS 的前 840 bp 为
Exo70A1 蛋白与 ARC1 蛋白的主要互作编码区。此
外根据杨红等[5]研究结果可知:RING-finger type 结
构与 U-box 蛋白质相似,所以认为其 RING-finger 结
构域功能类似于 U-box 结构域;在 NCBI 网站预测
结球甘蓝 ARC1 结构域,可知其存在 U-box 结构域,
且位于 844-1 041 bp。
综上可知 ARC1-Exo70A1 的互作区段(图 3),
对序列进行剪切。ARC1 以 U-box 保守域的第一个上
游核苷酸为剪切点,对于无 U-box 的序列以 RING-
finger 结构域(表 2 中编号为 43、45、47、48、52、
53、58 和 61)的第一个上游核苷酸为剪切点,获得
93 条互作区和非互作区 ARC1 序列;Exo70A1 以序
列 840 bp 处为剪切点,得到 83 条互作区和 81 条非
互作区 Exo70A1 序列(其中编号为 42 和 65 的序列,
因其非互作区不完整未使用)。
2.3  芸薹属与拟南芥属序列的相对进化速率分析
10 种材料结球甘蓝序列相似性极高,利用其共
有序列(命名为 ARC1-C、Exo70A-C)进行相关分析。
芸薹属及拟南芥属序列进行多态性分析的结果,如
284-ARC1
278-AC1
A4-ARC1
B3-ARC1
C-ARC1
E1-ARC1
F-ARC1
G3-ARC1
K2-ARC1
M1-ARC1
284-Exo70A1
278-Exo70A1
B3-Exo70A1
C-Exo70A1
E1-Exo70A1
F-Exo70A1
G3-Exo70A1
K2-Exo70A1
M1-Exo70A1
100
100
100
100
100
100
100
100
100
100
1900
1900
1900
1900
1900
1900
1900
1900
1900
10 20 30 40 50 60 70 80 90 100
1810 1820 1830 1840 1850 1860 1870 1880 1890 1900
图 2 局部序列比对图
生物技术通报 Biotechnology Bulletin 2016,Vol.32,No.682
表 4和 5所示。
非同义突变率(Ka)与同义突变率(Ks)的比
值是选择效应和选择方向的代表[16]。Ka/Ks 大于 1
则说明基因受到正向选择影响,为快速进化基因;
Ka/Ks 等于 1 则说明同义突变与非同义突变频率相
同,未受到选择的影响;Ka/Ks 小于 1 则说明基因
受负向选择影响,为相对保守基因。芸薹属与拟南
芥属的 ARC1 和 Exo70A1 序列的 Ka 与 Ks 及其比值
均小于 1(表 4 和表 5),说明在芸薹属与拟南芥属 
中,ARC1 与 Exo70A1 这两个基因都受负向选择影响,
是相对保守的基因。
比较不同物种同源或同类大分子的一级结构可
U-box ARMUND
interaction area interaction area
1 270
Exo70A1
Exo70
200 bp
ARC1
图 3 ARC1 与 Exo70A1 结构域示意图[8,11]
表 4 ARC1 多态性分析
序列名称
ARC1 编码区 ARC1 互作区 ARC1 非互作区
Ks Ka Ka/Ks Ks Ks
ARC1-C Br 0.1129 0.0341 0.3020 0.1038 0.1230
ARC1-C Bn 0.1200 0.0306 0.2550 0.1201 0.1185
ARC1-C Bo 0.0151 0.0041 0.2715 0.0254 0.0035
ARC1-C At 1.4635 0.2683 0.1833 1.6941 1.2630
At Br 1.4704 0.2677 0.1821 1.8585 1.2303
At Bn 1.4566 0.2555 0.1754 1.7705 1.2281
At Bo 1.4787 0.2644 0.1788 1.7252 1.2441
Br Bn 0.0510 0.0144 0.2824 0.0445 0.0551
Br Bo 0.1153 0.0327 0.2836 0.1078 0.1272
Bn Bo 0.1175 0.0291 0.2477 0.1158 0.1226
注:Ks :同义突变率;Ka :非同义突变率;At :拟南芥属序列;Br :小白菜序列;Bn :甘蓝型油菜序列;Bo :羽衣甘蓝序列
表 5 Exo7A1 多态性分析
序列名称
Exo70A1 编码区 Exo70A1 互作区 Exo70A1 非互作区 Ks
Ks Ka Ka/Ks Ks
Exo70A1-C Br 0.0876 0.0034 0.0039 0.0838 0.0129
Exo70A1-C Bn 0.0023 0.0007 0.3043 0.0000 0.0000
Exo70A1-C Bo 0.0624 0.0027 0.0433 0.0666 0.0000
Exo70A1-C At 0.3480 0.0257 0.0739 0.4521 0.0254
At Br 0.3581 0.0271 0.0757 0.4329 0.0397
At Bn 0.3552 0.0250 0.0704 0.4610 0.0264
At Bo 0.3527 0.0271 0.0768 0.4545 0.0263
Br Bn 0.0902 0.0041 0.0454 0.0837 0.0129
Br Bo 0.0725 0.0034 0.0469 0.0724 0.0129
Bn Bo 0.0648 0.0034 0.0525 0.0665 0.0000
注: 同表 4
2016,32(6) 83杨丹等 :结球甘蓝 ARC1 与 Exo70A1 编码区 cDNA 的克隆及进化分析
以得出其相对进化速率[17],其公式为:
K=d/2tN
其中,K 代表相对进化速率,2t 代表进化时间,d
代表替换的大分子数,N代表总的大分子数。
运用同义替换率估算分歧时间。序列间的同义
突变(Ks)率如表 4 和 5 所示,且已知芸薹属与拟
南芥的分歧发生在 200 万年前(million years ago,
MYA)[18],根据上述公式可以得出 K 值:ARC1
中 Bo 与 At 的同义突变率为 1.478 7,得出 KARC1 为 
0.037 0[12],同理可知 KExo70A1 为 0.008 8,说明 ARC1
的相对进化速率比 Exo70A1 快,其保守性要低。而
根据编码区内的互作区与非互作区不同区段序列的
同义突变率可知,KARC1 互作为 0.043 1、KARC1 非互作为
0.031 1、KExo70A1 互作为 0.011 4、KExo70A1 非互作为 0.000 7;
说明在 ARC1-Exo70A1 互作中,核酸序列互作区的
进化速率比非互作区要快。
2.4  10种材料的ARC1与Exo70A1的平行进化关系
进化树图 4-图 7 中大部分同一种属的序列位置
均较近,说明此进化树具有一定的可靠性。但个别
同一种属的序列分布在不同位置,,这可能是因为基
因分化先于了物种分化。
2.4.1  ARC1-Exo70A1 互作编码区 DNA 的进化分
析  互作编码区 ARC1 进化树(图 4-A)中单子叶植
物与双子叶植物均分为不同分支,而小立碗藓和江
南卷柏这两个低等植物序列则在双子叶部分独立于
一个分支下,说明 ARC1 的 N 端在进化过程中在双
子叶植物与单子叶植物中已经发生了分化。结球甘
蓝序列与羽衣甘蓝序列 3 聚类于同一树枝下,说明
A B
图 4-A 为 ARC1 互作区进化树整体;图 4-B 为 ARC1 互作区进化树芸薹属部分
进化树树枝上的数字是 the bootstrap probabilities(%)即重复百分比,当此值大于 70 时,说明此分支的可信度较高;图形中的数字
标尺是遗传标尺,分支长度与分化时间呈正相关;蓝色区域为双子叶植物富含区,黄色为单子叶植物富含区,红色虚线圈内为低
等植物区域。进化树均属于多物种基因家族进化树,包括基因重复事件和物种形成事件;通过比较分类单元共享祖先在时间上的
远近可判断其关系密切程度[19]
图 4 互作区 ARC1 的进化树
生物技术通报 Biotechnology Bulletin 2016,Vol.32,No.684
其亲缘关系很近。
Exo70A1 互作区进化树(图 5-A)的分支较短、
大部分聚类到一处,说明 Exo70A1 保守性较高。该
进化树可大体分为 3 大部分:上部的双子叶分支,
中间的单子叶分支,下部的双子叶分支。结球甘蓝
序列与甘蓝型油菜序列 9 聚类到芸薹属的这一树枝
A B
注:图 5-A 为 Exo70A1 互作进化树整体;图 5-B 为 Exo70A1 互作区进化树芸薹属部分
图 5 互作区 Exo70A1 的进化树
下,与实际情况植物分类相符合。从进化树的分支
情况可以看到芸薹属分支与拟南芥属分支位置临近,
说明芸薹属与拟南芥属的 Exo70A1 的 N 端在进化中
是很保守的,具有很近的亲缘关系。序列 66 即小立
碗藓这一低等植物聚类于双子叶富集区。总体上来
说 Exo70A1 在芸薹属植物的种间及属间高度保守。
根据 ARC1 互作区芸薹属部分放大图(图 4-B)
可知:芸薹属序列均聚类到同一树枝下,说明芸薹
属中 ARC1 的 N-端保守性较好;拟南芥靠近,说明
与拟南芥属的亲缘关系较为接近;芸薹属序列分为
3 部分,其中结球甘蓝测序序列也分为 3 部分,但
未发现其分支情况与亲和指数之间的相关性。而观
察 Exo70A1 互作区的芸薹属部分(图 5-B)可发现:
序列 9甘蓝型油菜与其他结球甘蓝序列聚类在一起,
这与 ARC1 互作区的分支情况存在差异;材料 278,
E1 与序列 7羽衣甘蓝的亲缘关系更近,并与其他结
球甘蓝材料聚类于不同分支下。
比较 ARC1 与 Exo70A1 互作编码区 DNA 的进
化树,可发现 3 个主要的共同点:第一,单子叶植
物与双子叶植物的序列均分别聚类于不同分支之
下,说明 ARC1 与 Exo70A1 的互作编码区 DNA均在
单子叶植物与双子叶植物之间已经发生了分化;第
二,芸薹属与拟南芥属的序列位置都十分靠近,说
明 ARC1 与 Exo70A1 的互作编码区 DNA在进化过程
2016,32(6) 85杨丹等 :结球甘蓝 ARC1 与 Exo70A1 编码区 cDNA 的克隆及进化分析
中至今仍然有着很近的亲缘关系;第三,芸薹属序
列分支情况类似;第四,低等植物序列均聚类于双
子叶富集区。综上说明 ARC1 与 Exo70A1 的互作区
存在协同进化。
2.4.2  ARC1-Exo70A1 非互作编码区 DNA 的进化分
析  在 ARC1 与 Exo70A1 非互作编码区进化树(图 
6、图 7)中,不论 ARC1 还是 Exo70A1,芸薹属的
非互作编码区序列都在同一分支下;非互作区进化
树中双子叶植物与单子叶植物也分别聚类于不同分
支下,这与互作区进化树情况相同。
ARC1 非互作编码区构建的进化树中(图 6):
与芸薹属亲缘关系最近的是拟南芥(Arabidopsis),
而大部分同一亚种的序列均聚类在同一分支下,表
现出相同的亚种间同源性更高的情况;其芸薹属序
列的分支情况与互作区部分相一致,而低等植物的
序列则独立于一个分支下,说明 ARC1 非互作区序
列差异性更大;分支长度短于互作区,即进化速率慢。
Exo70A1 非互作编码区构建的进化树中(图 7):整
体分支情况类似于互作区;分支长度也短于互作区;
芸薹属序列未出现亚枝,说明其保守性非常好。
非互作区进化树表明:芸薹属序列分支情况存
在一定的差异性;其进化速率均低于互作区,与 2.3
中结果一致;低等植物的分支存在差异性。以上分
析说明 ARC1-Exo70A1 互作中非互作区的 DNA编码
序列比互作区比较而言更为保守。
3 讨论
本研究以自交不亲和结球甘蓝为研究材料,结
合生物信息分析发现,结球甘蓝 ARC1 与其他芸薹
属 ARC1 序列相似性极高;结球甘蓝 Exo70A1 与芸
薹属 Exo70A1 序列也存在很高相似性及类似的结构
域,由此可知结球甘蓝存在 ARC1 和 Exo70A1 的同
源序列。
图 6 ARC1 非互作区进化树
生物技术通报 Biotechnology Bulletin 2016,Vol.32,No.686
所选用的 10 种结球甘蓝的亲和指数在 0-1.28
之间,其 ARC1 和 Exo70A1 的核酸序列无明显差异
存在,亲缘关系很近。说明在高度自交不亲和系的
材料中 ARC1 和 Exo70A1 序列的保守性较好,具有
保守的功能来维持自交不亲和信号通路。因此,在
实际 SI 系选育过程中,对于亲和指数略高于 1 的
品系不应立即舍弃,可多观察几代自交不亲和情况
后再决定是否保留该品系。与芸薹属亲缘关系较近
的拟南芥属中,拟南芥 A. thaliana 生态型均为自交
亲和型,而琴叶拟南芥 A. lyrata 却有天然的自交不
亲和型[20];但是在本文进化分析中发现 ARC1 和
Exo70A1 在芸薹属和拟南芥属中却具有很近的亲缘
关系和较高的相似度,但与禾本科等单子叶植物则
进化差异较大,考虑到自交不亲和机制出现在 20 
MYA 之后,故可以推则 ARC1 在不同生态型拟南芥
中对 SI 的贡献不同,ARC1 在拟南芥 A. thaliana 中
较完整,在拟南芥 A. lyrata 中则变异加大。在禾本
科等单子叶植物中则变异更大,可能承担着其他功
能。因此,所选育甘蓝品系的亲和指数高低可能反
映着 ARC1 参与 SI 反应的强弱程度,而 Exo70A1 似
乎没有这些差异。
本研究所用材料是经过多代人工选育所得,10
个品种的不结球甘蓝因受人为因素控制,导致其变
异趋同,如体现在 10 种材料的 ARC1 和 Exo70A1 的
基因编码序列具有极高的相似度,说明在同一选择
压下基因的变异及进化会向着类似的方向进行。在
Vekemans 等[14]文献中曾提到在环境条件的限制下,
人工选育 SI 系,可能导致其自交亲和性的加强。如
干旱等不利条件或有利于其向 SC系过渡,而顺境中
SI 杂种优势可大大抵消其向 SC系的转变。在逆境条
件下,人工选育的 SI 系其 S 位点多态性偏少,这可
能是材料更为集中,基因差异较低的原因之一。因
图 7 Exo70A1 非互作区进化树
2016,32(6) 87杨丹等 :结球甘蓝 ARC1 与 Exo70A1 编码区 cDNA 的克隆及进化分析
此人工选育 SI 系过程中应该尽量保持良好环境,在
获得 SI 系纯种的基础上尽量减少自交次数。本研究
所用材料虽是不同来源的亲本,但其选择范围、选
育条件等都可能在所测定的序列中起到了选择作用,
从而被固定为某种变异序列,导致 10 种自交不亲和
结球甘蓝其 ARC1 和 Exo70A1 序列相似度高,存在
平行进化关系,均聚类于芸薹属分支下。这说明短
时期的逆境选育并未造成 ARC1 和 Exo70A1 编码区
DNA序列的改变,因此这种转向是生理性的。但是
选育自交不亲和系最好在顺境条件下进行,因为只
有在顺境条件下,SI 所表现的异交优势,才不会被
逆境掩盖,自交不亲和性也才能得以延续下去,也
才具有选育 SI 系的遗传和生理基础。
ARC1 和 Exo70A1 互作编码区存在协同进化与
其功能相适应。本研究认为 ARC1 与 Exo70A1 蛋白
质的相互作用可能促成了 ARC1-Exo70A1 互作编码
区 DNA的协同进化,即二者在进化过程中相互影响,
从而具有相类似的进化方向。说明由于蛋白质之间
的相互作用需要不变的构象,这可能在一定程度上
约束了序列的变异程度,也就是说,当一方发生改
变时,另一方也相应会发生改变,这样才能保持蛋
白质之间仍旧存在互作所需的构象,最终形成协同
进化这一趋势。这与 Goh 等[21,22]提出的互作蛋白
质通常有相似的进化关系且表现为互作区域有相似
的进化树这一观点相切合。此外,根据相对进化速
率分析得知 ARC1 比 Exo701 的进化速度快,这与进
化树分析结果相一致,说明ARC1基因的变化性更大,
其在植物中可能具有多样性的功能。
ARC1-Exo70A1 互作编码区的变异速率比非互
作编码区更快。首先,在上游的 SCR-SRK 互作中,
SRK 的胞外域(S domain)起了主要作用[4-6],然
而 S domain 却具有多态性,其氨基酸序列表现出一
定的差异[12]。根据 Kitashiba 的文章[23],可知不同
胞外结构域的 SRK 属于不同 S 单倍型,且 S 单倍型
的分化先于物种分化,那么 SRK 胞外结构域与 SCR
的进化都应受到单倍型约束,其分化也应该先于物
种分化;对于上游的蛋白质而言,其可变性虽然较
大,但还存在其他机制来保证反应的进行,如 SLG
(S-glycoprotein,S-糖蛋白[24])与同一单倍型 SRK的
S domain 存在 90% 的氨基酸相似性[23],它与 SRK
之间可能存在一个机制以保证SI反应的发生。其次,
在 SRK-ARC1 互作中 ARC1 的臂重复(ARM)区域 
(与 Exo70A1 的非互作区)是互作区,由本研究结
果可知这个区段进化较慢,说明在 SI 途径中 SRK-
ARC1 互作占了比较重要的位置,需要较为保守的
结构域来维持反应的进行。最后,在下游互作蛋白
ARC1-Exo70A1 中互作区段序列也具有很大的可变
性,说明其可能只是 SI 下游反应的一个分支,或
存在其他机制来保障 SI 反应的顺利进行,而在杨佳
等[10]的文章中提到破坏 ARC1-Exo70A1 途径并不
能完全打破 SI,认为 SI 信号网络可能存在其他的分
支。此外,Exo70A1 的 Exo 结构域(与 ARCI 的非
互作区)其进化慢,可能是与其他蛋白质互作的区段,
猜测其应具有极其重要的作用;而目前已经明确在
酵母中 Exo70 结构域能够通过与 Rho3 GTPase 发生
相互作用,来介导细胞的极性运输[25]。Vekemans
等[14]认为 SI 向 SC 的过渡是由许多独立事件造成
的,那么这些变异可能是分布于 SI 途经中 SCR、
SRK、ARC1 等相关蛋白的。短期内,这些变异应该
是体现为随机的序列变异,结合本研究,可知这些
变异可能更加显著地积累于重要蛋白的互作区核酸 
序列。
本研究分析了 SI 信号传导途径中蛋白质 ARC1
和 Exo-70A1,如果加入其他相关的互作蛋白进行分
析,或许能发现 SI 途径相关蛋白质编码 DNA 的进
化规律,以期为其功能研究及 SI 信号传导途径研究
提供参考。而目前已经有许多软件可以通过分子测
年的方法来构建系统发生树的时序图,那么下一步
通过构建时序图便可获得节点分歧时间,进而得到
序列在各种物种中的相对进化速率,从而定量的分
析不同大分子(核酸,蛋白质等)的进化速率[19],
来说明 SI 途径相关大分子在不同选择压力下的进化
快慢,为 SI 的相关进化研究提供新的内容。
4 结论
10 种结球甘蓝自交不亲和材料之间存在平行进
化关系;ARC1 和 Exo70A1 在芸薹属和拟南芥属中是
相对较保守基因;在整个植物中 ARC1 和 Exo70A1
互作编码区存在协同进化,但变异速率却比非互作
编码区快。
生物技术通报 Biotechnology Bulletin 2016,Vol.32,No.688
参 考 文 献
[1]Schopfer CR, Nasrallah ME, Nasrallah JB. The male determinant of 
self-incompatibility in Brassica[J]. Science, 1999, 286(5445):
1697-1700. 
[2]Stein JC, Howler B, Boyes DC, et al. Molecular cloning of a putative 
receptor protein kinase gene encoded at  the self-incompatibility 
locus of Brassica oleracea[J]. Proc Natl Acad Sci USA, 1991, 88
(19):8816-8820. 
[3]吴志刚 . 甘蓝自交不亲和相关基因 MOD 的克隆及其与 ARC1
的 FISH 定位研究[D]. 重庆:西南大学 , 2011. 
[4]Shimosato H, Yokota NH,  Iwano M,  et  al. Characterization  of 
the SP11/SCR high-affinity binding site  involved  in  self/nonself 
recognition in Brassica self-incompatibility[J]. Plant Cell, 2007, 
19(1):107-117. 
[5]杨红 , 朱利泉 , 张贺翠 , 等 . 利用酵母双杂交系统鉴定甘蓝 SCR
与 SRK 胞外域片段间的相互作用[J]. 中国农业科学 , 2011, 
44(9):1953-1962. 
[6]Tantikanjana T, Nasrallah ME, Nasrallah JB. Complex networks of 
self-incompatibility  signaling  in  the Brassicaceae[J]. Current 
Opinion in Plant Biology, 2010, 13(5):520-526. 
[7]Stone SL, Erson EM, Mullen RT, et al. ARC1 is an E3 ubiquitin 
ligase  and promotes  the  ubiquitination  of  proteins  during  the 
rejection of  self-incompatible Brassica pollen[J]. Plant Cell, 
2003, 15(4):885-898. 
[8]杨昆 , 张贺翠 , Richard C, 等 . 甘蓝自交不亲和信号转导元件
ARC1 与 Exo70A1 的相互作用[J]. 作物学报 , 2011, 37(12):
2136-2144. 
[9]Samuel MA, Chong YT, Haasen KE,  et  al. Cellular  pathways 
regulating responses to compatible and self-incompatible pollen in 
Brassica and Arabidopsis stigmas intersect at Exo70A1, a putative 
component of the exocyst complex[J]. Plant Cell, 2009, 21(7):
2655-2671. 
[10]杨佳 , 李玉花 , 蓝兴国 . 芸苔属植物自交不亲和性 S- 受体激
酶的内吞作用及信号传递网络[J]. 植物生理学报 , 2012, 48
(3):211-216. 
[11]杨佳 . 羽衣甘蓝 ARC1 相互作用蛋白及授粉过程中差异表达
蛋白的研究[D]. 哈尔滨:东北林业大学 , 2012. 
[12]Ryuichi I, Takeshi N. Phylogenetic analysis of Brassiceae based on 
the nucleotide sequences of  the S-locus related gene, SLR1[J]. 
Theoretical and Applied Genetics, 2002, 105(8):1159-1165. 
[13]Edh K,   Widén B,   Ceplitis A. The evolution and diversification 
of S-locus haplotypes  in  the Brassicaceae  family[J]. Genetics, 
2009, 181(7):977-984. 
[14]Vekemans X, Poux C, Goubet PM, et al. The evolution of selfing 
from outcrossing ancestors in Brassicaceae :what have we learned 
from variation at  the S-locus?[J]. Evol Biol, 2014, 27(7):
1372-1385. 
[15]  张桂玲 . 甘蓝自交不亲和性快速鉴定方法的研究[D]. 哈尔滨:
东北农业大学 , 2003. 
[16]Nielsen R. Molecular signatures of natural selection[J]. Annual 
Review of Genetics, 2005, 39 :197-218. 
[17]张昀 . 生物进化[M]. 北京:北京大学出版社 , 1998 :207. 
[18]Koch M, Haubold B, Mitchell-Olds T. Molecular systematic of the 
Brassicaceae :evidence  from coding plastidic MatK and nuclear 
Chs sequences[J]. Am J Bot, 2001, 88(3):534-544. 
[19]  黄原 . 分子系统发生学(第 1版)[M]. 北京:科学出版社 , 
2012 :1-21. 
[20]郝艾馨 , 蓝兴国 , 王宇 , 等 . SRK-SCR 转基因拟南芥自交不亲
和性的研究进展[J]. 植物生理学报 , 2013, 11 :1113-1120. 
[21]Goh CS, Bogan AA, Joachimiak M, et al. Co-evolution of proteins 
with  their  interaction partners[J]. Mol Biol, 2000, 299(2):
283-293. 
[22]Goh CS, Cohen FE. Co-evolutionary analysis reveals  insights  into 
protein-protein interactions[J]. Mol Biol, 2002, 1 :177-192. 
[23]Kitashiba H, Nasrallah JB. Self-incompatibility  in Brassicaceae 
crops :lessons  for  interspecific  incompatibility[J]. Breed Sci, 
2014, 64(1):23-37. 
[24]Watanabe M, Takasaki T, Toriyama K, et al. A high degree of 
homology exists between  the protein encoded by SLG and  the S 
receptor domain encoded by SRK in self-incompatible Brassica
campestris L.[J]. Plant Cell Physiol, 1994, 8 :1221-1229. 
[25]Robinson NG, Guo L,  Imai  J,  et  al. Rho3  of  Saccharomyces 
cerevisiae, which regulates  the actin cytoskeleton and exocytosis, 
is a GTPase which interacts with Myo2 and Exo70[J]. Mol Cell 
Biol, 1999, 19(5):3580-3587. 
(责任编辑 李楠)