全 文 :植物生理学通讯 第 46卷 第 7期, 2010年 7月 643
收稿 2010-02-01 修定 2010-04-13
资助 国家自然科学基金(30 7 71 4 6 2)、重庆市自然科学基金
(2007BB1358)和西南大学博士启动基金(SWUB2008021)。
* 通讯作者(E-mail: yuahs@sohu.com; Tel: 023-68250974)。
蛋白质内含肽的研究及应用进展
韦静宜, 宋洪元 *, 李成琼, 王小佳, 司军, 任雪松
西南大学蔬菜重点实验室, 重庆 400715
提要: 内含肽的发现与研究只经过短短的20年, 但已在各个生物领域展现出应用潜力。本文阐述了蛋白质内含肽的相关概
念、种类、分布、结构、功能和自我剪接机制。分析了内含肽在当前生物技术领域中的应用情况以及存在的优点和局限
性, 最后就内含肽的应用前景进行了展望。
关键词: 内含肽;自我剪接机制; 研究及应用
Research and Application Advancement of Intein
WEI Jing-Yi, SONG Hong-Yuan*, LI Cheng-Qiong, WANG Xiao-Jia, SI Jun, REN Xue-Song
Key Laboratory of Olericulture, Southwest University, Chongqing 400715, China
Abstract: In spite of only 20 years period for discovery and investigation of intein, its potential application value
in biological research has been revealed. This paper reviewed the related concepts, types, distribution, configuration,
functions and the self-splicing mechanism of intein. The applications of intein in biotechnology area were
analyzed advantages and limitation. The application direction for the intein in future was also suggested.
Key words: intein; self-splicing mechanism; research and application
1 内含肽的相关概念
内含肽(intein)即蛋白质内含子, 是存在于前体
蛋白质中的一段氨基酸序列。在前体蛋白转变为
成熟蛋白的过程中, 内含肽靠自我剪切的方式从前
体蛋白中释放出来, 同时两端的肽链以肽键的方式
相连, 该过程即为蛋白质剪接(protein splicing), 这
一过程不需要特定的细胞环境以及任何辅助因子的
参与, 甚至可以体外进行。与内含肽相对应的是外
显肽(extein), 即内含肽两侧的氨基酸序列。位于
内含肽N端的序列称为N-外显肽, 位于内含肽C端
的序列称为 C-外显肽。N-、C-外显肽在内含肽
的作用下通过肽键连接成完整成熟蛋白(Perler等
1994)。内含肽有蛋白质和核酸 2种水平上的含义,
既指宿主蛋白质中的插入序列又指与此多肽序列相
对应的核苷酸序列(Kane等 1990)。内含肽的存在
有 2种状态: 剪接反应前称为融合内含肽(fused
intein), 剪接反应后称为游离内含肽(free intein)。
两者的一级结构相同但功能却不同, 前者可自我催
化蛋白质前体的剪接反应, 后者可作为归巢核酸内
切酶(homing endonuclease)参与内含肽归巢。
2 内含肽的特征
2.1 分布 1990年, Kane等在研究酿酒酵母空泡
ATP酶TFPl基因时发现了第 1个内含肽。1994年
Perler等将其正式命名为内含肽。迄今为止, 在
http: //www.neb.com/neb/inteins.html上注册的内含
肽已有 487个。这些内含肽广泛分布于生物界的
三大领域——真核生物、真细菌和古细菌、病毒
和原噬菌体等宿主中。在 487个内含肽中, 真细菌
中发现的内含肽种类最多, 为 231种; 其次是古细
菌, 为 156种; 真核生物最少, 为 100种。内含肽
的宿主蛋白质种类也很多, 包括代谢酶、核酸聚合
酶、蛋白酶和核酸还原酶等, 其中绝大部分与
DNA复制、修复、转录和翻译相关(Liu 2000)。
目前尚未在多细胞真核生物中发现内含肽。
2.2 结构 大部分内含肽由两端的剪切区域(terminal
splicing region)和中间的核酸内切酶结构域(homing
endonuclease domain)或连接结构域(linker domain)
组成(图 1)。根据这一特征, 内含肽可分为 3种: 经
典内含肽(canonical intein)、微小内含肽(mini intein)
和断裂型内含肽(split intein)。经典内含肽和微小
内含肽均包含两端的剪接结构域和中间区域, 不同
植物生理学通讯 第 46卷 第 7期, 2010年 7月644
的是, 前者中间区域为核酸内切酶结构域, 而后者
为连接结构域, 不同微小内含肽连接结构域的长度
并不相同。断裂型内含肽的中间区域在特定位点
断开, 形成N端片段(IN)和 C端片段(IC), 而且分别
位于基因组上相距较远的 2个基因上, 在前体蛋白
翻译成熟过程中, 这2个片段相互识别并恢复核酸
内切酶活性, 介导蛋白质反式剪切(protein trans-
splicing) (Wu等 1998; Sun等 2005)。
序列分析表明, 内含肽由 10个模块组成(图
1)。从内含肽 N端开始依次为 A、N2、B、N4、
C、D、E、H、F 和 G , 其中 A、N2、B、N 4
为N端剪切区域, F、G为 C端剪接区域, C、D、
E、H为自导引核酸内切酶活性区域或连接结构域
(Pietrokovski 1994, 1998; Perler等 1997)。Perler
等(1997)对内含肽序列的进一步分析表明, 参与内
含肽剪接的基序 A、B、F、G 在剪接位点处的
氨基酸残基高度保守, 并参加了内含肽剪接过程中
的亲和置换反应。大多数内含肽基序A中含有带
有羟基或巯基的氨基酸, 如 Ser、CysH。基序 B
中则含Thr-XX-His高度保守的氨基酸序列, 该序列
也存在于丝氨酸蛋白酶中。基序G中参与剪接反
应的保守氨基酸残基为 Asn、Ser、CysH、Thr、
His。比对现有的内含肽序列后发现基序A中的保
守位点(如 Ser、CysH)在某些内含肽中会被Ala、
图 1 内含肽结构示意图(根据 http://www.neb.com/neb/inteins.html图片修改)
Fig.1 Structure of inteins (modified from http://www.neb.com/neb/inteins.html)
方框内氨基酸: 标准剪切反应中的亲核攻击位点; 大写字母: 经典内含肽中的保守氨基酸; 小写字母: 内含肽中的多态氨基酸位点。
Gln或 Pro等所替代, 基序 G中也一样。
2.3 核酸内切酶活性 内含肽中间区域的模块 C、
D、E、H 共同构成了内含肽核酸内切酶区域
(family core homing endonuclease domain, DOD)
(Duan等 1997; Heath等 1997)。DOD区域在结构
和功能上都与核酸内切酶相似, 可以通过 “归巢 ”
进行内含肽自身的转移, 但没有剪切功能。内含肽
归巢即内含肽序列转移到没有这一序列的同源蛋白
的等位基因上。DOD 区域可以识别、切割不含
内含肽的同源蛋白质的等位基因, 利用同源重组, 将
编码内含肽的基因转移到等位基因上, 且插入位点
两端不形成重复序列(Guhan和Muniyappa 2003a)。
因此编码这种内含肽的DNA分子是一种有别于转
座子的可移动遗传因子。自导引核酸内切酶作用
时不需要其他分子辅助。但研究表明某些自导引
核酸内切酶作用时需要金属离子参与: 结核分支杆
菌的 RecA 内含肽具有Mn 2+依赖性(G uha n和
Muniyappa 2003b); 在ColE7核酸内切酶的HNH 家
族中, Zn2+在稳定酶结构和水解DNA过程中是必需
的(Ku等 2002)。
3 内含肽的剪接机制
内含肽介导蛋白质剪接涉及了 3个剪切位点
保守氨基酸残基的 4步亲核置换反应(图 2)。
3.1 N-O键重组 内含肽N端剪切位点的 Ser/Cys
残基侧链的N-O键或N-S键发生转酯酰基反应, 形
成了酯类的线性中间产物。
3.2 转酯作用 由C端外显肽Ser1或CyH1的羟基或
巯基对内含肽N端的酯键进行亲核攻击, 发生转酯
作用, 形成双N端分支状中间产物, 其中内含肽与
C端外显肽仍以肽键连接, 而N端外显肽与C端外
显肽则通过酯键连接在一起。该反应在碱性条件
下(pH 9~10)可发生逆转, 由分支中间体变回线性
前体(Xu等 1993)。
3.3 Asn环化 内含肽C端Asn的NH2基团对C-外
植物生理学通讯 第 46卷 第 7期, 2010年 7月 645
显肽的羰基发动亲核攻击, 形成氨基琥珀酸五元环
结构, 同时将游离内含肽释放出来。Asn/Gln的环
化基本上是不可逆的, 此位点的取代会阻断C端肽
键的裂解, 但并不影响第 2步反应。内含肽C端倒
数第1位的His能辅助Asn的环化, His突变也会影
响 C端肽键的裂解反应。
3.4 O-N键重组 这是自发反应。随着Asn的环化
和内含肽的切除, 外显肽相连, 但游离内含肽的氨
基琥珀酰亚胺还要发生自发羟基化, 外显肽之间要
形成稳定的肽键, 才完成蛋白质的剪接。
4 内含肽的应用
4.1 快速纯化目的蛋白 将靶蛋白与内含肽相互融
合能实现靶蛋白的一步纯化。最先人们使用 Sce
VMA 内含肽来进行蛋白质纯化, 先用Ala 取代内
含肽C 端的Asp 残基, 再连接上几丁质(chitin)作为
C 端的外显肽, 而目的蛋白作为N 端外显肽。翻
译后的蛋白前体进行N端剪接, 目的蛋白游离出来,
但 C端不能剪切, 导致内含肽仍与几丁质相连, 利
用几丁质树脂的吸附作用即可将目的蛋白纯化出
来。同样的, 也可以用Glu取代 C端His残基来调
节内含肽 C 端的剪接, 实现蛋白质纯化。Srinivasa
等(2009) 利用此方法实现了对大肠杆菌(E. coli)中
表达出的人体巨细胞集落刺激因子(human granulo-
cyte-macrophage colony stimulating factor, hGMCSF)
的一步纯化。
4.2 基因诊断和基因治疗 内含肽的插入会导致宿
主蛋白的结构和功能发生改变, 但经剪接后宿主蛋
白能恢复原有的结构和功能。利用这一特点可将
内含肽插入重组基因的内部, 使细胞质内合成的重
组蛋白降低自身的疏水性从而得以透过细胞质到达
线粒体内部, 再通过内含肽自我剪接使重组蛋白恢
复原有的功能和活性, 由此达到线粒体基因治疗的
目的(de Grey 2000)。将内含肽插入到核酸代谢相
关基因的内部能干扰到核酸代谢相关蛋白质的表
达, 因此内含肽可作为药物靶点, 而阻断内含肽自
我剪接的物质将成为基因治疗药物。Paulus (2003)
利用内含肽成功扰乱与结核分支杆菌DNA修复和
复制相关的蛋白——RecA和DnaB的合成, 导致结
核分支杆菌生长受到抑制, 甚至细胞死亡。
4.3 突变体的构建 利用温度敏感型内含肽可构建
温敏型突变体, 只需改变温度条件就可以开启或关
闭目的基因的表达。温敏型内含肽 Sce VMA所介
导的剪接反应在 18 ℃条件下可以正常进行, 随着
温度升高反应逐渐减缓, 到 30 ℃时停止。Gal80
是果蝇(Drosophila melanogaster) Gal4 转录因子的
负调控子。将温度敏感型Sce VMA 内含肽插入到
Gal80 中, 在适宜温度条件下, 内含肽正常剪接, 活
性Gal80正常合成, 导致Gal4 被抑制, β-半乳糖苷
酶不能合成, 果蝇不能利用乳糖; 而在限制温度下,
内含肽不能正常剪接, 活性Gal80无法合成, Gal4
仍保有活性, β-半乳糖苷酶可以合成, 果蝇能够利
用乳糖(Zeidler等 2004)。
4.4 毒素蛋白的合成 利用内含肽可以制备毒性多
肽样品(Evans等 1998)。Wu等(2002)利用Mtu
图 2 内含肽剪接机制(根据 http://www.neb.com/neb/
inteins.html图片修改)
Fig.2 Splicing mechanism of interns (modified from
http://www.neb.com/neb/inteins.html)
植物生理学通讯 第 46卷 第 7期, 2010年 7月646
RecA蛋白质内含肽在大肠杆菌中表达了对大肠杆
菌具有极强致死作用的高活性的 I-TevI核酸内切
酶。内含肽在宿主细胞中本底水平的剪接反应可
导致少量毒性蛋白产生, 影响宿主细胞生长。此时
可采用断裂型内含肽(如Ssp dnaE)来制备目标蛋白,
即在2个宿主细胞中分别表达目标蛋白N端与Ssp
dnaE 内含肽N端(1~123)肽段, 以及目标蛋白 C端
与Ssp dnaE 内含肽C端(124~159)肽段的融合蛋白,
再将2种融合蛋白在体外混合进行反式剪接, 获得
了完整的目标蛋白(Mills等 1998)。
4.5 介导蛋白质环化和多聚体制备 内含肽还可用
来制备蛋白质串联多聚体和环肽(Evans等 1999)。
将目标基因插入 2个内含肽之间, 经转录、翻译、
蛋白质剪接后目的蛋白N端留下 1个Cys残基, 目
的蛋白C端留下硫酯键, 再通过目的蛋白N端Cys
的SH基团进攻C端硫酯键完成环化。内含肽介导
的蛋白质环化技术可用于研究蛋白质作用机理,
Volkmann等(2010)利用断裂型内含肽构建了环状
的弧菌(Vibrio harveyi)酰基 -载体蛋白质(acyl car-
rier protein, ACP), 研究了酰基转移中ACP蛋白伸
展所需的条件。
4.6 介导蛋白质连接 内含肽还可以介导蛋白连接
(intein mediated protein ligation, IPL)或表达蛋白连
接(expressed protein ligation, EPL)。将目的基因
连接在内含肽的N端, 在还原剂(如巯基试剂)存在
时, 经过蛋白质剪接后所得的目的蛋白的C端留下
1个活泼的硫脂键, 该硫酯键可用于连接标记物或
探针(如自旋标记或荧光标签)、 其他蛋白质和非天
然氨基酸(David等 2004) (如生物素化或磷酸化的
氨基酸), 从而为研究蛋白与蛋白之间的相互作用以
及目标蛋白在细胞内的代谢路径提供方便。David
等(2 00 3)采用 IPL 方法对人白介素 8 ( huma n
interleukin-8, hIL-8)的末端羧基进行荧光标记, 在
HL60细胞中研究了IL-8和几种IL-8受体亚型之间
的相互作用以及 IL-8与受体复合物的摄取、内化
过程。Zhang 等(2001)用重叠的寡聚核苷酸构建了
一个有效的微小内含肽检测系统, 在微小内含肽N
端和 C 端之间插入亲和标记, 把绿色荧光蛋白
(green fluorescent protein, GFP)连在微小内含肽 C
端, 目的蛋白连在微小内含肽的N端, 通过检测荧
光蛋白就能检测到融合蛋白的表达。Ozawa 等
(2001)则用这个系统检测2种细菌蛋白之间的相互
作用: 把2个具有相互作用的目的蛋白分别融合进
蛋白质内含肽的 2个片段, 再直接与分开的增强型
绿荧光蛋白(enhanced green fluorescent protein,
EGFP)的C端和N端相连, 蛋白剪接作用产生EGFP
荧光团。
通过IPL还可将接蛋白质与核酸连接起来, 形
成蛋白质 -核酸杂合体, 获得双功能的蛋白质 -核
酸芯片, 此芯片可同时进行蛋白质和核酸 2个水平
上的检测。Burbulis等(2005)采用 IPL合成多肽 -
DNA杂合分子, 当杂合分子中的亲和受体与吸附在
固相支持介质上的配体结合后洗去游离的杂合分
子, 再加入DNA聚合酶以及与杂合分子中DNA序
列互补的引物进行PCR扩增, 通过对PCR产物的定
量分析, 可使对配体的检测下限达到 150个分子。
4.7 在转基因植物中的应用 断裂型内含肽的应用
可以防止基因水平转移导致的转基因污染, 这是由
于拆分后的基因片段无法翻译成为功能性全长蛋白
质。植物的遗传是花粉遗传, 质体中的DNA并不
遗传给下一代, 如果将目的基因进行拆分, 再与断
裂型内含肽融合后分别转化核基因组和质体基因
组, 可提高转基因植物的安全性。为了证明内含肽
在核基因组和质体基因组中均可进行反式剪接, 将
抗除草剂基因进行拆分, 再与断裂型内含肽结合, 然
后分别转化叶绿体基因组和核基因组, 核基因组中
还包含有叶绿体导向的信号肽序列, 结果证实了完
整抗除草剂蛋白质的存在, 表明位于不同基因组中
的断裂型内含肽可以进行反式剪接(Sun等 2001;
Chin等 2003; Chen等 2001)。除了除草剂基因, 其
它基因也可以进行拆分。Yang等(2003)将 β-半乳
糖苷酶基因拆分后分别与断裂型内含肽的2个片段
构成融合基因, 然后共转化拟南芥, 随后在拟南芥
中观察到有活性的 β-半乳糖苷酶。
内含肽的应用可以实现蛋白质在植物活体中
的组装, 从而控制植株性状, 创新种质资源, 如雄性
不育植株的获得。Kempe等(2009)将 barnase毒蛋
白拆分成 2个片段, 然后分别与断裂型内含肽 Ssp
DnaB的N、C端进行融合然后分别转化小麦(Triti-
cum aestivum), 在绒毡层特异性启动子的控制下, 融
合基因转化所得的2种植株的杂交后代F1代花药绒
毡败育从而获得不育株。早在 2008年, Gils等研
植物生理学通讯 第 46卷 第 7期, 2010年 7月 647
究者就利用上述技术建立了新型的断裂型内含肽介
导的拟南芥(Arabidopsis thaliana)两系配套杂交育
种系统。首先将 dnaB的N端、barnase基因的N
端、乙酰乳酸合成酶基因 (acetolactate synthase,
ALS)的N端和dnaE的N端融合在一起构建成A1系,
dnaB的C端、barnase的C端、ALS的C端和dnaE
的C端融合在一起构建成A2系, A1和A2连接起来
构建成原初的雄性不育系——A系(图 3)。A系与
带有 PhiC31重组酶位点的 B系进行杂交, F2代即
可获得互为等位基因系的A1系和A2系, A1系与A2
系杂交获得同时带有N-融合基因和C-融合基因的
后代——A1A2杂合体, 经过内含肽介导的蛋白质剪
切, 完整的barnase毒蛋白和乙酰乳酸合成酶被表达
出来, 使得 F3代即是雄性不育又能抗除草剂。利
用A1A2杂合体就可以进行杂交种子的生产、雄性
不育系的保持和转育(图 4)。此系统和现行的杂交
育种系统相比, 能大大简化制种过程、更好的生产
和保持亲本以及恢复杂交种子的生产力。
图 3 重组前和重组后的载体示意图(Gils等 2008)
Fig.3 Structure of the constructs before and after recombination (modified from Gils et al 2008)
图 4 杂交种子生产策略(Gils等 2008)
Fig.4 Strategy for the production of hybrid seed (modified
from Gils et al 2008)
A: 雄性不育系的构建; B: 雄性不育系的保持; C: 杂交种子的
生产; D: 雄性不育系的转育。
5 展望
虽然内含肽的发现和研究只有短短的20年时
间, 但无论是在基础科学研究中还是在医学实践中,
内含肽的应用潜力已充分表现出来, 尤其是内含肽
介导的蛋白质纯化技术、蛋白质连接技术已日趋
成熟。内含肽在转基因植物上的应用也开始崭露
头角。随着研究的深入, 内含肽将会在更多的生物
技术领域和生产实践中发挥重要作用。然而, 内含
肽在生物技术领域中的全面应用还需要周全的考
虑, 如表达载体的选择、适宜内含肽的选择、内
含肽中恰当突变的引入、表达系统中合适密码子
的使用、目的蛋白中内含肽适宜插入位点的选
择、表达条件的确定和优化、蛋白质剪接条件的
确定等。只有充分考虑并解决以上的问题, 才能更
好的发挥内含肽的作用, 从而达到简化生产、实验
过程, 降低成本的目的。
参考文献
Burbulis I, Yamaguchi K, Gordon A, Carlson R, Brent R (2005).
Using protein-DNA chimeras to detect and count small
numbers of molecules. Nat Methods, 2 (1): 31~37
植物生理学通讯 第 46卷 第 7期, 2010年 7月648
Chen L, Pradhan S, Evans TC Jr (2001). Herbicide resistance from
a divided EPSPS protein: the split Synechocystis DnaE intein
as an in vivo affinity domain. Gene, 263 (1-2): 39~48
Chin HG, Kim GD, Marin I, Mersha F, Evans TC Jr, Chen L, Xu
MQ, Pradhan S (2003). Protein trans-splicing in transgenic
plant chloroplast: reconstruction of herbicide resistance from
split genes. Proc Natl Acad Sci USA, 100 (8): 4510~4515
David R, Machova Z, Beck-Sickinger AG (2003). Semisynthesis
and application of carboxyfluorescein-labelled biologically
active human interleukin-8. Biol Chem, 384 (12): 1619~1630
David R, Richter MP, Beck-Sickinger AG (2004). Expressed pro-
tein ligation, method and applications. Eur J Biochem, 271
(4): 663~677
de Grey AD Jr (2000). Mitochondrial gene therapy: an arena for the
biomedical use of inteins. Trends Biotechnol, 18 (9): 394~399
Duan X, Gimble FS, Quiocho FA (1997). Crystal structure of PI-
SceI, a homing endonuclease with protein splicing activity.
Cell, 89 (4): 555~564
Evans TC Jr, Benner J, Xu MQ (1998). Semisynthesis of cyto-
toxic proteins using a modified protein splicing element.
Protein Sci, 7 (11): 2256~2264
Evans TC Jr, Benner J, Xu MQ (1999). The cyclization and
polymerization of bacterially expressed proteins using modi-
fied self-splicing inteins. J Biol Chem, 274 (26): 18359~18363
Gils M, Marillonnet S, Werner S, Grützner R, Giritch A, Engler C,
Schachschneider R, Klimyuk V, Gleba Y (2008). A novel
hybrid seed system for plants. Plant Biotechnol J , 6 (3):
226~235
Guhan N, Muniyappa K (2003a). Structural and functional chara-
cteristics of homing endonucleases. Crit Rev Biochem Mol
Biol, 38 (3): 199~248
Guhan N, Muniyappa K (2003b). Mycobacterium tuberculosis
RecA intein, a LAGLIDADG homing endonuclease, displays
Mn2+ and DNA-dependent ATPase activity. Nucleic Acids
Res, 31 (14): 4184~4191
Heath PJ, Stephens KM, Monnat RJ Jr, Stoddard BL (1997). The
stru cture of I-Crel , a group I in tron-encoded homing
endonuclease. Nat Struct Biol, 4 (6): 468~476
Kane PM, Yamashiro CT, Wolczyk DF, Neff N, Goebl M, Stevens
TH (1990). Protein splicing converts the yeast TFP1 gene
product to the 69-kD subunit of the vacuolar H+-adenosine
triphosphatase. Science, 250 (4981): 651~657
Kempe K, Rubtsova M, Gils M (2009). Intein-mediated protein
assembly in transgenic wheat: production of active barnase
and acetolactate synthase from split genes. Plant Biotechnol
J, 7 (3):283~297
Ku WY, Liu YW, Hsu YC, Liao CC, Liang PH, Yuan HS, Chak KF
(2002). The zinc ion in the HNH motif of the endonuclease
domain of colicin E7 is not required for DNA binding but is
essential for DNA hydrolysis. Nucleic Acid Res, 30 (7):
1670~1678
Liu XQ (2000). Protein-splicing intein: Genetic mobility, origin,
and evolution. Annu Rev Genet, 34: 61~76
Mills KV, Lew BM, Jiang S, Paulus H (1998). Protein splicing in
trans by purified N- and C-terminal fragments of the Myco-
bacterium tuberculosis RecA intein. Proc Natl Acad Sci USA,
95 (7): 3543~3548
Ozawa T, Takeuchi TM, Kaihara A, Sato M, Umezawa Y (2001).
Protein splicing-based reconstitution of split green fluores-
cent protein for monitoring protein-protein interactions in
bacteria: improved sensitivity and reduced screening time.
Anal Chem, 73 (24): 5866~5874
Paulus H (2003). Inteins as targets for potential antimycobacterial
drugs. Front Biosci, 8: S1157~S1165
Perler FB, Davis EO, Dean GE, Gimble FS, Jack WE, Neff N, Noren
CJ, Thorner J, Belfort M (1994). Protein splicing elements:
inteins and exteins - a definition of terms and recommended
nomenclature. Nucleic Acids Res, 22 (7): 1125~1127
Perler FB, Olsen GJ, Adam E (1997). Compilation and analysis of
intein sequences. Nucleic Acids Res, 25 (6): 1087~1093
Pietrokovski S (1994). Conserved sequence features of inteins
(protein introns) and their use in identifying new inteins and
related proteins. Protein Sci, 3 (12): 2340~2350
Pietrokovski S (1998). Modular organization of inteins and C-
terminal autocatalytic domains. Protein Sci, 7 (1): 64~71
Srinivasa Babu K, Muthukumaran T, Antony A, Prem Singh Samuel
SD, Balamurali M, Murugan V, Meenakshisundaram S (2009).
Single step intein-mediated purification of hGMCSF expressed
in salt-inducible E. coli. Biotechnol Lett, 31 (5): 659~664
Sun L, Ghosh I, Paulus H, Xu MQ (2001). Protein trans-splicing
to produce herbicide-resistant acetolactate synthase. Appl
Environ Microbiol, 67 (3): 1025~1029
Sun P, Ye S, Ferrandon S, Evans TC, Xu MQ, Rao Z (2005).
Crystal structures of an intein from the split dnaE gene of
Synechocystis sp. PCC6803 reveal the catalytic model with-
out the penultimate histidine and the mechanism of zinc ion
inhibition of protein splicing. J Mol Biol, 353 (5): 1093~1105
Volkmann G, Murphy PW, Rowland EE, Cronan JE Jr, Liu XQ,
Blouin C, Byers DM (2010). Intein-mediated cyclization of
bacterial acyl carrier protein stabilizes its folded conforma-
tion but does not abolish function. J Biol Chem, 285 (12):
8605~8614
Wu H, Hu Z, Liu XQ (1998). Protein trans-splicing by a split
intein encoded in a split DnaE gene of Synechocystis sp .
PCC6803. Proc Natl Acad Sci USA, 95 (16): 9226~9231
Wu W, Wood DW, Belfort G, Derbyshire V, Belfort M (2002).
Intein-mediated purification of cytotoxic endonuclease I-
TevI by insertional inactivation and pH-controllable splicing.
Nucleic Acids Res, 30: 4864~4871
Xu MQ, Southworth MW, Mersha FB, Hornstra LJ, Perler FB
(1993). In vitro protein splicing of purified precursor and the
identification of a branched intermediate. Cell, 75 (7):
1371~1377
Yang J , Fox GC Jr, Henry-Smith TV (2003). Intein-mediated
assembly of a functional β-glucuronidase in transgenic plants.
Proc Natl Acad Sci USA, 100 (6): 3513~3518
Zeidler MP, Tan C, Bellaiche Y, Cherry S, Häder S, Gayko U,
Perrimon N (2004). Temperature-sensitive control of pro-
tein activity by conditionally splicing inteins. Nat Biotechnol,
22 (7): 871~876
Zhang AH, Gonzalez SM, Cantor EJ, Chong SR (2001). Construc-
tion of a mini-intein fusion system to allow both direct
monitoring of soluble protein expression and rapid purifica-
tion of target proteins. Gene, 275 (2): 241~252