免费文献传递   相关文献

DNA载体的数据分类及查询系统的开发和应用



全 文 :·综述与专论·
生物技术通报
BIOTECHNOLOGY BULLETIN 2011 年第 8 期
DNA载体的数据分类及查询系统的开发和应用
刘国宪 吕蓓 程奇 李路
(中国农业科学院,北京 100081)
摘 要: DNA载体是基因工程中一个重要的工具,从 1977 年组建了第一个载体到现在,载体的数量已经达到上百种。
为了更好、更充分地利用这些载体为科研人员服务,设计了 DNA 载体的数据分类及查询系统软件。DNA 载体的数据分类及
查询系统包括 3 个模块:数据输入模块、数据查询模块和数据计算模块。首先将载体按照功能的不同进行分类和编号,建立一
个较完整的载体数据库。然后利用查询和计算功能,令用户快速地查找到其需要的载体。
关键词: DNA载体 数据分类 查询系统
Development and Application of DNA Vectors Classification and
Inquiry System
Liu Guoxian Lv Bei Cheng Qi Li Lu
(China Academy of Agricultural Sciences,Beijing 100081)
Abstract: DNA vectors are important tools in DNA manipulation. From the first vector developed in 1977,more than hundred
vectors were applied at present. In order to provide more adequate services for researchers using these vectors,DNA vectors classifica-
tion and inquiry system has been designed. There are three modules in this system,including data input module,data inquiry module
and data calculation module. Firstly,vectors were classified according to their different functions,while giving their numbers. Subse-
quently,a full vector data library has been constructed. By using the function of inquiring and calculating,clients can instantly find the
vector they need.
Key words: DNA vector Data classification Inquiry system
收稿日期:2011-02-22
作者简介:刘国宪,硕士研究生,研究方向:分子生物学;E-mail:liuguoxian@ caas. net. cn
1 DNA载体介绍
基因工程是 20 世纪 70 年代诞生的一门生物技
术科学,是生物工程中重要的一部分。其主要是指
在基因水平上的遗传工程,即用人工方法将所需要
的某一供体生物的遗传物质———DNA 大分子提取
出来,在体外用适当的工具酶进行切割后,把目的基
因或片段与载体 DNA 分子连接起来,然后在载体
DNA的帮助下,与载体一起侵入某一更易生长、繁
殖的受体细胞中,让外源遗传物质在受体细胞中复
制和表达,从而获得新的物种[1]。由于分离或改建
的基因和核酸序列自身不能繁殖,需要载体携带它
们到合适的细胞中复制和表现功能,因此在这个基
因改造的过程中,载体 DNA的发现和使用起到了重
要的推动作用。
基因工程载体(vector)是指可自主复制的
DNA 片段,它能有效地同外源 DNA 在体外组成重
组 DNA 分子,并运载外源 DNA 片段(基因)进入受
体细胞内。载体决定了外源基因的复制、扩增、传代
乃至表达。细菌质粒、噬菌体和动植物病毒是 3 种
最常用的 DNA载体。
这些载体可分为克隆载体和表达载体,其中表
达载体又分胞内表达和分泌表达两种。根据载体进
入的受体细胞不同,又分为原核细胞和真核细胞表达
载体。在基因工程操作中,根据运载的目的 DNA 片
段大小和将来要进入的宿主需要选用合适的载体。
质粒和噬菌体载体只能在细菌中繁殖,不能满
足真核 DNA重组需要。感染动物的病毒可改造用
作动物细胞的载体。由于动物细胞的培养和操作较
生物技术通报 Biotechnology Bulletin 2011 年第 8 期
复杂、花费也较多,因而病毒载体构建时一般都把细
菌质粒复制起始序列放置其中,使载体及其携带的
外来序列能方便地在细菌中繁殖和克隆,然后再引
入真核细胞。目前病毒载体常用者有改造来自猴肾
病毒 SV40(simian virus 40)、逆转录病毒和昆虫杆
状病毒等,使用这些病毒载体的目的多为将目的基
因或序列放入动物细胞中表达或试验其功能、或作
基因治疗等。
人类基因组十分庞大,约含 4 × 109 bp,建立和
筛选人的基因组文库,要求有容量更大的载体,酵母
人工染色体(yeast artificial chromosome,YAC)载体
的研究和应用满足了这个要求。YAC 含有酵母染
色体端粒(telesome)、着丝点(centromere)及复制起
点等功能序列,可插入长度达 200 - 500 kb 的外源
DNA,导入酵母细胞可以随细胞分裂周期复制繁殖
供作克隆,成为人基因组研究计划的重要工具[2]。
现在分子生物学使用的质粒载体都已不是原来
细菌或细胞中天然存在的质粒,而是经过了人工改
造。从不同的试验目的出发,科研人员设计了各种
不同类型的质粒载体,近年来发展很快,新的有特定
用途的质粒不断被创建(表 1)。
除常用的大肠杆菌质粒载体外,近年来发展了
许多人工构建的能用于微生物、酵母、植物等的质粒
载体,还有含有不止一个 ori、能携带插入序列在不
同种类宿主细胞中繁殖的载体,被称为穿梭载体
(shuttle vectors)[3]。
2 DNA载体的数据分类及查询系统介绍
随着生物技术的不断发展和试验的不同需求,
各种用途不同的载体层出不穷,有些载体虽然有相
同的用途,但是载体自身携带的酶切位点各不相同,
为了更好、更充分地利用这些载体为试验服务,本研
究设计了 DNA 载体的数据分类及查询系统软件。
此款软件不但能将实验室现有的载体统计成一个数
据库,而且能对这些载体按照功能的不同进行分类,
同时在查找的过程中,可以按照名字、序列信息或载
体中重要的元件进行查找,快捷方便,为科研人员节
省大量的时间。
建立 DNA载体的数据分类及查询系统,首先需
要将实验室现有的载体输入到软件中,建立一个完
整且全面的载体数据库。
软件分为几个模块。第一个模块是数据输入模
块,数据可以从这个模块输入、删除和存储,并且具
有数据库的导入与导出的功能。第二个模块是数据
查询模块,在第一个模块的数据输入以后,可以用第
二个模块查询输入的数据。查询数据可以按数据的
序号查询,也可以按数据的文字描述查询,只要是文
字描述中的任何关键字都可以进行查询。查询后系
统列出以该关键字查询到的相关描述的所有数据。
整体数据库导入与导出的功能可以备份整体数据库
和导入整体数据库。第三个模块是数据计算模块。
建立系统的具体步骤:按照载体功能的不同将
载体进行分类,每个载体对应一个独有的编号,然后
将这些载体输入到数据库中。输入的过程中,输入
它们的编号、载体的名称,同时有文字描述的选项,
该选项可介绍载体的功能,以及将载体中重要的元
件列入表中,使载体的名称和功能以及重要特性等
清晰地呈现在查询结果中。然后将载体的序列完整
输入,便于后期构建载体的查询。这款软件具有图
像功能,将载体图输入到软件中,载体中的筛选标
记、抗性和一些重要的酶切位点一目了然。实际应
用中,在输入目标载体的特征后,就能很快筛选到适
合的载体,并可查看目标载体的载体图。
如果在当前的载体库中搜索不到目标载体,用
户可以对载体库进行自我完善。具体操作是输入新
的目标载体的信息,然后点击数据储存,将载体的信
息存入到软件中。如果遇到输入错误或是重复的载
体,可以选择修改或者删除,以保证已保存的载体的
独有性和正确性。如果在录入的过程中,遗漏掉一
些数据,还可以通过插入数据的选项进行补充。录
入完毕后,即可使用查询的功能。在编号栏输入该
载体的编号或是在名称的选项中输入该载体的名
称,就能查到载体相关的信息,例如载体的完整序
列、载体图谱、重要的元件等。
本系统承载量较大,能够录入大量数据,随着载
体数量的不断增多,可不断丰富和更新数据库的
内容。
DNA 载体的数据分类及查询系统在建立数
据分类的基础上,规范数据分类,今后在规范的
数据分类的基础上,正式出版规范的数据分类
软件。
27
2011 年第 8 期 刘国宪等:DNA载体的数据分类及查询系统的开发和应用
表 1 DNA载体的数据分类表
载体类别 载体名称 载体特点 载体图
克隆载体
pBR系列,pGEM系列,pUC载体系
列,pMD18,pMD19等
装接外源 DNA 片段后在宿主
细胞中能自主复制的载体
原核表达载体 pET系列,pGEX系列
通过基因克隆技术,将外源目
的基因,通过构建表达载体并
导入表达菌株的方法,使其在
特定原核生物或细胞内表达
穿梭克隆载体
pShuttle载体系列,Ycp 和 Yrp 系
列载体
在不同类型受体细胞(如酵母
与细菌、细菌与动物细胞等)中
都能够进行复制的克隆载体
真核表达载体
酵母:pEMC载体系列,pPIC3、pPIC9、
pHIL-D1、pA0804、pA0815、pPSC3K
植物:pCAMBIA 系列,pZP 系列,
pBI121等
小鼠:纯化大鼠肾上腺髓质素
(AM)基因重组表达载体
略 略
噬菌体载体
Lambda ZAP载体系列,pBluescript
II 载体系列,pBC 载体系列 pAD-
GAL4 噬 菌 体 载 体,pBD-GAL4
Cam 噬菌体载体
略 略
病毒克隆载体 pVPack载体系列 略 略
转 座 子 构 建
载体
pExchange载体系列 略 略
体外表达载体
pIEx载体系列,pRSF 载体系列,
pCAL载体系列
略 略
37
生物技术通报 Biotechnology Bulletin 2011 年第 8 期
3 DNA载体的数据分类及查询系统的应用
DNA载体是基因工程中重要的研究工具,无论
是在研究上还是在应用上,越来越多的实验室和生
物公司都相继开发出各种各样的载体,以适应不断
发展的基因工程学科的需要。自 1977 年 Bolivar
等[4]组建了第一个系列的克隆载体 pBR以来,已建
立起的各种分子克隆载体用于不同的科学研究和生
物种类。
按照克隆载体的功能或用途来划分,可将 DNA
载体分为两大类:
(1)普通型载体(vector) :这类载体主要用于各
种基因组文库和 cDNA 文库的建立,例如常用的
pBR322,由 λ衍生的载体和 COS 质粒,以及一些大
肠杆菌 -酿酒酵母穿梭载体,如 YRp7 和 YEp13 等。
染色体 DNA片段或 cDNA 均可用这类载体进行增
殖。它们通常含有两个或两个以上的标记基因,其
中一个基因用于选择转化体(transformant) ,另一基
因则是用于检查载体中是否有外源 DNA插入。
(2)表达型载体(expression vector) :这类载体
主要用于研究基因的表达或是用于大量生产某些转
录产物或蛋白质,有的也可用于 cDNA文库的建立。
这类载体除具有普通型载体的特征外,还含有某些
基因的启动子序列,有的还含有转录终止子序列。
为了基因表达产物便于检测或是简化基因表达产物
的分离纯化,有的表达型载体除含有基因启动子序
列外,还有一段为信号肽链编码的 DNA 序列,这段
信号肽链可以使蛋白质分泌到细胞外。这类载体又
可称为分泌表达型载体(secretion expression vec-
tor)。为了使某些基因产物能投入到大规模的工业
生产中,科学家们已组建了各种高效表达的分泌型
载体。
在载体的实际应用中,由于相同的载体种类里
有不同的载体可以选择,如何寻找一个合适的载体
即成为研究人员需要认真考虑的问题。DNA 载体
的数据分类及查询系统可以帮助研究人员快速地搜
索到理想的载体,既节约时间,又提高了使用载体的
正确性,避免了不必要的重复工作。
在检索 DNA载体的数据分类及查询系统时,只
需要设置几个关键词,如载体的类型、载体的启动
子、标记基因,以及需要用到的限制性内切酶等,设
置的关键词越多,搜索的范围就越小,有利于快速搜
索到理想的载体。也可以进行模糊搜索,首先将所
有相关的载体都找到,再做进一步的筛选。
以大肠杆菌超氧化物歧化酶(superoxide dis-
mutase,SOD)基因的克隆和表达为例,如果让 SOD
基因能够在大肠杆菌里表达,首先要把体外扩增得
到的 SOD基因克隆到一个有多酶切位点的载体里,
才能够将该基因用适当的酶切割下来,再克隆到能
够在大肠杆菌里表达的载体中。在这个过程中,需
要两个载体的合作。具体操作的过程是用重组酶介
导扩增法(recombinase-aid amplification,RAA)[5]将
SOD基因从宿主菌株中扩增出来,将该基因克隆到
含 EcoR Ⅰ和 Hind Ⅲ的酶切位点的克隆载体中,用
克隆载体,EcoR Ⅰ和 Hind Ⅲ为关键词搜索 DNA载
体的数据分类及查询系统。结果表明,克隆载体中
的 pUC载体系列较为适合,于是将 SOD基因克隆到
pUCm-T Vector 上。再次用表达载体、大肠杆菌、
EcoR Ⅰ和 Hind Ⅲ为关键词检索 DNA 载体的数据
分类及查询系统,确定表达载体 pET-28a 为适合的
载体。将 EcoR I和 Hind Ⅲ双酶切的 SOD基因片段
连接到 pET-28a表达载体中,最终使 SOD 基因在大
肠杆菌内表达。
4 小结
DNA载体的数据分类及查询系统是根据工作
在第一线的科研人员的要求设计开发的一款应用性
较强的软件。对一个实验室而言,可以利用该系统
构建一套自己独有的载体库,使不同时期的工作能
够连贯起来,避免了人力、物力以及资源上的浪费。
本系统适用于与生物学相关的大专院校、科研单位
和医疗卫生部门,是国内首创的基于 DNA载体的数
据分类软件。
参 考 文 献
[1]楼士林,杨盛昌,龙敏南,等. 基因工程[M]. 北京:科学出版
社,2002.
[2]徐明良,杨金水. YAC克隆———复杂基因组分析技术.农业生物
技术学报,1997,5(1) :1-13.
[3] Aravalli RN,Garret R. Shuttle vectors for hyperthermophilic ar-
chaea. Extremophiles,1997,1(4) :183-191.
[4]Bolivar F,Rodriguez RL,Greene PJ,et al. Construction and char-
acterization of new cloning vehicles. II. A multipurpose cloning sys-
tem. Gene,1977,2(2) :95-113.
[5]吕蓓,程海荣,严庆丰,等. 用重组酶介导扩增技术快速扩增核
酸.中国科学:生命科学,2010,40(10) :983-988.
(责任编辑 狄艳红)
47