免费文献传递   相关文献

农业生物信息数据库发展现状及应用



全 文 :农业生物信息数据库发展现状及应用
晏瑾 肖浪涛
(湖南农业大学生物科学与技术学院,长沙 410128)
摘 要: 农业生物信息数据库是农业科学研究者的基础工具,利用数据库中的大量信息, 便于进行农业生物
的改良与保护。本文介绍了农业生物信息数据库的发展状况及其应用, 并讨论了目前农业生物信息数据库存在的
问题。
关键词: 生物信息学 数据库
Status Quo and Applications of Agricultural
Bioinformatics Database
Yan Jin Xiao Langtao
( Biology S ci ence and Technology Col le ge , H unan A gr icul tur al Univ er sit y , Chang sh a 410128)
Abstract: Agr icultural Bioinformatics Databases is the basic to ol fo r ag ricultur al science researchers, w ith the
help o f the data in these databases, it is easier to im prove and protect the agr icultural or ganism. T his art icle intr o-
duces the development situation and applications of ag ricultur al bioinfo rmatics database, and discusses the pr oblems
of ag ricultur al bioinfo rmatics database.
Key words: Bioinformatics Database
上个世纪 60 年代以来,随着蛋白质序列测定、
核酸序列测定以及基因克隆和 PCR ( polvmerase
chain reaction 多聚酶链式反应)技术的不断发展与
完善,全世界各研究机构获得了大量的生物分子原
始数据[ 1]。对这些数据的收集、存储、分析和解释,
从中获取有用的生物学信息, 从而形成了生物信息
学。生物信息学在农作物基因组分析中的深入应用
形成了农业生物信息学。农业生物信息学是农作物
基因组学研究的基础,对基因、基因的结构、基因产
物的功能分析都是必不可少的技术手段。随着遗传
操作技术特别是动植物细胞的基因转移技术的不断
创新和完善,如外源基因在转基因禾谷类作物中的
表达、/报告基因0用于植物的转化、优良性状基因的
分离技术等一系列技术的突破, 将农业生物信息学
与常规育种技术相结合, 从而提高育种效率, 创新遗
传资源, 加快育种进程, 己成为育种界的发展趋
势[ 2]。目前,农业生物信息学的主要成就在于水稻
基因组的测序、分析,在完成小麦、玉米等主要农作
物的测序工作后, 农业生物信息学研究将会有较大
发展[ 3]。
数据库是信息处理的基础, 而农业生物信息数
据库则是一切农业生物信息工作的出发点。全世界
的农学家、生物信息学家已充分认识到生物信息学
与农业结合将推动农业的发展, 高质量的完善的农
作物生物信息数据库的建立将为农作物基因组学的
研究奠定基础。利用生物信息数据库对基因、基因
的结构、基因产物的功能分析将成为农业基础与应
用研究工作中必不可少的技术手段[ 4]。因此, 农业
生物信息数据库成为生物信息学在农业中深入应用
的一个关键因素。
1 农业生物信息数据库发展概况
1. 1 国外农业生物信息数据库发展现状
同生物信息学研究一样, 农业生物信息学研究
当以美国取得进展较快。孟山都( M onsanto)公司、
收稿日期: 2005-12-30
作者简介:晏瑾( 1981- ) ,女,在读硕士,研究方向:生物信息学
生物技术通报
# 综述与专论# BIOTECHNOLOGY BULLETIN 2006年第 2期
先锋( Pioneer)公司等均有专门从事农业生物信息
学研究与开发的机构,已形成规模和产业 [ 3]。此外,
国际上已经建立了一些重要的农作物基因组数
据库。
UK Cr opNet是英国农作物植物信息网络( ht-
tp: / / ukcr op. net / ) ,其中的英国农作物基因数据库
建立于 1996年,目的是为了方便重要农艺性状基因
的鉴定和处理操作工作, 为农作物植物和模式植物
的比较分析奠定基础 [ 5]。迄今为止已完成了拟南
芥、大麦、油菜、紫花苜蓿和衣藻等 18个物种基因数
据库。此外, UK CropNet 开发了一系列便于可视
化和分析数据的软件工具, 其中的大部分软件工具
不仅可以免费使用, 还可以应用于其他类型的数
据库。
法国的 GenoPlante-Info( GPI)是由法国国家研
究学会于 2000年与几个私营公司联合开发而成, 目
的是进行农作物(主要是玉米、小麦、油菜籽、向日葵
和豌豆)及模式植物(主要是拟南芥和水稻)的基因
组分析,它不仅整合了大量的基因组序列、转录基
因、蛋白质组、以及等位基因的特性、位图和突变等
相关信息,还提供数据库和分析软件的服务, 通过
ht tp: / / g enoplante- info. infobiog en. f r/网站可以进
入 GPI的数据库查询信息[ 6]。
GrainGenes( ht tp: / / www . graingenes. org ) 由
美国农业部在 1992年创立,其最初目的只是为满足
那些从事麦类作物栽培、病理、遗传和分子机理研究
的科学家们的需要,而现在已经成为获得和公布麦
类作物基因和生物信息的中心 [ 7]。它是一个提供小
麦、大麦、黑麦和燕麦基因组信息的国际性数据库,
也是储存这些麦类作物的遗传图谱、绘图探针和引
物、基因、等位基因和 QTLs等重要信息的数据库。
数据库中的文件包含有引物序列、多态性描述及其
标记图片、基因型、实验方案、作物病理特征和突变
表型等一系列的数据信息,这些信息是由序列、外部
数据库的相关目录记录和 BLA ST 搜寻 ESTs 的结
果整合而来。
2003年建成的 MaizeGDB 是玉米遗传学和基
因组学数据库( Maize Genet ics and Genomics Data-
base) , 其网址是 ht tp: / / www . maizegdb. org/。它
综合了以前的 MaizeDB 和 ZmDB 两个数据库中有
用的信息 [ 8]。现在可提供的数据信息包括玉米序
列、基因型和染色体型的变异和染色体绘图数据等,
同时也提供一系列的序列搜寻和分析工具,另外还
列出了多达 2 400 名玉米研究者的联系信息, 为研
究者们提供了一个相互交流与合作的平台。
SGMDB ( Soybean Genomics and M icro arr ay
Database)是 1999年确立的大豆序列和微阵列数据
库,它主要用于存储和分析大豆的 EST s和微阵列
数据,可通过网址 ht tp: / / psi081. ba. ars. usda. gov/
SGMD/ default . htm.进入该数据库 [ 9]。目前这个数
据库中存有多达 50 000 000条的微阵列数据和几乎
20 000条的 ESTs数据。它可以通过基因表达数据
信息链接到大豆的 EST s, 也可运用其拥有的分析
工具进行数据挖掘。
水稻蛋白质组数据库 ( Rice Proteome Data-
base)是第一个详细记录水稻蛋白质组信息的数据
库( ht tp: / / gene64. dna. aff rc. g o. jp/ RPD/ )。其中
不仅存放着用 2D-PAGE方法从水稻组织和亚细胞
结构中得到的 21幅蛋白质参考图谱,还包括了像蛋
白质分子质量和等电点这类的计算结果、获得蛋白
质中氨基酸序列的关键性实验技术以及对比或搜寻
序列同源性的结果, 同时也提供与其他重要分子生
物信息数据库的链接[ 10] 。
由国际基因组中心 ( NCGR)和美国农业部的
ARS( Agr icultural Research Service) 合作完成的
T he Legume Informat ion System ( LIS) 是一个公
用的豆类信息资源数据库 ( ht tp: / / www. compara-
t ive- legumes. org)。它收录了多种豆类作物的遗传
和分子数据,可以进行豆类杂交品种的基因组和转
录序列比对。目前, L IS 有意结合一些其他数据库
中豆类的基因表达和生化途径信息, 以期扩大自身
的信息量,使 LIS中的数据趋于完整[ 11]。
美国农业基因组信息系统 ( Ag ricultural Ge-
nome Info rmat ion System ) AGIS)是由美国马里兰
大学植物生物系和美国农业部等单位联合创建的农
业基因组信息服务系统 ( ht tp: / / ars-genome. co-
mell. edu/ )。该系统目前主要包括农作物与牲畜品
种的基因信息,也包括种质与植物命名数据库等与
基因信息有关的数据库。基因数据库主要有植物基
因组、牲畜基因组等信息资源,另外还提供了分析基
34 生物技术通报 Biotechnology Bullet in 2006年第 2期
因组数据的各类工具软件, 还链接了其他基因数据
库、会议和出版物等 [ 12]。
1. 2 国内农业生物信息数据库发展现状
我国作为世界上最大的发展中国家和传统的农
业大国,紧跟国际科研的步伐,在农业生物信息学研
究和农业生物信息数据库的建设与维护方面也取得
了一定的成绩[ 13] 。
中国于 2000年 5月启动/中国杂交水稻基因组
研究和开发计划0, 以中国杂交水稻父本 / 籼稻
93110为研究对象, 全部计划已在 2003 年完成。
2001年 10月 12日,在中国科学院遗传研究所和国
家杂交水稻研究中心的合作下, 中国科学院基因组
生物信息学中心完成了具有国际领先水平的中国水
稻(籼稻)基因组/ 工作框架图0及数据库( ht tp: / /
www . negr. ac. cn/ 12chr/ database- irg sp. htm )的建
立。中国水稻(籼稻)基因组/工作框架图0和数据库
的公布标志着我国已经成为继美国之后世界上第二
个具有独立完成大规模的全基因组测序和组装分析
能力的国家。2002年完成中国水稻(籼稻)基因组
/精细图0。与此同时还进行了超级杂交水稻母本
/培矮 64s0的比较基因组研究。在此基础上, 我国
科学家将全面开展对杂交稻杂种优势机理研究和基
因预测分析;解析和发现与水稻育性、丰产、优质、抗
病、耐逆、成熟期等有关的遗传信息和功能基因; 进
而发现控制优良性状如米质、香味、抗性的因子, 为
我国的水稻应用研究和育种提供全面的生物信息服
务。
中国农作物种质资源数据库包括了 111种以上
作物、27万多份种质信息、近 1300 万个数据项, 总
数据量 600多 M ,数据量仅次于美国的种质植物资
源数据库[ 14] ;创建于 1992年的中国动物物种编目
数据库是通过中国科学院/八五0重大项目/生物多
样性生物学基础的研究0, /九五0期间得到院基础
研究特别支持项目/科学数据库及其信息系统0、国
家科委的/中国可持续发展信息共享示范项目0与中
国科学院生物多样性委员会的经费资助, 得以不断
增加与更新动物有关信息,并能上网服务。目前已
收录了一万余种(亚种)动物的基本信息; 2002年成
立的上海市农业生物基因中心[ 15] ,其数据库收集保
存了上海市农业生物基因资源, 同时也保存了全球
范围内具有重要科学意义与经济价值或应用前景的
优良资源; 2000年正式开通运行的北京农业信息网
( ht tp: / / www. agri. ac. cn)是发布国内外最新农业
信息和实用技术以及其他综合信息的大型农业专业
网站,该网站目前已建好的农业数据库有北京农业
专家数据库、北京市农业科技资源数据库、北京市农
业科技成果档案WEB数据库、农业实用数据库、农
业科技动态数据库和农业新技术新产品数据库等一
系列数据库[ 16] 。
2 农业生物信息数据库的应用
人类第一次如此近地接触基因, 研究基因、蛋白
质和生命,其研究成果必将对农业产业深远的影响。
由于农业生物信息数据库中的数据检索、序列比对、
同源性分析、结构预测等一系列工具软件和生物信
息学技术手段的迅速发展,农业生物信息数据库的
应用领域也越来越广。
2. 1 在动、植物品种改良方面的应用
随着人类基因组、水稻基因组以及各种模式生
物基因组的解译, 根据不同物种间的进化距离和功
能基因的同源性, 可以方便地找到各种家畜、经济作
物与其经济效益相关的基因,进而按照人们的愿望
加以改造[ 18]。通过比较基因组学、表达分析和功能
基因组分析,识别重要基因、发现新基因、加快基因
克隆的速度,对现有的农作物、畜禽、林果、蔬菜的品
种进行改造,甚至制造新的物种, 丰富种质资源, 以
满足人类营养需要。
2. 2 在保护农作物遗传资源方面的应用
对于我国这样的农业大国, 运用先进有效的生
物信息学研究手段, 结合我国丰富的特有植物遗传
资源,开展对中国优良农作物资源的单核苷酸多态
性和插入缺失多态性的研究,分离、克隆有自主知识
产权和重要经济价值的新基因及重要的基因表达调
控元件,发现控制优良性状基因的分子标记,防止农
作物遗传资源的外流, 将极大地加快我国的农作物
应用研究工作,实现我国农业持续发展。
2. 3 在病虫害防治方面的应用
从遗传基础上改变危害农业生产的微生物、昆
虫,最大限度地减少其数量和影响,同时引入抗性基
因,提高农业生物抗病虫害、抗逆能力。如中国预防
医学科学院已完成对禽减蛋综合症 AAV ) 2全基
352006年第 2期 晏瑾等:农业生物信息数据库发展现状及应用
因组的序列分析 [ 19] ,这就为以后研究该病奠定了基
础。以信号受体和转录途径组分分析为基础, 进行
农业化合物设计,结合化学信息学方法,鉴定可用于
杀虫剂和除草剂的潜在化学成分,将成为生物信息
学在农业上的另一推动力, 这将保证农作物高产优
质和绿色环保的市场要求。
3 农业生物信息数据库存在的问题
虽然目前农业生物信息数据库发展迅速, 但也
存在以下几个问题。
3. 1 生物信息数据库最初的发展是在医疗和制药
领域,导致了此后生物信息数据库的重心也一直是
偏向医疗和制药领域, 专业的高质量的农业生物信
息数据库数量较少,在整个生物信息数据库中所占
的比例也不高。
3. 2 农业生物信息数据库分布分散且格式不统一,
如何将独立的、分散的农业生物信息数据库的信息
整合到一起,形成农业生物信息数据库集成化和标
准化,不仅是农业生物信息数据库需要解决的问题,
同时也是目前生物信息数据库研究领域的新挑战。
3. 3 目前已开发应用的农业生物信息数据库主要
集中在英、美等发达国家,一些发展中国家的研究组
织由于资金和技术问题难以建成完善的农业生物信
息系统。世界各国应协力合作, 创建一个共享的农
业生物信息大平台,为农业生物信息资源的用户提
供高质量的服务,向发展中国家的科研组织提供周
到的技术支持。
3. 4 我国种质资源和遗传资源丰富,因此在农业生
物信息数据库的信息收集和提供使用方面做了大量
工作。我国应用大力构建我国自己的农业生物信息
数据库,积极发展二次或专业数据库,并与国际常用
数据库进行有效链接和及时更新。
参 考 文 献
1 商英潘,肖晓旦,刘雁书.医学信息, 2005, 18( 4) : 328.
2 郑国清,高亮之.计算机与农业, 2002, ( 9) : 37.
3 郑国清,高亮之.成就及展望.世界农业, 2002, 10( 282) : 35.
4 简兴,苗永美.农业网络信息, 2004, ( 4) : 29.
5 J o Dick s, Mary Anderson, Linda Cardle, et al. Nucleic Acids Re-
search, 2000, 28, ( 1) : 104.
6 Delphin e Samson, Fabrice Legeai, Emmanuelle Kars enty, et al .
Nucleic Acid s Research, 2003, 31, ( 1) : 179.
7 David E . Mat thew s , Victoria L. Carollo, Gerard R. Lazo, Olin
D. Nucleic Acids Research, 2003, 31, ( 1) : 183.
8 Carolyn J. Law rence, Quen feng Dong, Mary L. Polacco, et al .
Nucleic Acid s Research, 2004, 31: Databas e issu e: D393.
9 Nadim W, Alkh arouf , Benjamin F, Mat thew s. Nucleic Acids
Research, 2004, 32: D398.
10 Setsuko Kom atsu , Keiichi Kojima, Kouji Suzuki, et al. Nucleic
Acids Research, 2004, 32: D388.
11 Micheal K, Gonzales, E ric Archuleta, And rew Farmer , et al .
Nucleic Acids Research , 2005, 33: D660.
12 万跃华,何立民.情报学报, 2002, 21( 4) : 501.
13 段韶芬,郑国清.农业图书情报学刊, 2003, ( 3) : 20~ 23.
14 张蕴奇.农业网络信息, 2004, ( 8) : 4.
15 龙萍,曹开雄.上海农业学报, 2004, 20( 3) : 7.
16 张峻峰,蔡世英,孙素芬.农业图书情报学刊, 2001, ( 3) : 21~ 22.
17 刘玉庆,王禄山,张玉忠,李洪生.山东农业科学, 2001, ( 5) : 54.
18 郑国清,黄静,段韶芬,徐丽敏.河南农业科学, 2003, ( 1) : 8.
19 金奇,等.中国科学 C辑, 1999, 29( 5) : 543~ 548.
# 信息交流#
CIMMYT首次试种 GM耐旱小麦
AgBio tech Repo rter 2004年 21卷 4期 6~ 7页报道:国际玉米和小麦改良中心( CIMMYT )于最近首次
对 GM 耐旱小麦进行了大田种植试验。这种 GM 小麦携带了来自拟南芥菜 ( Ar abidop si s thal iana )的
DREB1A 基因。此种基因可使小麦具有耐受干旱、低温和盐渍的特性。
据悉, 先前在 CIMMYT 的生物安全温室进行的 DREB小麦种植试验,已取得了可喜的结果。认为如果
这次大田种植再获成功, 就可以利用这种 DREB 基因来培育其他禾谷类作物诸如水稻、玉米和大麦。指出
DREB基因是由日本国际农业科学研究中心提供的。此项研究获得了澳大利亚分子植物育种合作研究中心
的资助。 汪开治
36 生物技术通报 Biotechnology Bullet in 2006年第 2期