全 文 :植物学通报 2005, 22 (4): 494~501
Chinese Bulletin of Botany
①通讯作者。Author for correspondence. E-mail: zhchangqing@sina.com
收稿日期: 2004-05-25 接受日期: 2004-09-27 责任编辑: 崔郁英, 于昕
专 题 介 绍
园艺植物分子育种相关生物信息资源及其应用
1,2张长青① 1王 进 3李广平 3章 镇
1(南京大学生命科学学院 医药生物技术国家重点实验室 南京 210093)
2(金陵科技学院园艺系 南京 210038) 3(南京农业大学园艺系 南京 210095)
摘要 园艺植物分子育种中, 生物信息技术是一项新技术。GenBank、EMBL、DDBJ、Swiss-Prot等数
据库及其序列查询系统、序列比对软件和序列提交软件是园艺植物分子育种中的重要生物信息资源。本
文综述了这些生物信息资源, 以及它们在克隆新基因、预测新序列功能、鉴定种质资源和进行系谱分析
等方面的应用。
关键词 生物信息, 园艺植物, 分子育种, 数据库
Bioinformatics Resources for Molecular Breeding of
Horticultural Plants
1,2ZHANG Chang-Qing① 1WANG Jin 3LI Guang-Ping 3ZHANG Zhen
1(State Key Laboratory of Pharmaceutical Biotechnology, School of Life Science,
Nanjing University, Nanjing 210093)
2(Department of Horticulture, Jinling Institute of Technology, Nanjing 210038)
3(School of Horticulture, Nanjing Agricultural University, Nanjing 210095)
Abstract Bioinformatics technology is a new approach used in molecular breeding of horticultural
plants. Many databases and tools of bioinformatics, such as GenBank, EMBL, DDBJ, and SWISS-
PROT, are important resources for molecular breeding research. Horticultural researchers often use
these resources to predict the function of sequences of new nucleic acids or proteins, to produce
phylogenetic trees, and to clone new genes. The paper reviews the main bioinformatics resources,
including the important databases and frequently used service systems, and their applications in
molecular breeding of horticultural plants.
Key words Bioinformatics, Horticultural plants, Molecular breeding, Database
生物信息学(bioinformatics)是20世纪末随
着人类基因组计划的发展而兴起的一门新的交
叉学科。目前, 从蛋白质和核酸等生物大分子
的序列、结构和功能到基因表达、调控、修
饰以及信号转导和进化等, 都已建立了不同类型
的分子生物学数据库, 其中大多数都在Internet
网上发布, 供全球范围内的用户使用。2002年,
《Nucleic Acids Research》网页中列举了 336
个数据库的链接。2004年, 世界上已建立了548
个数据库(Galperin,2004)。目前, 该数量还在进
4952005 张长青等: 园艺植物分子育种相关生物信息资源及其应用
一步增长。为更好地利用这些数据资源, 生物
信息学家又为其配备了相关检索和分析工具。
生物信息资源有效地促进了园艺植物分子
育种研究, 尤其是分子育种上游研究工作。利
用生物信息技术, 陈劲枫等(2003)获得了黄瓜
(Cucumis sativus)的全雌特异引物, 田振东等
(2003)发现了马铃薯(Solanum tuberosum)的晚疫
病抗性相关基因。它为园艺植物分子育种者
提供了一条开展分子育种上游工作的新途径。
利用它, 育种者可以快速地获得目的序列、基
因功能、基因特征信号以及种或品种间的亲
缘关系等信息。与分子育种中的其他上游技
术相比, 该技术具有投资少、周期短、风险
小、污染少和技术要求低的优点, 特别适合我
国当前的分子育种状况。因此充分利用生物
信息资源将会给国内园艺植物分子育种研究带
来新效应。
1 园艺植物分子育种相关生物信
息资源
1.1 数据库
1.1.1 核酸序列数据库 核酸序列数据库是
生物信息学数据库中最大的一类数据库, 也是园
艺植物分子育种人员使用最为频繁的一类数据
库。它提供了基因的序列、功能和特性(包括
编码区、调控区、转录单元、重复区域、突
变位点或修饰位点等)、来源和递交者等信息,
并通过交叉引用其他数据库来提供相应的蛋白
质序列和功能以及参考文献等资料。中国园
艺植物分子育种人员所获得的核酸序列一般都
会在其中登记, 如胡桂兵等(2001)发现的毛叶枣
(Zizyphus mauri t ianan)AP1 基因片段在
GenBank中登记号为AF356541; 田振东等(2003)
发现的马铃薯晚疫病抗性基因登记号为
AY185207。同时, 部分学术期刊在发表相关论
文时, 也要求作者递交序列登记号。该类数据
库已成为基因工程育种和分子标记辅助育种的
必备数据库。
GenBank(http:∥ www.ncbi.nlm.nih.gov/
genbank)、EMBL(http:∥www.ebi.ac.uk/embl)
和DDBJ(http:∥www.ddbj.nig.ac.jp)是核酸序列
数据库中3个最主要的数据库, 其中以GenBank
更为著名(邢美园和苏开颜, 2003)。数据库建立
之初, 它们间很少进行数据交换。目前, 三方
合作建立了国际核酸合作组织(Stoesser et al.,
2003; Kulikova et al., 2004), 每天自动进行一次
数据交换, 确保任何一个数据库当日收到的数据
都能在三者之间相互共享(Tateno et al., 2000;
Miyazaki et al., 2004)。三者中, DDBJ中收录
的数据量最大(3.5×107条), 其次为GenBank(3.
3×107条), EMBL最少(2.7×107条)。中国园艺植
物科研工作者最喜欢使用的是GenBank数据
库, 而EMBL和DDBJ则分别是欧洲各国和日本
主要使用的核酸数据库。
GenBank、EMBL和DDBJ 3大数据库中
的序列来源主要为各种文献或专利中报道的序
列和一些大型测序公司递交的序列, 以及与其他
数据机构协作交换的序列。它们涉及到的物
种中, 有包括植物、微生物和哺乳动物等在内
的大约15万种生物。截止到2004年9月20日,
GenBank中已收录了 32 549 400条核酸序列
(Benson et al., 2004), 园艺植物相关的序列达
1 815 094条以上。表1列出了3个核酸数据库
中主要园艺植物所在属的核酸序列收录数。
1.1.2 蛋白质序列数据库 在生物信息学中,
蛋白质数据库的类型很多, 涵盖了蛋白质研究中
的各个环节。从园艺植物分子育种的角度看,
最值得介绍的是蛋白质序列数据库。它能帮
助该类研究人员构建分子亲缘关系树, 进行系谱
分析, 或者间接地被用于推测已有蛋白或核酸的
功能和特征信号。番茄( L y c o p e r s i c o n
escultentum)胞外糖蛋白CF功能的发现就是该
方面的例证(王金生, 1998)。
SWISS-PROT(http:∥ www.expasy.ch/
sprot)和Tr-EMBL(http:∥www.ebi.ac.uk/trembl)
是两个最常用的蛋白质一级结构数据库。
496 22(4)
表 1 主要园艺植物所在属的核酸和蛋白质序列数
Table 1 Nucleic acid and protein sequence number of plant family related to horticultural plants
属名 核酸序列数据库 蛋白质序列 属名 核酸序列数据库 蛋白质序列
数据库 数据库
Gen- EMBL DDBJ Swiss- Tr- Gen- EMBL DDBJ Swiss- Tr-
Bank Prot EMBL Bank Prot EMBL
芸苔属 645 118 1 651 1 420 379 1 983 百合属 521 48 263 20 212
Brassica Lilium
茄属 341 115 4 640 396 554 2 668 杜鹃属 498 43 303 4 78
Solanum Rhododendron
番茄属 181 779 3 315 230 269 1 243 梨属 431 265 140 15 200
Lycopersicon Pyrus
葡萄属 167 406 269 66 64 630 栗属 412 63 24 5 103
Vitis Castanea
苹果属 159 803 138 964 40 499 无花果属 399 147 15 1 153
Malus Ficus
莴苣属 68 972 125 41 8 264 南瓜属 331 175 66 33 143
Lactuca Cucurbita
柑橘属 60 304 420 2 936 456 2 843 猕猴桃属 326 135 35 18 158
Citrus Actinidia
李属 39 608 7 928 303 63 674 萝卜属 261 82 121 24 203
Prunus Raphanus
辣椒属 31 292 142 34 40 329 芍药属 210 8 5 3 143
Capsicum Paeonia
菜豆属 22 472 402 84 130 636 凤仙花属 190 17 99 7 58
Phaseolus Impatiens
葱属 22 287 525 135 15 220 杨梅属 159 10 1 1 5
Allium Myrica
蔷薇属 8 689 765 443 910 5 098 芒果属 152 43 26 1 29
Rosa Mangifera
核桃属 7 827 39 1 0 26 凤梨属 111 16 28 15 56
Juglans Ananas
鹅掌楸属 6 319 3 7 2 42 菊花属 90 15 22 0 18
Liriodendron Dendranthema
草莓属 5 706 266 84 16 136 丝瓜属 69 7 9 8 45
Fragaria Luffa
甜瓜属 4 120 449 279 50 368 萱草属 44 13 118 1 14
Cucumis Hemerocallis
木兰属 2 727 52 162 15 250 柿属 36 10 64 3 63
Magnolia Diospyros
银杏属 2 092 58 7 14 102 荔枝属 28 1 0 0 4
Ginkgo Litchi
豇豆属 1 156 198 363 78 376 枇杷属 8 0 3 0 8
Vigna Eriobotrya
西瓜属 758 14 33 6 56 枣属 7 3 0 0 0
Citrullus Ziziyphus
芭蕉属 756 440 45 8 247 合计 1 815 094 30 689 9 633 3 286 20 483
Musa Total
4972005 张长青等: 园艺植物分子育种相关生物信息资源及其应用
SWISS-PROT收录的主要是实验验证过的, 并经
专家仔细核实, 序列和功能都已明确了的蛋白质
序列。从事园艺植物分子育种研究的人员从
该数据库中可以查找到蛋白质的大量相关信息,
如蛋白质的结构域、功能位点、跨膜区域、
二硫键位置、翻译后修饰和突变体等。但是
由于该数据库的收集工作主要是通过手工完成
的, 所以其更新速度慢, 数据量少。为了弥补
这一缺陷, 1996年又开发了 Tr-EMBL数据库
(Boeckmann et al., 2003), 它当中的数据则全是
由计算机直接翻译EMBL核酸序列数据库中的
CDS片段获得的, 所以相对而言更新速度快, 数
据量大。但是, 由于其翻译的数据库具有一定
的错误率, 所以该数据库中的数据相对不可靠。
同时, 由于世界各地的实验室在对基因登记时,
因保留的上下游序列长短不同, 或者在序列分
类、注释等方面的差异, 常会带来序列冗余的
问题(赵国屏, 2002)。对园艺植物分子育种人员
来讲, 这些都是不利的。所以进行相关蛋白质
分析时, 首先使用SWISS-PROT数据库, 其次再
参考Tr-EMBL数据库, 但后者不宜作为可靠的
分析依据。
与核酸序列数据库相比, 蛋白质序列数据
库中收录的数据相对较少, 但SWISS-PROT数
据库的可靠程度极高。截止到 2004年 9月 20
日, SWISS-PROT数据库中拥有的蛋白质序列为
151 047条, Tr-EMBL中收录的序列为1 064 560
条, 园艺植物相关的序列数量分别在3 286条和
20 483条以上。主要园艺植物所在属的详细蛋
白质序列收录数见表 1。
1.1.3 其他数据库 除以上数据库之外,
PRINTS (http://www.bioinf.man.ac.uk/dbbrowser/
PRINTS)、BLOCK(http://www.blocks.fhcrc.
org)和 PROSITE(http://www.expasy.ch/prosite)
也是重要的蛋白质结构数据库。它们对蛋白
质的功能预测、系谱分析和遗传进化等方面
的研究非常重要, 但由于国内园艺植物的蛋白质
空间结构研究不多, 所以目前应用较少。
PRINTS是蛋白质家族的指纹数据库。它
由蛋白质各家族的保守序列构建而成, 其中包含
有蛋白家族特性和其保守序列特征信息。该
数据库对蛋白质鉴别的分辨力非常高, 可用于确
定未知蛋白质的家族关系(郝柏林和张淑誉,
2002)。
BLOCK是一个蛋白质序列模块数据库, 由
各个蛋白质家族中的高度保守区域组成。其
记录中包含有查询序列所属蛋白家族信息和构
建该序列模式的参数信息, 可用于蛋白保守序列
查询、家族鉴别和亲缘关系研究。
PROSITE是一个蛋白质模式数据库, 由
Prosite.dat和 Prosit.doc两个文件组成。前者
描述了序列的结合位点和序列特征信息以及功
能位点信息。后者则存放了文献摘要等文字
说明信息。该数据库在分析酶的催化位点、
配体结合位点和二硫键的位置等蛋白质序列模
式研究中非常重要。
1.2 数据库的服务系统
1.2.1 序列检索系统 序列检索系统是一类专
门用于序列数据库检索的工具。它可方便使
用者快速有效地获取目的信息。目前 ,
GenBank 使用的检索系统是 Ent rez 系统,
EMBL、DDBJ、SWISS-PROT和Tr-EMBL使
用的都是 SRS系统(Baker, 2000; Lopez et al.,
2003)。Entrez系统能根据用户的要求在包括
GenBank等在内的20多个数据库中进行检索,
具有界面简单、使用方便及检索数据库全的
优点(胡德华和方平, 2000; Stoesser et al., 2003);
而 SRS (sequence retrieval system)系统则具有
用户界面统一和查询效率高的优点, 它可根据用
户的需要选择安装不同数据库, 但不影响序列查
询(邢美园和苏开颜, 2003)。
1.2.2 序列比对工具 序列比对工具在分子
育种中用于比较序列相似性、设计PCR引物、
预测新基因的功能及分析亲缘关系。BLAST
(http://www.ncbi.nlm.nih.gov/blast) 和Clustal W/
X (http://www.ebi.ac.uk/clustalw) 是两个重要的
498 22(4)
序列比对软件。其中, BLAST属于两两序列相
似性搜索工具, 是目前单序列对库检索中使用最
广泛的比对程序。它具有多种运行程序, 如
BLASTn、BLASTp、BLASTx和TBLASTn等,
可用于满足不同序列分析的需要。目前, 许多
站点都提供BLAST服务。但对用户来讲, 需要
注意的是: 1)比对时使用的数据库和记分矩阵不
同, 比对的结果常会不同; 2)BLAST只能匹配连
续的序列, 而缺失片段将被分段显示; 3)BLAST
搜索的结果仅仅反映的是序列间相似程度的高
低, 而非同源程度的高低。是否同源还需要进
一步的进化事实来验证。Clustal W(Thompson
et al., 1994; 郭崇志和孙曼霁, 2000; Li, 2003)是
一个基于Web网上的多序列比对分析软件。
它能对不同物种中功能相同或相似的蛋白质或
核酸序列进行多重联配, 以发现序列间的保守
区域或生成分子进化树。Clustal X则是一个
适用于PC机上的程序, 与Clustal W的功能基
本相同。
1.2.3 序列提交软件 若实验中获得新序列就
需要提交给数据库。这一工作常由序列提交
软件BankIt (http://www.ncbi.nlm.nih.bov/bankit)
(胡德华和方平, 1998)或Sequin (http://www.ncbi.
nlm.nih.gov/sequin)来完成(Benson et al.,
2004)。使用BankIt时, 用户需要直接在网上操
作。而使用Sequin时, 则要求在本地计算机上
运行。二者相比, 前者除具有提交序列的功能
外, 还具有修改原始序列的功能。但它仅适用
于少量序列的提交。而后者则既适合于大量
序列提交, 也适合与长序列、EST序列和GSS
序列的提交。同时, 还可以协助用户对序列进
行注释和分析。
2 生物信息学资源在园艺植物分
子育种中的应用
近年来, 分子育种一直是园艺植物育种研
究的热点。它打破了种间基因交流的界限, 为
定向育种提供了技术支持, 在改良和修饰性状方
面有巨大潜力。生物信息学作为一门新兴学
科, 为分子育种提供了大量的珍贵资源和高效的
计算机工具, 从而成为分子育种的新技术。当
前, 生物信息学资源在园艺植物分子育种工作中
的应用主要集中在以下几个方面。
2.1 新基因克隆中的引物设计
基因克隆的经典方法是图位克隆和转座子
标签克隆, 但这些方法实验周期长、成本高及
操作技术复杂, 在基因克隆中并没有得到非常广
泛的运用。近年发展起来的用于分离和克隆植
物发育基因的mRNA差异显示技术、抑制差减
杂交技术和基因表达系列分析技术虽然操作简
便且效率高, 但通常得不到全长cDNA ,必须通过
cDNA文库筛选或RACE的方法才能获得。
利用序列数据库中已知物种或品种中的某
蛋白质的序列或基因序列, 使用Clustal W进行
多序列联配, 根据联配结果中的保守区域设计引
物, 克隆其他物种中的同源基因, 是生物信息技
术提供的一条基因克隆新途径。彭立新等
(2003)用其他植物中的MAPK基因保守区段设
计简并引物, 从西府海棠(Malus micromalus)中
克隆出了该基因的 cDNA全序列, 定名为Ma
MAPK; 王俊英等(2002)根据玉露桃(Prunus
persica cv. ‘yulu’)和猕猴桃(Actinidia deliciosa)
的 mRNA 序列设计引物, 以樱桃( P r u n u s
pseudocerasus)基因组为模板进行PCR扩增, 克
隆出了樱桃ACC氧化酶基因; 于喜艳等(2003)
根据 G e n B a n k 中登录的番茄、胡萝卜
(Raphanus sativus)和柑橘(Citrus sinesis)等酸性
转化酶基因的保守序列设计引物, 采用RT-PCR
技术, 克隆出了甜瓜(Cucumis melo)酸性转化酶
基因 cDNA片段。
利用数据库中的蛋白质表达谱, 比较处理
条件下的蛋白质图谱, 可克隆与该处理相关的蛋
白质基因。利用EST序列, 通过对基因组电子
克隆也可克隆新基因。但园艺植物中的蛋白
质图谱库、基因组序列库和 EST序列还比较
少, 国内目前这方面的应用不多。
4992005 张长青等: 园艺植物分子育种相关生物信息资源及其应用
2.2 预测新序列的功能
近年来随着生物信息学数据大量积累和生
物学知识的整理, 通过比对可以有效地分析和预
测新序列片段的功能。胡桂兵等(2001)对获得
的毛叶枣基因片段和GenBank中的所有序列进
行比对, 发现该序列与AP1基因序列有66%~
88%的相似性, 从而推测该片段具有AP1基因
的功能。罗安才(2003)对脐橙(Citrus sinensis)
及其芽变品种基因组间的差异片段进行了测序
和比对分析, 认为芽变出现的原因是某些酶的缺
乏。白双义等(2003)利用该技术, 对获得的月
季(Rosa hybrida)DNA片段的蛋白质序列进行
比对分析, 发现该序列的功能与衰老相关。
当前, 在已测定的核酸序列中, 对于基因功
能的预测都是基于已知功能的基因序列, 而与已
知功能基因结构不相似的未知基因, 生物信息学
技术的预测效果较差。
2.3 获取物种、品种的特征信息进行种质
资源研究和品种鉴定
分子生物学研究发现, 物种的多样性是基
因及其表达调控多样性的结果, 而基因及其表达
调控多样性可以在不同水平上进行检测, 包括器
官水平上的形态学和分类学特征、组织水平
上的解剖学特征、染色体水平上的细胞学特
征和分子水平上的蛋白质图谱、同功酶谱以
及 DNA分子标记图谱等。
利用生物信息技术获取物种、品种或基
因的特征信号, 开展种质资源研究和品种鉴定的
工作目前还比较少, 但它是种质资源研究和品种
鉴定的一条崭新的思路。常用的方法是: 输入
关键信息(如物种名称), 通过Entrez或SRS搜索
dbEST或核酸序列数据库, 并仔细筛选结果, 得
到部分SSR (simple sequence repeats)序列。再
根据SSR序列设计引物, 利用SSR分子标记技
术, 进行种质资源研究和品种鉴定。Sco t t
(2000)从5 000个葡萄(Vitis arnccrensis)EST序
列中分离到124个SSR序列, 分析了7个葡萄品
种资源。高志红等(2002)参考酸樱桃(Cerasus
vulgar is )、桃(Amygdalus pers ica )和杏
(Armeniace vulgaris)的 SSR引物, 设计果梅
(Prunus mume)的SSR引物, 并分析了果梅的
种质资源多样性。Guilford等(1997)以SSR序
列为探针筛选苹果(Malus domestica)基因组
文库, 区分了 2 1 个苹果品种。A r a n z a n a
(2001)对100个桃品种进行分析, 区分了78个
不同的基因型。
采取此策略也可以进行园艺植物微卫星序
列引物的开发。
2.4 构建分子亲缘关系树并进行谱系分析
园艺植物中存在着许多天然杂种, 有些品
种是经过实生选种或采用混合花粉杂交选育而
成的, 用常规方法无法判断其亲本。
借助生物信息学数据库, 利用Clustal W软
件, 对已知的不同物种或品种中某蛋白质的序列
或核酸序列进行相似性比较及序列聚类, 构建分
子进化树, 可进行谱系分析。根据分析结果, 可
以确定树种或品种间的亲缘关系, 从而从分子水
平上为提高杂交育种亲本选配的准确度以及种
质资源的有效利用提供依据。张露等(2002)对
新疆石竹属(Dianthus)植物中的 8个野生种和
一个外来种(Lychnis coronata)rDNA中的ITS区
序列进行测定、比较、聚类和进化树构建, 从
分子水平上提出了石竹属各物种的进化途径, 为
康乃馨新品种的选育提供了重要的参考依据。
由于物种或品种间存在着遗传物质的横向
迁移问题, 因此选用核酸片段序列构建分子亲缘
关系树时, 该问题必须引起注意。目前 COG
(cluster of orthologous groups)数据库中收录了
GenBank中登录的并已证明无该问题的所有核
酸片段序列。
3 讨论与展望
利用生物信息学技术进行分子育种, 具有
投资少、周期短、风险小、污染少和技术
要求低的优点, 适合我国当前的园艺植物育
种状况。
500 22(4)
参 考 文 献
由于各类数据库中已知的园艺植物EST序
列或者基因组序列还很少, 其研究进程落后于拟
南芥(Arabisopses thaliana)、水稻(Oryza
sativa)等模式生物, 所以无论进行基因的电子克
隆、功能预测、种质特征信号的提取、还是
亲缘关系树的构建, 利用生物信息学方法开展工
作还依然存在着相当大的难度。因此, 开展园
艺植物分子育种研究时, 需借助数据库中已有的
其他植物的相关序列知识, 通过不同植物间或品
种间的序列比较、交叉参照或与其他技术相
结合来使用。水稻和拟南芥等植物上的EST序
列或基因组序列测定的已经相当多, 生物信息学
技术的运用也很成熟, 因此利用该类植物中的一
些序列信息和研究手段开展园艺植物分子育种
工作, 也不失为良策。
随着植物分子生物学的发展, 借助生物信
息学数据库中的种质特征信号, 可对杂交后代的
重要经济性状进行早期预选和鉴定, 缩短育种年
限, 减少育种费用; 利用DNA指纹图谱资源, 如
RAPD数据库和AFLP数据库、RFLP数据库
等, 可对选育品种或育种材料进行鉴定; 利用同
源蛋白质家族数据库对相关育种材料进行亲缘
关系分析, 可对杂交亲本的选配提供依据。因
此, 专业(二次)数据库, 如DNA指纹图谱数据
库、同源蛋白质家族数据库等对园艺植物分
子育种者来讲, 是一类非常重要而且珍贵的资
源。目前这类植物数据库资源主要有小麦基
因图谱数据库WHEAT和树木遗传图谱数据库
TreeGenes, 而园艺植物中目前尚未建立专门的
这类数据库, 但随着基因和蛋白质测序的不断进
行, 随着研究发展的需要, 这类数据库以后必定
会建立, 它将给园艺植物分子育种带来极大的方
便和更加广泛的应用。
目前, 利用生物信息资源开展园艺植物分
子育种工作, 在发现新基因、基因功能预测、
种质资源研究和品种鉴定等方面已经取得了可
喜的成绩。对育种人员来讲, 这是一条新的途
径, 也是一条有效的捷径。尽管目前各数据库
中的园艺植物序列还不足够多, 专业(二级)数据
库尚未建立, 但已有资源对解决育种目标中的某
些关键问题已显出了其无与类比的优势。随
着今后各数据库中相关序列条目的增长、更
多物种基因组测序的完成以及各种专业(二级)
数据库的建立, 生物信息学技术必将会在园艺植
物分子育种中发挥更大的作用。
白双义, 刘青林, 欧阳青, 蔡文启 (2003) 月季切花衰老
相关基因的差异显示及其序列分析. 农业生物技术学
报, 11: 154-157
陈劲枫, 娄群峰, 余纪柱, 庄飞云 (2003) 黄瓜性别基因
连锁的分子标记筛选. 上海农业学报, 19: 11-14
高志红, 章镇, 韩振海, 沈志军 (2002) 果梅 SSR反应体
系的优化. 南京农业大学学报, 25: 19-22
郭崇志, 孙曼霁 (2000) Clustal W——蛋白质与核酸序
列分析软件. 生物技术通讯, 11: 146-149
郝柏林, 张淑誉 (2002) 生物信息学手册 (第二版) . 上海
科学技术出版社, 上海, pp. 150-151
胡德华, 方平 (1998) 如何向基因库 (GenBank) 发送核
酸序列数据. 遗传, 20: 34-35
胡德华, 方平 (2000) 基因库 (GenBank) 的电子邮件检
索. 中国企业导刊, 17: 31
胡桂兵, 徐昌杰, 陈大成, 郑启发, 安新民, 张上隆 (2001)
毛叶枣 APETALA1同源基因的克隆. 华南农业大学
学报, 22: 43-46
罗安才 (2003) 奉节脐橙芽变株系的AFLP分析. 农业
生物技术科学, 16: 20-24
彭立新, 郑成超, 李德全, 谷令坤, 束怀瑞 (2003) 西府海
棠Ma MAPK基因的克隆及表达特性. 植物生理与分
子生物学学报, 29: 431-436
田振东, 柳俊, 谢从华 (2003) DNA文库与 RACE方法
结合克隆一个马铃薯病程相关蛋白基因 cDNA. 遗传
学报, 30: 996-1002
王俊英, 张开春, 王俊平, 张军科 (2002) 樱桃ACC氧化
酶基因的克隆和序列分析. 华北农学报, 16: 11-15
5012005 张长青等: 园艺植物分子育种相关生物信息资源及其应用
王金生 (1998) 分子植物病理学. 中国农业出版社, 北京,
pp. 263
邢美园, 苏开颜 (2003) 生物信息学数据库— — 日本
DDBJ数据库及其检索应用. 情报杂志, 5: 50-61
于喜艳, 赵双宜, 何启伟, 孔庆国 (2003) 甜瓜果实酸性
转化酶基因 cDNA片段的克隆. 园艺学报, 30: 346-
348
张露, 蔡友铭, 诸葛强, 邹惠渝, 黄敏仁 (2002) 新疆石竹
属野生种核糖体DNA的 ITS序列与亲缘关系. 遗传
学报, 29: 549-554
赵国屏 (2002) 生物信息学. 科学出版社, 北京, pp. 50-57
Aranzana MJ, Arus P, Carbo J, King GJ (2001) AFLP and
SSR markers for genetic diversity analysis and culti-
var identification in peach[Prunus persica (L.)
Batsch]. Acta Horticulturae, 546: 367-370
Baker W, var den Broek A, Camon E, Hingamp P, Sterk
P, Stoesser G, Tuli AM (2000) The EMBL nucleotide
sequence database. Nucleic Acids Research, 28:19-23
Benson DA, Mizrachi IK, Lipman DJ, Ostell J, Wheeler
DL (2004) GenBank, update. Nucleic Acids Research,
32:23-26
Boeckmann B, Bairoch A, Apweiler R, Blatter MC,
Estreicher A, Gasteiger E, Martin MJ, Michoud K,
O’Donovan C, Phan I, Pilbout S, Schneider M (2003)
The SWISS-PROT protein knowledgebase and its
supplement TrEMBL in 2003. Nucleic Acids Research,
31: 365-370
Galperin MY (2004) The molecular biology database
collection, 2004 update. Nucleic Acids Research, 32:
3-22
Guilford P, Prakash S, Zhu JM, Rikkerink E, Guardiner S,
Bassett H, Forster R (1997) Microsatellites in Malus
× domestica (apple): abundance, polymorphism and
cultivar identification. Journal of Theoretical Biology,
225: 301-325
Kulikova T, Aldebert P, Althorpe N, Baker W, Bates K,
Browne P, Cochrane G, Duggan K, Eberhardt R,
Faruque N, Pastor MG, Harte N, Kanz C, Leinonen R,
Lin Q, Lombard V, Lopez R, Mancuso R, McHale M,
Nardone F, Silventoinen V, Stoehr P, Stoesser G, Tuli
MA, Tzouvara K, Vaughan R, Wu D, Zhu W, Apweiler
R (2004) The EMBL nucleotide sequence database.
Nucleic Acids Research, 32: 27-30
Li KB (2003) ClustalW-MPI, ClustalW analysis using
distributed and parallel computing. Bioinformatics,
19: 1585-1586
Lopez R, Robinson S, Kibria A, Harte N, Patel G, Harper
R, Quevillon E, Silventoinen V, Kallio K, Jokinen P
(2003) The European Bioinformatics Institute Web
Site, a new view. Bioinformatics, 4: 546-547
Miyazaki S, Sugawara H, Ikeo K, Gojobori T, Tateno Y
(2004) DDBJ in the stream of various biological data.
Nucleic Acids Research, 32: D31-D34
Scott KD, Eggler P, Seaton G, Rossetto M, Ablett EM,
Lee LS, Henry RJ (2000) Analysis of SSRS derived
from grape ESTS . Theoretical and Applied Genetics,
100: 723-726
Stoesser G, Baker W, van den Broek A, Garcia-Pastor M,
Kanz C, Kulikova T, Leinonen R, Lin Q, Lombard V,
Lopez R, Mancuso R, Nardone F, Stoehr P, Tuli MA,
Tzouvara K, Vaughan R (2003) The EMBL nucle-
otide sequence database, major new developments.
Nucleic Acids Research, 31: 17-22
Tateno Y, Miyazaki S, Ota M, Sugawara H, Gojobori T
(2000) DNA DataBank of Japan (DDBJ) in collabo-
ration with mass sequencing teams. Nucleic Acids
Research, 28: 24-26
Thompson JD, Higgins DG, Gibson TJ (1994) Clustal W,
improving the sensitivity of progressive multiple se-
quence alignment through sequence weighting, posi-
tion specific gap penalties and weight matrix choice.
Nucleic Acids Research, 22: 4673-4680