免费文献传递   相关文献

黄角苔叶绿体rbcL基因编码区的序列分析



全 文 :   第 38 卷 第 1 期
1999 年 1月
中山大学学报 (自然科学版)
ACTA SCIENTIARUM NATURALIUM
UNIVERSITATIS SUNYATSENI
 
Vol.38 No.1
Jan. 1999
 
 文章编号:0529-6579 (1999)01-0070-73
黄角苔叶绿体 rbcL基因编码区的序列分析
王 艇 , 苏应娟 , 朱建明 , 周 勤
(中山大学生命科学学院 , 广州 510275)
摘 要:测定了黄角苔 (Phaeoceros laevis(L.)Prosk)叶绿体 rbcL基因编码区的1398个核苷酸
序列 , 并且由此推导出对应的氨基酸序列.此基因中密码子的第 2 和第 3 位上 A/ T所占的比
例较高 , 分别为 53.6%和 77.5%.黄角苔 rbcL基因的编码区与花旗松 、 菠菜 、 玉米和雷氏衣
藻间在核苷酸序列上的同源性分别为 84.0%, 81.5%, 79.3%和 76.3%;在氨基酸序列上的同
源性分别为 9 1.0%, 89.9%, 88.5%和 89.3%.为研究角苔植物的系统发育提供了核苷酸序列方
面的资料.
关键词:黄角苔 , rbcL基因 , 编码区 ,序列分析
分类号:Q 949.351.4 , Q 751  文献标识码:A
在研究陆生植物的起源和演化方面 ,苔藓植物占有极其重要的地位.然而有关苔藓植物
系统发育的一些最基本问题仍有不少疑问 ,其中角苔类的系统位置就颇有争议.虽然越来越
多的学者主张把角苔目独立为角苔纲 ,和苔纲 、藓纲并列 ,但是有些学者仍认为角苔目以归
入苔纲为宜;还有少数研究认为角苔目和藓纲的关系更为接近 ,它们是姐妹群[ 1] .
目前主要是根据比较形态学 、解剖学及发育过程的细节等证据来探讨角苔类的分类地
位;超微结构的研究也提供了部分证据和资料[ 2] .然而 ,有关角苔类的分子系统学研究则还
未见报道.
RbcL基因 ,即核酮糖 1 ,5-双磷酸羧化酶/加氧酶或称 Rubisco 大亚基基因 ,最应引起植
物系统学研究上的注意.此基因由叶绿体基因组编码 ,所具有的一些性质特别适于研究植物
的系统发育:①以单拷贝形式存在 ,不发生基因转变;②长达 1 400碱基对 ,能为分支分析
提供充足的分子性状;③进化速率适度 ,尤其适于研究高等级分类单元间的系统关系;④
迄今已有 1 500余种植物的 rbcL基因序列得以测定 ,为在更加深入和广泛的范围内分析陆
生植物的起源和演化提供了基础[ 3 ,4] .
为了开展角苔植物的分子系统学研究 ,选择并测定了黄角苔(Phaeoceros laevis (L.)
Prosk)rbcL 基因的核苷酸序列.
基金项目:国家自然科学基金 (39500013 , 39700117);广东省自然科学基金 (950099 , 970176)
收稿日期:1998-10-15  第一作者简介:王艇 , 男 , 29 岁 , 副教授
1 材料与方法
1.1 植物材料
黄角苔(Phaeoceros laevis(L.)Prosk)采自香港沙田梅子林村 ,硅胶保存.凭证标本存中国
科学院华南植物研究所标本馆.
1.2 DNA提取
按照 Doyle和 Dickson建立的热 CTAB法[ 5]略加修改.
1.3 序列测定
以PCR产物直接测序.扩增和测序用的寡核苷酸引物见文献[ 6] .引物的合成与测序在
中国科学院微生物研究所的 Beckman Oligo1000 M DNA合成仪和 PE ABI PRISM 377 DNA自
动测序仪上进行.
2 结果与讨论
2.1 黄角苔 rbcL基因序列的测定
首次测定了黄角苔 rbcL基因1 398个核苷酸序列 ,其中A 395个 ,占28.2%,T 419个 ,占
30.0%,G 335个 ,占 24.0%,C 249个 ,占 17.8%.
ATG TCA CCA CAA ACG GAG ACT AAA GCA GGT GTT GGA TTC AAA GCT GGT GTT AAG GAT TAT AGA TTA
M S P Q T E T K A G V G F K A G V K D Y R L
ACC TAT TAT ACG CCT GAT TAC GAG ACC AAG GAT ACT GAT ACT TTG GCA GCG TCT CGA ATG ACT CCT
T Y Y T P D Y E T K D T D T L A A S R M T P
CAA CCA GGG GTG CCA CCT GAA GAA GCA GGA GCC GCA GTA GCT GCT GAA TCT TCA ACA GGT ACA TGG
Q P G V P P E E A G A A V A A E S S T G T W
ACT ACT GTT TGG ACC GAT GGA CTT ACC AGC CTT GAC CGT TAC AAA GGT CGA TGC TAT GAC ATT GAA
T T V W T D G L T S L D R Y K G R C Y D I E
CCT GTT GCT GGA GAG GAG AAT CAA TAT ATT GCT TAT GCT GCT CAT TCT TTA GAT TTG TTT GAG GAG
P V A G E E N Q Y I A Y A A H S L D L F E E
GGT TCT GTT ACC AAC ATG TTC ACT TCC ATT GTA GGT AAT GTT TTT GGA TTT AAA GCT TTA CGA GCT
G S V T N M F T S I V G N V F G F K A L R A
TCA CGT CTG GAA GAT TCA CGA ATT CCA CCT GCT TAT TCC AAA ACT TTT CAA GGT CCA CCT CAT GGT
S R L E D S R I P P A Y S K T F Q G P P H G
ATT CAA GTT GAA AGA GAT AAA TGG AAT AAA TAT GGT CGT CCT TTA TTA GGA TGT ACC ATC AAA CCA
I Q V E R D K W N K Y G R P L L G C T I K P
AAG CTA GGT TTA TCT GCT AAA AAC TAT GGT AGA GCT GTA TAT GAA TGT CTT CGT GGT GGA TTA GAT
K L G L S A K N Y G R A V Y E C L R G G L D
TTC ACC AAA GAT GAC GAA AAT GTT AAT TCT CAA CCT TTT ATG CGT TGG AGA GAT CGT TTT CTA TTT
F T K D D E N V N S Q P F M R W R D R F L F
GTA GCA GAA GCT ATT TCC AAA TCT CAA GCT GAA ACA GGG GAG ATT AAA GGG CAT TAC TTA AAT GCC
V A E A I S K S Q A E T G E I K G H Y L N A
ACT GCA GGT ACA TGT GAG GAG ATG ATG AAA AGG GCA CAT TTT GCT AGA GAA TTA GGA GTG CCT ATC
T A G T C E E M M K R A H F A R E L G V P I
GTA ATG CAT GAT TAT TTG ACA GGA GGT TTT ATT GCA AAT ACG ACC CTA GCT CGT TAT TGT AGA GAC
V M H D Y L T G G F I A N T T L A R Y C R D
AAT GGT TTA CTT CTC CAT ATT CAT CGT GCC ATG CAT GCA GTT ACC GAC AGA CAA AGA AAT CAT GGT
N G L L L H I H R A M H A V T D R Q R N H G
ATT CAC TTT CGT GTA TTA GCT AAA GCA TCA CGT ATG TCC GGG GGA GAT CAT CTT CAT CCA GGT ACA
I H F R V L A K A S R M S G G D H L H P G T
GTT GTA GGT AAA TTA GAG GGA GAA TGT GAA GTA ACT TTA GGC TTT GTG GAT TTA CCT TGC GAC GAT
V V G K L E G E C E V T L G F V D L P C D D
TAT ATT GAA AAA GAT CGA AGT CGT GGG ATA TAT TTT ACT CAA GAC TGG GTC TCT ATG CCT GGT GTT
Y I E K D R S R G I Y F T Q D W V S M P G V
CTG CTC GTG GCT TCA GGT GGT ATT CAT GTT TGG CAT ATG CCT GCT TTA ACT GAG ATT TTC GGA GAT
L L V A S G G I H V W H M P A L T E I F G D
GAT TCC GCA TTA CAG TTT GGC GGG GGA ACT CTA GGA CAC CCT TGG GGA AAT GCA CCT GGT GCA GTA
D S A L Q F G G G T L G H P W G N A P G A V
GCT AAT CGA GTT GCT TTA GAA GCT TGT GTC CAA GCT CGT AAT GAA GGA CGT GAT CTT GCT CGC GAA
A N R V A L E A C V Q A R N E G R D L A R E
GGT AAT GAT ATT ATC CGT GAA GCT AGT AAG TGG AGT CCT GAA TTA GCA GCT GCT TGC GAA GTA TGG
G N D I I R E A S K W S P E L A A A C E V W
AAA GAA ATT AAA
K E I K
图 1 黄角苔 rbcL 基因编码区的核苷酸序列和由此推导的氨基酸序列
Fig.1 The nucleotide sequence of the coding region in Phaeoceros laevis rbcL gene and its deduced amino acid sequence
71第 1 期        王 艇等:黄角苔叶绿体 rbcL基因编码区的序列分析
2.2 密码子使用
在黄角苔的 rbcL基因中 ,密码子的第 2位和第 3位倾向于使用 A或T ,其中在第 2位上
A和T 所占比例为53.6%,在第3位上A和T两者所占比例高达77.5%.使用频率较高的密
码子为GCT ,GGT , GAA和GAT ,它们的使用频率共计19.5%,而编码Ser的TCG 、编码 Pro 的
CCG和编码Arg的 CGG在所测序列中未曾出现.在由核苷酸序列推导出的氨基酸序列中 ,
Gly ,Ala及 Leu的所占比例较高 ,分别为 10.1%,9.7%和 7.5%;酸性氨基酸和碱性氨基酸的
比例分别为12.7%和 14.4%.疏水氨基酸的比例为40.1%(表 1).
表 1 黄角苔 rbcL基因的密码子使用表
Tab.1 Codon usage of the Phaeoceros laevis rbcL gene
TTT Phe 13 TCT Ser 8 TAT Tyr 14 TGT Cys 6 CTT Leu 6 CCT Pro 15 CAT His 13 CGT Arg 14
TTC Phe 4 TCC Ser 5 TAC Tyr 3 TGC Cys 3 CTC Leu 2 CCC Pro 0 CAC His 2 CGC Arg 1
TTA Leu 18 TCA Ser 6 TAA End 0 TGA End 0 CTA Leu 4 CCA Pro 7 CAA Gln 10 CGA Arg 6
TTG Leu 3 TCG Ser 0 TAG End 0 TGG Trp 9 CTG Leu 2 CCG Pro 0 CAG Gln 1 CGG Arg 0
ATT Ile 15 ACT Thr 13 AAT Asn 13 AGT Ser 3 GTT Val 13 GCT Ala 27 GAT Asp 20 GGT Gly 23
ATC Ile 3 ACC Thr 9 AAC Asn 2 AGC Ser 1 GTC Val 2 GCC Ala 3 GAC Asp 7 GGC Gly 2
ATA Ile 1 ACA Thr 6 AAA Lys 18 AGA Arg 8 GTA Val 10 GCA Ala 14 GAA Glu 21 GGA Gly 16
ATG Met 11 ACG Thr 3 AAG Lys 4 AGG Arg 1 GTG Val 4 GCG Ala 1 GAG Glu 11 GGG Gly 6
2.3 rbcL基因编码区的同源性比较
黄角苔 rbcL基因编码区的核苷酸序列和推导出的氨基酸序列与花旗松(Pseudotsuga
menziesii)[ 7] 、菠菜(Spinacia oleracea)[ 8] 、玉米(Zea mays)[ 9]和雷氏衣藻(Chlamydomonas rein-
hardii)[ 10]对应序列的同源性比较结果见表 2.结果显示 ,氨基酸序列的同源性程度比核苷酸
序列间的同源性程度更高 ,说明 Rubisco 酶大亚基要实现其功能在氨基酸水平上必需具相当
的保守性.黄角苔和雷氏衣藻间的比较更能反映出这个特点 ,它们核苷酸序列的同源性程度
为76.3%,但是氨基酸序列的同源性程度仍高达 89.3%,造成这种现象的原因是两者分别
选择编码相同氨基酸的不同密码子.
目前我们正在进一步测定其它苔藓植物的 rbcL基因序列 ,试图为应用 rbcL基因序列数
据探讨角苔目的系统学问题积累更多资料.
表2 黄角苔与其它植物 rbcL基因编码区的同源性程度
Tab.2 Homologies of the rbcL gene coding region between Phaeoceros laevis and other plants
种 名 核苷酸差异(碱基)第1 位 第 2位 第 3位 总计
同源性程度/ %
核苷酸序列 氨基酸序列
花旗松 P .menziesii 39 20 164 223 84.0 91.0
菠菜 S .oleracea 39 30 189 258 81.5 89.9
玉米 Z .mays 43 35 202 280 79.3 88.5
雷氏衣藻 C.reinhardii 57 34 240 331 76.3 89.3
72 中山大学学报 (自然科学版)             第 38 卷
参考文献:
[ 1]  MISHLER B D , CHURCHILL S P.A cladistic approach to the phylogeny of the “ Bryophytes” .Brittonia , 1984 ,
36:406~ 424
[ 2]  SCHUSTER R M.New manual of biology.Nichinan , 984.760~ 1092
[ 3]  HASEBE M , ITO M , IWATSIKI K , et al.Phylogenetic relationships in Gnetophyta deduced from rbcL gene se-
quences.Bot Mag(Tokyo), 1992 , 385 ~ 391
[ 4]  王艇 ,苏应娟 , PARKS C R.木兰亚纲的分子系统学研究进展(一).植物学通报 , 1994 , 12(4):1 ~ 7
[ 5]  DOYLE J J , DICKSON E E.Preservation of plant samples for DNA restriction endonucease analysis.Taxon , 1987 ,
36:715~ 722
[ 6]  LEWIS L A ,MISHLER B D , VILGALYS R.Phylogenetic relationships of the liverworts(Hepaticae), a basal em-
bryophyte lineage , inferred from nucleotide sequence data of the chloroplast gene rbcL.Molecular Phylogenetics and
Evolution , 1997 , 7(3):377 ~ 393
[ 7]  HIPKIN V D , TSAI C H , STRAUSS S H.Sequence of the gene for the large subunit of ribulose 1 , 5-bisphosphate
carboxylase from a gymnosperm , Douglas fir.Plant Molecular Biology , 1990 , 15:505 ~ 507
[ 8]  ZURAWSKI G , PERROT B , BOTTOMLEY W , et al.The structure of the gene for the subunit of ribulose 1 , 5-bis-
phosphate carboxylase from spinach chloroplast DNA.Nucleic Acid Res , 1981(9):3251 ~ 3270
[ 9]  McINTOSH L , POULSEN C , BOGORAD L.Chloroplast gene sequence for the large bisphosphatecarboxylase of
maize.Nature , 1980 , 288:556~ 560
[ 10]  DRON M , RAHIRE M , ROCHAIX J D.Sequence of the chloroplast DNA region of Chlamydomonas reinhardii
containing the gene of the large subunit of ribulose bisphosphate carboxylase and parts of its flanking genes.J Mol
Biol , 1982 , 162:7775~ 7793
Sequence Analysis of the Coding Region in Chloroplast
rbcL Gene from Phaeoceros laevis
WANG Ting
, SU Yingjuan , ZHU Jianming , ZHOU Qin
Abstract:1 398 nucmeotides of the coding region have been sequenced in the chloroplast rbcL gene
from Phaeoceros laevis (L.)Prosk , and the corresponding amino acid sequence has also been de-
duced.The second and the third positions of the codons in the gene have a bias towards using adenine
and thymine bases , the proportions of A and T in the two positions are 53.6% , 77.5%respectively.
The nucleotide sequence homologies of P.laevis rbcL gene coding region with Pseudotsuga menziesii ,
Spinacia oleracea , Zea mays and Chlamydomonas reinhardii are 84.0%, 81.5%, 79.3% and 76.
3%, respectively , while the deduced amino acid sequence homologies are 91.0%, 89.9%, 88.5%
and 89.3%, respectively.This paper offers DNA sequence data for the study of hornwort phylogeny.
Keywords:Phaeoceros laevis (L.)Prosk , rbcL gene , the coding region , sequence analysis
73第 1 期        王 艇等:黄角苔叶绿体 rbcL基因编码区的序列分析
School of Life Sciences , Zhongshan University , Guangzhou 510275 , China