全 文 :胡伟毅,汪连军,秦国勋,等. 5 种 DNA条形码在苍耳属中遗传距离比较[J]. 江苏农业科学,2014,42(4) :36 - 38.
5 种 DNA条形码在苍耳属中遗传距离比较
胡伟毅,汪连军,秦国勋,盛志超
(连云港出入境检验检疫局,江苏连云港 222042)
摘要:比较了 5 种 DNA条形码的重点关注基因 psbA - trnH、ITS、ITS2、rbcL、matK 在苍耳属中的遗传距离,以期为
植物 DNA条形码标准基因的筛选研究提供参考。用通用引物对 7 种苍耳属植物的 psbA - trnH、ITS、ITS2、rbcL、matK
基因进行扩增、测序,利用 MEGA 5. 1 软件计算遗传距离及标准误。结果表明:ITS2、ITS、matK、psbA - trnH、rbcL基因在
苍耳属中的遗传距离依次减小;ITS2、psbA - trnH、ITS、matK、rbcL 基因在苍耳属中的遗传距离标准误依次减小。因此
从苍耳属的植物层面看,ITS基因作为植物 DNA 条形码要比 ITS2 基因具有更好的稳定性;作为植物 DNA 条形码,
matK基因要优于 psbA - trnH基因。
关键词:DNA条形码;遗传距离;苍耳属
中图分类号:S567. 210. 1 文献标志码:A 文章编号:1002 - 1302(2014)04 - 0036 - 02
收稿日期:2013 - 08 - 07
基金项目:江苏出入境检验检疫局科技项目(编号:2012KJ54)。
作者简介:胡伟毅(1984—) ,男,河北宣化人,硕士,主要从事港口外
来有害生物的截获工作。E - mail:94087540@ qq. com。
植物 DNA条形码技术是针对植物基因组中的特定基因
进行片段扩增、测序而发现其碱基变化规律的技术手段,此概
念由加拿大科学家 Paul 于 2003 年正式提出[1],此技术在动
物 COⅠ基因中的应用较为成熟[2 - 4],但由于 COⅠ基因在植
物中的变化较为保守,不能起到很好的区分作用,使得植物
DNA条形码技术的研究重点仍在通用基因片段的应用、筛选
和搭配上[5]。psbA - trnH、ITS、ITS2、rbcL 及 matK 序列是植
物 DNA 条形码重点关注的序列[6 - 9]。本试验比较了 5 种
DNA条形码重点关注基因 psbA - trnH、ITS、ITS2、rbcL、matK
在苍耳属(Xanthium)中的遗传距离,以期为植物 DNA条形码
标准基因的筛选研究提供参考。
1 材料与方法
1. 1 材料与试剂
试验用材料为 7 种苍耳属植物:北美苍耳(Xanthium chi-
nese)、苍耳(Xanthium sibiricum)、刺苍耳(Xanthium spino-
sum)、西方苍耳(Xanthium occidentale)、巴西苍耳(Xanthium
brasilicum)、美丽苍耳(Xanthium speciosum)、宾州苍耳(Xanth-
ium pensylvanicum) ,这些外来苍耳均为 2012 年在进口大豆中
截获,并由中国检验检疫科学院鉴定的样本。
试验用试剂有 DNeasy Plant Mini Kit、2 × Taq master
mix、琼脂糖、GoldenviewⅠ、引物[10](详见表 1)等。
1. 2 试验方法
1. 2. 1 DNA的提取 采用 DNeasy Plant Mini Kit 试剂盒
法提取 DNA,按照说明书逐步操作,可得到 200 μL DNA 样
品,于 - 20 ℃冰箱保存。
1. 2. 2 PCR反应体系 PCR 反应使用中美泰和公司的 2 ×
Taq master mix进行扩增,反应采用 25 μL体系:3 μL DNA 模
板,1 μL 引物1,1 μL 引物2,12 . 5 μL 2 × Taq master mix,
表 1 引物合成序列表
引物名称 序列(5→3) 纯化方法
rbcLf ATGTCACCACAAACAGAAAC OPC
rbcLr TCGCATGTACCTGCAGTAGC OPC
matKf CGATCTATTCATTCAATATTTC OPC
matKr TCTAGCACACGAAAGTCGAAGT OPC
ITSf CCTTATCATTTAGAGGAAGGAG OPC
ITSr TCCTCCGCTTATTGATATGC OPC
ITS2f ATGCGATACTTGGTGTGAAT OPC
ITS2r GACGCTTCTCCAGACTACAAT OPC
trnH - psbAf GTTATGCATGAACGTAATGCTC OPC
trnH - psbAr CGCGCATGGTGGATTCACAATCC OPC
注:OPC是定制引物时选用的纯化方式,全称为 oligonucleotide
purification cartridge。
7. 5 μL ddH2O。
1. 2. 3 PCR扩增反应条件 ITS、ITS2、rbcL 基因采用相同的
PCR条件:95 ℃ 4 min;94 ℃ 30 s,52 ℃ 45 s,72 ℃ 45 s,35
个循环;72 ℃ 10 min;4 ℃保存。
matK基因的 PCR 条件:95 ℃ 4 min;94 ℃ 45 s,52 ℃
1. 5 min,72 ℃ 1. 5 min,35 个循环;72 ℃ 10 min;4 ℃保存。
psbA - trnH基因的 PCR 条件:95 ℃ 4 min;94 ℃ 30 s,
52 ℃ 1 min,72 ℃ 1 min,35 个循环;72 ℃ 10 min;4 ℃保存。
1. 2. 4 琼脂糖凝胶的制备 称取 1. 5 g regular agarose G - 10
于锥形瓶中,分别加入 100 mL ddH2O、2 mL 50 × TAE buffer,
高火微波 4 min后将锥形瓶置于 75 ℃水浴中 5 min,再加入
10 μL goldenview I,摇匀后静置 10 min,倒入凝胶模具中,放
置 30 min后使用。
1. 2. 5 电泳 取 4 μL PCR 产物进行点样电泳,在 100 V 条
件下跑 45 min后将凝胶放入凝胶成像系统拍照,得到的电泳
结果见图 1 至图 5。从图 1 至图 5 可以看出,7 种苍耳属植物
的 5 种序列扩增条带单一清晰,没有特异性条带以及拖尾现
象,与预期结果相符。
1. 2. 6 测序及拼接处理 将 PCR 产物送至中美泰和生物技
术(北京)有限公司进行双向测序,对测序结果用 CodenCode
—63— 江苏农业科学 2014 年第 42 卷第 4 期
DOI:10.15889/j.issn.1002-1302.2014.04.057
Aligner软件进行剪切和拼接即得到完整序列。登陆 NCBI 并
将拼接后的序列进行 BLAST检测,证明苍耳属植物的扩增序
列为目的序列。利用MEGA 5. 1 软件[11]对序列进行 ClustalW
校对,校对后的序列继续用 MEGA 5. 1 进行分子进化遗传
分析。
1. 2. 7 遗传距离的计算 利用 MEGA 5. 1 软件中的 Distance
功能,采用 Tamura - Nei模型计算每种 DNA 条形码在苍耳属
中的总体平均遗传距离,采用 bootstrap 法(1 000 个重复)计
算标准误。
2 结果与讨论
从图 6 可以看出,ITS2、ITS、matK、psbA - trnH、rbcL 基因
在苍耳属中的遗传距离依次减小,分别为 1. 777 1、1. 747 0、
1. 400 4、1. 344 5、0. 633 0;ITS2、psbA - trnH、ITS、matK、rbcL在
苍耳属中的遗传距离标准误依次减小,分别为 1. 199 1、
0. 833 2、0. 660 0、0. 368 9、0. 106 8。从结果上看,ITS2、ITS 基
因的遗传距离相近,但是 ITS的标准误为 0. 660 0,远小于 ITS2
基因的 1. 199 1,因而从苍耳属植物层面看,ITS 基因作为植物
DNA条形码要比 ITS2基因具有更好的稳定性;matK较 psbA -
trnH基因的遗传距离稍大,而且 matK 的标准误为0. 660 0,小
于 psbA - trnH基因的 0. 833 2,说明从苍耳属植物层面来看,
matK基因作为植物 DNA条形码要优于 psbA - trnH基因。
3 结论
综合本试验结果,从苍耳属的植物层面看,ITS 基因作为
植物 DNA条形码要比 ITS2 基因具有更好的稳定性;matK 基
因作为植物 DNA条形码要优于 psbA - trnH基因。
参考文献:
[1]Tautz D,Arctander P,Minelli A,et al. A plea for DNA taxonomy[J].
Trends in Ecology and Evolution,2003,18(2) :70 - 74.
—73—江苏农业科学 2014 年第 42 卷第 4 期
櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄
[2]朱立静,陈淑吟,许晓风,等. 四角蛤蜊江苏群体线粒体 COⅠ 基
因片段序列研究[J]. 江苏农业科学,2010(4) :33 - 35,97.
[3]姜 帆,刘佳琪,李志红,等. 基于 DNA 条形码的广西苦瓜中实
蝇幼虫分子鉴定研究[J]. 植物保护,2011,37(4) :150 - 153.
[4]李鹏飞,朱文斌,贺舟挺,等. 东海带鱼 DNA条形码的建立及COⅠ序
列变异分析[J]. 浙江海洋学院学报:自然科学版,2013,32(1):6 -9.
[5]Chase M W,Salamin N,Wilkinson M,et al. Land plants and DNA
barcodes:short - term and long - term goals[J]. Philosophical Trans-
actions of the Royal Society of London. Series B,Biological Sciences,
2005,360(1462) :1889 - 1895.
[6]任保青,陈之端. 植物 DNA条形码技术[J]. 植物学报,2010,45
(1) :1 - 12.
[7]张 欣,于瑞祥,方晓明,等. 橄榄油掺假检测技术的研究进展
[J]. 中国油脂,2013,38(3) :67 - 71.
[8]庞晓慧,宋经元,陈士林. 应用 DNA条形码技术鉴定中药材灯心
草[J]. 中国中药杂志,2012,37(8) :1097 - 1099.
[9]伏建国,杨晓军,钱 路,等. 植物 DNA 条形码技术在出入境检
验检疫领域的应用[J]. 植物检疫,2012,2(02) :64 - 69.
[10]高连明,刘 杰,蔡 杰,等. 关于植物 DNA条形码研究技术规
范[J]. 植物分类与资源学报,2012,34(6) :592 - 606.
[11]Tamura K,Peterson D,Peterson N,et al. MEGA5:molecular evolu-
tionary genetics analysis using maximum likelihood,evolutionary dis-
tance,and maximum parsimony methods[J]. Molecular Biology and
Evolution,2011,28(10) :2731 - 2739.
王红梅,武恩斯,朱玉风. 固有无序蛋白质无序区和有序区氨基酸组成偏好性分析[J]. 江苏农业科学,2014,42(4) :38 - 39.
固有无序蛋白质无序区和有序区氨基酸组成偏好性分析
王红梅1,武恩斯2,朱玉风2
(1. 德州学院物理与电子信息学院 /山东省功能大分子生物物理重点实验室,山东德州 253023;
2.山东师范大学,山东济南 250358)
摘要:以固有无序蛋白质为研究对象,通过 CD - HIT对数据进行去冗余处理,然后利用编程软件对数据进行统计
而得到新的数据。对所有无序区及有序区的氨基酸含量进行对比,认为氨基酸 Val、Ile、Leu、Phe、Trp、Asn、Tyr、His 具
有形成有序结构的偏好性;氨基酸 Pro、Ser、Gln、Asp、Lys具有形成无序结构的偏好性。研究结论有助于进一步挖掘固
有无序蛋白质的序列特征,并为固有无序蛋白质的预测提供一些借鉴。
关键词:固有无序蛋白质;功能位点;无序区;序列分析
中图分类号:Q516 文献标志码:A 文章编号:1002 - 1302(2014)04 - 0038 - 02
收稿日期:2013 - 08 - 23
基金项目:山东省自然科学基金(编号:ZR2010CQ041)。
作者简介:王红梅(1974—) ,女,山东德州人,硕士,副教授,主要从事
生物信息学的研究。E - mail:whm_2327@ 126. com。
蛋白质是生物体中最重要的两类大分子之一,传统思想
认为蛋白质要实现其生物功能,必须先折叠成一个稳定的三
维结构,因此形成了蛋白质结构决定其功能的主流观点[1]。
然而随着基因工程方法和实验技术的发展以及基因组计划的
开展,在 20 世纪 90 年代初,人们发现有些蛋白质或蛋白质序
列中的一部分区域在生理条件下不具有一个确定的三维结
构,但是依然能够正常行使生物学功能。进一步研究发现的
这类蛋白质越来越多,并逐渐形成了一种新的蛋白质类型,称
为固有无序蛋白质(intrinsically disordered proteins,简称为
IDPs)[1 - 3]。对目前存在的大量基因库数据进行分析发现:蛋
白质的无序结构与蛋白质功能之间关系密切,无序蛋白质在
诸如转录、翻译、调控细胞信号转导、蛋白质磷酸化及小分子
存储等过程中发挥着重要的作用;另一方面,无序蛋白质又经
常与多种疾病联系在一起。与人类癌症相关的蛋白质中,无
序蛋白质的含量高达 79%;在心血管疾病有关的蛋白质中,
无序蛋白质的含量也高达 57%。无序区是固有无序蛋白质
发挥功能的主要区域,功能位点大多分布在该区域,因此预测
蛋白质的无序区成为判断蛋白质是否无序的热点问题。
Romero 等在 1997 年首次对蛋白质无序区域进行预测,他们
预测的准确性达到 70%,此后无序蛋白质的预测方法得到了
迅速发展,目前应用于无序蛋白质序列预测的方法已经超过
50 种,并且这些预测方法的准确性普遍达到 85%以上。
本研究基于序列分析的方法,以 DisProt数据库中的固有
无序蛋白质为研究对象,通过 CD - HIT程序对数据进行去冗
余处理,将处理后的数据利用编程软件 Matlab 7. 0 进行统计
而得到新的数据;对新数据进行分析,通过编程把序列的无序
区和有序区分别提取出来,再分析无序区和有序区氨基酸组
成的偏好性。本研究有助于进一步挖掘固有无序蛋白质的序
列特征,从而为固有无序蛋白质的预测提供借鉴。
1 数据来源及去冗余处理
1. 1 数据来源
本研究以固有无序蛋白质数据库 DisProt(版本 6. 01)[4]
(http:/ /www. disprot. org / index. php)为研究对象(发布日期
为 2012 年 10 月 15 日) ,下载数据库中最新的固有无序蛋白
质进行研究,共有无序蛋白质 684 个,无序区 1 513 个。
1. 2 去冗余处理
由于蛋白质序列数据库中都含有大量的冗余序列,它们通
常不能提供更多的信息,而且不利于数据的统计分析,并且由
于冗余序列要占用更多的计算机存储和处理资源,因此去除这
些冗余信息具有很高的实用价值,不但可以减小数据库的大
—83— 江苏农业科学 2014 年第 42 卷第 4 期