作 者 :董伯佺
期 刊 :吉林大学 2013年 09期 页码:73
关键词:节节麦基因组;FM-index;BWT算法;CAP3算法;重叠群;数据平台;
摘 要 :本文主要的任务是构建节节麦基因组数据平台。节节麦基因组通过Solexa测序技术得到短序列片段的集合。本文采用改进的重叠群构建算法(BCA)把这些基因组短序列组装成重叠群。BCA算法采用的组装策略是先比对再组装的策略。重叠群的构建主要分成三个步骤,首先采用Burrows-Wheeler transform算法和FM-index算法把基因组短序列与参考序列压缩后再进行比对,达到初步组装的目的,然后通过筛选程序将质量值较低的序列去除掉,以免污染最后的运行结果,最后用筛选后的序列片段作为输入文件,通过CAP3组装的方法构建重叠群。实验证明,BCA算法构建的重叠群无论是在片段的长度还是准确度上,都有较为...