作 者 :穆彩琴1, 张瑞娟2, 屈聪玲2, 韩渊怀3,4, 王兴春2,3,4,*, 杨致荣1,3,4,*
期 刊 :植物生理学报 2016年 52卷 7期 页码:1066-1072
关键词:谷子;RNA-Seq;转录组;新基因发掘;基因结构优化;
摘 要 :尽管谷子(Setaria italica)全基因组序列图谱已经公布, 但其基因注释很不完善。为此, 本文应用RNA-Seq技术开展了谷子新基因发掘和已注释基因结构优化工作。以‘晋谷21’谷子叶片为材料提取总RNA, 构建测序文库并利用Illumina HiSeq 2500测序平台进行双端测序, 最终获得37 072 949条高质量的干净读段(clean reads)。将其进一步与‘豫谷1号’谷子参考基因组进行序列比对, 鉴定出614个新基因。在此基础上, 利用COG、GO、KEGG、Swiss-Prot和NR等数据库对其进行了功能注释, 获得了438个新基因的注释信息。此外, 还优化了7 175个已注释基因的结构, 延伸了4 330个基因的5′端和5 362个基因的3′端。本研究旨在为后续谷子功能基因组学研究和其他生物基因组注释信息的完善提供有益的借鉴。