作 者 :张帆
期 刊 :吉林大学 2012年 09期 页码:60
关键词:基因芯片;基因表达数据;特征选择;SVM-RFE;差异表达基因;抗旱;
摘 要 :本文针对拟南芥抗旱基因预测这一差异表达问题,用不同的特征选择方法基于基因芯片数据进行实验分析,以获得准确且有效的研究与农艺性状相关的特征基因的方法。分别从算法本身以及实验结果两方面进行了深入探讨。 首先通过传统的T-test和Fold change方法对拟南芥基因芯片数据的应用,分析传统方法存在的弊端。其次,对于高通量的基因芯片数据,难免掺杂一些噪声数据和界外值。故从度量基因表达数据变化幅度的角度,用平均绝对差(MADV)和改进的平均绝对差(IMADV)差异系数方法来寻找抗旱基因,模拟实验结果表明,其效果优于传统方法。 最后,针对植物芯片数据样本量小的问题,提出了用交叉验证方法改进...