摘要

首先基于生物信息学理论,对所给的结肠癌基因表达数据进行分析处理,由于数据呈现出非正态的分布,所以我们首先用非参数Mann-Whitney U统计量检验法进行无关基因的剔除;然后按照相似度和基因变量与理想基因相似性的大小,对原有的基因进行分组筛选特征基因.最后,用Fisher-List分类器进行结肠癌亚型的识别,并且用误识率为依据鉴别出了8个包含完整分类信息的基因。实验结果表明,本研究鉴别出的8个信息基因能以100%的正确率准确识别结肠癌亚型.