摘要

针对准确率不适于评价不平衡数据特征子集性能的缺陷,提出F2-measure(简称F2)准则。为避免m RMR(minimal redundancy-maximal relevance)的互信息法倾向于选择多值特征,提出归一化互信息SU(symmetrical uncertainty)。针对AUC(area under an ROC curve)最大化框架下,特征选择算法的特征与类标相关性、特征之间相关性度量量纲不一致的问题,提出特征权重归一化方法。为加快特征选择过程,提出同时考虑互信息SU和特征AUC值的特征预选择算法,减少备选特征子集规模。将F2和AUC结合用于评价特征重要度,提出动态加权特...