改进MAHAKIL的过采样技术

作者:袁甜甜; 李凤莲; 左婷
来源:电子设计工程, 2023, 31(17): 1-6.
DOI:10.14022/j.issn1674-6236.2023.17.001

摘要

针对脑卒中数据不平衡,发病风险分类预测性能较差的问题,基于MAHAKIL过采样以及孤立森林提出了MARAIF过采样算法。为了提高新生成样本的多样性,使用随机数将MAHAKIL技术生成新样本单一取平均值的方法进行替换。此外,考虑到合成样本时容易生成噪声样本,该研究采用孤立森林算法检测新合成样本的噪声样本,并将其去除。使用机器学习将平衡的数据集分类器进行分类,与SMOTE、ADASYN、MAHAKIL过采样技术进行比较,实验结果表明,与不同的分类器相结合,MARAIF算法可以获得更好的分类性能,AUC值与F1-measure分别最高可提高25.50%和11.32%,验证了算法的有效性。

全文