非平衡数据训练方法概述

张琦; 吴斌; 王柏

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

非平衡数据训练方法概述

作者：张琦; 吴斌; 王柏

来源：计算机科学, 2005, (10): 181-186.

摘要

现实世界中数据分类的应用通常会遇到数据非平衡的问题,即数据中的一类样本在数量上远多于另一类,例如欺诈检测和文本分类问题等。其中少数类的样本通常具有巨大的影响力和价值,是我们主要关心的对象,称为正类,另一类则称为负类。正类样本与负类样本可能数量上相差极大,这给训练非平衡数据提出了挑战。传统机器训练算法可能会产生偏向多数类的结果,因而对于正类来说,预测的性能可能会很差。本文分析了导致非平衡数据分类性能差的多方面原因,并针对这些原因列出了多种解决方法。

出版日期2005
单位北京邮电大学

收藏分享被引浏览

更新时间：2018-08-06 21:01

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号