摘要

本文首先介绍了文本分类的应用背景,从传统的人工分类到后面的基于机器学习的文本分类,而垃圾债券新闻自动过滤实际上可以看作文本分类的一个特例二分类问题,因此便可以基于文本分类的相关知识与理论对垃圾债券新闻进行自动过滤。接下来本文从数据预处理,文本分类算法设计与实现及分类算法评估等方面详细地描述了垃圾债券新闻自动过滤的处理过程。