摘要

原始数据存在大量的空缺、噪音及错误数据,必须进行筛选和清理,本文针对用于建模的电信数据在数据理解、数据创建、数据清洗及数据格式化等方面探讨了几种进行提取、清理和转换方法,以消除数据中的噪音和缺失等,便于用户聚类分析,提高模型的精度和正确率。

  • 出版日期2011
  • 单位昭通师范高等专科学校