摘要

2011年以来,我国多地出现了雾霾天气,对大气颗粒成分分析有助于人们了解雾霾形成的原因,制订有效的应对措施.本文的主要目的是对于大气颗粒物成分进行命名.传统颗粒物的命名是在经验的基础上,对颗粒进行逐个的命名.若将该过程自动化,难点有两个:数据规模太大、人工经验难以量化.本文使用数据挖掘的工具,首先进行了一次聚类分析,降低了数据规模.为了解决人工经验难以量化的问题,使用逻辑回归分类算法,并进行了调优,使正确率达到了业务处理的要求.