摘要

针对中文微博垃圾特点,提取基于向量空间模型的中文文本相似度、长短链接相似度、发文时间规律等新的分类特征,加入现有的特征集,运用支持向量机方法,训练后得到分类模型。实验结果表明,该方法是一种有效的垃圾微博识别技术。