摘要

社交网络上用户发布的在线内容非常不稳定,用户对每个事件的关注度也随时变化。虽然每个事件的关注程度各不相同,但某些具有共同特征的事件会呈现出相似的流量模式,本文旨在根据社交网络事件的流量时间序列对事件进行聚类,找到事件的共性特征。首先,利用皮尔逊相关系数来确定各事件的主题标签;然后,利用各事件的主题标签获得每隔固定时间有关该事件的推文总量,即该事件的流量时间序列;最后,利用K-SC(K-Spectral Centroid)聚类算法对事件的流量时间序列进行聚类,并分析聚类结果中每一类事件的共性特征。利用推特上2020东京奥运会期间场地自行车比赛事件的推文数据,验证了本文方法对基于流量时间序列的社交网络事件进行聚类分析的有效性。