摘要

社交媒体数据可以为台风灾害追踪、灾时救援和灾情评估提供及时有效的信息。现有研究常采用主题建模和情感分析等技术对台风期间社交媒体平台(如新浪微博等)舆论话题和情感变化进行研究。在省域范围内以小时为时间粒度的多维度有效性论证尚有欠缺,且在舆情分析时未能区分用户群体差异。本文以台风"利奇马"为例,在浙江省域范围内,以新浪微博数据为研究对象,首先从词频分析、台风关注度时空变化以及特定灾害事件响应3个角度探讨了微博数据对台风灾情响应的有效性;其次采用隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型技术挖掘微博文本主题信息,并根据Louvain算法对主题社团进行划分;然后开发了一种基于自定义情感词典的情感分析方法用于情感指数计算,与SnowNLP相比情感倾向性预测精度得到了提高;最后分析了台风期间官方和民众在新浪微博平台上的话题关注以及情感演变差异。结果表明:(1)在省级范围内,微博数据能有效反映台风动态和灾害时空分布;(2)台风事件微博文本的主题变化反映了灾情不同阶段舆论关注点的动态变化;(3)官方微博文本比民众微博文本具有更明确的主题社团结构;(4)台风事件相关微博文本中的消极情绪在台风登陆后显著增加,其中民众微博文本对台风灾害的情绪响应更及时,官方微博文本中的情感表达始终相对积极。