摘要

研究耦合了逐日气候数据和情绪数据,使用关键词分析技术和多项式逻辑回归模型考察气候与情绪之间的关联。情绪数据创新性地使用微博大数据替代传统的问卷数据,以全国五个典型城市为样本,爬取这五座城市在新浪微博上关于气候内容的文本,通过自然语言处理和机器学习得到情绪数据。研究发现:气候与情绪之间存在着复杂的曲线关系;不同气候因子对情绪的影响力是有差异的,综合考虑关键词TF-IDF权重、显著性指标和偏回归系数权重等,得出气候因子的影响力中日照和湿度对情绪的影响力最大,气温和降水其次,风速最小。