摘要

目的 分析我国肺结核的网络搜索词与实际数据之间的相关性及时序变化特征,通过构建肺结核预测模型,探讨百度指数在肺结核防治监测中的补充应用,为江苏省肺结核防控工作提供科学依据。方法 使用范围选词法确定肺结核搜索词,选择2011年1月至2020年12月相关搜索词的百度指数和实际发病数据,采用Pearson相关分析两者之间的相关性及时序变化特征,进而分别建立多元线性回归模型和人工神经网络模型,以2020年1—12月发病数据检验模型并用平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和拟合优度(R2)评价两种模型的预测效果。结果 基于百度指数建立的预测模型能够提前1—2个月预测下一轮大流行出现的时间节点,其中,“领先2个月”和“领先1个月”人工神经网络模型的MAE为273.75和357.99,MAPE为8.86%和11.53%,R2为0.75和0.6。结论 根据搜索词百度指数建立的预测模型具有一定的预见性,能够提前预测下一波肺结核的流行趋势,可作为传统肺结核监测预警系统的有益补充和进一步扩展。