摘要

随着信息技术的快速发展,卫生健康数据不断增多,数据的可靠性评估是数据实践应用、科学研究的前提和保障。传统的人工、统计学数据可靠性评估方法难以适用于海量数据的可靠性评估,而且造成人力资源的浪费。本研究构建一种基于机器学习的公共卫生数据可靠性评估系统,首先对数据进行存储、标注和规则性质控,并对数据进行特征工程处理,然后选取部分数据由机器学习算法自主训练数据特征并形成数据可靠性评估模型,通过模型来评估其他数据的可靠性,最后进行数据量检验并综合评价数据的可靠性。由此形成数据可靠性评估的新方法、新模式,有助于弥补现有评估方法的不足,提升数据可靠性评估的准确率和效率。

  • 出版日期2023
  • 单位上海申康医院发展中心; 上海市疾病预防控制中心

全文