摘要

基于MOOC的教学过程中,产生了大量的学习行为数据,然而,实际应用中,由于缺乏统一的数据标准及监控系统,数据质量问题堪忧,由此导致进行数据分析时产生的学习评价具有片面性和不可靠性。为解决数据质量问题,结合大数据的类型多样性、数据量大、数据变化快速、分布式存储等特征,文章首先提出了大数据环境下的数据质量规则形式化描述技术;其次,给出了不一致数据检测模型和修复模型;最后,根据数据规则之间的依赖关系,设计了数据清洗修复框架。实验表明,本文提出的方法可获得有效的学习评价。

  • 出版日期2023
  • 单位三江学院