摘要

阐述了数据挖掘的概念和算法,重点介绍了线性回归算法,基于多元线性回归算法分析了影响大学英语四级的诸多因素。根据数据挖掘思想,收集历史数据并适当加以变换,使用统计分析技术对影响大学英语四级的诸多因素进行分析,得出了大学英语四级成绩与其影响因素之间的线性回归关系,拟合程度较高,可用于四级成绩预测,对学生学习和学校教学管理有很大的指导作用和使用价值。