摘要

为了预测学生在大学一年级以后的异动情况,利用机器学习中的随机森林算法建立相应的预测模型.该模型选取了学生大学一年级的总学分和13门大学一年级的课程成绩作为特征,利用随机森林算法模型对该生异动情况建立了预测模型.在建立模型时,考虑到异动学生数量与非异动学生数量相差很大的问题,提出了解决这种不平衡数据集问题的方法.结果显示,此模型达到了较好的预测效果,总体预测准确率85.4%;Matthew相关系数0.6183.