摘要

单词记忆检索是指人在记忆中搜索到一个单词的过程,是单词学习的重要方面。目前关于单词记忆检索的研究非常有限。文中提出一种基于DBSCAN聚类和随机森林的单词记忆检索难度预测模型,通过仿真程序和机器学习算法,从单词自身特征出发预测单词记忆检索的难度。首先开发一个单词记忆检索仿真程序,根据仿真程序结果以及单词的字母组成结构、词性、使用频率构造特征向量,训练一个随机森林回归模型集用于预测单词记忆检索难度七维向量表达。另外,使用DBSCAN聚类算法获取单词难度标签,在此基础上训练一个随机森林分类预测模型用于预测单词的难度分类。实验结果表明:回归模型集平均拟合优度R2值达到了0.906;分类预测模型准确率达到了0.985;模型整体具有较好的鲁棒性。

全文