基于DBSCAN和随机森林的单词记忆检索难度预测研究

傅小倞; 罗正军<sup>*</sup>; 杨艺豪; 郑祝倩

doi:10.16652/j.issn.1004-373x.2023.21.020

摘要

单词记忆检索是指人在记忆中搜索到一个单词的过程，是单词学习的重要方面。目前关于单词记忆检索的研究非常有限。文中提出一种基于DBSCAN聚类和随机森林的单词记忆检索难度预测模型，通过仿真程序和机器学习算法，从单词自身特征出发预测单词记忆检索的难度。首先开发一个单词记忆检索仿真程序，根据仿真程序结果以及单词的字母组成结构、词性、使用频率构造特征向量，训练一个随机森林回归模型集用于预测单词记忆检索难度七维向量表达。另外，使用DBSCAN聚类算法获取单词难度标签，在此基础上训练一个随机森林分类预测模型用于预测单词的难度分类。实验结果表明：回归模型集平均拟合优度R2值达到了0.906；分类预测模型准确率达到了0.985；模型整体具有较好的鲁棒性。

出版日期2023
单位南京航空航天大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-19 07:08

基于DBSCAN和随机森林的单词记忆检索难度预测研究

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友