摘要

本研究鉴于某公司职位描述存在的特点以及其所带来的问题,对其展开研究。由于职位描述中的文本字数少、数量多,特征维数较高,样本特征稀疏,不能很好的抽取出文本关键特征。针对这些问题,我们用潜在语义索引模型(LSI)对文本进行特征提取,分析潜在语文空间维度对聚类性能的影响,然后根据提取的特征进行K-means聚类,能有效降低简历匹配筛选过程中的职位类别数,提高了简历匹配的效率。