基于词替代策略的LSA预处理研究

简艳

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于词替代策略的LSA预处理研究

作者：简艳

来源：微计算机信息, 2011, (01): 242-243+295.

摘要

潜在语义分析(LSA)是一种扩展的向量空间模型,通过截断奇异值分解(TSVD)建立低维的词语对文档的潜在语义空间,达到信息抽取和去除"噪声"的目的。但是当文档集里的文档主题分布不均匀时,弱势主题会被当作"噪声"忽略掉。为减弱LSA对弱势主题的忽略,本文利用《同义词林》来计算词语的相似度,提出了一个基于词替代策略的潜在语义分析改进模型。实验表明,此模型能够更好的解决同义词、多义词问题,并且大大减弱对弱势特征的忽略。

出版日期2011
单位中国人民解放军信息工程大学

收藏分享被引浏览

更新时间：2019-07-25 17:29

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号