自适应信息过滤中使用少量正例进行阈值优化(英文)

夏迎炬; 黄萱菁; 胡恬; 吴立德

doi:10.13328/j.cnki.jos.2003.10.005

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

自适应信息过滤中使用少量正例进行阈值优化(英文)

作者：夏迎炬; 黄萱菁; 胡恬; 吴立德

来源：软件学报, 2003, (10): 1697-1705.

DOI：10.13328/j.cnki.jos.2003.10.005

摘要

自适应信息过滤中一个大的挑战在于其数据稀疏问题.因此,在对输入的文本流进行过滤的同时学习最优阈值非常重要.提出了一种新颖的阈值优化算法.该算法可以通过少量的正例进行快速的学习,所需数据的获得具有增量性,故而其计算量及所需的存储空间很小.此外,该算法还具有高效、健壮、实用性强等优点.在第10届国际文本检索会议(TREC10)上,复旦大学的自适应信息过滤系统使用了该阈值优化算法,并取得了第3名的成绩.其T10U和T10F分别达到了0.215和0.414.

出版日期2003
单位复旦大学

全文

访问全文

收藏分享被引浏览

更新时间：2018-12-26 01:36

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号