情感化智能网络爬虫设计及实现

作者:彭欣悦; 范严; 徐海峰
来源:现代信息科技, 2020, 4(23): 97-99.
DOI:10.19850/j.cnki.2096-4706.2020.23.027

摘要

为了实现文档的情感化抓取,设计了一款应用于网页文档搜索的智能型爬虫软件,相对于一般搜索引擎,更专注于从智能化和情感化角度实现海量Web文本数据的发现和呈现。文章对搜索关键字的智能化语义校正方法进行了研究,对于一些疏忽导致的语义错误,设计相关算法进行自动化校正;实现了搜索文本的情感化排序,搜索结果的返回不仅仅是关键字的匹配,还进行情感分类标注;利用文档的情感标签对一些网络暴力、虚假评论等文档进行文本甄别。

全文