摘要

目前网络上的重要应用都是围绕对用户兴趣的研究和发现而展开和完善的,主要的方式是借助于对用户的Web访问数据进行相关挖掘。该研究主要是通过建立一个从底层数据获取到上层数据处理的原型系统,对真实捕获的网络数据利用小世界网络模型提取中文文档关键字后处理为用户兴趣,再将用户的访问兴趣通过隐马尔可夫模型抽象成一种时间序列,依次反映用户兴趣的序列性,从而利用GSP算法得到用户的兴趣并供后续处理。实验证明,该原型系统从数据获取到最终处理,可以得到比较满意的结果。