摘要

游戏门户网站为提升玩家们的游戏体验,建立了大量站点用以提供游戏资讯及相关攻略。然而这些站点间异构现象明显,且缺乏统一的知识体系。提出基于领域本体的文本标注算法,通过融合站点间的数据,构建游戏领域本体。同时,针对游戏领域的应用,优化了新词发现算法,并进一步对攻略文本进行语义标注。通过这些语义标签,不仅能直观地了解攻略中的内容,也能更好地为攻略文本的语义检索服务。实验证明,所提出的本体构建方法在游戏领域具有一定的推广性,同时游戏领域词汇发现算法与传统的分词工具相比也取得了更好的结果。