地名地址基因的网页文本地名地址提取算法

作者:杜中波; 刘新; 宋婷婷; 梁冰; 周新宇
来源:测绘科学, 2019, 44(04): 196-202.
DOI:10.16251/j.cnki.1009-2307.2019.04.029

摘要

针对网页文本蕴含着丰富的地名地址空间信息,但因其描述的随机性、多样性,导致信息很难被快速、准确地识别出来的问题。该文在分析网页文本中地名地址组成特点的基础上,考虑地名地址的事件属性,提出了一种基于"地名地址基因"的信息提取方法,依据事件相关度、地名地址的字符长度等提取因子建立提取规则树获取目标地名地址。实际数据测试表明该方法在地名地址提取上更具针对性,提高了效率和准确率。

全文