摘要

专有名词识别(Named-Entity Recognition,NER)是自然语言处理和信息检索的基础。现有的很多文献集中于人名、地名、机构名等的识别,很少涉及到书名和电影名等较为复杂的专有名词。专注于某搜索引擎的用户查询日志中出现的这类复杂专有名词的识别。根据用户的查询在网络中的上下文数据,将查询进行粗切分,并利用该网络数据作为训练语料训练复杂专名分类器。使用三种不同的分类器,证实该方法能取得相当好的效果。