摘要

针对现有方法在大规模数据集量化时所产生的信息流失,影响检索准确率等问题,提出了脱机训练与在线索引等两种索引学习算法。采用类神经网络架构去学习最近邻关系,重新定义索引结构。将查询值的特征向量作为类神经网络的输入,类神经网络的输出则是各群的近邻概率。通过预测各群的近邻概率,来取代传统以欧几里得距离来排序的方法。仿真结果表明,通过学习并依照近邻概率去访问各群,可以让候选集信息更为精准。还可以与其它近邻搜索方法整合,提升它们的检索精度。

  • 出版日期2021
  • 单位新疆财经大学