摘要

时空轨迹数据关联的语义信息能更好地反映用户行为,对于POI密集分布的城市区域,轨迹的语义信息很难根据单一的距离或时间要素进行匹配,该文设计一种基于隐马尔可夫模型(HMM)的时空轨迹语义匹配方法。首先,利用时间阈值与距离阈值提取逗留点,并利用考虑时间的DBSCAN聚类方法对逗留点进行聚类,得到由抽象停留位置构成的轨迹;然后,结合POI数据获得停留位置的候选语义,再以停留位置序列为观测序列,以每个停留位置所关联的候选地点作为隐藏状态建立HMM,并用改进的加权距离的TF-IDF方法计算HMM的观测概率;最后,解算HMM得到最有可能的访问地点序列作为轨迹的语义匹配结果。该方法不依赖其他外部数据或训练数据,适用于POI密集分布的城市区域,基于真实时空轨迹数据集的实验结果验证了该方法的有效性。

  • 出版日期2023
  • 单位江苏省地理信息资源开发与利用协同创新中心; 南京师范大学; 虚拟地理环境教育部重点实验室