摘要

【目的】分析现有数据引用实践中的引用特征,归纳数据引用识别方法,总结数据引用识别的研究现状和未来发展方向。【方法】将现有数据引用识别方法归为基于规则识别、有监督机器学习算法和半监督机器学习算法三类,并对各方法的原理、特点、现存问题、性能效果、适用范围等方面进行概括分析。【结果】目前相关技术集中在有监督机器学习算法,结合数据引用行为识别和数据引用元素抽取的识别方法是未来的研究方向。【局限】主要从整体上归纳数据引用特征以及现有的数据引用识别算法,未深入阐述具体算法的技术细节。【结论】目前数据引用识别研究仍存在领域局限、方法单一、未充分考虑数据引用特征等问题,有待进一步优化。

  • 出版日期2023
  • 单位北京协和医学院; 中国医学科学院