摘要

[目的 /意义]在中医文献中存在大量的短语,目前的短语挖掘方法在中医文献上效果差强人意,针对这个问题,提出了面向中医文献的短语挖掘方法。[方法 /过程]该方法在中医文献分词器基础上,利用中医领域新语言知识库,训练得到短语质量评分模型,并在此基础上利用词性标签信息构建短语分割模型对文献进行挖掘,提高中医文献中短语挖掘的准确率。并在《中医古代名医医案》上进行实验。[结果 /结论 ]选取挖掘短语的Top300对其进行精确率的评估,其准确率为84.96%。实验证明中医文献分词器+短语分割模型的挖掘方法在中医领域文献上的短语挖掘效果优于其他挖掘方法。