摘要

为了解决现如今网络问诊中存在的一些问题,提高用户的体验,使用Spark计算框架,设计了一个基于知识图谱的医疗领域问答系统。首先对专业医学知识网站进行数据的爬取以及处理,使用Neo4j图数据库进行数据的存储。再基于相似度计算的方法进行问句实体的抽取,使用支持向量机算法进行问句意图的识别。最后利用Spark计算框架,实现问句解析算法的并行化。测试结果表明,该问答系统具有一定的实用价值。

全文