摘要

[目的/意义]学科领域的离群主题词可为创新机会发现提供新颖、稀缺的信息,离群主题词跨学科组合能催生新的知识,产生突破性学术创新机会。[方法/过程]以情报学和政治学为例,利用LDA提取不同学科文献的主题,以概率分布低的主题词为数据对象,利用Word2Vec和PCA技术将题名和摘要中包含文本语义的主题词表示为低维稠密向量,根据主题词在二维空间的分布发现学科内的离群主题词;利用余弦相似度计算不同学科离群主题词之间的语义相似度,将相似度高的不同学科的离群主题词组合视为具有创新潜能的组合。根据设计的需求度指标进一步筛选离群主题词组合,最终确定未来具有研究潜力的学术创新机会。[结果/结论]将主题提取与语义分析相结合,充分考虑了离群主题词的价值和语义环境;将离群主题词跨学科组合的语义相似度与需求度结合,能够兼顾学术创新的新颖性和有用性特征。研究表明,此研究方法能够有效发现学术创新机会,为科研指导、知识服务提供可靠参考。

全文