面向软件缺陷报告的提取方法

林涛; 高建华; 伏雪; 马燕; 林艳

摘要

软件工程中的软件缺陷报告数量在快速增长,开发者们越来越困惑于大量的缺陷报告。因此,为了达到缺陷修复和软件复用等目的,有必要研究软件缺陷报告的提取方法。提出一种提取方法,该方法首先合并缺陷报告中的同义词,然后建立空间向量模型,使用词频反文档频率以及信息增益等文本挖掘的方法来收集软件缺陷报告中单词的特征,同时设计算法来确定句子复杂度以选择长句,最后将贝叶斯分类器引入该领域。该方法可以提高缺陷报告提取的命中率,降低虚警率。实验证明,基于文本挖掘和贝叶斯分类器的软件缺陷报告提取方法在接受者工作特征曲线面积(0.71)、F-score(0.80)和Kappa值(0.75)方面有良好效果。

出版日期2016
单位上海师范大学

收藏分享被引浏览

更新时间：2024-05-13 20:33

面向软件缺陷报告的提取方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友