摘要

针对软件代码的缺陷预测是常见的研究问题,但基于协议的代码缺陷预测暂时无人尝试研究。提出了改进的有监督跨域协议缺陷预测(enhanced supervised cross-domain protocol defect prediction,ESCPDP)算法,解决跨域缺陷预测中类不平衡及特征冗余等问题。首先提出Mean-ReSMOTE算法来解决数据集的类不平衡问题,其次提出Hybrid-RFE+算法对过采样后的数据进行特征选择,得到最优子集,最后使用支持向量机(support vector machine,SVM)构建有监督缺陷预测模型。在NASA数据集和自主搜集构建的Net协议缺陷数据集上,以Acc、Recall和F1值作为评测指标对提出的模型进行验证,实验结果表明改进的有监督跨域协议缺陷预测算法要优于其他经典算法,具有更好的预测效果。

  • 出版日期2023
  • 单位中国人民解放军63891部队