基于DiWCSmSTL的跨项目软件缺陷预测

作者:刘晶; 闵帆*; 宋国杰
来源:海南热带海洋学院学报, 2023, 30(02): 51-61.
DOI:10.13307/j.issn.2096-3122.2023.02.07

摘要

为了在诸多新项目中快速找到用于迁移的最优参考项目,解决基于迁移学习的跨项目缺陷预测(Cross Project Defect Prediction, CPDP)应用中存在的由单源选择性偏差而导致的缺陷预测性能稳定性问题,提出了用于跨项目缺陷预测的双重初始权重的代价敏感多源迁移学习模型(Double initial Weights and Cost Sensitive multi-Source Transfer Learning, DiWCSmSTL),采用多源替代单源从而减少选择偏差以获得更稳定的性能。本研究模型首先融合行业内不同的数据支持多源迁移;然后利用动态性能评估进行代价敏感的源项目选择以减少负迁移的影响;最后对所融合的数据设置双重初始权重以获得稳定的模型。在3个开源数据集上进行实验,结果表明:基于多源融合的预测模型比单源融合能够获得更稳定的性能;代价敏感和双重权重设置既能有效缩短缺陷预测模型生成时间,又能在曲线下面积(Area under the curve, AUC)和几何平均值(Geometric mean,Gmean)指标上均取得改进。

全文