集成特征选择的代价敏感Boosting软件缺陷预测方法
(2024-01-31 08:59:38)1 论文标题:集成特征选择的代价敏感Boosting软件缺陷预测方法
2 作者信息:唐鹤龙, 李英梅:哈尔滨师范大学计算机科学与信息工程学院,黑龙江 哈尔滨
3 出处和链接:唐鹤龙, 李英梅. 集成特征选择的代价敏感Boosting软件缺陷预测方法[J]. 软件工程与应用,
2023, 12(6): 975-988.
https://doi.org/10.12677/SEA.2023.126096
4
摘要:软件中潜在的缺陷会产生严重的后果,通过使用软件缺陷预测技术可以及时地检测到模块中的缺陷。然而,由于软件缺陷数据集中的类不平衡和高维度特征问题,会导致模型的预测性能下降,因此提出了一种集成特征选择的代价敏感Boosting软件缺陷预测方法(Cost-Sensitive
Boosting for Feature Selection,
CSBFS)。CSBFS首先采用了一种代价敏感的特征选择算法,该算法先计算每个特征对预测结果的贡献值,并根据不同错误类别的代价对贡献值进行调整,选择具有正向贡献的特征作为特征子集,解决了高维度特征的问题;接下来,将这个特征选择算法嵌入进Boosting算法中,在Boosting的每一轮迭代中,为每个基学习器选择合适的特征子集,从而增加了基学习器之间的多样性;此外,通过调整错误类别的权重,为第一类错分样本赋予更高的权重,以缓解类别不平衡问题,进一步提高了预测效果。在20个公开数据集上进行实验,以F-measure、Recall、AUC、G-mean等作为评价指标,实验结果验证了CSBFS方法的有效性。
后一篇:无证书的普适环境匿名认证方案