欢迎来到天天文库
浏览记录
ID:53029260
大小:445.94 KB
页数:7页
时间:2020-04-14
《基于集成混合采样的软件缺陷预测研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、CN43—1258/TP计算机工程与科学第37卷第5期2015年5月ISSN1OO7—13OXComputerEngineering&ScienceVo1.37,No.5,May.2015文章编号:1007—130X(2O15)05—0930—07基于集成混合采样的软件缺陷预测研究戴翔,毛宇光h(1.南京航空航天大学计算机科学与技术学院,江苏南京210016;2.南京大学计算机软件新技术国家重点实验室,江苏南京210093)摘要:对软件缺陷预测的不平衡问题进行了研究,提出了一种处理不平衡数据的采样方法,用来解决分类器因为样本集中的样本类别不平衡而造成分类器性能
2、下降的问题。为了避免随机采样的盲目性,利用启发性的混合采样方法来平衡数据,针对少数类采用SMOTE过采样,对多数类采用K—Means聚类降采样,然后综合利用多个单分类器来进行投票集成预测分类。实验结果表明,混合采样与集成学习相结合的软件缺陷预测方法具有较好的分类效果,在获得较高的查全率的同时还能显著降低误报率。关键词:不平衡数据;SMOTE;K—Means;投票;集成学习中图分类号:TP306文献标志码:Adoi:10.3969/i.issn.1007—13OX.2O15.05.012Researchonsoftwaredefectpredictionbase
3、doni●ntJegrat·ed1sampli‘nganc1Iensemlbl’elearni●ngDAIXiang.MAOYu—guang’(1.CollegeofComputerScienceandTechnology,NanjingUniversityofAeronauticsandAstronautics,Nanjing210016;2.StateKeyLaboratoryforNovelSoftwareTechnology,NanjingUniversity,Nanjing210093,China)Abstract:Westudytheclass—i
4、mbalancedproblemofsoftwaredefectpredictionandproposeaninte—gratedsamplingmethodforclass—imbalanceddataclassificationSOastoenhancetheclassificationability.Inordertoavoidtheblindnessofrandomsampling,weutilizetheintegratedsamplingmethodtobalancedatasets:usingSMOTEforover—samplingminori
5、tyclassandK—Meansclusteringfordown—samplingma—jorityclass.Afterobtainingabalanceddataset,weutilizemultiplesingleclassifierstoensemblelearning.Experimentalresultsshowthatthesoftwaredefectpredictionalgorithm,whichcombinesintegratedsam—plingandensemblelearning,hasbetterclassificationpe
6、rformance,obtainingahighertruepositiveratewhilesignificantlyreducingthefalsealarmrate.Keywords:unbalanceddataset;SMOTE;K—Means;vote;ensemblelearning面对软件规模日益膨胀的现状,传统的完全依赖人引言工对整个软件进行穷尽测试的方式已经不能适应现实测试工作的需要,如何在有限的时间内针对可近年来,软件产业蓬勃发展,大到航空航天领能存在缺陷的模块进行测试已经成为一项研究热域小到手机应用,在方便人们生活的同时,软件缺点。软件缺
7、陷预测为快速定位可能存在缺陷的模陷也带来了严重的生命财产安全隐患,如“甬温线”块提供了依据。的信号灯事故、光大证券的“乌龙指”事件。软件测软件缺陷预测可以看作二分类问题,即软件模试被广泛认为是一种预防软件缺陷的有效手段,而块存在缺陷和不存在缺陷。在现实的第三方软件*收稿日期:2014—04—10;修回日期:2014—05—26基金项目:国家自然科学基金资助项目(41301407)通信地址:210016江苏省南京市自下区御道街29号南京航空航天大学计算机科学与技术学院Address:CollegeofComputerScienceandTechnology,Na
8、njingUniversityofAe
此文档下载收益归作者所有