欢迎来到天天文库
浏览记录
ID:50116914
大小:8.56 MB
页数:61页
时间:2020-03-06
《基于特征提取和代价敏感学习的软件缺陷预测方法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、.->-.-?、.单嫌:1的^^^蛹1V-.n'I.■...,::皆>—fV!.考店凌若邊'爲碑葛T,'马^一二.考營您硕女寺戈方‘為v巧f;V-*"*>.細'..!;‘V;叛0、‘.:兵辟/.霄藻:一.丫/’、叩;‘是,V玄.r-琴:\.'麵爹’\rS.户7,'..'.'VV'';.'誉r巧习J论诚一目:巧獅槪隨備感学、>//..'r,的i誦研究、離M一fI\''....--
2、...s\'、f;'-'V.‘-.:r号‘学.o誦熱8‘v-咳>'.与甲姓名:.聲洋?;.-'^frj社':_讀/:\,一导师ur迎.:誠H.讓v.,I;V3,.:也学泣类别-.''1忠社聲i.听、f-J講’■-.L.->类型i,'全日制‘7禱f.*Vv;蠻K.霉.',?..4.5?'V>^业^领域)獄\I里.\某>视:刖论文提交期'.式的担ir
3、I..:..vf,'.一、:,.审T^,3";."'谅r‘1扣:SoftwareDefectPredictionBasedonFeatureExtractionandCost-sensitiveLearningThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfortheDegreeofMasterofEngineeringByLUHaiyangSupervisor:
4、Prof.JINGXiaoyuanMarch2015摘要软件缺陷已经成为软件开发过程中不得不面对的重要问题。基于机器学习的软件缺陷预测技术从已有的软件模块中获得的历史数据,对新的软件模块进行缺陷预测,从而判定它们是否存在缺陷,为软件项目提供决策支持。本文分析了软件缺陷预测的特点,同时针对当前软件缺陷预测中存在特征冗余问题和类不平衡问题进行了深入研究,做出了以下工作:(1)为了解决软件模块中的特征冗余问题给软件缺陷预测造成困难,提高对软件缺陷预测的准确率,本文提出了基于监督学习的核拉普拉斯特征映射算法(S
5、KLE)。SKLE将核方法和监督学习运用到拉普拉斯特征映射算法(LE)上,改进LE算法中的距离度量方式的不足。在NASA软件数据库上与相关算法进行了实验比较,结果表明通过SKLE提取的低维特征能够有效地消除软件模块之间的冗余信息,获得较高的F-measure值。(2)考虑到软件缺陷预测中存在的两类不平衡问题以及误分代价问题,本文借助代价敏感学习,提出了基于代价敏感的神经网络算法(CSBPNN)。CSBPNN在误差函数中加入代价敏感信息,调整BP神经网络的权值和偏置参数,使BP神经网络对第二类误分类更加敏
6、感。与其他代价敏感分类算法相比,CSBPNN有效地解决了软件缺陷预测中代价敏感问题,提高了有缺陷软件模块的召回率和F-measure值。(3)考虑到单一分类器的分类能力有限,本文采用集成学习方法,提出了基于代价敏感的集成学习算法(Cost-Adaboost)进一步提高算法的性能。与最新的几种软件缺陷预测方法相比,Cost-Adaboost不仅具有最好的F-measure值,而且进一步降低了软件缺陷预测中的误分代价,提高了有缺陷软件的召回率。关键词:软件缺陷预测,特征提取,代价敏感学习,集成学习IAbst
7、ractSoftwaredefecthasbecomeaveryimportantproblemtobesolvedintheprocessofthesoftwaredevelopment.Softwaredefectpredictiontechnologybasedonmachinelearningobtainshistoricaldatafromexistedsoftwaremodulesandpredictsothernewsoftwaremodules.Inthispaper,wefocuson
8、theresearchofredundancyfeaturesandtheimbalanceclassproblem,andproposeaseriesofnovelmethods:(1)Inordertosolvetheredundancyfeaturesinsoftwaremodules,weproposeanewmethodnamedSupervisedKernelLaplacianEigenmaps(SKLE),whichappli
此文档下载收益归作者所有