集成学习在软件缺陷检测中的运用.pdf

集成学习在软件缺陷检测中的运用.pdf

ID:50432636

大小:3.88 MB

页数:63页

时间:2020-03-06

集成学习在软件缺陷检测中的运用.pdf_第1页
集成学习在软件缺陷检测中的运用.pdf_第2页
集成学习在软件缺陷检测中的运用.pdf_第3页
集成学习在软件缺陷检测中的运用.pdf_第4页
集成学习在软件缺陷检测中的运用.pdf_第5页
资源描述:

《集成学习在软件缺陷检测中的运用.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、、-T寧泣巧码:10293密级;—I*;X.'■-1..■;.:^^違也缘嗜;'r.':....i';硕去#像给或1…、两4雀研--麵.论文题目:集成学习在软件缺陷检測中的运用V’-I.-.心—巧;;、’一1012041025学号黄文聪姓名荆晓远导师信息安全学科弯业硏究方向生物轉站语遵i-;-.申请草位装别王堂\J.■?‘,1

2、<,..’^—--Ml生J论文摄交扫期■月f:V\■.N,J?.〇.‘'*、_'?,?、;?V(,..(.'女rV八‘’’'I‘----:L.Va.^\记\V:EnsembleLearningForSoftwareDefectDetectionThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfortheDegreeofMasterofEngin

3、eeringByHuangWencongSupervisor:Prof.XiaoyuanJingMarch2015南京邮电大学学位论文原创性声巧本人声明所呈交的学位论文是我个人在导师指导下进斤的研究工作巧取得的研究成果。尽我所知,除了文中特别加tu示注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它一教育机构的学位或证书而使用过的材料。与我同工作的同击对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。一本人学位论文及涉及

4、相关资糾若有不实,愿意承担切相关的法律责任。、研究生签名:香对良日期;哪南京邮电大学学位论文使用授权声明本人授权南京邮电大学可レッ保留并向国家有关部口或机构送交论义的复印件和电子文档:;;允许论文被查阅和借阅可W将学位论文的全部或部分内容编入有关数据库进行检索可从采用影印、缩印或扫描等复制手段保存、汇编本学位论文。本文电子文档的内容和纸质一论文的内容相致。论文的公布(包括刊登)授权南京邮电大学研巧生院办理。涉密学位论文巧解密后适用本授权书。‘、芳i:L研巧生签名:;

5、據或导师签名峽日期:站M/L带-摘要近年来,软件缺陷检测成为软件工程领域里的一个研究热点。其主要可分类动态检测与静态检测两类。静态检测是使用软件的历史数据来建模预测软件缺陷,其具有较高的适用性及准确性,被广泛地研究及运用。静态检测的关键是如何充分分析软件的历史数据,从而建立准确的二分类模型来区分有缺陷软件与无缺陷软件。在软件缺陷检测中,有缺陷的软件样本会大大少于无缺陷的软件样本,这就造成了软件缺陷的严重类不平衡问题,如何解决这个问题成为软件缺陷预测的关键。常见的方法有重采样,代价敏感等。这里,

6、我们使用基于下采样的Bagging方法,每次训练弱分类器时,采样得到类平衡的样本子集。再通过多个弱分类器融合得到强分类器,从而提高模型的泛化能力以及分类效果。集成学习的方法中,想要进一步提高模型的分类效果,我们可以从提高单一分类器的效果,提高各个弱分类器的随机性,寻找合适的融合方法三个方面入手。之前我们通过下采样方法,提高了单一分类器的分类效果。在此基础上,我们通过增加模型独立性,优化融合方法等,进一步提高模型效果。在集成学习中,多个分类型之间越独立,最终得到的结果越好。对比于基于样本随机的Baggi

7、ng方法,基于特征子空间的特征随机方法能够得到更加独立的弱分类器,从而取得更好的模型稳定性以及分类准确性。在这里,我们引入基于特征构造的随机特征子空间方法,进一步提高软件缺陷模型的分类效果。通过上述方法,我们得到一系列的弱分类器。由于二分类的特殊性,一般的准确率不能很好地描述二分类模型的效果。这里,我们提出了基于综合评价指标F-measure的加权融合方法,进一步优化模型效果。对于提出的所有方法,我们都在NASA提供的软件缺陷数据库上进行实验,与现今较流行的一些方法进行比较。实验结果表明,我们的方法在

8、NASA十个软件缺陷库上的分类效果均有较大的提升。关键词:软件缺陷检测,改进Bagging,特征构造,随机特征子空间,分类器融合IAbstractInrecentyears,softwaredefectpredictionisoneofthemostimportantresearchtopicsinsoftwareengineeringwhichcanbegenerallycategorizedintotwotypes:dynamicandstaticd

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。