欢迎来到天天文库
浏览记录
ID:33567830
大小:653.32 KB
页数:73页
时间:2019-02-27
《基于改进随机森林的软件故障预测模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、代号10701学号1021121274分类号TP311.5密级公开题(中、英文)目基于改进随机森林的软件故障预测模型研究ResearchontheSoftwareDefectPredictionTheDesign,ImplementationandApplicationofaWEBModelBasedontheImprovedRandomForest作者姓名严蕾指导教师姓名、职务段振华教授学科门类工学学科专业计算机软件与理论提交论文日期二○一三年三月西安电子科技大学学位论文独创性(或创
2、新性)声明秉承学校严谨的学分和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切的法律责任。本人签名:日期:西安电子科技大学关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用
3、学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。(保密的论文在解密后遵守此规定)本学位论文属于保密,在本人签名:年解密后适用本授权书。导师签名:日期:日期:摘要摘要在软件开发过程中,准确地预测有故障倾向的软件模块可以帮助测试人员以及开发人员高效地发现软件故障。对于大型
4、系统,软件故障预测就更加重要,因为它能够帮助开发人员在开发过程中将精力和资源集中使用在容易出现故障的模块,从而更合理地分配资源。目前软件故障预测模型主要是通过机器学习算法来构建的,软件故障预测主要是根据软件质量属性以及软件的历史故障数据来对被测系统的软件模块进行故障预测。本文首先对软件质量属性进行了研究,包括方法级属性集合McCabe和Halstead,面向对象(OO)属性集合。本文提出的软件故障预测模型采用方法集属性与面向对象属性相结合的方法对软件进行度量。针对软件故障数据的不平衡性问题,本文提出了一种改进的随机森林算
5、法,在对模型进行训练前首先对训练数据集进行平衡化处理,以减少训练数据对模型准确度的影响,模型生成后在保证预测准确率较高的情况下精简模型,提高预测效率。应用本文提出的算法对Eclipse中的数据进行处理,实验表明本文提出的改进算法性能高于其他现存的机器学习算法。关键词:软件质量软件故障预测模型随机森林算法决策树AbstractAbstractDuringthedevelopmentprocessofsoftware,accuratepredictionoffaultpronemodulesenablesthetest
6、ersanddeveloperstoidentifythedefectsefficiently.Softwaredefectpredictionmodelsaremorevaluableforthelarge-scalesystem,wherethedevelopersneedtofocustheirattentionandresourcesonthefaultpronemodulesinthesystemunderdevelopment.Currently,manymachinelearningalgorithmsha
7、vebeendevelopedandappliedforsoftwaredefectprediction.Softwarepredictionmodelsmainlyusesoftwarequalityattributesandthehistoricaldefectrecordstodiscoverthefaultpronemodelsinthesystemundertesting.Firstlyinthisthesis,softwarequalitymetrics,includingmethodlevelmetrics
8、ets(McCabe,Halstead)andtheObject-Orientedmetricsetsarestudied.Thesoftwarepredictionmodelproposedinthisthesisusesthecombinationofmethodlevelmetricsetsandobject-
此文档下载收益归作者所有