基于数据挖掘的软件故障定位技术研究

基于数据挖掘的软件故障定位技术研究

ID:34110309

大小:8.61 MB

页数:69页

时间:2019-03-03

基于数据挖掘的软件故障定位技术研究_第1页
基于数据挖掘的软件故障定位技术研究_第2页
基于数据挖掘的软件故障定位技术研究_第3页
基于数据挖掘的软件故障定位技术研究_第4页
基于数据挖掘的软件故障定位技术研究_第5页
资源描述:

《基于数据挖掘的软件故障定位技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、声明尸咧本学位论文是我在导师的指导下取得的研究成果,尽我所知,在本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均已在论文中作了明确的说明。研究生签名:硇即年弓月碜日学位论文使用授权声明南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅或上网公布本学位论文的部分或全部内容,可以向有关部门或机构送交并授权其保存、借阅或上网公布本学位论文的部分或全部内容。对于保密论文,按保密的有

2、关规定和程序处理。研究生签名:匿∑会匙Ⅵ即年乡,印罗日硕士学位论文基于数据挖掘的软件故障定位技术研究摘要随着软件应用领域的不断扩大,软件规模变得越来越大,软件产品结构也变得越来越复杂。复杂软件中隐藏的软件故障难以定位,从而导致软件的可靠性得不到有效保证。当软件出现故障时,如何快速有效地定位软件故障是一个非常有价值的研究方向。但是现有的调试技术基本上都是通过设置断点运行程序,排错时只利用了一次失败运行中的动态执行信息,而忽略了大量测试用例多次运行时收集的海量测试数据。那么如果将这些海量的测试数据有效利用起来,从

3、中发现和故障有关的信息,那么将更加有效地实现故障定位。本文通过对Tarantula方法的研究发现可以将数据挖掘(DataMining)技术应用到软件故障定位中,即采用关联规则挖掘算法,找到像{e(i)jF}这样的规则,即导致程序执行失败的语句。通过计算提升度lift(e(i),F),将其作为可执行语句的可疑度,按照其值的大小进行降序排列,就可以得到按照语句可疑度从大到小进行排序的故障报告。然后针对Tarantula方法只利用了语句成功和失败执行的次数来度量语句的可疑度而忽略了语句执行补集对故障定位的辅助作用这

4、个不足,提出利用语句执行补集来改进提升度lift(e(i),F),记为complementlift’。最后,将关联规则li矗方法和改进的基于语句执行补集的complementTarantula方法、Wong方法及Dice方法,分别在Siemens程序集的109个故障版本程序中进行实验并用图表分析的方式比较了这五种方法。实验表明:改进的基于执行补集的关联规则方法complementlift’的故障定位效果最优,优于原有的Tarantula方法、常见的Wong方法和Dice方法,程序员在排错时需要检查的语句比其他

5、四种方法明显要少。而关联规则liR方法比Tarantula效果好、与Dice方法相当,但是却比Wong方法要稍显逊色。并进一步在大程序集Space上进行分析,结果表明基于关联规则数据挖掘方法的故障定位能更有效地识别大程序中的故障。关键词:故障定位,关联规则,语句执行补集,Gcov,Siemens程序集,TarantulaAbstractWiththecontinuousexpansionofsoftwareapplications,softwareisbecomingincreasinglylarge-sca

6、leandthestructuresofsoftwareproductsarebecomingmoreandmorecomplex.SoftwarefailureshiddeninComplexsoftwaresaredifficulttolocate,resultingintheunreliabilityofsoftwares.Whenthesoftwarefails,howtolocatesoftwarefailuresquicklvandefficientlyisaveryvaluableresearc

7、hdirection.However,existingdebuggingtechniquesaremostlyrunningtheprogrambysettingbreakpointswhendebuggingafailedrunusingonlyonedynamicexecutioninformation,whileignoringthemassivetestdatacollectedbylargenumberoftestcases.Soifwetakeeffectiveuseofthesevastamou

8、ntsoftestdatatogethertodiscoverfault-relatedinformation,itwillbemoreeffectiveforfaultlocation.Theresearchofthispaperfindsthatassociationruleminingalgorithmofdataminingtechniquecanbeappliedtosoftwarefau

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。