基于数据集缩减的bug分配

基于数据集缩减的bug分配

ID:32974142

大小:7.46 MB

页数:65页

时间:2019-02-18

基于数据集缩减的bug分配_第1页
基于数据集缩减的bug分配_第2页
基于数据集缩减的bug分配_第3页
基于数据集缩减的bug分配_第4页
基于数据集缩减的bug分配_第5页
资源描述:

《基于数据集缩减的bug分配》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于数据集缩减的bug分配BugTriageBasedonDataReduction学号:2地17031指导教师:塑基大连理工大学DalianUniversityofTechnologyJIIIIIIIIIIIIIIIIIIMIIIIIJIIY2417367’__________-___··—。大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包

2、含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目I垄互丝礓辇隆盗鱼垒笔丕丝J怕作者签名:幺堡鉴日期:塑型年二L月—址日大连理工大学硕士学位论文摘要在软件开发与维护过程中,bug修复是至关重要的一个环节。快速准确修复bug的关键,是找到能修复bug的开发者,即bug分配。当前人们主要用文本分类方法来解决bug分配问题,然而该方法受到大规模且低质量的数据集的制约。为了提升bug分配的准确率,本文提

3、出基于特征选择和实例选择的数据集缩减方案。该方案包含两方面内容:一是降低数据集的规模,二是提高数据集的质量。本文使用结合特征选择与实例选择的方法来实现这一目标。为了验证缩减方案的有效性,本文选取了两种特征选择方法和实例选择方法,基于Eclipse、Gnome和NetBeans的数据集进行实验。对每一个数据集,实验剔除了70%的属性和50%的实例。实验结果表明,利用缩减的数据集能取得比原始数据集更好的准确率。基于以上三个数据集的实验结果,本文发现特征选择和实例选择的顺序对最终的bug分配结果有很大影响。对一个新的

4、数据集,为了能准确给出最佳的组合选择,本文对组合顺序建立了一个预测模型。实验从Eclipse和Mozilla的bug仓库中分别选取了连续ID号的300000个bug,抽样出不同大小的数据集。每一个数据集中抽取出描述该数据集的18个属性。实验结果表明,基于决策树的预测模型可以取得71.8%的准确率。关键词:bug分配;数据集缩减;顺序预测模型;特征选择;实例选择基于数据集缩减的bug分配BugTriageBasedonDataReductionAbstractBugfixingisanimportantproce

5、ssinsoftwaredevelopmentandmaintenance.Bugtriage,i.e.,assigninganewbugtoanappropriatefixer,isthekeystepofbugfixing.Themainapproachestoaddressthebugtriageproblemarebasedontextclassification.However,theseapproachessufferfromthelarge-scaleandlow—qualitydatasets.

6、Inthisthesis.thedatareductiontechniquebasedonfeatureselectionandinstanceselectionisproposedtoimprovetheaccuracyofbugtriage.Datareductionincludestwoaspects.toreduce也escaleandtoincreasethequality.Featureselectionandinstanceselectiontechniquesarecombinedtoachie

7、vethisobjective.Toevaluatetheeffectivenessofthedatareductiontechnique.twofeatureselectionalgorithmsandtwoinstanceselectionalgorithmsareconductedonEclipse.GnomeandNetBcans.Foreachdataset.70%ofwordsand50%ofinstancesareremoved.Experimentalresultsshowthatthefina

8、ldatasetscanachievebetteraccuracythantheoriginalones.Fromtheexperimentalresultsoverthreeprojectdatasets,wefindthattheorderoffeatureselectionandinstanceselectionhasastrongimpactonthefinaltriageac

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。