基于主动学习bug自动分配

基于主动学习bug自动分配

ID:32420272

大小:2.41 MB

页数:54页

时间:2019-02-04

基于主动学习bug自动分配_第1页
基于主动学习bug自动分配_第2页
基于主动学习bug自动分配_第3页
基于主动学习bug自动分配_第4页
基于主动学习bug自动分配_第5页
资源描述:

《基于主动学习bug自动分配》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、1Y1111Ill2lllIll411111111IJlLl7IIl5IIlll6111ILl2IIlllY2417562..大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题

2、目:基王圭边堂翌鲍鱼坠g自边佥壅作者签名:菱函4日期:立Qf三年—厶月—L日大连理工大学专业学位硕士学位论文摘要软件bug分配是指将用户提交的bug安排给对应的开发人员进行修复的过程。通常bug分配是基于用户提交的bug描述信息,由专人手动将bug安排给开发人员的。在大型的开源项目中,如Mozilla和Eclipse,bug分配正在越来越多的占用开发人员的时间和资源。本文通过分析,发现已有的bug分配方法存在的以下两个问题:(1)由于每日提交的bug数目巨大,而且人的知识不足,传统的人工分配不仅

3、耗费大量的资金和时间。(2)使用自动化方法的bug分配,面临标记成本昂贵的问题。建立模型需要大量带有标记的bug,才能保证准确率。本文提出基于主动学习的bug自动分配算法。该算法从机器学习的角度对bug报告进行分析,将bug的修复者作为bug的类,选取各类别bug描述信息作为训练集,建立朴素贝叶斯模型。同时使用评委会主动学习的方法,在分类过程中,选择争议最大的bug请求其类别,进行自主学习,然后再对bug进行分配。本文的实验对大型开源项目Eclipse的bug仓库中的186774条bug进行基于

4、主动学习的自动分配。首先用l%的训练数据训练三个基于朴素贝叶斯的分类模型,三个分类器对测试集中的bug进行投票;然后选出熵最大的bug,请求其真实标签,加入训练集,并重新训练分类器;最后再对测试集中的数据进行分配。实验结果表明,基于主动学习的bug自动分配算法在进行bug分配时平均每秒分配4.1条,初始训练集在1%的情况下,主动学习最终达到25.541%的较好的分类效果。关键词:bug自动分配;主动学习;朴素贝叶斯;评委会主动学习方法基于主动学习的bug自动分配AutomaticBugTriag

5、eBasedonActiveLearningAbstractSoftwarebugtriageisaprocesstoassignanewlysubmittedbugtoitscorrespondingdeveloper,whoshouldfixthebug.Inbugtriage,expertdevelopersmanuallyassignbugstotheirdevelopersbasedonthesubmitteddescriptionbyusers.Inlargeopensourcepr

6、ojects,suchasMozillaandEclipse,moreandmoretimeandresourcesofdevelopersareoccupiedbybugtriage.珊sthesisanalyzesexistingbugtriagemethodsandfindsoutthefollowingtwoissues:(1)Intraditionalmanualtriage,thenumberofsubmittedbugperdayislarge.Sincedevelopersare

7、alwayslackofcorrespondingknowledge,manualtriagewillcostagreatamountofmoneyandtime.(2)Inautomatictriagemethods,labelingcostisveryexpensive.Toensuretheaccuracyofbuildingacategorizationmodel,alargeamountoflabeledbugsareneeded.Inthispaper,anautomaticbugt

8、riageapproachbasedonactivelearningisproposed.T11isapproachanalyzesbugreportsfromtheperspectiveofmachinelearning.Basedonbuildingatrainingsetwitllthedescriptionofbugs,developersaremappedontobugcategoriesandaNaiveBayesianmodelisestablished.Meanwhile,the

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。