缺陷追踪系统数据质量问题

缺陷追踪系统数据质量问题

ID:22571294

大小:584.00 KB

页数:17页

时间:2018-10-30

缺陷追踪系统数据质量问题_第1页
缺陷追踪系统数据质量问题_第2页
缺陷追踪系统数据质量问题_第3页
缺陷追踪系统数据质量问题_第4页
缺陷追踪系统数据质量问题_第5页
资源描述:

《缺陷追踪系统数据质量问题》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、缺陷追踪系统数据质量问题信息科学技术学院13级秦汉民摘要:缺陷追踪系统是软件开发人员管理,维护已知软件缺陷的工具,记录缺陷报告的基本信息以及用户对其操作的历史信息。缺陷追踪系统的数据可能存在质量问题,影响开发实践和相关研究。以摘要为例,摘要是对缺陷报告的简短描述,在缺陷报告的重现和修复以及重复报告检测的过程中发挥着重要作用。在缺陷报告的生命周期,摘要经常被改变。考虑到大部分改变是为了得到更好的摘要,本文认为改变后的摘要质量高于改变前的摘要。本文使用著名开源社区Mozilla和Eclipse的数据进行研究。首先,本文发

2、现摘要的质量影响开源社区重复报告检测的能力。本文通过重现重复报告检测的相关研究,不仅说明以高质量的当前摘要(改变后的摘要)替换低质量的原始摘要(改变前的摘要)作为输入时,模型的结果显著提升,而且说明而且说明部分研究者错误地使用高质量的数据,得到过分乐观的结果。然后,本文总结摘要变化的两大原因:与表述相关的变化和与内容相关的变化。其中与内容相关的变化主要包括与内容标签部分相关的变化和与内容主体部分相关的变化。最后,本文对贡献者和开源社区书写摘要提出以下建议:避免低级错误,规范标签使用以及提供具体信息,并且针对这些建议提

3、出可能的解决方案。正文:第一章:相关背景本章首先介绍缺陷追踪系统以及缺陷报告的生命周期。然后,本章介绍本文的研究对象以及数据的基本信息。1.1缺陷追踪系统缺陷追踪系统(issuetracingsystem)是软件开发人员管理,维护已知软件缺陷的工具,使用者可以通过缺陷追踪系统创建缺陷报告,更新缺陷报告,并且修复相关缺陷。目前广泛使用的缺陷追踪系统包括Bugzilla,Jira等,不同的缺陷追踪系统的界面和功能大致相同。对于一条缺陷报告,缺陷追踪系统记录其基本信息以及用户对其操作的历史信息。基本信息主要包括缺陷报告的标

4、识,缺陷报告的创建时间,缺陷报告的摘要(summary),以及缺陷报告的描述(description)等。历史信息记录缺陷报告基本信息的修改,主要由修改前的值,修改后的值,修改时间,修改人构成。图1展示缺陷追踪系统Bugzilla中缺陷报告的基本信息,图2展示缺陷追踪系统Bugzilla中缺陷报告的历史信息。在缺陷报告的基本信息中,摘要是非常重要的信息。摘要是对缺陷报告的简短描述,常被用于检测重复报告以及搜索缺陷报告,图3展示Mozilla社区重复报告检测界面(上)以及缺陷报告搜索界面(下),可以发现,摘要是需要输入

5、的重要信息。另外,在诸如重复报告检测(duplicatedetection),缺陷定位(buglocalization)等研究领域中,摘要同样是重要的输入变量。图1:缺陷追踪系统Bugzilla中缺陷报告的基本信息图2:缺陷追踪系统Bugzilla中缺陷报告的历史信息图3:Mozilla社区重复报告检测界面及缺陷报告搜索界面1.2缺陷报告生命周期缺陷报告的生命周期需要经历若干状态,图4展示缺陷报告的典型生命周期。当缺陷报告进入缺陷追踪系统时,状态被标注为UNCONFIRMED。经过triage流程,缺陷报告的相关信息

6、被填充,状态被标注为NEW。当特定开发者开始处理缺陷报告时,缺陷报告的状态被标注为ASSIGNED。当缺陷修复完成时,缺陷报告的状态被标注为RESOLVED,结果被标注为FIXED。缺陷报告的结果还可能是DUPLICATE,INCOMPLETE等,DUPLICATE说明缺陷报告和已经存在的缺陷报告重复,IMCOMPLETE说明缺陷报告缺乏必要的信息进行重现和修复。在特定情况下,缺陷报告的状态可能被标注为REOPEN,这说明相关缺陷需要进一步的处理。在缺陷报告的生命周期,缺陷报告的基本信息可能被改变。与其他信息相比,摘

7、要的改变尤其频繁。考虑到大部分改变是为了得到更好的摘要,本文认为改变后的摘要质量高于改变前的摘要。图4:缺陷报告的典型生命周期1.3本文研究对象本文的研究对象主要包括Mozilla社区和Eclipse社区两个开源社区,两个社区均使用Bugzilla作为缺陷追踪系统。本文使用的数据包括Mozilla社区3个时间点(2012年,2013年,2016年)采集的数据和Eclipse社区1个时间点(2011年)采集的数据,其中Mozilla社区2012年和2013年的数据仅用作第2章的实验参照,表1展示数据的基本信息。Name

8、Author#ofissuesLastreporttimeMozilla2016MozillaCommunity11605992016-03-0313:08:06Mozilla2013MozillaCommunity7748092013-01-0109:58:15Mozilla2012Zhouetal.7093852012-05-0104:24

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。