改进的软件错误报告自动分类算法.pdf

改进的软件错误报告自动分类算法.pdf

ID:55314951

大小:344.42 KB

页数:5页

时间:2020-05-14

改进的软件错误报告自动分类算法.pdf_第1页
改进的软件错误报告自动分类算法.pdf_第2页
改进的软件错误报告自动分类算法.pdf_第3页
改进的软件错误报告自动分类算法.pdf_第4页
改进的软件错误报告自动分类算法.pdf_第5页
资源描述:

《改进的软件错误报告自动分类算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第41卷第6期计算机工程2015年6月VO1.41NO.6ComputerEngineeringJune2015·人工智能及识别技术·文章编号:1000-3428(2015)06.0183.05文献标识码:A中图分类号:TP311改进的软件错误报告自动分类算法黄伟,林劫,江育娥,江秉华(1.福建师范大学软件学院,福州350108;2.南京医科大学病理学系,南京210029)摘要:软件错误报告的自动分类能够节省大量人力和时间,然而用户提交的错误报告主观性较强,对错误报告的描述较随意,造成自动分类的效率低下。为此,基于传统的词频一逆向文件频率(TF—IDF)算法,结合文档内词条频度与词条在同类

2、别及不同类别文档中的分布情况,提出2种特征降维的改进算法,降维后再对词条进行权值处理,进一步提高特征降维的效果。实验结果表明,应用该算法得到的错误报告自动分类在精确率、召回率、F1值和准确度等指标上比现有算法都有明显提高。关键词:特征降维;错误报告;文本自动分类;词频一逆向文件频率;特征权重;频率中文引用格式:黄伟,林劫,江育娥,等.改进的软件错误报告自动分类算法[J].计算机工程,2015,41(6):183一l87.英文引用格式:HuangWei,LinJie,JiangYu’e,eta1.ImprovedAutomaticClassificationAlgorithmofSoftwa

3、reBugReport[J].ComputerEngineering,2015,41(6):183—187.ImprovedAutomaticClassificationAlgorithmofSoftwareBugReportHUANGWei’LINJie,JIANGYu’e,JIANGBinhua,(1.FacultyofSoftware,FujianNormalUniversity,Fuzhou350108,China;2.DepartmentofPathology,NanjingMedicalUniversity,Nanjing210029,China)【Abstract】Autom

4、aticclassificationofsoftwarebugreportssavealargenumberoftimeandhumanresources.However,thebugreportssubmittedbyusershaveastrongsubjectivity,withcasualtextdescriptions.Thisresultsinineffectiveclassification.Twoimprovedalgorithmsareproposedtoreducefeaturedimensionsinclassifyingbugreportsfromtheirtext

5、descriptions.ThesetwoalgorithmsarebasedonthetraditionalTermFrequency—InverseDocumentFrequency(TF—IDF)algorithm,combinedwiththetermfrequencyindocumentationsandthedistributionoftheterminthesamecategoryanddifferenttypesofcategories.Oneweightprocessingisusedafterfeaturedimensionreductioninordertogetab

6、etterresult.Experimentalresultsindicatethattheproposedalgorithmhasbetterperformanceintermofprecision,recall,F1score,andaccuracythanthecurrentalgorithms.【Keywords】featuredimensionreduction;bugreport;textautomaticclassification;TermFrequency—InverseDocumentFrequency(TF—IDF);featureweight;frequencyD0

7、I:10.3969/i.issn.1000—3428.2015.06.033新提交的错误报告进行归类,以分配给合适的开发1概述人员,这就能够提高软件错误修复的效率。同时,由开源软件的用户提交的错误报告对改进软件、于用户提交的错误报告主观性比较强,特别是提交提高软件质量起着关键作用。在理想情况下,一人对错误的描述有较强的随意性,因此错误报告的个错误应该在最短时间内分配给能够最快修复它的自动分类难度又加深了一层。开发人员。据

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。