欢迎来到天天文库
浏览记录
ID:55314951
大小:344.42 KB
页数:5页
时间:2020-05-14
《改进的软件错误报告自动分类算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第41卷第6期计算机工程2015年6月VO1.41NO.6ComputerEngineeringJune2015·人工智能及识别技术·文章编号:1000-3428(2015)06.0183.05文献标识码:A中图分类号:TP311改进的软件错误报告自动分类算法黄伟,林劫,江育娥,江秉华(1.福建师范大学软件学院,福州350108;2.南京医科大学病理学系,南京210029)摘要:软件错误报告的自动分类能够节省大量人力和时间,然而用户提交的错误报告主观性较强,对错误报告的描述较随意,造成自动分类的效率低下。为此,基于传统的词频一逆向文件频率(TF—IDF)算法,结合文档内词条频度与词条在同类
2、别及不同类别文档中的分布情况,提出2种特征降维的改进算法,降维后再对词条进行权值处理,进一步提高特征降维的效果。实验结果表明,应用该算法得到的错误报告自动分类在精确率、召回率、F1值和准确度等指标上比现有算法都有明显提高。关键词:特征降维;错误报告;文本自动分类;词频一逆向文件频率;特征权重;频率中文引用格式:黄伟,林劫,江育娥,等.改进的软件错误报告自动分类算法[J].计算机工程,2015,41(6):183一l87.英文引用格式:HuangWei,LinJie,JiangYu’e,eta1.ImprovedAutomaticClassificationAlgorithmofSoftwa
3、reBugReport[J].ComputerEngineering,2015,41(6):183—187.ImprovedAutomaticClassificationAlgorithmofSoftwareBugReportHUANGWei’LINJie,JIANGYu’e,JIANGBinhua,(1.FacultyofSoftware,FujianNormalUniversity,Fuzhou350108,China;2.DepartmentofPathology,NanjingMedicalUniversity,Nanjing210029,China)【Abstract】Autom
4、aticclassificationofsoftwarebugreportssavealargenumberoftimeandhumanresources.However,thebugreportssubmittedbyusershaveastrongsubjectivity,withcasualtextdescriptions.Thisresultsinineffectiveclassification.Twoimprovedalgorithmsareproposedtoreducefeaturedimensionsinclassifyingbugreportsfromtheirtext
5、descriptions.ThesetwoalgorithmsarebasedonthetraditionalTermFrequency—InverseDocumentFrequency(TF—IDF)algorithm,combinedwiththetermfrequencyindocumentationsandthedistributionoftheterminthesamecategoryanddifferenttypesofcategories.Oneweightprocessingisusedafterfeaturedimensionreductioninordertogetab
6、etterresult.Experimentalresultsindicatethattheproposedalgorithmhasbetterperformanceintermofprecision,recall,F1score,andaccuracythanthecurrentalgorithms.【Keywords】featuredimensionreduction;bugreport;textautomaticclassification;TermFrequency—InverseDocumentFrequency(TF—IDF);featureweight;frequencyD0
7、I:10.3969/i.issn.1000—3428.2015.06.033新提交的错误报告进行归类,以分配给合适的开发1概述人员,这就能够提高软件错误修复的效率。同时,由开源软件的用户提交的错误报告对改进软件、于用户提交的错误报告主观性比较强,特别是提交提高软件质量起着关键作用。在理想情况下,一人对错误的描述有较强的随意性,因此错误报告的个错误应该在最短时间内分配给能够最快修复它的自动分类难度又加深了一层。开发人员。据
此文档下载收益归作者所有