代价敏感主动学习与多分类不平衡学习方法的研究

代价敏感主动学习与多分类不平衡学习方法的研究

ID:37331261

大小:5.42 MB

页数:61页

时间:2019-05-21

代价敏感主动学习与多分类不平衡学习方法的研究_第1页
代价敏感主动学习与多分类不平衡学习方法的研究_第2页
代价敏感主动学习与多分类不平衡学习方法的研究_第3页
代价敏感主动学习与多分类不平衡学习方法的研究_第4页
代价敏感主动学习与多分类不平衡学习方法的研究_第5页
资源描述:

《代价敏感主动学习与多分类不平衡学习方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、南京大学研究生毕业论文代价敏感主动学习与多分类不平衡学习方法的研究ResearchonCost—sensitiveActivelearningandMulti—classImbalancelearning南京大学计算机科学与技术系导师:周志华教授二。一一年五月南京大学研究生毕业论文在真实世界的问题中,不同类型的错误往往具有不同的代价,不同类别的样本的数目往往显著不同,因此,代价敏感学>--J幂n类别不平衡学匐受到了机器学习与数据挖掘领域国内外研究者的关注。本文对此进行研究,主要做了以下工作:1.提出一种代价敏感主动学习方法CosBAQ。真实世界问题中经常存在大量未标记样本,

2、且其标记查询代价往往不同,本文同时考虑误分类代价和样本标记查询代价,在标记查询总代价约束下,通过选择对降低误分类代价最有帮助的样本进行查询,可以有效地利用有限查询资源降低总误分代价。实验证明CosBAQ方法可以在标记查询总代价的约束下,高效的确定需要标记的样本,有效的降低了总误分代价。2.提出一种基于HDDT的多分类不平衡决策树集成学习方法HDDT-E。以往的类别不平衡学习大多集中研究二分类问题,而实际生活中的数据集往往存在多分类的要求。本文采用对二分类不平衡问题具有很好效果的HDDT作为集成算法的基分类器,实验证明,该方法可以有效的对多分类不平衡问题进行学习。关键词:机器

3、学习;代价敏感学习;类别不平衡学习;主动学习;多分类南京大学研究生毕业论文Inrealworldproblems,differentmisclassificationcostandthenumberofexamplesfronlalwaysinducestodifferentclassalwaysvariessignificantly.Therefore,cost-sensitivelearningandclass-imbalancelearninghasreceivedmuchattentionofmachinelearninganddataminingcommunity

4、.Thisthesisfocusesonextendingcost-sensitivelearningandclass—imbalancelearningtosolvemorecomplexrealworldapplications.Indetail,maininnovativecontributionsofthisthesiscanbesummarizedasfollows:1.Proposeacost-sensitiveactivelearningmethod:CosBAQ.Thereishugenumberofunlabeleddataintherealworldan

5、dthequerycostofthemiSdifferent.Weconsidermisclassificationcostandquerycostsimultaneously.Withthelimitationoftotalquerycost,weselecttheunlabeleddatawhichiSmosthelpfulforreducingtotalmisclassificationcostforquery.EmpiricalstudiesonrealworldapplicationsdemonstratethattheproposedmethodiSe仃ecti

6、veandefficient.2.Proposeamulti-classimbalancelearningmethod:HDDT-E.Mostofpreviousresearchaboutclass-imbalancelearningfocusesonbinaryclassproblemwhilemanydatasetsaremulti.classinrealworld.WeuseHDDTwhichworkswellonbinaryclassproblemasthebaseclassifieroftheensemblemethod.EmpiricalstudiesOHUCI

7、datasetshowthatsuchHDDT-Eperformsbetterthanmulti-classrescalingmethods.酾酾酾蝴s:Machinelearning;Cost-sensitivelearning;Class—imbalancelearning;Activelearning;Multi-classlearning南京大学研究生毕业论文目录第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.31.1引言⋯⋯⋯⋯⋯⋯⋯1.2研究背景⋯⋯⋯⋯⋯⋯

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。