基于三支决策的代价敏感学习方法研究

基于三支决策的代价敏感学习方法研究

ID:35059473

大小:3.51 MB

页数:71页

时间:2019-03-17

基于三支决策的代价敏感学习方法研究_第1页
基于三支决策的代价敏感学习方法研究_第2页
基于三支决策的代价敏感学习方法研究_第3页
基于三支决策的代价敏感学习方法研究_第4页
基于三支决策的代价敏感学习方法研究_第5页
资源描述:

《基于三支决策的代价敏感学习方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、^’.::心V.,V*:'l暮'l,巧J‘'如.叫’‘^V义V龍茄I282。"‘学号誦、|,,;诗.苗咖导分类号TP18II苗谋扛i’'、l.种扼尖f.:’滅或f妻^硕±学位论文!(专业学位)或:’'、‘?.、、.'*?、、kr?.,;:;.心.‘?.;、-.:.'、.:游换乃基于兰支决策的代价敏感学习方法硏究弘辜'麵¥\安着营‘':;或雞誦載誦S禱:扑算化技术哮苗舞-专业学位领域:;专业学位类别:工程硕±.^备.,.’

2、7r{_->申请人:刘洋洋v.驅每.y指导毅师:徐久成教授,二胃、?叫-一、乐縣輸:':糾非‘、二〇-六辆月'罐審围?'-',.扣:'-.V渠.>、,、,立/>巧.‘或^;一.餐六批f;顏独彻性声明本人邦重声明:所呈交的学位论文是我个人在导师指导下进行的研巧工作及取得的研巧成果。尽我所知,除了文中特别加;?^1标注和致谢的地方外,论文中不包含其他人己经发表或撰写的研充成果,也不包含为获得河南师范大学或其他教育机构的学位或证书一所使用过的符料。与我同工作的同

3、志对本研究所做的任何贡巧均邑在论文中作T巧确的说明并表示了谢意。:签名:為_日巧车洋论文使用的关于授权说明本人完全了解河南师范大学有关保留、使用学位论文的规定,目P;有权保留并向送。口交论文的复印件和磁盘,允许论文被查阅和借阅本人授权河国家有关部或机构^i南师范大学可i^■将学位论文的全部或部分内容编入有关数据库进行检索,可处采用影。描、汇论(密论密、缩或扫等制手段保存编学位文保的学位文在解后适用本捏印印复)权书-."<1导师豁名;爲抑af?:期:70/6签名(^^^COST-SENS

4、ITIVELEARNINGMETHODRESEARCHBASEDONTHREE-WAYDECISIONADissertationSubmittedtotheGraduateSchoolofHenanNormalUniversityinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringByLiuYangyangSupervisor:Prof.XuJiuchengApril,2016摘要数据挖掘中的一个重要模型是分类模型,传统数据挖掘方法的目标是获得一个

5、分类精度尽可能高的分类器。但是在实际问题中,外部环境的各种不确定因素会导致决策不能顺利达到预期目标,进而带来决策风险代价,且分类模型中的误分类代价不尽相同,存在代价敏感性。完全避免决策失误是难以做到的,人们所期望的是使决策风险代价最小,而非期望利益最大化。追求决策知识与经验数据的严格一致性容易给决策者提供错误的决策信息,且忽略了决策者对预期风险的规避心理,已不适用于解决实际问题。三支决策将决策视为分类问题,与数据挖掘处理的问题模型相一致,建立了决策理论与数据挖掘方法之间的桥梁,其具有的误差容忍与代价敏感机制可以使传统的数据挖掘方法在分

6、类中对不同代价的误分类结果具有区分性与敏感性,以做出风险损失最低的分类结果。针对一般的数据挖掘模型仅仅寻求分类器的精度,不能根据人们的期望处理现实中的决策问题,本文将三支决策用于传统的数据挖掘方法中,构建了基于三支决策的代价敏感学习方法,使传统的数据挖掘方法更好地适应具有代价敏感性的实际问题。本文主要研究内容如下:(1)针对典型的支持向量机增量学习算法对有价值的非支持向量的忽略,以及一般的支持向量机增量学习算法尽可能提升分类精度的客观性,利用三支决策的代价敏感性和边界域构建了一种新的支持向量机增量学习算法。该算法首先根据支持向量机的学

7、习原理来度量三支决策中的条件概率;然后采用三支决策划分出边界域,并基于支持向量机对其与新增样本、原支持向量的并集进行分类;最后,通过实验证明,该方法不仅能够筛选出有价值的非支持向量进而提高分类的精确性,而且使支持向量机增量学习方法更适合于具有代价敏感性的实际问题,并使三支决策中条件概率的构建方式更切合于具体学习环境。(2)针对现有的涉及k近邻的top-n离群点检测算法通常依赖于参数k,n,但用户却很难确定合适的参数值,基于三支决策的三支语义提出了一种基于三支决策的代价敏感离群点检测方法。该方法首先采用k近邻来度量三支决策的条件概率;其

8、次,构建使决策代价最小的最优化问题来自适应地寻找最优条件概率;然后,采用三支决策递归地I划分离群点;最后,通过实验证明,该方法不仅使条件概率的度量方法适用于离群点检测问题,而且可以在不需要用户参与的前提下自动地检测离群点

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。