面向不平衡数据集的分类算法研究

面向不平衡数据集的分类算法研究

ID:35101964

大小:3.16 MB

页数:45页

时间:2019-03-17

面向不平衡数据集的分类算法研究_第1页
面向不平衡数据集的分类算法研究_第2页
面向不平衡数据集的分类算法研究_第3页
面向不平衡数据集的分类算法研究_第4页
面向不平衡数据集的分类算法研究_第5页
资源描述:

《面向不平衡数据集的分类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、.....勉曙纖缕姉馨國賺麵‘'1:.:;啤爾議雞.選酿:麵導鱗r參.’.:‘.^-‘.痴.苦這:i..:熟;^.:々\5歡韦夺‘苗一、‘L'"如.分类号:;;请学校代码单鴻诗:10165次把;這密级03000685:;^片学号;2111;;、、,%■語^’、::y:’..傅.>、、‘-.、’、?、,i、■'V:,,,堤璃親t掉遠掌師範乂學麵i讓躁‘拳’‘第二魏:掛鑛雜C式權奪扇,一‘'■.、‘、I1、-^、:'VJy硕±学位论豪iH..胃睡f胃'、|。胃’<-捧哈:,呼气滋夺'

2、'巧乂月拍沁':.^:背:^、-弘.V銷說试.;\\,碱;’.巧"一难碱P唉义,41;.:^..,專;細讀|||錢禁;'''。'、''踐和、^:?'碟誠覆祿苗点'。-‘'、。^->々.-.识,.;错咕兔;.;皋識鮮贪辉,:面向不平衡数据集的分美算法研究3窜學每.、纖品巧V、:技避輕"'P一‘、’'.:’-..—苗..^、-―二奔^v;:.t;A..’二4P.'、..,:节',\斬?.沪>〇;;共公;古;,..'户冷-满.:讀'神'片一纖Vikv妍、、皆作者姓名;安徐雨雨一戚遲茲黯屬'.t、:计算数学;難学科专业骄"满;纖賴孰

3、研究模式识别与计算机、方向:?笔凉拉,品"、'‘图形图像处理>转',!声著寅5'V.师姓名;闺德勤教授..;戳导#.'■""■",■■-产、‘,、w'‘—.’咕一^.■-、'一>子J,瑞W'沒;卢伊:>,、义,;啤、'.‘:^'心、-續矜齡%磯:i、;、7择巧斯知-、抑巧辩>—'■.寺‘'.V^,.,,'、、.-r、'.、w.JVr.>;’iK;v‘.. ̄、、別化店-S啼\VV'...^.:Y.::,、‘乂,V、.V\、V.分类号:学校代码:10

4、165密级:学号:201311000685硕士学位论文面向不平衡数据集的分类算法研究作者姓名:徐丽丽学科、专业:计算数学研究方向:模式识别与计算机图形图像处理导师姓名:闫德勤教授2016年5月学位论文独创性声明本人承诺:所呈交的学位论文是本人在导师指导下所取得的研巧成果L:U示注。论文中除特别加和致谢的地方外,不包含他人和其他机构己经撰写或发表过的研究成果,其他同志的研究成果对本人的启示和所提供的帮助,均己在论文中做了明确的声明并表示谢意。学位论文作者签名:徐加碱学位论文販权的使用授权书本学位论文作者完全了解迂宁师范大学有关保留、使用学位论文的规定,及学校有

5、权保留并向国家有关部n或机构送交复印件或磁盘,允许论文被查阅和借阅。本文授权迂宁师范大学,可W将学位论文的全部或部分内容编入有关数据库并进行检索,可レッ采用影印、缩印或扫描等复制手段保存、汇编学位论文,并且本人电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后使用本授权书。学位论文作者签名:娩苗指导教师签名:签名日期:年Jr月^日辽宁师范大学硕士学位论文摘要人们挖掘和找到更多的数据信息的能力越高,在各个领域中累积的数据就越多,其中不乏有平衡数据集和不平衡数据集。因此这就需要人们采取有效的方法来处理这些大数据,从中找到它们的规律,有效利用它们蕴

6、含的信息。处理数据最重要的工作之一就是数据的分类,所谓数据的分类是指分析和研究已有的数据集,并在该数据集中找出隐含在其中的信息和规律,然后预测未知数据集的类别。经典的数据分类方法,如支持向量机、极限学习机等,对于平衡数据集的分类已得到了令人满意的结果。但是在实际应用中,使用的数据集通常是不均衡的。已有的分类方法没有关注数据的类别分布不均衡这个情况,导致分类的结果不尽人意。因此,我们需要改进现有的算法或者是设计新算法以减少数据类别分布的不均衡对分类效果的影响。针对传统的分类算法对不平衡数据集中的少数类数据分类准确率低的问题,基于极限学习机和支持向量机,本文主要从以下两个方面进行研究:(

7、1)在数据层面,基于聚类和欠采样,提出改进的极限学习机(FCM-ELM)。提出的方法通过聚类分析,将训练集的负类数据分成不同的簇,然后按规定的采样率在各簇中进行欠采样,用选择出的数据组成新的负类数据集,进而使训练集正、负类数据的个数趋于均衡。对比分析实验结果,提出的方法有效地减少了数据的不均衡分布对分类的正确率的干扰,得到了更好的分类效果。(2)在算法层面,结合支持向量机和聚类,提出加权集成学习算法(FCM-ENW-SVM)。首先提出模型——加权支持向量机

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。