基于Weka平台的改进模糊C均值聚类算法研究与应用

基于Weka平台的改进模糊C均值聚类算法研究与应用

ID:36689482

大小:9.87 MB

页数:70页

时间:2019-05-13

基于Weka平台的改进模糊C均值聚类算法研究与应用_第1页
基于Weka平台的改进模糊C均值聚类算法研究与应用_第2页
基于Weka平台的改进模糊C均值聚类算法研究与应用_第3页
基于Weka平台的改进模糊C均值聚类算法研究与应用_第4页
基于Weka平台的改进模糊C均值聚类算法研究与应用_第5页
资源描述:

《基于Weka平台的改进模糊C均值聚类算法研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、声明本人郑重声明:所呈交的学位论文,是本人在指导教师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含其他个人或集体己经发表或撰写过的科研成果。对本文的研究做出重要贡献的个人和集体,均己在文中以明确方式标明。本声明的法律责任由本人承担。论文作者签名:垫垫益日期:汐廖.‘.争关于学位论文使用权的说明本人完全了解太原理工大学有关保管、使用学位论文的规定,其中包括:(D学校有权保管、并向有关部门送交学位论文的原件与复印件;②学校可以采用影印、缩印或其它子复制手段复制并保存学位论文;

2、③学校可允许学位论文被查阅或借阅;④学校可以学术交流为目的,复制赠送和交换学位论文;(D学校可以公布学位论文的全部或部分内容(保密学位论文在解密后遵守此规定)。作者签名:鱼垫垡日期:导师签名:刀J弓、6,年日期:矽丛垒:丫太原理工大学硕士研究生学位论文基于Weka平台的改进模糊C均值聚类算法研究与应用摘要数据挖掘是从大量数据资源中获取有用信息和知识资源的方法。聚类算法是数据挖掘算法中被广泛使用和研究的算法之一,其中模糊C均值聚类算法利用模糊理论根据隶属度来划分实例属于哪个类别,对待聚类数据的分析更加客

3、观。本文分析研究了模糊C均值聚类算法,该算法简单且聚类性能较好,但是对初始值较敏感,容易使算法陷入局部极小值,而得不到全局最优,不但迭代次数会增加,而且最终容易导致聚类失败。针对模糊C均值聚类算法存在的这种问题,提出了一种基于实例密度的模糊C均值聚类算法,使类中心更加接近实际聚类中心,减少了迭代次数,提高了聚类效果。通过在模拟数据集和UCI数据集上进行实验,验证了改进后算法的有效性。系统功能丰富、操作简便、基于Java语言的开源数据挖掘工具Weka倍受数据挖掘研究者的关注。但是Weka在聚类方面集成算

4、法较少,因此,针对Weka系统的开发环境结构、接口规范、添加新算法的具体方法及实现步骤进行研究,对其进行二次开发,实现了层次聚类算法SmipleChameleon算法、模糊C均值聚类算法以及改进后的模糊C均值聚类算法。为了进一步验证改进后算法的有效性,本文将改进后算法应用于社会保险审计数据中。通过对社会保险审计数据进行分析研究,根据其数据具有数据量大、缴费类型多以及存在冗余数据的特点,对数据进行数据合并和属性选择等预处理,将传统模糊C均值聚类算法及改进后算法针对每个地区的四个聚类目的进行对比实验。通过

5、分析实验结果,得出改进后算法减少了迭代次数的同时提高了聚类效果,再次验证了改进后算法的有效性。关键词:Weka平台,模糊C均值聚类算法,实例密度,社会保险审计太原理工大学硕士研究生学位论文II太原理工大学硕士研究生学位论文RESEARCHANDAPPLICATl0NOFIMPRoVEDFUZZYC.MEANSCLUSTERINGALGORITHMBASEDONⅥ厂EKAPLArFORMABSTRACTDataminingisamethodtoobtainusefulinformationandknow

6、ledgeresourcesfromlargeamountsofdataresources.TheclusteringalgorithmiswidelyusedandstudiedinDataminingalgorithms.ThefuzzyC-meansclusteringalgorithmusingfuzzytheoryisclassifiedaccordingtothedegreeofmembershipinstancebelongstowhichcategory,treatclustering

7、dataanalysismoreobjective.ThepaperanalyzedthefuzzyC-meansclusteringalgorithm,thefuzzyC-meansclusteringalgorithmissimpleandhasgoodperformance,butmoresensitivetoinitialvalues,easytomakethealgorithmfallintothelocalminimumandnotglobaloptimum,notonlythenumbe

8、rofiterationsincreases,buteventuallyeasilycausethefailureofclustering.InviewoftherequirementofthefuzzyC-meansclusteringalgorithm,thepaperproposesafuzzyC—meansclusteringalgorithmbasedondensityofinstances,theclusteringcenterisclose

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。