面向数据流模糊聚类算法的应用研究

面向数据流模糊聚类算法的应用研究

ID:35102132

大小:3.56 MB

页数:61页

时间:2019-03-17

面向数据流模糊聚类算法的应用研究_第1页
面向数据流模糊聚类算法的应用研究_第2页
面向数据流模糊聚类算法的应用研究_第3页
面向数据流模糊聚类算法的应用研究_第4页
面向数据流模糊聚类算法的应用研究_第5页
资源描述:

《面向数据流模糊聚类算法的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、..'o"’-I单位代码:10293密级:公开.;一…:扭'硕女《健化戈,却若I藝论文题目:面向数据流模糊聚类算法的应用研究1013041206学号姓名陈小东导师孙力娟教授学科专业计算机应用技乂硏究方向■数据挖掘工学硕±申请学位类别论文提交二零一六年王月日期.''巧斬\^.,;:iv心,'某h;知A一,'‘':-南京邮电大学学位论文原创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研巧工作及取得的研巧成果。尽我所知,li除了文中特别加U示注

2、和致谢的地方外,论文中不包含其他人已经发表或撰写过的研巧成果,也不包含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。一,切相关的法律责任本人学位论文及涉及相关资料若有不实愿意承担。水日期.研巧生签名:货:tU电南京邮电大学学位论文使用授权声明本人授权南京邮电大学可レッ保留并向国家有关部口或机构送交论文的复印件和电子文搭;允许论文被查阅和借阅;可W将学位论文的全部或部分内容编入有关数据库进行检索;可1^^采用影印、缩印或扫描等复制手段保存、汇编本学位论文

3、。本文电子文档的内容和纸质一论文的内容相致。论文的(包括登)授权南京邮电大学巧生院办理。公布刊研适。论用涉密学位文在解密后本授权书研生签;、如;:名故导签名日期究师?ResearchonFuzzyClusteringAlgorithmforDataStreamThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfortheDegreeofMasterofEngineeringByXiaodongChenSupervisor:Prof.LijuanSunMarch2016摘要作为数据挖掘技术

4、的研究前沿,数据流具有实时连续、高速到达以及动态变化等特点,在如无线传感器网络、金融分析市场、网络入侵检测等众多领域都扮演着十分重要的角色。聚类分析作为数据挖掘技术的主要组成部分之一,旨在发现数据中隐藏的簇类知识信息,为用户做出正确的决策提供理论指导。概念漂移检测作为数据流研究中不可避免的问题之一,主要是期望发现数据流模型何时以及因何原因发生变化,从而达到预测数据流趋势的目的。当前的聚类算法主要是在整个数据集上展开的,很难直接应用于数据流上,因此迫切需要设计出可以处理数据流的聚类及概念漂移检测算法。本文针对数据流聚类算法的研究主要分为以下三点:首先通过分析国内外的相关文献,对数

5、据流的研究现状和不足之处进行了综述;其次针对数据流上的聚类任务受到时间和空间限制的问题,本文提出了一种新的数据流模糊聚类算法WeightDecayStreamingMicroClustering(WDSMC)。该算法使用改进的带权值的模糊C均值算法作为基准聚类算法,并采用微簇结构和权值衰减结构提高聚类质量。实验表明,相比于SWFCM算法和StreamKM++算法,WDSMC算法具有更好的聚类精度;最后本文对数据流中可能会出现的概念漂移现象,提出了在大小可变的滑动窗口中通过度量相邻窗口之间的聚类差异性来判断是否发生了概念漂移并提供相应的解决方案。实验表明算法能够有效地检测出数据流

6、中的概念漂移现象,具有很好的聚类效果和很高的时间效率。关键词:数据流,模糊C均值聚类,权值衰减,概念漂移,可变滑动窗口IAbstractAsaresearchfrontofdatamining,withthecharacteristicsofcontinuetimelyarrivedatahighspeedanddynamicchanged,datastreamhasplayedanimportantroleinmanyfiled,suchaswirelesssenornetwork,financialanalysismarket,networkintrusiondetecti

7、onandsoon.Asamainlypartofdatamining,clusteringanalysiscandiscoveryclustermodelsindata,andhelpuserstomarkaccuratedecisions.Asoneofdatastreamresearches,conceptdriftdetectionisusefultofigureoutwhenandwhydatadistributemodelchanged,andhelptopredictthetr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。