反馈式聚类算法的研究论文

反馈式聚类算法的研究论文

ID:32350212

大小:1.18 MB

页数:57页

时间:2019-02-03

反馈式聚类算法的研究论文_第1页
反馈式聚类算法的研究论文_第2页
反馈式聚类算法的研究论文_第3页
反馈式聚类算法的研究论文_第4页
反馈式聚类算法的研究论文_第5页
资源描述:

《反馈式聚类算法的研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、华中科技大学硕士学位论文摘要聚类分析是数据分析的一种基本方法,既可以作为一种独立的数据挖掘工具,用来获得对数据分布情况的了解,也可以作为其他数据挖掘算法的预处理步骤。因此,在市场或客户细分、模式识别、生物学研究、空间数据分析、Web文档分类等方面具有广阔的应用前景,得到了国内外学者的广泛关注,取得了丰硕的研究成果。但是从目前的实际应用情况来看,大多数聚类算法均只考虑如何根据原始数据进行单向分析,应用效果不尽人意。针对国内外现有的聚类算法及其应用效果的不足,以传统的CURE算法为基础,提出了反馈式聚类算法。将基于聚类分析的结果数据反馈到聚类

2、分析阶段,根据反馈数据来调整聚类结果,且这个反馈过程是可不断循环求精的。在反馈式聚类算法中,创新性地提出了反馈集、反馈间关系集、结果集的概念,并对相关性质进行了研究。定义了反馈式聚类算法中结果集构建、结果集归并、初始聚类、聚类后处理的四个阶段,并给出了每个阶段的详细实现算法。利用MyEclipse开发工具,实现仿真系统,进行了仿真实验,从聚类结果准确性、异常数据检测率、时间复杂度三个方面进行测试分析,并与CURE算法进行了对比。最后,结合某电信运营商的分析型客户关系管理系统(试点数据集总数为20万),利用反馈式聚类算法对客户进行了细分。从

3、分析和应用的结果来看,反馈式聚类算法可以不断发现原有CRM系统中的数据质量问题,同时在聚类阶段就可将受到过度打扰的客户区分出来,使聚类结果的准确性得到了显著提高。关键词:聚类分析,反馈式聚类算法,客户关系管理I华中科技大学硕士学位论文AbstractClusteranalysisisoneofthebasicmethodsindataanalysis.Itcanbeusedasanindependentdataminingtoolstoobtainthedistributionofdatas,orasapretreatmentstepfo

4、rotherdataminingalgorithms.Therefore,ithasbroadprospectsinthedomainsofmarketorcustomersegmentation,patternrecognition,biology,spacedataanalysis,Webandotherdocumentsclassification,etc.Ithasbeenwidespreadconcernedbydomesticandforeignscholars,andfruitfulresearchresultshasach

5、ieved.However,conclusionfromthepracticalapplicationundercurrentsituationshowsthatmostclusteringalgorithmsconsideronlyhowtoconductaone-wayanalysisofrawdata,andtheeffectisoflittlesatisfaction.Basedonthis,firstofall,acomprehensiveanalysisoftheexistingclusteringalgorithmsandt

6、heirapplicationathomeandabroadismade,thentheirdeficienciesarepointedout.BasedonthetraditionalCUREalgorithm,theideaoffeedbackclusteringalgorithmisputforward,whichmeansfeedingtheresultdataofclusteranalysisbacktothetheinitialphaseofclusteranalysis,toadjusttheprocessofcluster

7、analysisbasedonfeedbackdata.Thisprocessofresultbacktotheclusteranalysisstageistobecontinuedforrefinement.Inthefeedbackclusteringalgorithm,conceptsoffeedbacksets,setsofrelationshipbetweentwofeedbacksetsandresultsetsareestablishedinnovatively,andtherelatedcharacteroftheseco

8、nceptsarestudied.Fourstepsofthefeedbackclusteringalgorithmaredefinedasresultsetsconstruction,res

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。