资源描述:
《反馈式聚类算法的研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、华中科技大学硕士学位论文摘要聚类分析是数据分析的一种基本方法,既可以作为一种独立的数据挖掘工具,用来获得对数据分布情况的了解,也可以作为其他数据挖掘算法的预处理步骤。因此,在市场或客户细分、模式识别、生物学研究、空间数据分析、Web文档分类等方面具有广阔的应用前景,得到了国内外学者的广泛关注,取得了丰硕的研究成果。但是从目前的实际应用情况来看,大多数聚类算法均只考虑如何根据原始数据进行单向分析,应用效果不尽人意。针对国内外现有的聚类算法及其应用效果的不足,以传统的CURE算法为基础,提出了反馈式聚类算法。将基于聚类分析的结果数据反馈到聚类
2、分析阶段,根据反馈数据来调整聚类结果,且这个反馈过程是可不断循环求精的。在反馈式聚类算法中,创新性地提出了反馈集、反馈间关系集、结果集的概念,并对相关性质进行了研究。定义了反馈式聚类算法中结果集构建、结果集归并、初始聚类、聚类后处理的四个阶段,并给出了每个阶段的详细实现算法。利用MyEclipse开发工具,实现仿真系统,进行了仿真实验,从聚类结果准确性、异常数据检测率、时间复杂度三个方面进行测试分析,并与CURE算法进行了对比。最后,结合某电信运营商的分析型客户关系管理系统(试点数据集总数为20万),利用反馈式聚类算法对客户进行了细分。从
3、分析和应用的结果来看,反馈式聚类算法可以不断发现原有CRM系统中的数据质量问题,同时在聚类阶段就可将受到过度打扰的客户区分出来,使聚类结果的准确性得到了显著提高。关键词:聚类分析,反馈式聚类算法,客户关系管理I华中科技大学硕士学位论文AbstractClusteranalysisisoneofthebasicmethodsindataanalysis.Itcanbeusedasanindependentdataminingtoolstoobtainthedistributionofdatas,orasapretreatmentstepfo
4、rotherdataminingalgorithms.Therefore,ithasbroadprospectsinthedomainsofmarketorcustomersegmentation,patternrecognition,biology,spacedataanalysis,Webandotherdocumentsclassification,etc.Ithasbeenwidespreadconcernedbydomesticandforeignscholars,andfruitfulresearchresultshasach
5、ieved.However,conclusionfromthepracticalapplicationundercurrentsituationshowsthatmostclusteringalgorithmsconsideronlyhowtoconductaone-wayanalysisofrawdata,andtheeffectisoflittlesatisfaction.Basedonthis,firstofall,acomprehensiveanalysisoftheexistingclusteringalgorithmsandt
6、heirapplicationathomeandabroadismade,thentheirdeficienciesarepointedout.BasedonthetraditionalCUREalgorithm,theideaoffeedbackclusteringalgorithmisputforward,whichmeansfeedingtheresultdataofclusteranalysisbacktothetheinitialphaseofclusteranalysis,toadjusttheprocessofcluster
7、analysisbasedonfeedbackdata.Thisprocessofresultbacktotheclusteranalysisstageistobecontinuedforrefinement.Inthefeedbackclusteringalgorithm,conceptsoffeedbacksets,setsofrelationshipbetweentwofeedbacksetsandresultsetsareestablishedinnovatively,andtherelatedcharacteroftheseco
8、nceptsarestudied.Fourstepsofthefeedbackclusteringalgorithmaredefinedasresultsetsconstruction,res