欢迎来到天天文库
浏览记录
ID:32474403
大小:5.04 MB
页数:80页
时间:2019-02-06
《聚类融合算法研究及其在电信中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、瀣巍大学酸:l:学位论文蒙类敲含算法磺究及其露电基中戆癍赐摘要聚类,作为数据挖掘技术研究的热点之一,受到了越来越多的关注。目前已有很多比较成熟的聚类算法,如K-means、K-medoids、BIRCH、CURE、DBSCAN、STING等。虽然其中有些算法已经得到广泛应用,但由于聚类分析算法对于数据集有诸多限制,’所以很难找到适合的方法迸行聚类分析。由此,聚类磁合算法应运焉生。2002年,聚类融合算法一经提出就得到广泛关注。实验证明,该方法能够得到比单一聚类算法更优的结果。但其自身并不成熟,仍存在许多问题,如关键参数设定、“软’’“硬’’聚类的融合、共识函数的设计及选择等。本
2、文新做工作如下:1.本文在深入了解聚类融合算法的基础上,重点考察了利用K-means算法产生聚类成员的聚类融合算法中各成员的聚类个数与最终融合质量的关系,并提出了一种改进算法以提高聚类融合的精确度。首先,根据聚类成员之阀存在差异度的思想,定义了一种差异度计算公式;其次,通过实验考察各个聚类成员的聚类个数与目标聚类个数的差值对融合结果的影响,制定了加权函数的计算公式。实验数据证明,改进算法在精确度方面谠予豢算法。2.电信中客户细分模型多用K-means算法来进行,但该方法在实际成用中存在许多问题:需要专业人员指定聚类个数并对结果做出经验判断、划分结果“过硬’’等。本文将聚类融合改
3、进算法号l入客户细分中,以某市电信公司小灵通业务数据挖掘为背景,针对客户通话、短信等行为属性特征进行客户细分。过程中使用聚类融合改进算法,能够有效解决上述问题并得出合理的聚类结果,弼时通过对Co-association矩阵的分析可以得到每个客户属予某一集群的概率,达到了“软化’’划分结果的豳的,使数据挖掘更智能化。关键词:数据挖掘、聚类、聚类融合、差异度、共识函数、电信、客户细分、数据预处理瀚江大学矮一}学使论文聚类融会算法礤究及其J谯逝焦孛戆疲愿AbstractClustering,asoneofthehotpointsofDataMiningResearch,becomes
4、anincreasinglyhottopic.Atpresent,manyclusteringalgorithmsareavailable,suchasK-means,K-medoids,BIRCH,CHRE,DBSCAN、STING,andSOon.Althoughsomeofthemhavebeenappliedwidely,itishardforpeopletofindsuitableclusteringalgorithmforaproperdataset,fortherealemanyrestricts.onthosedatasetsfromclustering.So,
5、clusteringensembleemergedasthetimesrequire.In2002,clusteringensemblealgorithmWasputtedforwardandsoongivenextensiveattention.Experimentsprovedthatthroughthismethodwecangetbetterresultthansingleclusteringalgorithm.Butthisalgorithmisfarfrommature,suchastheenactmentofsomekeyparameters,theensembl
6、ebetween‘soft’clustersand’hard’dusters,howtodesignandchoosetheconsensusfunctions,andSOon.Themainworksinthispaperaredescribedasfollows,1.Onthebasicofhavingstudiedclusteringensemblesthoroughly,byfocusingonreviewingtherelationshipsbetweennumbersofdustersineveryelustererandthequalityofthefinalre
7、sult,andanimprovedalgorithmtoimprovetheaccuracyofclusteringensemblewasmade.First,accordingtotheideathattherealediversitiesamongdusters,aformulatomeasurethisdiversityWasdefined;secondly,whetherthedifferencebetweennumbersofdustersofclusterersandtheta
此文档下载收益归作者所有