资源描述:
《距离修正模糊c均值聚类算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、距离修正的模糊C均值聚类算法摘要:经典的模糊c均值算法基于欧氏距离,存在等划分趋势的缺陷,分错率较高,只适用于球形结构的聚类。针对这一问题,利用数据的点密度信息,在数据点与聚类中心的距离度量中引入了调节因子,提出了一种基于密度的距离修正矩阵,并用其代替经典模糊c均值算法中的距离度量矩阵。通过人造数据集和uci数据集的两组聚类实验,证实了改进算法对非球形结构的数据同样适用,且相比经典的模糊c均值算法具有更高的聚类准确率。关键词:聚类;模糊c均值;距离度量;点密度;调节因子improvedfuzzyc-mean
2、sclusteringalgorithmbasedondistancecorrection英文作者名louxiao-jun1*,lijun-ying1,liuhai-tao1,2英文地址(1.shanghaiinstituteofmicrosystemandinformationtechnology,chineseacademyofsciences,shanghai200050,china;2.wuxisensingnetindustrializationresearchinstitute,wuxijian
3、gsu214135,china)abstract:basedoneuclideandistance,theclassicfuzzyc-means(fcm)clusteringalgorithmhasthelimitationofequalpartitiontrendfordatasets.andtheclusteringaccuracyislowerwhenthedistributionofdatapointsisnot距离修正的模糊C均值聚类算法摘要:经典的模糊c均值算法基于欧氏距离,存在等划分趋势的缺陷
4、,分错率较高,只适用于球形结构的聚类。针对这一问题,利用数据的点密度信息,在数据点与聚类中心的距离度量中引入了调节因子,提出了一种基于密度的距离修正矩阵,并用其代替经典模糊c均值算法中的距离度量矩阵。通过人造数据集和uci数据集的两组聚类实验,证实了改进算法对非球形结构的数据同样适用,且相比经典的模糊c均值算法具有更高的聚类准确率。关键词:聚类;模糊c均值;距离度量;点密度;调节因子improvedfuzzyc-meansclusteringalgorithmbasedondistancecorrectio
5、n英文作者名louxiao-jun1*,lijun-ying1,liuhai-tao1,2英文地址(1.shanghaiinstituteofmicrosystemandinformationtechnology,chineseacademyofsciences,shanghai200050,china;2.wuxisensingnetindustrializationresearchinstitute,wuxijiangsu214135,china)abstract:basedoneuclideandis
6、tance,theclassicfuzzyc-means(fcm)clusteringalgorithmhasthelimitationofequalpartitiontrendfordatasets.andtheclusteringaccuracyislowerwhenthedistributionofdatapointsisnotspherical.tosolvetheseproblems,adistancecorrectionfactorbasedondotdensitywasintroduced.t
7、henadistancematrixwiththisfactorwasbuiltformeasuringthedifferencesbetweendatapoints.finally,thenewmatrixwasappliedtomodifytheclassicfcmalgorithm.twosetsofexperimentsusingartificialdataanducidatawereoperated,andtheresultsshowthattheproposedalgorithmissuitab
8、lefornon-sphericaldatasetsandoutperformstheclassicfcmalgorithminclusteringaccuracy.keywords:clustering;fuzzyc-means(fcm);distancemeasurement;dotdensity;regulatoryfactor0引言模糊聚类技术基于模糊集合论,被广泛应用于数据挖掘、模式识别、控制决策等领域