协同极大熵聚类算法.pdf

协同极大熵聚类算法.pdf

ID:53732103

大小:362.11 KB

页数:5页

时间:2020-04-20

协同极大熵聚类算法.pdf_第1页
协同极大熵聚类算法.pdf_第2页
协同极大熵聚类算法.pdf_第3页
协同极大熵聚类算法.pdf_第4页
协同极大熵聚类算法.pdf_第5页
资源描述:

《协同极大熵聚类算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第3l卷第5期计算机应用与软件Vo1.31No.52014年5月ComputerApplicationsandSoftwareMav2014协同极大熵聚类算法江森林(无锡职业技术学院物联网分院江苏无锡214121)摘要极大熵聚类算法(MEC)是基于信息论的新型聚类算法。以不同子集之间的协同关系为出发点,与信息理论中的极大熵原理相结合,通过构造新的极大熵目标函数来改变传统聚类算法中对整个数据集直接聚类的机制。提出一种基于协同的极大熵聚类算法CMEC,它不仅具有较MEC算法更高的聚类精度和更好的泛化性等特点,

2、较之协同模糊聚类算法还具有更好的物理意义。实验结果表明所提出的CMEC算法具有上述优点,其聚类效果比传统的聚类算法有了很大的提高。关键词聚类算法极大熵协同系数协同的极大熵中图分类号TP311文献标识码A,DOI:10.3969/j.issn.1000—386x.2014.05.068CoLLABoRATIVELYMAXIMUMENTRoPYCLUSTERINGALGoRITHMJiangSenlin(Collegeof~ternetofThings,WuxiInstituteofTechnology,Wu

3、xi214121,flangsu,China)AbstractMaximumentropyclusteringalgorithm(MEC)isanewclusteringalgorithmbasedoninformationtheory.Inthispaper,consideringthecollaborationrelationbetweendifferentsubsetsasthestartingpointandcombiningtheMECprincipleininformationtheory,w

4、echangethemechanismofclusteringdirectlyonentiredatasetintraditionalclusteringalgorithmbyconstructinganovelmaximumentropyobjectivefunction.Weproposeacollaboration—basedmaximumentropyclustering(CMEC).Ithasthecharacteristicsofhigherclusteringaccuracyandbette

5、rgeneralisationthanMECalgorithm,andhasbetterphysicalsensecomparedwithcollaborativefuzzyclusteringalgorithm.ExperimentalresultsshowthattheproposedCMECalgorithmhastheaboveadvantages,ithassignificantimprovementinclusteringeffectthanthetraditionalclusteringal

6、gorithm.KeywordsClusteringalgorithmMaximumentropyCollaborativecoefficientCollaborativelymaximumentropy子集之间的协同作用,有效提高了MEC的聚类精度和泛化性0引言能。另一方面,在协同部分,本文在协同目标函数的最后一项即全局项中,不仅考虑使得各个子集的隶属度尽可能的接近,还从聚类分析的目的是寻找数据集里的“自然分组”,即所每个样本到各自聚类中心的距离人手,使得每个子集中,各个样谓的“簇”。通俗地说,簇就是指

7、相似元素的集合。当前,聚类本到各自中心的聚类尽可能地接近,从而改进了原协同目标函分析作为一种高效的数据挖掘工具,已经被广泛地应用到模式数表达,使得目标函数前后的数量级保持了一致。通过UCI标识别、数据分析、图像处理以及市场研究等领域。准数据集与模拟数据集实验均表明,CMEC算法确实具有更好信息熵作为一种新的理论工具,近年来已经被成功地应用的聚类性能。于聚类分析的研究工作中。由Mukaidono等人提出的极大熵聚类算法MEC_3是其典型代表。与其他聚类算法的不同在于,它1相关工作将信息熵引入目标函数中,从而

8、对数据进行无监督学习。为了进一步拓展信息熵在聚类分析中的应用,学术界基于极大熵聚给定数据集X=Ii=1,2,⋯,Ⅳ},∈R,聚类数目为C,类原理又从不同角度提出了许多改进算法。。为协同系数,为极大熵中的系数,聚类中心为V=Ii=1,在实际应用中,数据子集之间通常有协同作用,协同作用指2,⋯,C},其中为第i个聚类中心,隶属度矩阵U={UIi=1,元素对元素的相干能力,表现了元素在整体发展运行过程中协2,⋯,C;j=1,2,⋯,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。