优化子空间的高维聚类算法-论文.pdf

优化子空间的高维聚类算法-论文.pdf

ID:58156506

大小:511.24 KB

页数:6页

时间:2020-04-25

优化子空间的高维聚类算法-论文.pdf_第1页
优化子空间的高维聚类算法-论文.pdf_第2页
优化子空间的高维聚类算法-论文.pdf_第3页
优化子空间的高维聚类算法-论文.pdf_第4页
优化子空间的高维聚类算法-论文.pdf_第5页
资源描述:

《优化子空间的高维聚类算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、JournalofComputerApplicationsISSN1001。90812014.O8.1O计算机应用,2014,34(8):2279—2284CODENJYIIDUhttp://www.joca.cn文章编号:1001-9081(2014)08-2279.06doi:10.11772/j.issn.1001—9081.2014.08.2279优化子空间的高维聚类算法吴涛,陈黎飞,郭躬德(福建师范大学数学与计算机科学学院,福州350007)(通信作者电子邮箱elfei@fjnn.edu.cn)

2、摘要:针对当前大多数典型软子空间聚类算法未能考虑簇类投影子空间的优化问题,提出一种新的软子空间聚类算法。该算法将最大化权重之间的差异性作为予空间优化的目标,并提出了一个量化公式。以此为基础设计了一个新的优化目标函数,在最小化簇内紧凑度的同时,优化每个簇所在的软子空间。通过数学推导得到了新的特征权重计算方法,并基于k-means算法框架定义了新聚类算法。实验结果表明,所提算法对子空间的优化降低了算法过早陷入局部最优的可能性,提高了算法的稳定性,并且具有良好的性能和聚类效果,适合用于高维数据聚类分析。关键词:

3、高维数据;聚类;子空问优化;特征权重;差异中图分类号:TP181文献标志码:AHigh·dimensionaldataclusteringalgorithmwithsubspaceoptimizationWUTao.CHENLifei.GUOGongde(SchoolofMathematicsandComputerScience,FujianNormalUniversity,FuzhouFujian350007,China)Abstract:Anewsoftsubspaceclusteringalgori

4、thmwasproposedtoaddresstheoptimizationproblemfortheprojectedsubspaces,whichwasgenerallynotconsideredinmostoftheexistingsoftsubspaceclusteringalgorithms.Maximizingthedeviationoffeatureweightswasproposedasthesub·spaceoptimizationgoal,andaquantitativeformula

5、waspresented.Basedontheabove,anewoptimizationobjectivefunctionwasdesignedwhichaimedatminimizingthewithin-clustercompactnesswhileoptimizingthesoftsubspaceassociatedwitheachcluster.Anewexpressionforfeature—weightcomputationwasmathematicallyderived,withwhich

6、thenewclusteringalgorithmwasdefinedbasedontheframeworkoftheclassicalk-means.Theexperimentalresultsshowthattheproposedmethodsignificantlyreducestheprobabilityoftrappinginlocaloptimumprematurelyandimprovesthestabilityofclusteringresults.Andithasgoodperforma

7、nceandclusteringeficiency,whichissuitableforhigh-dimensionaldataclusteranalysis.Keywords:high—dimensionaldata;clustering;subspaceoptimization;featureweight;deviation2005年1O月的IEEE数据挖掘国际会议上,高维数据的处理0引言被认为是当前数据挖掘研究领域中十大挑战性课题之一J。聚类作为数据挖掘研究的一种重要手段,目的是将给定在高维数据中,

8、簇类可能与不同的特征子空间相关的一个数据集划分成多个簇,使得同一簇内的样本尽量相似,联J。文献[9]中定义的子空间可以分为硬子空间(Hard而与其他簇中的样本相异较大I2。目前,聚类分析已经在Subspace)和软子空间(SoftSubspace)两种类型。本文研究软许多领域获得广泛应用,如模式识别、文本挖掘、机器学习、网子空间,它已在统计学和数据挖掘领域获得了广泛的关注。络搜索、基因表达、顾客区分和图像处理等。目前,基于软子

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。