基于最近邻优先的高效聚类算法

基于最近邻优先的高效聚类算法

ID:36818761

大小:323.20 KB

页数:7页

时间:2019-05-16

基于最近邻优先的高效聚类算法_第1页
基于最近邻优先的高效聚类算法_第2页
基于最近邻优先的高效聚类算法_第3页
基于最近邻优先的高效聚类算法_第4页
基于最近邻优先的高效聚类算法_第5页
资源描述:

《基于最近邻优先的高效聚类算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第36卷第6期四川大学学报(工程科学版)Vol.36No.62004年11月JOURNALOFSICHUANUNIVERSITY(ENGINEERINGSCIENCEEDITION)Nov.2004文章编号:100923087(2004)0620093207基于最近邻优先的高效聚类算法1111,21,314胡建军,唐常杰,李 川,彭 京,元昌安,陈安龙,蒋永光(1.四川大学计算机学院,四川成都610064;2.成都市公安局科技处,四川成都610017;3.广西师范学院信息技术系,广西南宁530001;4.成都中医药大学,四川成都61007

2、5)摘 要:针对高维空间中任意形状的多层次聚类问题,基于“同类相近”的思想,提出并实现了最近邻优先吸收聚类算法NNAF算法。证明了最近邻点搜索定理,基于这一定理又提出了SNN(SearchingNearestNeighbors)算法和GSNN(Grid2basedSearchingNearestNeighbors)算法,其时间复杂度为O(n3log(n)),当用扫描图像所得数据时,时间复杂2度会降为O(n);而使用传统的搜索算法,时间复杂度为O(n);提出了实现任意形状高维空间聚类的NNAF算法,时间复杂度为O(n);提出了MLCA(Mu

3、lti2layerClusterAlgorithm)算法并证明了两个相关的定理,在改变阈值后重新聚类时,使用MLCA算法可以节省90%以上的时间。实验结果显示,以上算法适应于任意形状的高维空间数据的聚类,可以有效过滤噪声数据,且用户需要的先验知识少、可快速获得各种层次的聚类结果。关键词:数据挖掘;聚类分析;最近邻优先吸收;多层次聚类中图分类号:TP311.13文献标识码:AAnEfficientMulti2layerClusteringAlgorithmBasedonNearestNeighborsFirst1111,21,314HUJi

4、an2jun,TANGChang2jie,LIChuan,PENGJing,YUANChang2an,CHENAn2long,JIANGYong2guang(1.SchoolofComputer,SichuanUniv.,Chengdu610064,China;2.Dept.ofSci.andTech.,ChengduPublicSecurityBureau,Chengdu610017,China;3.Dept.ofInfo.andTech.,GuangxiTeachersEducationUniv.,GuangxiNanning5300

5、01,China;4.ChengduUniv.ofTraditionalChineseMedicine,Chengdu610075,China)Abstract:NearestNeighborsAbsorbedFirst(NNAF)clusteringalgorithmwasproposedtoresolvetheproblemofthemul2ti2layerclusteringforhighdimensionaldatawitharbitraryshapebasedontheideathatthedatainsameclustermu

6、stbenear.Asearchingnearestneighbortheoremwasproved.Basedonthetheorem,SNN(SearchingNearestNeighbors)andGSNN(Grid2basedSearchingNearestNeighbors)algorithmswereproposedwithtimecomplexityO(n3log(n))orO(n)ifthedataaregainedbyscanningimage.Theyaremuchfasterthanthetraditionalsea

7、rchingnearestneighborsal22gorithmwithO(n).AclusteringalgorithmofNNAFtoprocessmulti2dimensionaldatawitharbitraryshapewasproposedwithtimecomplexityO(n).Multi2layerClusteringAlgorithm(MLCA)wasproposedandtwointerrelatedtheoremswereproved.Inthecaseforthresholdadjusting,itsaves

8、timeover90%.Theexperimentsshowedthatthenewalgorithmscanefficientlyprocesshighdimensionaldatainar

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。