欢迎来到天天文库
浏览记录
ID:10162717
大小:33.00 KB
页数:9页
时间:2018-06-12
《数据挖掘常用聚类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、数据挖掘常用聚类算法研究摘要:信息社会的发展,使数据量以前所未有的速度在增长,因此从海量数据中获取有用的知识和信息就变得越来越重要。数据挖掘是一种综合多领域知识而形成的数据分析技术,能够从大量数据中获取有价值的知识并为决策提供支持。聚类分析算法是数据挖掘中的一个核心内容,也是目前研究的一个热点。该文首先讲述了基于划分的聚类算法、基于分层的聚类算法、基于密度的聚类算法和基于网格的聚类算法等常用的聚类分析算法,并分析了其特点;然后通过举例详细描述了最近邻聚类算法的操作过程。聚类算法的总结,对聚类的研究和发展具有积极意义。关键词:数据挖掘;聚类;聚类算法;簇;核密度中图分类号:TP18文献标识
2、码:A文章编号:1009-3044(2014)16-3710-03Abstract:Thedevelopmentoftheinformationsocietymaketheamountofdatagrowingatanunprecedentedrate,andsotoobtainusefulknowledgefromhugeamountsofdataandinformationbecomesmoreandmoreimportant.Dataminingisadataanalysistechniqueformedbyintegratingmulti-domainknowledge,whic
3、hcanacquirevaluable9knowledgefromlargeamountsofdataandprovidesupportfordecision.Clusteringanalysisalgorithmindataminingisacorecontent,whichisalsoahotspotintheresearchofthecurrent.Thisarticlefirstdescribescommonlyusedclusteringalgorithmsthatincludetheclusteringalgorithmbasedonclassification,theclu
4、steringalgorithmbasedonhierarchiesandtheclusteringalgorithmbasedondensityandtheclusteringalgorithmbasedgrid,andthenanalyzestheircharacteristics.Theoperationprocessofnearestneighborclusteringalgorithmisillustratedindetailbyanexample.Thesummaryoftheclusteringalgorithmshaspositivesignificanceforther
5、esearchanddevelopmentofclustering.Keywords:datamining;clustering;clusteringalgorithm;cluster;kerneldensity9近年来,通信技术、计算机技术、信息技术的快速发展和不断完善,使社会上每天产生了大量的诸如文本、音频、视频、图像等数据。面对这些海量数据,如何从中找到有价值的知识和信息是目前研究者研究的一个重要课题,数据挖掘技术在这种背景下应运而生了。数据挖掘是从大量数据中提取或挖掘出潜在的、有价值的、可理解的知识和规则的过程,并为用户决策提供支持。作为一个应用驱动的领域,数据挖掘吸纳了诸如统计
6、学习、机器学习、模式识别、数据库和数据仓库、信息检索、可视化、算法、高性能计算和许多应用领域的大量技术[1]。数据挖掘是一种新式的具有一定深度的数据处理技术;聚类分析是一种重要的分析数据的方法,是将物理的或抽象的对象集合分成相似的对象类的过程[2],是人们发现事物内在联系的有效手段之一[3]。划分后的对象类被称为簇,因此聚类的结果是一个簇集,也称为一个聚类。聚类分析的主要目标是在没有先验信息的前提下将样本空间中的数据集按照某种度量标准划分成若干类,使得按照这一标准在同一类中的个体尽可能相似而在不同类中的个体有较大差异[4]。聚类分析并没有对簇的数目和结构做出事先的假定,因此它是一种无监督
7、学习的方法,其具体实现有不同的算法。1数据挖掘常用聚类算法简要介绍9聚类分析是数据挖掘中占具着重要地位,它是在数据对象没有类标号的情况下,把数据对象集划分成若干个簇,使得同一个簇内的数据对象高度相似,不同簇间的数据对象高度相异。聚类分析技术在生物学、商务智能和Web搜索等领域得到了广泛应用。到目前为止出现了一些实现聚类分析的算法,其中比较常用的有基于划分的聚类算法、基于层次的聚类算法、基于密度的聚类算法和基于网格的聚类算法等。1)基
此文档下载收益归作者所有