增量聚类算法的设计与实现

增量聚类算法的设计与实现

ID:33367149

大小:2.75 MB

页数:54页

时间:2019-02-25

增量聚类算法的设计与实现_第1页
增量聚类算法的设计与实现_第2页
增量聚类算法的设计与实现_第3页
增量聚类算法的设计与实现_第4页
增量聚类算法的设计与实现_第5页
资源描述:

《增量聚类算法的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、内蒙古科技大学硕士学位论文摘要随着网络技术的飞速发展以及数据库技术的进步,各个领域的信息量急剧增长,一方面,数据挖掘处理的数据规模越来越大,另一方面,对数据集实时数据挖掘的需求不断加大。目前大多数聚类算法处理海量动态数据需要消耗大量的时间和空间资源,并且挖掘效果不理想,使其有效性和可扩展性受到了限制。在这种情况下,增量聚类算法应运而生,有效的解决了海量动态数据的聚类问题。为了实现动态、增量聚类,首先,对基于密度和自适应密度可达聚类算法(ClmteringAlgorithmBasedonDensi够andDensi妙mach

2、able,CADD)进行了改进:第一,为密度可达包成员设置标志值,极大的提高了聚类效率:第二,改进半径和密度的计算方式,避免了重复的计算:第三,编程实现聚类结果的可视化,可以直观的评价聚类效果。实验结果表明,改进后使得算法的复杂度明显减小。其次,在CADD算法改进的基础上重点研究了两方面内容:(1)根据CADD算法的特点,提出了基于密度可达的增量聚类算法_叫CADD算法,由于该算法是非批量聚类方式,实验表明虽然聚类效果比较好,但是效率较低;(2)根据层次聚类算法BIRCH中聚类特征的概念,提出了子簇特征的概念和子簇的相似准

3、则(包括空间位置相似性和空间分布相似性),并进一步设计、实现了基于子簇特征的增量聚类算法——ICSCF算法。此外在计算数据点密度时,还引入了抽样技术。由于ICSCF算法采用批量处理方式,理论分析和实验结果证明,该算法不仅具有较高的聚类效率,同时,通过将数据集分割、逐步动态聚类,还能实现对大型数据库的聚类分析,有良好的可扩展性,特别是在空间聚类(如图像处理)方面能够发挥重要的作用。关键词:聚类算法;动态增量聚类;子簇特征;子簇相似准则;空间聚类内蒙古科技大学硕士学位论文AbstractWithrapiddevelopment

4、ofnetworktechnologyanddatabasetechnology,theamountofinformationgrowsrapidlyinvariousfields.Ontheonehand,thedatascalebecomesmoreandmorehuge;ontheotherhand,thedemandofrealtimeDataMiningisincreasing.Mostoftraditionalelusterir毽algorithmsconsumelargeamountsoftimeandspa

5、ceresourcesandtheyareofweaknessesineffectivenessandscalability.Inthiscase,theemergenceofincrementalclusteringalgorithmscanslovetheproblemseffectively.Inordertoachievedynamic,incrementalclustering,thispaperanalyzesClusteringAlgorithmBasedonDensityandDensity—reachab

6、le(CADD)atfirst,andthenmakessomeimprovements.Theimprovementsincludethreeaspects:1.Setsignsfordensity-reachablemembers.Aimistoimproveefficiency.2.Improvemethodforcalculatingradiusanddensitywhichavoiddoublecounting.3.Achievevisualizationtoassessclusteringresultseffe

7、etivly.ExperimentalresultsshowthatimprovedCADDalgorithmreducesthecomplexity.BasedonimprovedCADDalgorithm,thepaperfocusesonthefollowingtwoaspects:(1)proposesIncrementalClusteringAlgorithmBasedonDensityandDensity-reachable(ICADD)accordingtothecharacteristicsofCADDal

8、gorithm.ThealgorithmUSeSnon-batchmode.Itislessefficient.(2)proposesIncrementalClusteringAlgorithmBased011SubclusterFeature(ICSCF),whichisbasedonthenotio

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。