欢迎来到天天文库
浏览记录
ID:32711197
大小:2.41 MB
页数:78页
时间:2019-02-14
《数据挖掘技术中聚类算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、内蒙古科技大学硕士学位论文摘要数据挖掘技术是当前计算机领域的一个研究热点,引起了大量研究人员的关注。而聚类分析是数据挖掘技术中一个重要的研究方向,目前这方面的研究主要集中在如何提高聚类算法的有效f生和实用性。沧文首先对数据挖掘技术做了介绍,旨在分析与确定数据挖掘技术的研究领域与存在的问题。数据挖掘技术中,聚类分析方法在模式识别、图像处理等领域获得了广泛的研究与应用,但是也存在聚类算法智能性、稳定性、有效性、可扩展性等方面的问题。因此,论文进~步详细分析和研究了现存的各种有代表
2、生的聚类算法,对它们缺点与优势以及各自所适应的具体应用前提、性能进
3、行了比较全面的对比与总结;在此基础上提出了对K-Means算法和DENCLuE算法(基于密度分布函数的聚类算法)进行整合思想,依此来提高聚类方法智能性(实现无指导挖掘)、稳定性、有效性和可扩展性,同时给出了两种算法的整合理论基础。在实现整合算法的过程中,首先通过聚类对象属性(变量)的加权处理——基于复相关系数倒数的欧氏距离加权,消除了对象属性问的相关性,提高了聚类结果的准确性;然后,根据两种算法的整合思想,提出了一种新的聚类算法一基于密度和对象方向的K.Mealls算法KADD(K.MeansAl如rit}lrnbasedonDen蛳andD
4、irection),详细介绍了KADD算法的定义、数据结构、模型的建立,以及算法的具体实现。这种算法不但避免了需要用户事先给出难以确定的聚类参数的困难局面和随机选择初始聚类中心造成聚类结果的不稳定;而且可以发现任意形状的聚类;克服了K—Means算法对孤立点数据的敏感问题;提高了算法的可扩展性。最后在不同的数据集上,通过对原K—Means算法和KADD算法进行测试和对比,结果表明,算法的设计与实现是成功的,具有良好的可伸缩性,可发现任意形状的聚类,处理噪声数据的能力强,且具有较强的可解释性和可用性。关键词:数据挖掘;聚类:K.Means算法;
5、DENCLUE算法;KADD算法一堕茎直型垫叁堂堡主兰笪堕苎——TheResearchofCIustenngAlgorithminDataMilIingTechnologyAbstl翟ctDataMiIlingtecllllologyisahotspotofcompu喇onaldomain,which捌slotsofresearchers.C1uStering趾alysisiSanimportantresearchdirectionindataminingtechn0109y,锄dnawitsmoststudyisfocused0nhpmvi
6、ngValidityaIldpmcticabilityofcluSteringalgorit}Im.Thisp印er,atfirstiti删ucesdatamimI培tccllrlology.The砸marypulposeisa11alySes锄dascenainsrese甜chdomamandexis咄nproblemsofda诅倒商ng础nology.Clus刚nga11alysisisapmmisingapplicationi11嗍emreco鲥don,inlageprocessing,etc.ButitexistssomeprobIe
7、msiniIllelligence,slabm饥validi哆andexpa璐ibil毋ofdllsleringaIgorimm.Therefbre,thisp印ercompletedanalysingofrepresentatiVeandleadingalgorithmsofC1usteringinexistencoanddugouttheiradvantagesanddisadVantagesaswellastheirsconditioninpoint.Later,paperanalysesK—Meansand(DENsity-based
8、CLUstE血酌DENCLUEconsideratelyonthetheory1evel,andtheoryisprovidedfortheintegrationofK—MeansandDENCLUEalgorithm,itcanimprovesprobJemsofexistentclusteringalgorithm.IncourseofcompIctingintegrationaIgorithm,nrstconceptweightedattrtbutesisproposed,itcaneliminatesrelativityofattri
9、butesandimpmvesveracityofc】usteringresult.AndthenanewcIusteringalgorithm—K—MeansAl
此文档下载收益归作者所有