欢迎来到天天文库
浏览记录
ID:37123658
大小:1.63 MB
页数:44页
时间:2019-05-18
《鏁版嵁鎸栨帢涓仛绫荤畻娉曠殑鐮旂┒》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、摘要随着信息技术的迅速发展,人们积累了大量的数据。如何从这些冗余数据中提出对人们有用的信息就成了如今亟需要解决的问题。数据挖掘技术就在这种背景下应运而生,并且发展了几年就已经成为目前数据库和信息决策领域最为热门的课题和方向之一。作为数据挖掘中的一个重要分支,聚类分析是通过分析数据的相似性把大型数据集合分类,使得在同一个类里面的数据最为相似,而不同类中的数据又彼此相异,得到很好的分类效果。本文主要研究了聚类算法,所做的主要工作如下:1.利用密度聚类算法收敛速度快,层次聚类算法可以在不同粒度水平上对数据进行探测,而且容易实现相似度量或距离
2、度量的优点,发现了一种新的基于密度的层次聚类算法,克服了层次聚类算法时间复杂度的问题,得到比较好的聚类结果。2.将免疫算法引入模糊聚类算法,克服了模糊聚类算法对初始值敏感容易陷入局部最优的问题。新的聚类算法能够在不给定初始簇数目的条件下得到准确的聚类结果。3.结合传统聚类算法与模糊聚类算法。利用密度算法对中心点不敏感的优点,将密度算法应用于模糊聚类,得到新的聚类算法应用于数据量大的数据集时,它的准确率要明显高于模糊聚类算法和免疫算法。关键词:聚类算法;C均值算法;密度聚类算法;层次聚类算法;免疫算法;自适应聚类算法。ABSTRACTW
3、iththedevelopmentofinformationscienceandtechnology,thedatabasemanagementsystemhavebeenappliedmoreandmorewidely,andthesizeofthedatabasehascontinuedtoexpand,peoplehaveaccumulatedmassiveamountofbusinessdata,andhowtofindthevaluableinformationinthevastocean—likedatahavebecom
4、eanurgentneedtobesolved.Fromthisdataminingtechniqueshaveemerged,whichisoneofthemostcutting-edgeresearchofthedatabaseandinformationdecision—making.Clusteranalysisasanimportantbranchofdataminingistheanalysisofdata’Ssimilarity,anddividedthelargedatasetsintogroups,inwhichth
5、edatainsidethesamegroupwasmostsimilartoeachotherandthedataindifferentgroupswasdifferfromeachother.Clusteringisaneffectivemeansoffindingusefulinformation.Basedontheabovestudy,thispapermainlydiscussesC-meansclusteringmethodwhichbasedontheimmunegeneticalgorithmandparticles
6、warllloptimizationalgorithmseparately.Followingisthemainworkhasbeendone:1.Usingdensityclusteringalgorithmfastconvergence,hierarchicalclusteringalgorithmscanbeatdifferentlevelsofdatagranularitytodetect,andveryeasytoimplementsimilaritymeasureordistancemetricadvantagestoac
7、quireanewdensity—basedhierarchicalclusteringalgorithm,thehierarchicalclusteringalgorithmtoovercomethetimecomplexityoftheproblem,getabetterclusteringresults2.Theimmunealgorithmfuzzyclusteringalgorithm,fuzzyclusteringalgorithmtoovercometheinitialvaluesensitiveeasilytrappe
8、dintolocaloptimizationproblem.AndthenewclusteringalgorithmCannotclusterthegiveninitialconditions,thenumberofac
此文档下载收益归作者所有