欢迎来到天天文库
浏览记录
ID:33935000
大小:8.99 MB
页数:73页
时间:2019-03-01
《行车热点中无监督聚类算法的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、万方数据分类号UDC学位论文行车热点中无监督聚类算法的研究与应用作者姓名:指导教师:申请学位级别:学科专业名称:论文提交日期:学位授予日期:评阅人:董楠党群教授东北大学信息科学与工程学院硕士学科类别:工学计算机应用技术2014年6月论文答辩日期:2014年6月2014年7月答辩委员会主席:刘杰民教授刘杰民教授、原福永教授东北大学2014年6万方数据AThesisinComputerAppncationr】№chnologyResearChandApplicationofUnSuperViSedClusteringAlgoritJlminDrivingH0tspotByDOngNanSuper
2、visor:ProfessorDangQullNortheasternUniversi蚵June2014万方数据独创性声明本人声明,所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加以标注和致谢的地方外,不包含其他人己经发表或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。学位论文作者签名:毫夺帝日期:>口,够.占.够学位论文版权使用授权书本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。
3、本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流。作者和导师同意网上交流的时间为作者获得学位后:半年口一年口一年半口学位论文作者签名:蔫砀签字日期:印f舻.6.珍两年囱导师签名:签字日期:2矽f牛、毛。。f万方数据东北大学硕士学位论文摘要行车热点中无监督聚类算法的研究与应用摘要聚类是数据挖掘领域中重要的技术之一,用于发现数据对象中未知的分类。聚类算法不仅可以作为发现数据库中数据分布的深层次信息的工具,还可以将其作为数据挖掘中的一个预处理步骤。聚类分析是要达到这样一种目的,将数据对象划分成不同的簇,使得同一个簇中的数据对象具有较高的相似度,不同簇中的数据对象的相似度较
4、低。行车热点是车辆行驶频繁的地带,它可以反映出用户的行车规律,本文主要利用了聚类分析技术来解决行车热点问题。本文首先对基于划分的K-Means聚类算法进行了分析研究,K.Means算法的优点是简单易行,时间复杂度为O(n),并且适用于处理大规模数据集。其次就是本文的重点工作,针对K-MeaIls聚类算法的聚类个数k值的确定、初始聚类中心的选取及对孤立点敏感这三方面缺点进行了改进,提出了改进的算法KMSDR。算法的目标是在确保发现聚类中心的同时使同一类内的相似度大而不同类内的相似度小。算法采用改进的最大最小距离法选取新的聚类中心,并且根据距离阈值判断所选中心是否孤立;其次给出Dis(S,k)距
5、离函数,并应用此聚类函数确定最佳聚类个数;用类中数据对象代替均值中心的方法降低孤立点对类中心点的影响。并且通过三组数据来对改进的算法进行仿真实验,证明KMSDR算法在聚类质量及时间效率方面得到了改进。最后将改进的Ⅺ江SDR算法运用到行车数据分析系统的行车热点问题中,并针对得到的行车热点完成页面的展示,而且在行车热点基础上实现了周边检索及测距的功能。经过实验验证,改进算法能够较准确的找到行车热点,并且在时间性能上得到了提高,算法的稳定性也强。行车热点功能不仅可以反映出车辆的活动规律以便用户了解自己的驾驶习惯,也为用户的出行提供方便。关键词:行车热点;数据挖掘;聚类算法;K.Means-II—万
6、方数据东北大学硕士学位论文AbSlractResearchandApplicationofUnsupervisedCluste血gAlgori岫li11DriVillgHotspotAbstractClusteringisoneofmemostimport锄ttecIlIlologiesof批mining,WhichisusedtodiscoverIulknowncl雒sificationin№sct.IIladdition,ⅡlecluSteriIlgalg耐t11】[1lcallnotonlybeused弱atooltofindt11edistributionofde印-leVelinf
7、o肌ationdataind撕b嬲ebutalsomatc锄beusedasaprcprocessingst印inda舾mining.Clust甜nganalysisist0achieVesuchagoalthatwilldiVisionmedataobjectint0di疏rentclusterstllatthesameclusterh硒highsimilaritybutthesimilarityofdat
此文档下载收益归作者所有