欢迎来到天天文库
浏览记录
ID:33234344
大小:1.44 MB
页数:52页
时间:2019-02-22
《基于最优划分的多密度梯度网格聚类算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、AMulti-densityGradientGridClusteringAlgorithmbasedontheOptimalDivisionDissertationSubmittedtotheGraduateSchoolofHenanUniversityinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofScienceByZhangZhendongSupervisor:ZhengFengbinMay2012关于学位论文独创声明和学术诚信承诺本人向河南大学提出硕士学位申请.本人郑
2、重声明:所呈交的学位论文是本人在导师的指导下独立完成的,对所研究的课题有新的见解.据我所知,除文中特别加以说明、标注和致谢的地方外,论文中不包括其他人已经发表或撰写过的研究成果,也不包括其他人为获得任何教育、科研机构的学位或证书而使用过的材料.与我一同工作的同事对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。在此本人郑重承诺:所呈交的学位论文不存在舞弊作伪行为,文责自负.学位申请人(学位论文作者)签名:羽幽∑201Z,年占月f8日关于学位论文著作权使用授权书本人经河南大学审核批准授予硕士学位.作为学位论文的作者,本人完全了解并同
3、意河南大学有关保留、使用学位论文的要求,即河南大学有权向国家图书馆、科研信息机构、数据收集机构和本校图书馆等提供学位论文(纸质文本和电子文本)以供公众检索、查阅。本人授权河南大学出于宣扬、展览学校学术发展和进行学术交流等目的,可以采取影印、缩印、扫描和拷贝等复制手段保存、汇编学位论文(纸质文本和电子文本).(涉及保密内容的学位论文在解密后适用本授权书)学位获得者(学位论文作者)签名:201≯年S月f彦日学位论文指导教师签名:201摘要数据挖掘是从数量庞大的、随机出现的、客观存在的、不完全的并充满噪声的数据中提取和发现有价值的信息,从而为商务分
4、析与决策、自然科学理论、人文地理等提供有效的技术支持和可靠的数据依据。其中,聚类分析是数据挖掘中一项十分重要而有趣的研究课题,并且因为其强大的应用和研究价值而受到越来越广泛的关注。为解决网格聚类算法中对参数过于敏感、无法自动识别不同密度梯度类以及不同梯度类间划分不够精确等问题,提出了基于最优划分的多密度梯度网格聚类算法(OPMDG)。该算法只需用户输入一个大致的密度阈值范围,网格边长自动计算并可自动调节适应,减少了算法对参数的敏感性;提出了二重划分技术,可挖掘不同密度梯度的类;对于处于不同类上的交界点,引入了电荷间吸引力的概念,能有效解决类间
5、聚类精度不高等问题。实验结果表明,OPMDG算法能识别各种不同形状、大小的簇,挖掘具有不同密度梯度类,并能有效地划分边界和去除离群点与噪声点。在通过和GCOD算法的对比中,可以显著发现OPMDG算法的精度和准确度更高,且时间复杂度是一个不大的线性函数。关键词:网格聚类,参数半自动化,最优划分,多密度梯度,算法ABSTRACTDataminingisamethod,which,fromahugenumberofrandomlyoccurring,objectiveexistence,incompleteandnoisydatawereextra
6、ctedandfindvaluableinformationforbusinessanalysisanddecision,thus,thetheoryofnaturalscience,humangeographyandprovideeffectivetechnicalsupportandreliabledatabasis.Amongthem,clusteringanalysisindataminingisaveryimportantandinterestingresearchtopics,andbecauseofitsgreatapplica
7、tionandresearchvalueandhasattractedmoreandmoreattention.InordertosolvethegridclusteringalgorithmtoparametertOOsensitive,Canautomaticallyidentifythedifferentdensitygradientanddifferentgradientdifferentiatesbetweenpreciseenoughtowaitforaproblem,putforwardAMulti·densityGradien
8、tGridClusteringAlgorithmbasedontheOptimalDivision(OPMDG).Thisalgorithmonlyneedstoi
此文档下载收益归作者所有