基于网格模型的孤立点检测算法

基于网格模型的孤立点检测算法

ID:33388177

大小:2.28 MB

页数:48页

时间:2019-02-25

基于网格模型的孤立点检测算法_第1页
基于网格模型的孤立点检测算法_第2页
基于网格模型的孤立点检测算法_第3页
基于网格模型的孤立点检测算法_第4页
基于网格模型的孤立点检测算法_第5页
资源描述:

《基于网格模型的孤立点检测算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、山东大学硕士学位论文基于网格模型的孤立点检测算法姓名:闫宗奎申请学位级别:硕士专业:计算机软件与理论指导教师:石冰20090405山东大学硕士学位论文摘要数据挖掘技术是从上个世纪80年代开始发展起来的一门新技术,就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识。而孤立点分析是数据挖掘中的重要研究方面之一,其作用就是发现数据中的“小模式’’,即数据集中显著不同于其它数据的对象。经过近20年的发展,数据挖掘技术在理论研究上日趋成熟,正不断的扩展其应用范围,当前数据挖掘已用于电信、金融、商业、

2、气象预报、DNA、股票市场、入侵检测和客户分类等许多领域。因此,本文首先研究了基于单元的孤立点发现算法,指出了其存在的缺点:其次,提出了一种基于网格模型的孤立点检测算法。本文的主要工作可以概括为以下五个方面:(1)从孤立点挖掘的现实意义、算法、应用领域、挖掘工具、算法的评价等各个方面对孤立点挖掘问题进行了综述。(2)针对已有检测方法的不足,本文提出了一个新的孤立点检测方法,通过对数据集的网格划分与数据模型的转换来判别异常,从而有效提高算法的效率。.(3)设计了基于网格的检测算法,给出了数据空间的网格划分,定义了网格内孤立点存在性阈值,提出了基于网格的孤立点检测算法

3、,在保证算法的有效性的前提下,降低了算法的时间复杂度。(4)实现了一个异常检测实验平台ED(ElninoDetector),其中集成了所提出的算法,为异常检测提供了一个分析工具。所提供的数据接口能够从标准Elnino数据集中获取数据,并进行相应的数据浏览和分析。(5)结合气候数据收集的特点,探讨了使用异常检测来检测气候的必要性和方法。本文的研究目的是构建一个使用本文的算法从真实数据中检测异常数据实验平台,主要包括几个方面:1.给出数据空间的网格划分;2.定义网格内孤立点存在性阈值;3.提出了基于网格的孤立点检测算法;山东大学硕士学位论文4.基于真实数据的算法验证。

4、本文实现了一个基于EclipseRCP的试验平台,通过对Elnino数据集的检测结果,对本文提出的算法进行了验证。试验结果表明,该算法能够得到比较好的孤立点分析结果。最后,对本文的工作进行了总结和对研究前景的展望。关键词:数据挖掘;孤立点:网格模型II山东大学硕士学位论文ABSTRACTDataMiningisanewtechniquedevelopedfrom1980s.Itaimstoextracttheimplicit,unknown,andpotentiallyusefulknowledgefromvoluminous,non—complete,fuzzy

5、,stochasticdata.Outliers’analysisisallimportantpartofdataminingresearch.Itspurposeistofindthe”smallpatterns“fromdataset.Anoutlierisallobjectthatisconsiderablydissimilarorinconsistent、7l,iththeremainderofthedata.After20yearsofdevelopment,onthetheory,dataminingtechniquesisbecomingmorean

6、dmoreconsummateandisexpandingitsapplicationarea.Now,datamininghasbeenusedintelecom,finance,busyness,weatherforecast,DNA,stockmarket,intrusiondetectionandcustomersegmentationetc.Sointhispaperwefirstresearchthealgorithmofoutlierdetectionbasedcell,pointoutitsshortcomings,andthendesignsan

7、ewalgorithmbasedonthe鲥dmodel.Themainworksinthethesisarelistedasfollowing:1.Summarizingtheproblemofoutlierminingfromtherealisticmeaning,algorithms,applicationrangesdetectiontools,algorithm’Sevaluation,etc.2.Toovercomethelimitationofexistingalgorithmsforoutlierdetection,thispaperprovide

8、sanew

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。