欢迎来到天天文库
浏览记录
ID:15571507
大小:468.50 KB
页数:38页
时间:2018-08-04
《基于层次的孤立点检测算法设计及实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、南华大学计算机科学与技术学院毕业设计(论文)毕业设计(论文)题目基于层次的孤立点检测算法设计及实现学院名称计算机科学与技术学院指导教师肖基毅职称教授班级本05计算04班学号20054440428学生姓名李敬康2009年5月29南华大学计算机科学与技术学院毕业设计(论文)目录摘要iiiAbstractiv第一章绪论11.1研究背景及研究意义11.3论文组织结构2第二章相关知识32.1数据挖掘概述32.1.1数据挖掘概念32.1.2数据挖掘过程42.1.2数据挖掘算法组成52.2聚类分析52.2.1聚类算法简介62.2.2基于层次的聚类方法8
2、2.2.3距离、相似系数及聚类分析中的数据类型142.3孤立点分析172.3.1基于统计的方法182.3.2基于距离的孤立点检测算法182.3.3基于偏离的孤立点探测202.4本章小结20第三章算法设计与实现213.1算法相关定义213.2算法描述223.3算法实现243.3.1数据结构定义24iv南华大学计算机科学与技术学院毕业设计(论文)3.3.2算法函数说明253.4算法分析303.4.1算法复杂度303.4.2算法的局限性303.5本章小结30第四章结论31参考文献32谢辞33iv南华大学计算机科学与技术学院毕业设计(论文)摘要摘
3、要:孤立点检测是数据挖掘的一个重要方面,因其独特的知识发现功能而得到较为深入的研究。孤立点检测算法己经在金融欺诈检测、网络入侵检测、生态系统失调天气预报等风险控制领域得到了广泛的应用。聚类分析和孤立点检测技术己经广泛应用于模式识别、数据分析、图像处理、市场研究等许多领域。聚类及孤立点检测算法研究已经成为数据挖掘研究领域中非常活跃的一个研究课题。本文介绍了数据挖掘理论,在深入研究聚类分析和孤立点检测算法的基础上提出了基于层次的孤立点检测算法。给出了算法较为详细的描述,阐述了算法中各个函数的功能。该算法基于层次方法,采用欧几里得距离进行凝聚的
4、层次聚类。根据聚类中含有单一数据元素的类数来确定初始孤立点个数,然后根据距离阀值判断是否为孤立点。通过对算法的性能进行分析,该算法的时间复杂度为,空间复杂度为,其中N是数据规模。试验结果表明,基于层次的孤立点检测算法能基本实现孤立点的检测,并对孤立点进行精确性分析。关键字:数据挖掘;层次聚类;凝聚;孤立点检测;距离iv南华大学计算机科学与技术学院毕业设计(论文)AbstractAbstract:OutlierdetectionisanimportantaspectofDataMining,whichhasgetmoredepthresea
5、rchbecauseofitsuniqueknowledgediscoveryfunctions.Today,therearelotsofefficientoutlierdetectionalgorithmswhicharewidelyusedinfinancialfrauddetection,networkinstructiondetection,ecosystemimbalance,Weatherforecastandotherriskcontrolareas.Clusteringanalysisandoutlierdetection
6、,asimportantpartsofdatamining,arewidelyappliedtothefieldssuchaspatternrecognition,dataanalysis,imageprocessing,andmarketresearch.Researchonclusteringanalysisandoutlierdetectionalgorithmshasbecomeahighlyactivetopicinthedataminingresearch.Inthisthesis,theauthorpresentstheth
7、eoryofdatamining,andbasedondeeplyanalysisthealgorithmsofclusteringandoutlierdetection,theauthoradvanceshierarchical-basedoutlier-detectionalgorithm.Elaboratestheideaofthealgorithm,expoundsthefunctionsofalgorithm.ThealgorithmbasedonhierarchicalclusteringandusedEucliddistan
8、cetoagglomeratedclustering.Accordingtoasingleclustercontainsseveraltypesofdataelementstodetermin
此文档下载收益归作者所有