资源描述:
《毕业设计(论文)异常数据挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、®喫俛vXIAMENUNIVERSITYOFTECHNOLOGY毕业设计(论文)中文题目异常数据挖掘研究英文题HResearchonoutlierdatamining系别:计算机科学与技术系专业年级:计算机科学与技术09级姓名:杜海丰学号:0907045143指导教师:陈玉明职称:讲师2011年5月20日毕业设计(论文)诚信声明书本人郑重声明:在毕业设计(论文)工作中严格遵守学校有关规定,恪守学术规范;我所提交的毕业设计(论文)是本人在指导教师的指导下独立研究、撰写的成果,设计(论文)中所引用他人的文字、
2、研究成果,均已在设计(论文)中加以说明;在本人的毕业设计(论文)中未剽窃、抄袭他人的学术观点、思想和成果,未篡改实验数据。本设计(论文)和资料若有不实之处,本人愿承担一切相关责任。学生签名:摘要粗糙集理论,它是一种分析处理数据的理论,在20世纪80年代由波兰科学家Pawlak建立。一开始由于语言交流上的问题,建立该理论的时候只有一些东欧学者会研究和应用它,后来随着该理论的发展才慢慢受到全球上知名数学学者和计算机学者的重视。知识粒度的基木思想在许多领域都有体现,如粗糙集、数据库、聚类分析、模糊集、证据理论、
3、数据挖掘和机器学习等。自从1979年L.A.Zadeh在世界上首次提出并讨论了知识粒度问题ZU,知识粒度获得了人们越来越多的关注。经过多年的发展,知识粒度已在知识发现、数据挖掘、软计算中扮演越来越重要的角色。在本论文中,木人引入知识粒度这一个方法作为一个统一的框架去理解和实施异常点挖掘。此外,还给出了基于知识粒度的异常点挖掘算法。该算法结合粗糙集与数据挖掘技术研究异常数据。理论研究和实验结果表明,知识粒度方法对评定异常是有效且适用的。关键词:粗糙集;异常检测;数据挖掘;知识粒度ABSTRACTRoughs
4、ettheory,itisatheoryofdataanalysisandprocessing,80inthe20thcenturybyPolishscientistsPawlakestablished.Thebeginningoftheproblemsduetolanguageexchanges,theestablishmentofthetheory,whenonlyafewEasternEuropeanscholarswouldstudyandapplyit,andlaterwiththedevelo
5、pmentofthetheoryslowlybytheglobalcomputeronthewell-knownscholarsandscholarsinmathematicsseriously.Thebasicideaofknowledgegranulationinmanyareas,suchasroughsets,database,clusteringanalysis,fuzzysets,evidencetheory,dataminingandmachinelearning.1979L.A.Zadeh
6、thefirsttimeintheworldanddiscussedaftertheknowledgegranulationoffuzzy,theknowledgegranulationobtainedpeoplemoreandmoreattention.Afteryearsofdevelopment,knowledgegranularityinknowledgediscovery,datamining,softcomputingplaysanincreasinglyimportantrole.Inthi
7、spaper,weintroducethismethodofknowledgegranularityasaunifiedframeworktounderstandandimplementoutliermining.Inaddition,wealsogivethesizeofknowledge-basedalgorithmforminingoutliers.Thealgorithmcombinesroughsetsanddataminingofabnormaldata.Theoreticalandexper
8、imentalresultsshowthatthemethodofassessmentofknowledgegranularityisaneffectiveandappropriateexception.KeyWords:roughsets;outlierdetection;datamining;knowledgegranulation目录第1章引言11.1概述11.2研究的目的和意义21.3国内外研究现状31.3.1数据挖掘