基于模糊聚类分析的数据异常知识发现方法

基于模糊聚类分析的数据异常知识发现方法

ID:34293524

大小:1.11 MB

页数:51页

时间:2019-03-04

基于模糊聚类分析的数据异常知识发现方法_第1页
基于模糊聚类分析的数据异常知识发现方法_第2页
基于模糊聚类分析的数据异常知识发现方法_第3页
基于模糊聚类分析的数据异常知识发现方法_第4页
基于模糊聚类分析的数据异常知识发现方法_第5页
资源描述:

《基于模糊聚类分析的数据异常知识发现方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于模糊聚类分析的数据异常知识发现方法ANOMALYDETECTIONMETHODFORDATASETSBASEDONFUZZYCLUSTERING李建勋哈尔滨工业大学2015年7月国内图书分类号:O235学校代码:10213国际图书分类号:519.7密级:公开理学硕士学位论文基于模糊聚类分析的数据异常知识发现方法硕士研究生李建勋导师陈延梅申请学位理学硕士学科计算数学所在单位数学系答辩日期2015年7月授予学位单位哈尔滨工业大学ClassifiedIndex:O235U.D.C:519.7DissertationfortheMasterDegreeinScienceA

2、NOMALYDETECTIONMETHODFORDATASETSBASEDONFUZZYCLUSTERINGCandidate:LiJianxunSupervisor:ChenYanmeiAcademicDegreeAppliedfor:MasterofScienceSpeciality:ComputationalMathematicsAffiliation:DepartmentofMathematicsDateofDefence:July,2015Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学理学

3、硕士学位论文摘要近些年来,计算机技术得到了迅猛的发展,相应的,也带动了数据库领域和信息技术领域相关技术的飞快升级。数据挖掘技术被广泛的应用于天气预报、疾病分析、信用卡欺诈分析、股票市场分析等各个领域之中。虽然传统的异常点检测方法已经可以完成大多数数据集的检测任务,但是有些时候,传统的异常点检测方法考虑的方面可能不全,这就会影响异常点检测的效果和精度。模糊c−均值聚类(简称FCM)算法与其他的聚类算法类似,具有一定的数据聚类能力,但是在利用FCM算法进行数据聚类时,会存在一个不可避免的问题,异常数据应与其一个范围之内邻域数据的分布相关,但这种算法却没有考虑邻域的影响。本文通过对FC

4、M算法的目标函数进行改进,得到了一种考虑了邻域因素的邻域-模糊c−均值算法(简称NFCM),并分别应用改进前后的算法对数据集进行分类。局部离群因子(简称LOF)算法是一种已经十分完善的基于密度的离群点检测方法,但其仍然存在上述没有考虑邻域影响的缺点,本文中将对基于密度的LOF算法进行改进,对数据集进行分类后,根据数据对象的分类情况,通过改进其可达距离和可达密度的形式,得到考虑了邻域对检测结果影响的模糊-LOF算法(简称NFu-LOF),并分别应用改进前后的算法对数据集进行检测和分析。本文中选取四个数据集,首先分别应用模糊c−均值(FCM)算法、改进的邻域模糊c−均值(简称NFCM

5、)算法对这四个数据集进行数值试验,通过数值试验的结果对比分析改进后的邻域模糊c−均值(简称NFCM)算法的召回性和优越性。然后将分别应用LOF算法、改进的模糊LOF算法对其中两个数据集进行数值试验,通过数值试验的结果对比分析改进后的模糊-LOF算法的准确性和优越性。关键词:数据挖掘;异常点检测;邻域;模糊c−均值(FCM)算法;LOF算法-I-哈尔滨工业大学理学硕士学位论文AbstractInrecentyears,Withtherapiddevelopmentofcomputertechnology,thereisarapiddevelopinginthefieldofinfo

6、rmationtechnologyanddatabase.Therefore,anomalydetectiontechnologyiswidelyusedinthefieldoftheweatherforecast,diseaseanalysis,cardfraud,stockmarketanalysisandotherfields.Mostoftheanomalydetectiontaskscanbecompletedbytraditionalanomalydetectionmethods,butsometimes,traditionalanomalydetectionmeth

7、odscan'ttakeeveryfactorintoaccount.Similartootherclusteringalgorithm,FCMalgorithmcansolvesomeanomalydetectionproblems.ButthereisainevitableprobleminFCMalgorithm.Inthispaper,thefunctionofFCMalgorithmwasimproved,andwegetanewanomalydetectionalgo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。