资源描述:
《广东工业大学毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、计算机学院毕业论文39本科毕业设计(论文)BP神经网络的异常点检测应用可行性研究学院计算机学院专业软件工程年级班别2006级(4)班学号3106007039学生姓名蔡东赟指导教师王丽娟2010年5月3939摘要异常点数据是指数据集中与众不同数据。这部分数据的量小,但是对于我们的日常生产生活的影响极大。因此,异常点检测被广泛应用于网络入侵检测,金融保险,天气预报以及新药研制等领域。相对于大量的正常数据挖掘而言,异常点检测被称作小模式数据挖掘。BP算法是一种常用的数据挖掘算法。但是BP算法进行实际数据的异常点数据挖掘
2、过程中存在:实际数据的维数较高,存在冗余特征的干扰,以及在高维特征下,数据量不充分的问题。因此,本文分析BP神经网络处理各种数据的情况,并得到以下结果。(1)BP神经网络能够较好的分离特征单一的仿真数据;但是(2)特征相似性较大的数据集,难以分离判断;(3)正常数据不充分或者不具有代表性,因此正常数据类学习不充分,从而导致异常无法判断。针对以上问题,本文提出了以下的改进措施:(1)BP算法前进行特征约简(映射)从中选取有益于异常检测的特征(2)多神经网络融合,不同神经网络识别不同的特征,相互取长补短,融合后得到最
3、终的结果。关键字:异常,BP,异常点检测,神经网络注:本设计(论文)题目来源于教师的国家级(或部级、省级、厅级、市级、校级、企业)科研项目,项目编号为:。3939AbstractOutlierdataisthedatasetdifferentdata.Thispartofthesmallamountofdata,butforourdailyproductionandlifeofgreat.Therefore,theanomalydetectioniswidelyusedinnetworkintrusiondete
4、ction,finance,insurance,weather,andnewdrugdevelopmentandotherfields.Relativetothelargenumberofnormaldatamining,theanomalydetectionmodeliscalleddataminingsmall.BPalgorithmisacommonlyuseddataminingalgorithm.ButtheBPalgorithmtorealdataoutliersexistinthedataminin
5、gprocess:thehigherthedimensionoftheactualdata,thereareredundantfeaturesoftheinterference,andhigh-dimensionalfeature,theissueofinadequatedata.Therefore,thispaperanalyzesavarietyofBPneuralnetworkprocessingofdata,andtogetthefollowingresults.(1)BPneuralnetworkcan
6、betterseparationcharacteristicsofasinglesimulationdata;but(2)thecharacteristicsofsimilarlargedatasets,separationisdifficulttojudge;(3)normaldataisnotsufficientornotrepresentative,sothenormaldataclasslearningisnotsufficient,leadingtoabnormalcannotjudge.Tosolve
7、theaboveproblem,thispaperproposesthefollowingimprovements:(1)BPalgorithmbeforefeaturereduction(map)benefitfromanomalydetectionfeaturesselected(2)integrationofmultipleneuralnetworks,differentneuralnetworktorecognizethedifferentcharacteristicsofeacheachother,th
8、efinalfusionresult.KeyWords:Outliers-Data,BP,Algorithms,NeuralNetworks3939目录1引言11.1背景11.2传统已有异常点算法介绍11.2.1基于统计学的异常点检测算法11.2.2基于距离的异常点检测算法21.2.3基于密度的算法31.2.4基于偏差的异常点检测51.2.5基于聚类的异常点检测算法62基