无监督异常检测方法研究及其应用

无监督异常检测方法研究及其应用

ID:23937690

大小:3.54 MB

页数:78页

时间:2018-11-11

无监督异常检测方法研究及其应用_第1页
无监督异常检测方法研究及其应用_第2页
无监督异常检测方法研究及其应用_第3页
无监督异常检测方法研究及其应用_第4页
无监督异常检测方法研究及其应用_第5页
资源描述:

《无监督异常检测方法研究及其应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、电子科技大学UNIVERSITYOFELECTRONICSCIENCEANDTECHNOLOGYOFCHINA硕士学位论文MASTERTHESIS论文题目无监督异常检测方法研究及其应用学科专业计算机软件与理论学号201521060311作者姓名刘鑫指导教师董强副教授分类号密级注1UDC学位论文无监督异常检测方法研究及其应用(题名和副题名)刘鑫(作者姓名)指导教师董强副教授电子科技大学成都(姓名、职称、单位名称)申请学位级别硕士学科专业计算机软件与理论提交论文日期2018.03.23论文答辩日期2018.05.18学位授予单位和日期电子科技

2、大学2018年06月答辩委员会主席评阅人注1:注明《国际十进分类法UDC》的类号。ResearchonUnsupervisedAnomalyDetectionAlgorithmandApplicationAMasterDissertationSubmittedtoUniversityofElectronicScienceandTechnologyofChinaDiscipline:ComputersoftwareandtheoryAuthor:XinLiuSupervisor:A.Prof.DongQiangSchool:Schoolof

3、ComputerScience&Engineering摘要摘要根据Hawkins对于异常的定义:“异常是远离其他观测数据,并且产生机制与正常数据不同的样本数据”,可以得出异常检测是对数据中不同于正常行为的异常数据模式的检测和发现。在网络环境、复杂机器系统、气象信息系统等系统中,数据模式往往可以归纳成两种形式,一种是正常,一种是异常。在这些系统中,异常模式往往包含了重要的信息,及早发现异常模式可以规避已知或者未知的风险,同时提高工作效率。目前异常检测技术已经大量应用到各个领域,例如网络入侵检测,信用卡欺诈检测、复杂系统中的故障检测与修复和气

4、象异常检测等。识别,理解和预测数据中的异常已经成为现代数据挖掘的关键支柱之一。在大数据环境下,人们比以往更加关注能够快速从全体数据中获得有价值信息的方法。因此无监督异常检测算法更加需要关注异常的发现效率和在各类型数据情况下算法的可适应性问题。本课题旨在通过对以往无监督异常检测算法优缺点的研究与分析,提出一种基于无监督决策树的异常检测算法。本文的主要研究内容包括以下三个部分:1、国内外异常检测算法比较研究。此部分是本课题研究的逻辑起点。通过该部分对异常检测算法的背景研究与分析可以找出现有算法的优点与不足,从而总结归纳出新的算法。2、无监督异

5、常检测算法的提出与实验。此部分基于第一部分的调研,提出一种结合统计学知识和决策树构建方法的新的无监督决策树算法。该方法利用数据在特征上的分布信息找出决策树分支节点的最优分割点。实验结果表明,该方法可以获得比现有通用方法更好的检测效果。同时该方法相较于现有方法,对数据具有更强的适应性。3、决策树加速算法的提出与实验。为了使得决策树算法在大样本下依然有较高的执行效率,提出一种基于梯度的决策树找最优分割点的方法。该方法利用可分性的梯度信息来指导跳过不重要分割点处的可分性计算,减少了大量的计算量。实验表明该方法在减少大量计算量的同时,并不会降低算

6、法精度。关键词:异常检测,统计学习,决策树算法,决策树加速算法IABSTRACTABSTRACTAccordingtoHawkins'definitionoftheanomaly,“Theanomalyisthedatathatisdifferentfromtheotherobservationsandproducedbydifferentmechanisms.”.Therefore,anomalydetectionisthedetectionanddiscoveryofabnormaldatapatternsindatathatared

7、ifferentfromnormalbehavior.Inthenetworkenvironment,complexmachinesystems,weatherinformationsystemsandothersystems,theconditionsinthesesystemscanoftenbesummedupintwoforms,oneisnormal,anotherisabnormal.Inthesesystems,thepatternsofabnormaloftencontainimportantinformation.Wec

8、ansometimesavoidcatastrophicrisks,improvingworkefficiencyandsoonifwehasdetectedpatternsofabnorma

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。