基于半监督聚类的入侵检测算法研究

基于半监督聚类的入侵检测算法研究

ID:33385976

大小:1.76 MB

页数:59页

时间:2019-02-25

基于半监督聚类的入侵检测算法研究_第1页
基于半监督聚类的入侵检测算法研究_第2页
基于半监督聚类的入侵检测算法研究_第3页
基于半监督聚类的入侵检测算法研究_第4页
基于半监督聚类的入侵检测算法研究_第5页
资源描述:

《基于半监督聚类的入侵检测算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、河南大学硕士学位论文基于半监督聚类的入侵检测算法研究姓名:李雯睿申请学位级别:硕士专业:应用数学指导教师:申石磊20070501河南大学研究生硕士学位论文第l页摘要.网络信息系统需要采取主动的防御措施。入侵检测技术是近20年来出现的一种主动保护系统、免受黑客攻击的新型网络安全技术。传统的入侵检测算法是基于监督学习的,检测率较高,误报率较低,但无法检测到未知攻击,且要求将数据正确地标记为正常或异常.网络环境中存在大量的未标记数据,要正确地标记这些数据,几乎是不可行的。如果将非监督学习方法应用到入侵检测中,基于聚类的入侵检测算法能够检测未知攻击,检测率较高,但误报率也较高。由此本文提出基

2、于半监督学习的入侵检测算法。一半监督学习是机器学习领域中一个新的研究热点,通过标记数据和未标记数据的联合概率分布,来改进分类器的性能。根据网络数据的特点,本文提出了基于半监督聚类的入侵检测算法,利用少量的标记数据,生成用于初始化算法的种子聚类,然后辅助聚类过程,检测已知和未知攻击。在网络环境中,标记数据是有限的,为了充分利用监督信息,用户需要主动查询标记数据的约束,而不是随机选择约束,这样即使少量的约束也能大大改进算法的性能。本文系统地研究入侵检测系统的基本理论,介绍了入侵检测的定义,分析了入侵检测的模型、研究现状和当前存在的问题。针对基于聚类的入侵检测算法误报率高的问题,提出了基于

3、半监督聚类的入侵检测算法ACKID。论文将主动学习策略应用于半监督聚类过程中,主动学习策略查询网络中未标记数据与标记数据的约束关系,采用FarthestFirst对未标记数据进行标记。KDDCup99数据集是用于评估入侵检测算法的标准数据集,结合KDDCup99数据集,分析了ACKID入侵检测算法的评估过程,确定ROC曲线为ACKID算法的评估指标,分析网络数据的属性特征并对数据预处理,最后评估ACKID算法的性能。实验结果表明,ACKID算法能够检测出未知攻击,证实利用标记数据和约束可以提高算法的检测率,降低误报率,并且表明采用主动学习策略能够获取最有用的监督信息以检测未知攻击。关

4、键词:入侵检测;半监督聚类;主动学习;ROC曲线第1I页河南大学研究生硕士学位论文AbstractInformationsystemneedsactiveprotectionmeasures.Duringthesetwodecades.intrusiondetectionwhichprotectssystemactivelyfromhacker’Sattacksisanewtechnique.ThetraditionalalgorithmsforintrusiondetectionbasedonsupervisedlearningCall’tdetectuDknownattacksa

5、ndrequestthatdataarecorrectlyIabeledasnormaloranomaly,whichdetectionratesarehigherandfalsepositiveratesarelower.Therearelotsofdatainnetworkenvironment.especiallyforlabelingnewunknownattackscorrectlyishardlypossible.Ifthemethodsofunsupervisedlearningaleappliedtointrusiondeteetinn.theintrusiondet

6、ectionalgorithmsbasedonclusteringcandetectnnknownattacks。whichdetectionratesarehigherwhereasfalsenegativesratesarealsohigher.Consequently,thepaperproposesthealgorithmforintrusiondetectionbasedonsemi-supervisedclustering.Semi—supervisedlearningisoneofnewresearchofmanyhottopics,whichattainsjointp

7、robabilitydistributionoflabeleddataandunlabeleddatatoimproveclassifier'sperformance.nepaperproposesthealgorithmforintrusiondetectionbasedonsemi.supervisedclusteringwhichusesafewlimitedlabeleddatatogenerateseedclustersinitiatingthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。