欢迎来到天天文库
浏览记录
ID:33394701
大小:2.78 MB
页数:58页
时间:2019-02-25
《入侵检测中的数据集生成和使用技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、V华中科技大学硕士学位论文摘要基于数据挖掘的入侵检测技术是当前网络安全研究的一个热点。基于数据挖掘的入侵检测系统面临的很重要的问题就是如何生成和使用数据集,即如何生成和使用训练数据集和测试数据集。在基于数据挖掘的入侵检测系统中,其特征模式库是通过对训练数据集进行数据挖掘建立起来的。训练数据集质量的高低直接影响特征模式库的质量,从而影响入侵检测系统的检测效果。准确地评测一个入侵检测系统对使用者和开发者都是很有意义的,它可以提供使用者一个选择入侵检测系统的标准:也可以作为开发者辅助开发和调试的工具。一个良好的测试数据集对于系统评测的影响是不言而喻的。但是由于具体环
2、境和各个开发系统的巨大差异,目前这两个方面的研究都还只是初步性的,没有形成行业规范。网络中的流量数据被分为正常数据和攻击数据两个部分。首先假定一个正常网络中的流量数据是正常数据,对它们进行截获以作为正常数据;然后按照一定的方法模拟攻击行为,生成攻击数据;接着按照一定的比例混合构成混合数据。数据集生成以后再根据具体使用的入侵检测算法确定数据属性项,以转换成格式化的记录数据。按一定的比例和方法选取数据集中适当的数据项作训练数据集,并对其进行优化,去除噪音和非典型数据。优化方法采用的是k-NN的改近算法k-NNforIDSo这样生成的训练数据集可以随时添加新的数据量
3、,易于扩充,并且能较好的接近现实环境。测试数据集的生成基本和训练数据集的生成方法相同,但其数据项可以直接从混合数据中选取而得到。由于具体网络环境等的限制,很多攻击可能很难在具体的网络中实现。分段混合评测根据不同阶段评测的重点采取离线和在线评测数据结合的方法,可以减实际环境对评测的限制。关键词:入侵检测系统,训练数据集,测试数据集,系统脆弱性,评测方法z华中科技大学硕士学位论文AbstractThetechniqueofintrusiondetectionbasedondataminingisahotresearchtonetworksecurity.Theve
4、ryimportantthingtointrusiondetectionbasedondataminingaremethodologyforbuildingandusingdataset,i.e.trainingdatasetandtestingdataset.ThepaternsetofIDSarebuiltontrainingdatasetbydatamining.Thequalityoftrainingdatasetdirectlyafectthequalityofpaternset,andsoitafecttheeficiencyofdetection
5、.It'ssignificativeontestingaIDSaccurately,foritcouldprovidedachoicestandardforuserandadebuggingtoolfordeveloper.Theefectofagoodtestingdatasettosystemtestingisobvious.Unfortunately,theresearchonthesetwofieldsareonlypilotstudyanditdoesn'tformtheindustryguildbyfarforvarityofrealisticen
6、vironmentanddevelopmentsystem.Thedataofnetworktrafficwillbedividedintonormaldataandatackdata.Itsupposethatthetraficdataonanormalnetworkarenormaldata,sothedataonnormalnetworkshouldbecapturedasnormaldata.Theatackdatawouldbeproductedbysimulatingatackbehaviousinsomemeans.Thenthenormalda
7、taandtheatackdatawouldbemixedinadefiniteproportiontoproductmixturedata.Afterdatasetwasproducted,itshouldbetransformedtoformateddatasetwithsomespecificattributeswhicharechosenaccordingtothegivenintrusiondetectionalgorithm.Somedatashouldbechosenfromthedatasetbysomeproportionandmethodt
8、oformtrainningdatas
此文档下载收益归作者所有