基于不均衡数据集和决策树的入侵检测分类算法的研究

基于不均衡数据集和决策树的入侵检测分类算法的研究

ID:33765293

大小:2.03 MB

页数:51页

时间:2019-03-01

基于不均衡数据集和决策树的入侵检测分类算法的研究_第1页
基于不均衡数据集和决策树的入侵检测分类算法的研究_第2页
基于不均衡数据集和决策树的入侵检测分类算法的研究_第3页
基于不均衡数据集和决策树的入侵检测分类算法的研究_第4页
基于不均衡数据集和决策树的入侵检测分类算法的研究_第5页
资源描述:

《基于不均衡数据集和决策树的入侵检测分类算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、合肥工业大学硕士学位论文基于不均衡数据集和决策树的入侵检测分类算法的研究姓名:夏竹青申请学位级别:硕士专业:计算机应用技术指导教师:叶震20100401基于不均衡数据集和决策树的入侵检测分类算法的研究摘要随着信息技术的快速发展,网络安全日益成为信息社会人们所面临的一个挑战性难题,入侵检测系统的研究和实现随之成为计算机研究和应用领域的重要课题。数据挖掘技术可以对海量数据进行自动高效的分析处理,并能从中挖掘出潜在的规律、规则、模式等知识,已被引入到入侵检测研究领域中。分类技术作为一种有效的数据挖掘方法,在基于数据挖掘的入侵检测

2、中得到广泛应用。由于入侵检测数据集存在类分布不均衡的问题,传统分类方法应用到入侵检测中存在不足,需要引入新的策略来解决类分布不均衡的数据集分类问题。C4.5算法分类原理简单易懂,很容易被理解和接受,具有简单有效的特点。特别在不均衡数据集分类问题上,经典的C4.5算法似乎已成为比较的基准。本文分析了入侵检测训练集的特点和当前不均衡数据集的分类方法,提出了基于欠抽样处理器和C4.5算法的二级分类器CCBCE。欠抽样处理器采用聚类算法GCA和K近邻算法对训练集中大类进行欠抽样,旨在更加准确地去除大类中的边界、噪声和冗余样本,降低

3、训练集的不均衡程度,同时采用Adaboost算法,以C4.5作为基分类器,构造集成分类器C4.5BCE进行二次分类,避免了大类在欠抽样时丢失有用分类信息,从而提高了整体的分类性能。将本文提出的二级分类器CCBCE在UCI学习库中的入侵检测数据集KDDCUP99DATA的实验结果与经典的C4.5算法以及基于欠抽样处理器的C4.5算法的实验结果进行了分析比较。另外,针对集成分类器C4.5BCE,采用不同的集成规模进行了实验,并对实验结果进行了分析。发现随着集成规模的增加,分类检测性能不断得到增强,当集成分类器中个体分类器数目达

4、到一定数量后,集成分类器的性能趋于稳定。关键词:入侵检测:不均衡数据集;C4.5算法;欠抽样技术;Adaboost算法ResearchonAlgorithmtoIntrusionDetectionClassificationBasedonImbalanceddatasetanddecisiontreeAbstractWiththefastdevelopmentofinformationtechnology,networksecurityincreasinglybecomestobeachallengeproblem,SOr

5、esearchandimplementofIntrusionDetectionSystemturnstobeallimportanttaskincomputerresearchandapplicationfields.Dataminingtechnique,whichcallanalyzeandprocesshugedataautomaticallyandefficientlyandmineforlatentrole,regulationandpatternhasbeenintroducedintoIDSresearchf

6、ields.ClassificationhasbeenusedinDMbasedIDSasanavailableDMtechnique.However,traditionalclassificationmethodshavedeficiencyinIDSfortheclassdistributionofIDSdatasetisimbalanced.Sonewclassificationstrategiesshouldbeintroducedintoclassdistributionimbalanceddatasetclas

7、sificationproblems.C4.5algorithmiseasytounderstandprinciplesofclassification,itiseasytounderstandandaccepttoperson,withsimpleandeffectivefeatures.Especiallyintheclassificationofimbalaneeddatasets,theclassicalC4.5algorithmseemstohavebecomethebaselineforcomparison.I

8、nthispaper,weanalyzesthefeaturesofthecurrentintrusiondetectiontrainingsetandclassificationapproachesofimbalanceddataset.Weproposedthetwoclassifiersnamed

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。