欢迎来到天天文库
浏览记录
ID:32533703
大小:2.52 MB
页数:69页
时间:2019-02-11
《改进聚类和决策树算法在入侵检测中应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、广东工业大学硕士学位论文改进的聚类与决策树算法在入侵检测中的应用姓名:易倩申请学位级别:硕士专业:计算机应用技术指导教师:滕少华201205摘要网络技术的快速发展带动了网络应用范围的扩大,随之出现了网络安全问题。目前网络攻击手段多达数千种,应对网络安全问题,除了防火墙,比较有效的措施是入侵检测系统。作为主动防御网络攻击的手段,入侵检测需要解决网路数据量大、噪声数据多、在线学习难等巨大挑战,在海量网络数据中正确识别攻击数据也是亟待解决的问题。入侵检测的本质是从大数据集中提取网络数据特征,依据特征判断网络行为是正常行为或者入侵行为,从而把入侵检测问题
2、转化为数据分类问题。本文主要研究了将K均值聚类算法与C4.5决策树分类算法应用于网络入侵检测的相关问题。K均值聚类算法是利用无监督学习过程获取知识的方法,在聚类过程中不需要任何的先验知识,可以发现未知攻击类型,具有过程简单、收敛速度快等优点,但对数据类型的误判率略高。决策树属于有监督的学习分类方法,需要利用网络行为的先验知识预先标记训练数据。它对已知类型攻击有较高的识别率,但对未知攻击类型的检测则差强人意。本文针对两种算法的不足分别对K均值聚类算法和C4.5决策树分类算法进行改进,并将改进后的算法相结合,构建综合入侵检测算法。本文主要工作包括三个
3、部分:第一部分针对传统K均值聚类算法只适用于球形结构数据集的聚类这一不足,提出一种改进聚类准则函数的方法,采用可以反映属性间相关性的马氏距离替代欧氏距离判断样本间的相似度,为了体现不同属性对聚类结果的不同重要程度,在距离度量中加入属性权重因子和矩阵协调因子,提高K均值聚类算法对非球形簇数据集的聚类能力。第二部分针对C4.5决策树分类算法在某些情况下易产生多值偏向这个问题,提出对属性的分裂信息值进行修正,引入与属性值个数相关的协调因子,从而降低多值属性的信息增益率,使算法倾向于选择其他更有分类意义的属性作为分裂节点,避免多值偏倚。第三部分是将改进的
4、K均值聚类算法和C4.5决策树算法相结合构造综合入侵检测算法。给出了用综合入侵检测算法判断入侵的方法,说明了综合入侵检测系统模型的结构并阐述了具体模块各自的功能及实现细节。最后,选取KDD99数据集进行实验,分别将改进后的算法与原算法的检测效果广东工业大学硕士学位论文进行对比分析,通过试验数据验证,改进后的算法是可行、有效的。基于改进的K均值聚类算法与C4.5决策树分类算法构造的综合检测入侵检测算法也取得了较好的检测效果。关键字:K均值;C4.5:决策树;加权马氏距离;入侵检测ⅡABSTRACTTherapiddevelopmentofnetwo
5、rktechnologyhasdriventheexpansionofthescopeofnetworkapplications,andbringsmuchnetworksecurityissues.TherehasbeenthousandsofNetworkattacksmethods,respondtonetworksecurityissues,inadditiontothefirewall,themoreeffectivemeasuresareintrusiondetectionsystems.Asameansofactivedefense
6、networkattacks,intrusiondetectionneedtosolveenormouschallengessuchasthelargeamountofnetworkdata,noisedata,onlinelearning,inamassivenetworkdatacorrectlyidentifyattackdataarealsoproblemstobesolved.Intrusiondetectionextractcharacteristicsofnetworkdatafromalargedataset,accordingt
7、othecharacteristicstodeterminethenetworkbehaviorisnormalbehaviororintrusionbehavior,intrusiondetectionproblemisconvertedintodataclassification.ThispaperstudytheK.m’eansclusteringalgorithmandtheC4.5decisiontreeclassificationalgorithmappliedtonetworkintrusiondetectionproblem.K-
8、meansclusteringalgorithmistheunsupervisedlearningprocesstoacquirekno
此文档下载收益归作者所有