基于支持向量机的网络流量识别模型

基于支持向量机的网络流量识别模型

ID:28143362

大小:18.12 KB

页数:5页

时间:2018-12-08

基于支持向量机的网络流量识别模型_第1页
基于支持向量机的网络流量识别模型_第2页
基于支持向量机的网络流量识别模型_第3页
基于支持向量机的网络流量识别模型_第4页
基于支持向量机的网络流量识别模型_第5页
资源描述:

《基于支持向量机的网络流量识别模型》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。基于支持向量机的网络流量识别模型  摘要:针对网络流量识别问题,提出一种基于支持向量机的网络流量识别模型。首先通过流量特征提取模块,提取适合在支持向量机中识别网络流量的6个主要特征。对数据进行清洗、预处理以及训练和学习,从而实现整个基于SVM的网络流量识别系统。实验结果表明,经过交叉检验选择参数后,再用支持向量机模型进行训练和学习,

2、可以取得较好的分类效果。  关键词:网络流量;支持向量机;流量识别  DOIDOI:/  中图分类号:TP393  文献标识码:A文章编号:1672--0162-03  0引言为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行

3、培训,熟悉系统的使用和维护。  网络流量识别一直以来都是业界研究的重点[1]。目前,网络流量分类和识别主要分为4种类型:基于端口识别、基于应用协议特征字识别、行为特征的启发式识别、基于机器学习方法的分类和识别[2-3]。随着端口跳变、信息隐藏等技术的广泛采用,基于特征端口的识别方法已经不再适用于网络流量的识别与检测[4];基于应用协议特征字的识别虽然准确率比较高,但由于需要获取分组的应用层负载,对处理效率的影响较为严重,并且涉及到隐私保护等法律问题,故不被广泛采用[5];基于行为特征的启发式识别是综合利用流

4、的属性、统计特性以及流的行为特征,按照启发式负责对流量进行分析,达到对网络流量分类和识别的目的,但其分类和识别结果不确定,而是基于概率的结果,因此识别方法的精度取决于网络流量应用特征的显著程度和启发式规则对这种特征的覆盖能力[6]。近年来,基于机器学习的网络流量识别方法表现出了较高的准确率,因此得到越来越多研究者的青睐[7-8]。  本文所讨论的网络流量识别问题,其本质上就是一个二分类问题,考虑到SVM在解决二分类问题中的卓越性能,以及其具有的学习能力,故采用它来实现对网络中正常流量和异常流量的初步识别。 

5、 基于以上观点,本文提出一种基于SVM的网络流量二分类识别方法,与只采用特征值匹配的识别网络流量方法相比,大大减少了特征值匹配模块的工作量,提高了网络流量识别系统效率。  1基于SVM的流量识别系统  本文首先通过流量特征提取模块,提取适合在支持向量机中识别的网络流量的6个主要特征。接着,对数据进行清洗和预处理,通过对数据进行训练和学习,从而实现整个基于SVM的网络流量识别系统。  流量特征提取模块C和Υ为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏

6、目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。  本模块采用了开源软件Winpcap进行网络数据的捕获分析,选取数据包在特定时间间隔内本机连接出去的IP数、端口数、包长、包数、上行速度和下行速度6大特征信息。  基于SVM的P2P流量识别模块  本模块主要�ν�1中提取出的流量统计特征信息进行整理

7、,剔除冗余数据,并将其转换为特征向量形式,采用支持向量机的方法将其交给SVM进行训练,训练后得到一组支持向量,即今后的预测模型。将预测模型与预处理过的待预测特征向量共同代入SVM的决策函数中,从而判别出该网络流量是否为P2P流。  预处理  对数据集进行预处理,即对数据进行缩放的目的在于:  ①避免部分特征值范围过大而另一部分特征值范围过小;  ②避免训练时为了计算核函数而计算内积时引起数值计算困难。  因此通常将数据缩放到[-1,1]或者是[0,l]之间,本文采用默认缩放范围[-1,1]。  寻找最优参数

8、C、Υ  数据预处理后,便可以利用网格搜索法来交叉验证寻找核函数RBF对于训练数据集的最优参数C和Υ[9]。为了识别出好的,以便分类器能准确地预测未知数据。  模型训练为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。