基于机器学习算法的p2p流量分类研究

基于机器学习算法的p2p流量分类研究

ID:24592497

大小:2.66 MB

页数:135页

时间:2018-11-15

基于机器学习算法的p2p流量分类研究_第1页
基于机器学习算法的p2p流量分类研究_第2页
基于机器学习算法的p2p流量分类研究_第3页
基于机器学习算法的p2p流量分类研究_第4页
基于机器学习算法的p2p流量分类研究_第5页
资源描述:

《基于机器学习算法的p2p流量分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、·湖南工业大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者签名:日期:年月日湖南工业大学论文版权使用授权书本人了解湖南工业大学有关保留、使用学位论文的规定,即:学校有权保留学位论文,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以采用复印、缩印或其他手段保存学位论文;学校可根据国

2、家或湖南省有关部门规定送交学位论文。作者签名:导师签名:日期:年月日···-······摘要P2P应用的快速增长,带来网络拥塞、大量消费网络带宽等诸多问题,而传统的基于端口与有效载荷的网络流量分类方法存在着很多缺陷,研究按照5元组(源IP、源Port、目的IP、目的Prot及IP协议)的定义,将P2P报文分成双向TCP或UDP流,抽取独立于端口、协议和有效载荷的原始数据报文的信息作为P2P流的特征,形成特征向量,用特征向量表示流,流的分类类别为P2P的协议类型。用提出的基于ReliefF-CFS的方法选择流的特征子集,该方法结合ReliefF和基

3、于相关性(CFS)两种特征选择方法,产生适合于分类P2P流的特征子集。首先利用ReliefF特征选择方法把候选特征按与类别相关性的大小排序,通过设定的阈值选择与类别相关性大的特征子集作为CFS选择方法的初始集,然后利用CFS结合正向搜索得到最终的较优特征子集。研究使用C4.5决策树、支持向量机(SVM)、K近邻(KNN)三种机器学习算法构建P2P流量分类器,利用获取的原始数据寻找分类器的最优分类参数,主要采用分类准确率和分类时间标准进行评估;并研究统计原始数据报文的部分信息分类P2P流,实验中分别统计流的双向50、100、150、200个报文信息

4、,结果显示不仅减少了特征统计计算的复杂度和分类的时间,而且有更高的分类准确率。为了让研究的成果能有实际的应用价值,通过构建相应的硬件、软件环境,对P2P流量的在线实时分类作了初步的研究。设计并实现了基于机器学习算法的P2P流量分类原型系统,系统分类分类器构建和分类两个阶段,每个阶段有数据采集、数据解析、流的合成以及分类四个模块。关键字P2P,流量分类,特征选择,机器学习I···-······ABSTRACTMoreandmoreP2Papplicationsconsumenetworkbandwidthandgeneratenetworkcong

5、estion.ThetraditionalP2Ptrafficclassificationmethodsbasedonportandpayloadhavemanyobjections.Accordingtothefive-tupledefinition(sourceIPaddress,sourceportnumber,destinationIPaddress,destinationportnumberandIPprotocol),thepacketsareclassifiedintobidirectionalTCPorUDPflow.Theflo

6、wattributesirrelevanttoprotocolandportsareextractedtobecharacteristicvectorthatisusedtorepresentthetraffic.ThetrafficclassificationtypeistheprotocoltypeofP2P.ThetrafficcharacteristicsubsetisdecidedbyusingtheReliefF-CFS method,whichcombineswithReliefFandCFStogeneratecharacteri

7、stic subsetsforclassifyingtheP2Ptraffic.Thecandidatecharacteristicsarefirst orderedbythedependencyusingtheReliefFmethod,ofwhichlargerthan thresholdissetintotheoriginalsetforCFSmethod,thenthefinaloptimal characteristicsetisdecidedbyusingCFSandforwardsearch.TheP2Ptrafficclassif

8、ierisconstructedusingC4.5decisiontree,SVM andKNN.Andtheoptimalparame

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。