资源描述:
《基于apriori算法的流量识别特征自动提取方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第12期刘兴彬等:基于Apriori算法的流量识别特征自动提取方法·59·基于Apriori算法的流量识别特征自动提取方法刘兴彬1,2,杨建华1,谢高岗1,胡玥1,2(1.中国科学院计算技术研究所下一代互联网研究中心,北京100190;2.北京科技大学信息工程学院,北京100083)摘要:提出了一种基于Apriori算法自动提取协议识别特征的方法,该方法可以自动提取2种最常用的协议识别特征——特征字符串和包长特征,提取特征的效率较传统方法有很大的提高。通过识别率、准确率、正误识别率和负误识别率等指标验证了所提取特征的准确性和完整性,
2、并根据结果反馈指导特征提取的过程,保证了提取特征的可靠性。关键词:流量识别;自动提取协议识别特征;Apriori算法;深度包探测中图分类号:TP393.08文献标识码:A文章编号:1000-436X(2008)12-0051-09AutomatedminingofpacketsignaturesfortrafficidentificationatapplicationlayerwithapriorialgorithmLIUXing-bin1,2,YANGJian-hua1,XIEGao-gang1,HUYue1,2(1.Resear
3、chCentreofNextInternetInstituteofComputingTechnology,ChineseAcademyofSciences,Beijing100190,China;2.SchoolofInformationEngineering,BeijingUniversityofScienceandTechnology,Beijing100083,China)Abstract:Automaticandaccurateextractionpacketsignaturesarethefoundationofthepr
4、ecisetrafficidentificationatapplicationlevel.Amethodwhichcanautomaticallyextractthepacketsignaturesofcharacteristicstringandpacketlengthfortrafficidentificationatapplicationlayerwasproposed.Theidentificationrate,accuracyrate,positiveidentificationerrorrateandnegativeid
5、entificationerrorratehavebeenverifiedwithexperimentonsometracestovalidtheminedsignatures.Keywords:trafficidentification;automaticallyextractedsignaturesofprotocols;Apriorialgorithm;deeppacketinspecting第12期刘兴彬等:基于Apriori算法的流量识别特征自动提取方法·59·1引言收稿日期:2008-08-20;修回日期:2008-11
6、-18基金项目:国家重点基础研究发展计划(“973”计划)基金资助项目(2007CB310702);国家自然科学基金资助项目(90604015);中国科学院重大科研装备研制项目(YZ200824)FoundationItems:TheNationalBasicResearchProgramofChina(973Program)(2007CB310702);TheNationalNaturalScienceFoundationofChina(90604015);TheMajorResearchProjecttoDevelopEquip
7、mentofChinaAcademyofSciences(YZ200824)网络应用层流量识别对网络规划、网络管理、流量工程、安全检测等至关重要。传统的应用层协议流量识别方法主要基于IANA(Internetassignednumbersauthority)定义的协议端口实现。然而,目前许多新的应用层协议为了逃避防火墙的过滤、避开主机的限制以及出于本身安全因素等原因[1],逐渐开始采用动态端口号,甚至加密方式进行通信。SubhabrataSen等分析发现KazaaP2P协议进行通信的流量中,仅30%的Kazaa第12期刘兴彬等:基于
8、Apriori算法的流量识别特征自动提取方法·59·流量是通过传输层的缺省端口号传输的,这表明仅使用固定端口号进行流量识别是很不准确的[2]。为解决此问题,研究者们提出了深层数据包探测技术(DPI,deeppacketinspecti