资源描述:
《基于关联规则的入侵检测算法综述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基于关联规则的入侵检测算法综述武玉刚1,2秦勇2宋继光2,3杨忠明2(1.江苏科技大学计算机与信息工程学院,江苏镇江212003;2.茂名学院信息与网络中心,广东茂名525000;3.太原理工大学计算机与软件学院,山西太原030024)摘要:关联规则是一种新型的数据挖掘方法。根据目前国内国际的研究情况,针对关联规则的特点,首先对关联规则进行了介绍,并对经典Apriori算法做了描述。之后针对该算法的缺点,介绍了一些改进算法。针对入侵检测算法的缺点及其在入侵检测方面的研究分别进行了分析综述,并对其改进阐述。最后,指出了在该领域
2、需要进一步研究的热点问题。关键字:关联规则;入侵检测;数据挖掘TheOverviewofIntrusionDetectionAlgorithmsBasedonAssociationrulesWUYu-gang1,2QINYong2SONGJi-guang2,3YANGZhong-ming2(1.Dept.Computer&InformationEngineering,JiangSuUniversityofScience&Technology,Zhenjiang,Jiangsu212003;2Centerofinformati
3、on&networksMaominguniversity,Maoming,Guangdong525000;3Dept.ComputerScience,TaiYuanUniversityofTechnology,Taiyuan,Shanxi030024)Abstract:Associationruleisanewdataminingmethod.Underthecurrentsituationofdomesticandinternationalresearchforthecharacteristicsofassociation
4、rules,firstofallpairsofassociationruleswereintroduced,andmadetheclassicApriorialgorithmaredescribed.Aftertheaddresstheshortcomingsofthealgorithm,introducedsomeimprovingalgorithms.Thedisadvantagesfortheintrusiondetectionalgorithmanditsapplicationinintrusiondetection
5、researchsynthesiswereanalyzed,anditimprovementsaredescribed.Finally,pointedouttheneedforfurtherresearchinthisarea,ahotissue.KeyWords:associationrules;intrusiondetection;datamining中国分类号:TP3930.引言网络安全,已经变得至关重要。作为传统网络安全技术的补充,入侵检测受到更多的重视。基于模式匹配、统计分析和完整性分析的传统入侵检测方法,逐渐不能
6、适应快速发展的网络安全技术。将关联规则引入到入侵检测中,可以适应快速发展的网络技术并提高入侵检测的检测效率。1.关联规则介绍1.1关联规则基本定义定义1(关联规则)关联规则(associationrule)是由Agrawal[1]等人首先提出的一个重要KDD研究课题,它反映了大量数据中项目集之间有趣的关联或相关联系。定义2(项)设I=是二进制文字的集合,其中的元素称为项(item)。定义3(支持度)记D为交易(transaction)T的集合,交易T是项的集合,并且TI。,其中(1)定义4(置信度),其中(2)定义5(强关联
7、规则)是指挖掘出支持度和可信度分别大于用户给定的最小支持度(min_supp)和最小可信度(min_conf)的关联规则。定义6(频繁项集)如果项集的出现频率大于或等于min_supp与D中事务总数的乘积,则称它为频繁项集。定义7(兴趣度)[2]规定R的兴趣度为,(3)其中为,=。1.1Apriori算法Agrawal等于1993年首先提出了挖掘顾客交易数据库中项集间的关联规则,并设计了一个基本算法,其核心是基于频集理论的递推方法,即基于两阶段频集思想的方法,将关联规则的设计分解为两个子问题:1)发现频集。这个子问题是最重要
8、的,开销最大,因此,各种算法主要致力于提高发现频集的效率。2)根据所获得的频繁项集,产生强关联规则。根据定义这些规则必须满足信任度阈值。由于步骤2中的操作极为简单,因此挖掘关联规则的整个性能就由步骤1中的操作处理所决定。挖掘关联规则的总体性能由第一步决定,第二步相对容易实现。首先产生频繁1