关联规则在通信告警分析中的应用研究

关联规则在通信告警分析中的应用研究

ID:23310737

大小:52.50 KB

页数:5页

时间:2018-11-07

关联规则在通信告警分析中的应用研究_第1页
关联规则在通信告警分析中的应用研究_第2页
关联规则在通信告警分析中的应用研究_第3页
关联规则在通信告警分析中的应用研究_第4页
关联规则在通信告警分析中的应用研究_第5页
资源描述:

《关联规则在通信告警分析中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、关联规则在通信告警分析中的应用研究随着收集和存储在数据库中的数据规模越来越大,人们对从这些数据中挖掘相应的关联知识越来越有兴趣。移动通信X络监控告警的结构化数据从形式上来说是一种多维数据,对于这类数据如何有效地进行关联规则的挖掘,是本文深入研究探讨的一个问题。关键词:关联规则;通信告警;数据挖掘;序言  关联规则是表示数据库中一组对象之间的某种关联关系的规则,关联规则挖掘的主要对象是交易(Transaction)数据库。这种数据库的一个主要应用是零售业,比如超级市场的销售管理。条形码技术的发展使得数据的收集变得更

2、容易、更完整,从而可以存储大量的交易资料。关联规则就是辨别这些交易项目之间是否存在某种关系1。这种关联规则提供的信息可以用作商品目录设计、商场货架的布置、生产安排、具有针对性的市场营销等。1.关联规则挖掘概述  1.1挖掘关联规则的步骤  (1)根据最小的支持度,在大量事务寻找高频率出现的频繁项集(Itemset)。  (2)根据最小的置信度,找到的频繁项集产生关联规则。  其中第二个步骤比较容易,一般经过第一步的筛选后的频繁项集都不会很多,通过子集产生法就可以产生关联规则。  1.2关联规则挖掘的分类  市场购

3、物分析仅仅是一种关联规则挖掘的应用。事实上,有许多不同类型的关联规则知识挖掘。可以根据以下标准对这些关联规则挖掘方法进行分类:  (1)根据关联规则所处理的具体值来进行分类划分  若一个规则仅描述“数据项是否出现”这种情况间的联系,那么这种关联规则就是一个布尔关联规则。若一个规则描述的是定量数据项(或属性)之间的关系,那么它就是一个定量关联规则,在这些规则中,数据项(或属性)的定量数值可以划分为区间范围。  (2)根据规则中数据的维数来进行分类划分  若一个关联规则中的项(或属性)仅涉及一个维,那么它就是一个单维

4、关联规则。若一个规则涉及两个或更多维,那么它就是一个多维关联规则挖掘。2、应用于通信告警表单的Apriori算法改进  至今已提出了许多Apriori算法的改进方法。本文对通信告警表单关联规则挖掘的算法采用的正是添加了如下改进技术的Apriori算法。  2.1哈希(hash)表技术  利用hash表技术可以帮助有效地减少候选k-项集Ck(k>1)所占用的空间。本实验中,在结构化数据中的4个属性(告警时间,设备类型,告警种类,告警等级),我们用符号Ixy代表第x个属性的第y个选项,如I12代表“告警时间”属性中的

5、选项“eveningbusytime”,I23代表“设备类型”属性中的选项“transcoder”等。就组合而言2-项集共有3×3+4×4+12+12+12+12=73种。对一个2-项集Ix1y1Ix2y2,定义一个hash函数h(x,y)=((x1+x2)×10+(y1+y2))mod73,之后,在扫描表单数据库以便从候选1-项集C1中产生1-频繁项集L1时,就可以为每个表单数据产生所有的2-项集并将它们哈希到hash表的不同栏目中,且增加相应栏目的计数。  2.2数据划分  利用数据划分技术来挖掘频繁项集而只

6、需扫描整个数据库两次。它包含两个主要处理阶段。第一阶段,算法将表单数据库D分为n个互不相交的部分;若数据库D中的最小支持阈值为min_sup,那么每个部分所对应的最小支持频度阈值为:  min_sup×number_of_transaction_of_partition  对于每个划分(部分),挖掘其中所有的频繁项集;它们被称为是局部频繁项集,利用一个特别的数据结构记录包含这些频繁项集的表单记录的TID,以便使得在一次数据库扫描中就能够发现所有的局部k-频繁项集,k=1,2,…。就整个表单数据库D而言,一个局部频

7、繁项集不一定就是全局频繁项集;但是任何全局频繁项集一定会出现从所有划分所获得的这些局部频繁项集中。3、通信告警表单的多维关联规则挖掘  如果在表单数据库中的数据是以多维形式定义存储的,那么就不能使用简单的单维布尔关联规则挖掘方法了。包含两个或更多的谓词的关联规则就称为多维关联规则2。我们的通信告警表单数据库记录了数据的属性信息,包括告警时间,设备类型,告警种类,告警等级等。将表单数据库中的这些属性看成谓词,那么挖掘包含多个谓词的关联规则是很有价值的。如:Time(X,”morningbusy”)∧equipmen

8、ttype(X,”transcoder”)→alarmkind(X,”linkFailureEvent”)  事实上,这种方法可以用于一切非连续型数据的关联规则挖掘,因为在求1-频繁项集的时候我们就对其作了一定限制,而上述Apriori关联规则的挖掘算法从第3步之后的计算都会按照限制去计算,所以,我们可以得出一个结论,就是在求非连续型数据的关联规则挖掘问题中,都可以用以上

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。