基于apriori算法及方差分析的电力故障原因相关度分析

基于apriori算法及方差分析的电力故障原因相关度分析

ID:8933416

大小:62.50 KB

页数:10页

时间:2018-04-12

基于apriori算法及方差分析的电力故障原因相关度分析_第1页
基于apriori算法及方差分析的电力故障原因相关度分析_第2页
基于apriori算法及方差分析的电力故障原因相关度分析_第3页
基于apriori算法及方差分析的电力故障原因相关度分析_第4页
基于apriori算法及方差分析的电力故障原因相关度分析_第5页
资源描述:

《基于apriori算法及方差分析的电力故障原因相关度分析》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、基于Apriori算法及方差分析的电力故障原因相关度分析  中图分类号:TP391文献标识码:A  0.引言  电力系统在空间上的广域分布,导致电力事故的发生是不可避免的,事故数据的收集、分析很难全面、系统地进行。分析2003年~2015年中国南方电网电力生产事故,目前同类事故重复现象比较普遍。采用故障树分析法无法确定导致事故发生的上下级原因之间的相关度,不能确定主要的事故防范措施;另一方面,故障树分析法缺乏对事故分析结果的系统应用,要想全面查找到各个根本原因间的逻辑关系,十分困难,不能建立多方面、多维度

2、防范措施,无法真正达到事故预防目的。利用基于Apriori算法及方差分析的故障树上下级原因相关度分析方法,分析事故上下级原因的相关度可以有针对性地对事故进行防范,降低事故发生概率,减少事故的发生。  Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集合的算法。Apriori算法通过查找事务数据库中所有支持度大于最小支持度的频繁项集。将Apriori算法利用于事故树上下级原因分析,得出的频繁项集合的支持度便是事故树上下级原因之间的相关度,此时最小支持度应该设定为零;另外,Apriori算法还可以在频

3、繁项集合中产生所有大于等于最小可信度的关联规则,即可分析同级原因的关联规则。  对于电网发生的电力事故来说,在某一个确定的时间段上,电力安全生产管理水平是趋于一个稳定的程度,则对应的电力生产事故发生的可能性也是趋于一个确定的值。因此,在一个确定的时间段内发生的电力生产事故的次数服从正态分布,也就是说在这段时间内导致电力生产事故发生的直接原因事件出现的次数成正态分布。  方差分析法是一种常用的统计方法,方差分析就是将总的方差分解为各个方差的成分,然后利用显著性检验法进行分析判断和做出适当的结论。对需要进行分

4、析的因素进行方差分析,若分析结果落入拒绝域,说明下级因素对上级因素没有显著影响;若分析结果落在拒绝域外,则说明有显著的影响。分析得出存在显著影响的因素,可以针对性地对事故进行防范,降低事故发生的概率。  1.Apriori算法  1.1概述  Apriori算法是一种以概率为基础的具有影响的挖掘布尔型关联规则频繁项集合的算法。同时,Apriori算法是第一个关联规则挖掘算法,也是最为经典的算法。Apriori算法利用逐步检索的迭代方法寻找出某数据库中项集合的密切联系,通过这种密切联系来形成规则。Aprio

5、ri算法中包含了几个重要的概念,其中项集(Itemset)就是项的集合,包含K个项的集合为k项集;项集合出现的频率表示在某数据库中,包含项集合的个数,称为项集合的频率。通过制定的最小支持度,如若某项集合满足最小支持度,则称它为频繁项集。  Apriori算法是一个基于频集理论递推的方法,它利用“频繁项集的所有非空子集必定是频繁的,非频繁项集的所有超级必定是非频繁的”这一性质来实现。其根本原理是:通过查找数据库中的所有数据项,从而得到一个大项集L1,如果大项集L1为非空,根据此大项集得到一个候选项集合C1,

6、然后对该数据库中的每一个数据项数据项t,求出t在C1中的全部子集Ct。子集Ct中的每一个的候选项集c,令c加l。当扫描该数据库一遍后,筛选出候选项集合C1中所有计数大于或等于最小支持度的项集组成频繁项集合。  1.2Apriori算法步骤  Apriori算法的挖掘任务分为以下问题:  (1)找出某数据库中所有支持度大于或等于最小支持度的候选项集。具有最小支持度的候选项集称为频繁项目集。  (2)在频繁项集合中产生所有大于等于最小可信度的关联规则。  1.2.1具体步骤  首先确定在该数据下的最小支持度。

7、  Apriori算法采用了候选项集合的概念,通过查找数据库中的所有数据项,得到一个大项集L1,根据大项集得到候选项集,若候选项集的支持度大于或等于最小支持度,则该项集合为频繁项集合(LargeItemset)。此支持度为频繁项集合的概率。  假设一个简单事务数据库D的模型,数据库D的数据如图1所示的事故树。分别求取一级原因A、B、C与事故之间的关联程度,二级原因A1、B1、C1分别与一级原因A、B、C的关联程度,三级原因A11、B11、B12、C11分别与二级原因A1、B1、C1的关联程度,四级原因B1

8、11与三级原因B11的关联程度,须从数据库中计及事故的次数以及各原因的次数。  表1中:001―010代表10个电网事故故障树编号,A、B、C、D、E分别代表事故一级原因。  若要求取一级原因与事故之间的额关联程度首先通过扫描数据库D,生成项集,见表2。  其次利用Apriori算法对数据库中的项集进行扫描,计数每个项集在数据库中的次数,即在每一次迭代过程中,Apriori算法都产生了一个大项集,然后计算每一个候选项集所出现的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。