资源描述:
《基于关联规则变压器故障诊断》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于关联规则变压器故障诊断摘要:利用数据挖掘技术对电力系统中的大量测控数据挖掘已成为一种有效的故障诊断方法,首先介绍基于关联规则的数据挖掘原理,然后分析了关联规则在变压器故障诊断中的应用方法,实例表明,使用关联规则对电力设备进行故障诊断更高的正确率。关键词:关联规则;数据挖掘;电力设备;故障诊断中图分类号:TP393文献标识码:A文章编号:1009-3044(2012)30-7167-02近年来数据挖掘技术(粗糙集理论,模式聚类,决策树,关联规则等)得到了快速的发展,在金融、医疗、生物、电力、化工等领域得到了广泛应用。电力设备在运行管理中产生大量的测控数据,如:遥测数据、继保数据、遥信数据
2、和二次计算结果等,这些数据隐含着设备的运行状态,如在实际电力设备发生故障之前的一段时间内,遥测数据可能会发生某种变化,如温度、压力等参数的异常增减,如果能利用数据挖掘技术对历史测控数据进行分析和总结,找出其内在的规律,再用这些内在规律判断当前设备运行的状况,如能及时发现故障征兆并采取有效措施,就可以避免电力系统出现重大的故障,基于关联规则的故障诊断技术能够从历史数据中自动或半自动地获取潜在的诊断知识,从而有效解决故障诊断中知识获取困难的问题,非常适合用来分析变压器状态。1基于关联规则的数据挖掘在电力设备故障诊断领域,采用关联规则在大型关系数据库中进行数据挖掘分析找出设备的状态是电力状态检修
3、的一个新方向,通过分析故障特征量与故障模式之间的可信度,便能确定故障特征量与该故障模式的相关程度,通过大量的数据挖掘,可以挖掘出设备特征量指标与故障模式之间可能存在一些隐含关联关系,并以此作为电力设备状态检修决策的依据。1.2关联规则原理分析关联规则挖掘(AssociationRuleMining)是根据用户给定的最小支持度minsup和最小置信度minconf从事务数据库D中找出所有的关联规则。1)关联规则:若满足X中条件的数据库元组能推导出丫,则称X与Y关联,记为X二〉Y,其中Ywl,Xel,并且XnY二①,[I=i1,i2,...ik,...,in];2)支持度:[supportX?
4、丫二countX?YDx100洵其中,[D=t1,t2,...tk,…,tn]为事务数据集,[countX?Y]表示事务中[X?Y]的事务数;3)置信度:[confidence(X->Y)=count(X?Y)count(Y)xlOO%],其中,count(Y)是包含项集Y的事务数目,count(X=>Y)是包含项集X=>Y的事务数目;1)强关联规则:[X?Ysupport(X?Y)%,confidence(X?Y)%]o1.2关联规则挖掘的过程关联规则对数据事务进行挖掘中,首先,扫描事务数据库T,并对任何个项i进行计数接着对数据进行归一化处理和离散化处理,然后组成适合关联规则挖掘的事务数
5、据库,再根据最小支持度阈值寻找频繁项集,并将其组成新的频繁项集,然后再根据最小可信度阈值筛选出关联规则,对可以合并的关联规则进行合并,确定感兴趣的强关联规则,并作为有用规则输出,最后用关联规则对电力设备进行故障诊断;常用的算法有Apriori算法、FP树频繁项集算法等,文中选用了最有影响的挖掘布尔关联规则频繁项集的Apriori算法,并对其进行了改进,采用基于散列的技术压缩候选k项集Ck(k>1),利用事务压缩对一些候选项进行标记或删除,并对寻找候选项集进行数据划分,减少扫描数据库的次数,此外,在任何点前添加动态项集计数,提高了Apriori算法的搜索速度。2基于关联规则的电力设备故障诊断
6、方法1)简化事务数据库事务数据集是使用关联规则进行数据挖掘必须直接面对的对象,在关联规则挖掘过程中,需要收集大量的数据,数据越充分,得出的有用结论的置信度就越高,但由于变压器测控的数据存在很多重复的数据,必须对这些重复的数据进行归一化量化,将其值归一化到[0,1]区间上。2)分箱由于经过归一化后得到的数据是连续的数据,为了方便挖掘,我们对连续的数据进行分箱,划分为区间。这些区间是动态的,在挖掘期间我们可以对它们进行进一步合并,三种常用的分箱策略有等宽分箱、等频分箱和基于聚类的分箱,本文使用等宽分箱,每箱的区间长度相同,每个属性的量化属性的分箱大小由操作者确定,由于属性区间被归一到[0,1]
7、区间,默认分箱分为10个区间,每个区间大小为0.1,变压器经过量化后得到动态离散值,再对这些数据进行等宽分箱操作,划分区间。再根据比值编码,选择属性子集,剔除对挖掘任务无关的冗余属性。3)找频繁谓词扫描上一步产生的数据,找出满足条件的频繁谓词集。因为变压器色谱数据指标只有5项,频繁项集内最大成员只可能为5个,不会产生更多的频繁相集,因此可以根据Apriori算法,找出满足最小置信度的频繁谓词集(满足最小支持度),发现频繁