基于数据挖掘的理论线损分析

基于数据挖掘的理论线损分析

ID:38228603

大小:219.47 KB

页数:4页

时间:2019-05-25

基于数据挖掘的理论线损分析_第1页
基于数据挖掘的理论线损分析_第2页
基于数据挖掘的理论线损分析_第3页
基于数据挖掘的理论线损分析_第4页
资源描述:

《基于数据挖掘的理论线损分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于数据挖掘的理论线损分析11121卢志刚,韩彦玲,钟嘉庆,谭福龙,李爽(1燕山大学电气工程学院,河北秦皇岛066004;2济南柴油机股份有限公司河北分公司,青县062650)摘要:电力网的损耗受多种因素影响,挖掘线损率与各概化处理。种影响因素之间的关联规则,进而找出对线损影响大的因最邻近算法是一种典型的懒散分类算法。其素,对节能降损有重要的指导意义。把数据挖掘中的聚类基本思想是在多维空间中找到与未知样本最近邻和FP-Growth算法应用在理论线损分析中,得出负荷变化的k个点,并根据这k个点的类别来判断未知样与线损率变化之间的关联关系,为有效可行的降损措

2、施提本的类。如果未知样本的周围的样本点的个数较供参考信息,对系统的经济运行有重要的现实意义。少,那么该k个点所覆盖的区域将会很大,反之关键词:线损分析;数据挖掘;聚类;关联规则;FP-Growth则小。随着算法的迭代,成员依次被合并到离自算法身最近的簇中。在算法中,使用阀值t来判定成0引言员是否将被加入到已经存在的簇中或产生一个新历年的线损计算积累了大量的数据,一般的的簇。算法如下:线损分析都是在对这些数据简单查询、搜索的基输入:D{t1,t2,,tn}//成员集合础上,分析影响线损各个因素的变化,而忽略了A//表示成员之间距离的邻接矩这些影响因素之

3、间的关联,以及它们和线损率之阵输出:间潜在的有用信息,造成了大量数据的浪费。如k//簇集何分析利用这些历史数据,找出其中隐藏的规律,最邻近算法:对降损工作有重大意义。k1{t1};数据挖掘(DM,DataMining)就是从大量的、k{k1};不完全的、有噪声的、模糊的、随机的数据中,k1;提取隐含在其中的、人们事先不知道的、但又是fori2tondo潜在的有用信息和知识的过程。它通过对大量历findthetminsomeclusterkminksuchthat史数据的分析,可以挖掘出规则、概念、模式等dis(ti,tm)isthesmalles

4、t;形式的信息和知识。关联规则是一种重要的数据ifdis(ti,tm)tthen挖掘方法,它是寻找在同一个事件中出现的不同kmkmt项的相关性,可以发现大量数据中数据项集之间else有趣的关联。通过关联规则的分析,可以找出各kk1;个影响因素与线损率之间的变化关系。本文介绍kk{ti}了最邻近聚类算法和FP-Growth关联规则的基本2FP-Growth关联规则概念和挖掘原理,并将其应用在线损分析中,挖关联规则分析是一种对选定数据集进行特征掘出负荷变化与线损率变化之间的关系。描述的挖掘算法,它搜索系统中的所有事务,从1最邻近聚类算法中找出所有

5、能将一组数据项和另一组数据项相联聚类与分类类似,都是将数据进行分组。但系的规则,这种规则的建立并不是确定的关系,与分类不同的是,聚类中的组不是预先定义的,而是一个具有一定置信度的可能值,即事件发生而是根据实际数据的特征按照数据之间的相似性的概率。本文采用FP-Growth算法即频繁模式增来定义的,聚类中的组也称为簇。电力网线损计长算法寻找所有的频繁项集,生成强关联规则,算中的数据很多都是连续性的数值数据,如负荷、在此基础上寻找线损率和各影响因素之间的潜在电压等。对于这些连续属性值,通过将属性域划的有价值的关联关系。分为区间,用区间的标号代替实际的数据值,

6、从2.1问题描述而将它们进行概化处理,即进行数据的离散化。给定一组项目I{I1,I2,,Im}和一个事务数本文采用最邻近算法来实现对连续性数据的据库D{t1,t2,,tn},其中ti{Ii1,Ii2,,Iik}并且1IijI,关联规则是形如XY的蕴含式,其中FP-Tree含单个路径,则对于路径P中的每个组合X,YI是两个项目集合,称为项目集并且(记作)产生模式a,其支持度s中结点的XY。最小支持度;否则对于在Tree头部的每个ai产生关联规则XY的支持度(s)是数据库中包一个模式aia,(其支持度sai的支持度

7、)构含XY的事务占库中所有事务的百分比。造的条件模式基,然后构造的条件FP-Tree关联规则XY的置信度()是包含XYTree,如果Tree非空,则调用的事务数与包含X的事务数的比值。FP-Growth(Tree,)。若s(XY)最小支持度,且(XY)其中,在构造FP-Tree的过程中,是对D进最小置信度,称为关联规则XY为强规则,否行第二次扫描,由其中的每一个事务产生一个分则称关联规则XY为弱规则。通常根据实际情枝,在对每一个事务中的项目进行处理的过程中,况来指定最小支持度和最小置信度。支持度和置是按L的正向顺序进行处

8、理的,而在对FP-Tree信度是描述关联规则的两个重要概念,前者用于进行数据挖掘

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。