欢迎来到天天文库
浏览记录
ID:16449535
大小:59.00 KB
页数:6页
时间:2018-08-09
《基于数据挖掘技术的电气设备在线监测系统开发》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基于数据挖掘技术的电气设备在线监测系统开发包晓晖(福建水利电力职业技术学院,福建永安,366000)摘要:文章介绍了数据仓库与数据挖掘技术,论述了数据挖掘技术在电气设备在线监测中的应用,并提出了基于此技术的在线监测系统硬件设计,重点分析了数据预处理模块中线性均值法和数据挖掘模块中决策树分类算法的应用。关键词:数据仓库数据挖掘在线监测预处理算法0 引言随着电力系统中电气设备状态在线监测装置的广泛使用,其在线监测到的数据也日益丰富,如何从海量的数据中快速准确地提取用于科学决策的信息,已是一项有助于完善该系统的重点工作。
2、为此所使用的工具算法必须突破传统的简单的数据库表模式应用,建立更为贴近决策者思维过程的支持,代替决策者的复杂数据与信息的处理,及时提供正确决策所需全部信息。1概述1.1 数据仓库与数据挖掘技术数据仓库领域的权威W.H.Inmon给出了数据仓库的一个简短而全面的定义:数据仓库(DataWarehouse)是一个面向主题、集成、时变、非易失的数据集合,是支持管理部门的决策过程。数据仓库是一个环境,而不是一件产品,提供用户用于决策支持的当前和历史数据,这些数据在传统的操作型数据库中很难或不能得到。数据挖掘(DataMi
3、ning),又称为数据库中的知识发现(KnowledgeDiscoveryinDatabase,KDD),就是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。它是一门涉及面很广的交叉学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。数据挖掘的分析方法主要有分类、估值、预测、相关性分组或关联规则、聚类、描述和可视化等六种。其中,分类、估值、预测属于直接数据挖掘,后
4、三种属于间接数据挖掘。数据挖掘的一般流程为:①定义问题——清晰地确定某个应用领域或某个问题,确定数据挖掘的目的;②数据选择——在大型数据库和数据仓库目标中提取数据挖掘的目标数据集;③数据预处理——进行数据再加工,包括检查数据的完整性及数据的一致性、去噪声,填补丢失的域,删除无效数据等;④数据挖掘——根据数据功能的类型和和数据的特点选择相应的算法(如汇总、分类、回归、聚类等),在净化和转换过的数据集上进行数据挖掘;⑤结果分析——对数据挖掘的结果进行解释和评价,转换成为能够最终被用户理解的知识;⑥知识的运用——将分析所
5、得到的知识集成到信息系统的组织结构中去。1.2电气设备在线监测系统电气设备在线监测,就是利用传感、电子、计算机等技术,通过对运行中高压设备的信号采集和传输、数据处理、逻辑判断,来实现对电力设备运行状态的带电测试或不间断的实时监测和诊断。目前,发电厂或变电站的电气设备在线监测系统一般为分层分布式在线监测系统,包括就地监测终端、站方在线监测站、局方主站系统等三层。其监测的主要内容有:发电机绝缘局部放电;变压器、电抗器的局部放电量;容性设备的介质损耗因数、电容量;GIS局部放电情况;电缆绝缘介质损耗、泄漏电流;开关电器绝
6、缘拉杆泄漏电流;系统母线频率、电压、谐波;大气环境参数(如现场温度、湿度)等。2 系统总体设计2.1 系统目标本文拟开发的基于数据挖掘技术的电气设备在线监测系统,旨在将原在线监测系统的数据与各相关因素的数据组合起来进行探索性、系统性分析;然后,选择并运用数据挖掘算法对这些数据进行剖析,得到各相关因素对设备状态影响的定量表示,以便地获得各类信息,如同一电压等级下同相设备绝缘状况比较,同一生产厂家制造的设施绝缘状况比较,在何时间、何环境条件绝缘参数变化更显著,何种干扰信号容易引起误报警等;根据这种定量表示,结合下一时段
7、系统负荷、气象预测数据,预测出下一时段的电气设备状态曲线,从而准确地判断设备的健康状况,防范未然。2.2 系统结构系统采用Server/Client架构,服务器端(局工作部)的工作平台是Windows2000Server,数据库采用MSSQLServer2000。整个系统包括4个模块,完成4个功能:选择数据、数据预处理、挖掘算法、分析预测。客户端(厂站监测站)工作在Win98/ME/XP界面,可以方便地进行分析、预测和浏览预测结果。图1 系统的总体结构图客户终端1客户终端n历史数据实测数据数据仓库数据处理服务器端
8、数据挖掘分析预测数据选择3数据预处理如前述,数据处理模块需将在线监测所得数据进行预处理,这包括检查数据的完整性及数据的一致性、去噪声,填补丢失的域,删除无效数据等。比如对缺失数据,如果缺失数据的前后时间间隔不大,可根据一元探索性数据分析理论的线性均值法来插值弥补。算术均值公式如式(1)示:式(1)应用:若已知n时刻、n+i时刻的温度值Tn、Tn+i,而缺少中
此文档下载收益归作者所有