欢迎来到天天文库
浏览记录
ID:10163770
大小:31.50 KB
页数:9页
时间:2018-06-12
《数据挖掘技术在电力行业中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、数据挖掘技术在电力行业中的应用研究【摘要】信息技术在电力行业中的应用越来越重要,本文分析数据挖掘技术,构建电力行业中数据挖掘系统的模型,简述数据挖掘技术在电力行业中,状态检修、电力营销、负荷预测中的相关应用。【关键词】数据挖掘;电力行业;检修;预测1.引言电力行业信息化的现状。在过去近50年的时间里,电力行业信息化主要可以分为三个阶段:初级阶段,电力信息化较为基础,主要为电力企业利用IT打基础,包括对基础局域网的搭建,计算机的使用普及,以及针对一些简单应用进行的初步系统开发等等;中级阶段,也是我国目前各级电力企业的状总值,在这一阶段,企业中相应的部门、各电力分公
2、司建立了现代化的信息中心,建立了完整的企业主干网,对于生产调度、生产营销等专业领域也构建了专业的业务支持系统。也构建了能满足电力企业的基础需求的电力信息化系统;高级阶段,集中型平台建设.集团网络架设全面业务整合平台。随着电力企业体制改革的推进,信息系统除了提供基础支持,更重要的是为企业的决策、管理、创新提供快速、全面的信息,企业已经不能满足于各个独立电力信息化已经不能仅仅的业务系统,对整合型平台的呼声也越来越高。9从上个世纪六十年代起,我国电力行业开始了信息化建设,电力系统的工程计算,变电站和发电厂的自动监测、监控等方面。到了八十年代,电力系统各个方面都被信息化
3、覆盖,包括电力企业各个层次以及各级电力企业建立的不同的信息系统。随着科学技术的发展,以及信息化建设加快,电力系统的信息化系统产生并累积了大量的数据,有些数据甚至成为了信息孤岛。电力行业信息化系统每天都在产生大量的数据,尤其是过程控制和数据采集对现场运行设备进行监视和控制,实现数据采集,设备控制采集,测量,参数据调节,以及各种信号报警等,这些数据中蕴藏着重要的信息,但缺乏从数据中提取知识的工具,企业很多重要的决定和决策不是根据数据库中的信息丰富的数据,而是凭经验和直觉做出,数据和信息之间形成鸿沟。数据挖掘技术是近年来应运而生的一门新兴技术,它能够利用现有的计算机技
4、术和各个相关领域的知识,将其组织成适合决策分析需要的分析数据,挖掘出有用的模式知识和规则,用来提高整个管理系统的决策分析能力,围绕电力企业关键指标体系,应用数据挖掘技术势在必行。2.数据挖掘技术数据挖掘又称为知识发现(knowledgediscovery)、商业智能(businessintellige-nce)、预测建模(predictive9modeling)以及预测分析(predictiveanalytics)等等。这里使用的数据挖掘定义,数据挖掘是一项探测大量数据以发现有意义的模式(pattern)和规则(rule)的业务流程(businessproces
5、s)。从狭义上讲,数据挖掘是工具和技术的集合。它是用来支持以客户为中心的企业的几种必要技术之一。从广义上讲,数据挖掘是一种态度,即业务行动应该基于学习、知情的决定比不知情的决定要好,以及度量结果对业务有益等。数据挖掘也是一个应用分析工具和技术的过程和方法论(methodology)。2.1数据挖掘过程数据挖掘的流程分为以下几个步骤:问题提出,数据收集(预处理),数据挖掘(算法执行),结果的解释和评估,知识,如图1所示。图1数据挖掘过程2.2数据挖掘的主要方法2.2.1关联分析关联分析是指如果两个或多个事物之间存在一定的关联,那么其中一个事物就能通过其他事物进行预
6、测,它的目的是为了挖掘隐藏在数据间的相互关系。在数据挖掘的基本任务中关联(association)和顺序贯模型(sequencing)关联分析是指搜索事务数据库(transactional9databases)中的所有细节或事务,从中寻找重复出现概率很高的模式或规则。其属于灰色理论中的一种分析方法。2.2.2时间序列分析时间序列分析(Timeseriesanalysis)是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。2.2.3聚类分析聚类分析指将物理或抽象对象的集合分组成为由类似的对象
7、组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。2.2.4分类分析主要是研究对有关信息进行分类的方法,分类模型以分析数据集中的某些数据得到另外的数据结果,主要分为预测离散变量的分类,预测的连续变量的回归(Regression),数据挖掘中广泛使用的分类方法有决策树,神经网络、径向基础函数等。2.2.5异常分析9一条信息在一定条
8、件下可能是垃圾的信息,而
此文档下载收益归作者所有