欢迎来到天天文库
浏览记录
ID:23276984
大小:63.62 KB
页数:5页
时间:2018-11-06
《基于大数据背景下提高供电公司数据质量对策分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于大数据背景下提高供电公司数据质量对策分析(国网宿迁供电公司223800)摘要:随着电网智能化的发展,电力信息系统变得更为复杂,其数据也随之增大,从而引起了各种的数据质量问题,严重阻碍了电力信息系统的使用。文章阐述了电力大数据的特点以及影响数据质量的因素,并在此基础上提出了相应的对策。关键词:大数据;数据质量;供电公司;电网智能化;电力信息系统随着信息技术在电网中的应用,电M产生的数据量和类型也急剧增加。面对逐渐复杂的数据资源,数据质量问题也随之增多,比如系统内/外的问题、核对标准的问题等,这些问题严重影响了电力信息系统的应用与推广,比较典型的例子就是电
2、力营销信息管理系统用电客户档案的数据质量问题。电IM企业在需要进行停电检修或电网故障导致停电时都会电话或短信通知客户,如果营销系统里记录的用电客户的联系电话缺失或者不准确,电力客服就无法及时准确地通知到客户,从而对用电客户的生产、生活造成不良影响。诸如此类的问题在电力资产管理系统,安全生产管理系统也一样存在。随着电力营销、生产、资产等主业务信息系统都釆取了“大集中”模式,数据质量的问题也逐步凸显。为了解决这些数据质量问题,供电系统逐渐引用了大数据技术。所以针对这些大数据和大数据技术,供电公司应引入有效、可行方法,来提高数据质量。1电力大数据特征目前,电力大
3、数据指的是大数据的理论、技术以及思想在电力行业中的实践,它提供了从数据的采集一直到最后的展示较为完善的解决方案。1.1价值密度比较低一般而言,数据的价值是取决于在大量的数据中挖掘有效的信息。比如,在输变电设备的检测系统中,采集的大部分数据是正常的,仅有少量的不正常,但是这些非正常的数据是对设备状态检测的关键性数据。1.2具有交互的特点0前,电网企业正朝以用户为核心的方向进行转变,用户对供电系统服务质量的满意程度将会是很重要的考核指标,所以,供电系统可以根据数据的分析与挖掘,对用户的需求进行了解,来提高更高质量的服务。此外,交互特点还表现在用户在用电的高峰期
4、会向电网进行供电。1.3处理的速度较快在对数据进行决策吋,对能够实时与在线处理的要求逐渐提高,因此必须提高对数据进行处理的速度,符合决策的要求,在极短的吋间内对大量数据进行相关分析。1.4类型繁多主要包括非结构化、半结构化和结构化。信息系统的建立加快了半结构化类型数据的增多,比如视频、音频以及图片等。另外,电网企业还要必备能源和气象等外部数据,才能保证供电的可靠性。1.5体量庞大已经从TB级升到PB级。信息化的电网的建立使数据可以进行实吋的收集与传输,间隔仅为秒级,使数据量呈指数增长。但是对火量数据的应用与存储技术还不完善,数据的价值不能得到良好的挖掘。2
5、数据质量的影响因素影响供电行业数据质量的原因非常多,而依据数据产生的节点与时间,能够把这些因素归为以下三类:2.1数据的导入过程该过程一般指的是利用集成、接口或手工等方式把数据输入对应仓库的这一程序。这一程序对数据产生的作用主要体现在:(1)人工方式的录入方式,会因为一些没办法预防的原因,而导致结果难以预测;(2)对系统进行重建或升级维护时,经常会对旧系统进行淘汰或者合并,因此整顿数据与原来的数据之间的转换问题较为复杂,面临着严峻的挑战;(3)对原来的数据进行转换吋,没冇可以依靠的源系统的元数据,为源数据自身并不完备;(4)业务系统前台操作员录入不规范或系
6、统对录入的数据未作校验,导致业务单据流程归档后,保存到后台数据库的原始数据就存在数据质量问题。2.2导致数据变坏的过程会导致数据产生损坏的原因有很多:(1)不能对变化地对数据进行捕获,各个系统间通常具有很多的接口,在对接口进行修改时,通常不会把对它产生影响的统一修改;(2)在专业知识或者人员流失后,新来人员对数据的意义进行准确的分析比较闲难;(3)数据的处理过程是一个自动化的操作,可能会发生某些验证界面很难涵盖数据的所冇特点,也可能是因为性能上的原因将其屏蔽了,所以一旦出现错误,在将大量的数据反馈给客户的时候,将会被责怪,用户对数据质量的感知度也会降低。2
7、.3系统内部过程系统自身在对数据进行整理分析的时候也会对其质量产生一定的影响,主要是对数据进行处理、清洗和清除的过程。第一,在对数据进行处理过程中,一旦处理程序发生变化,就会导致质量问题的出现,而新产生的对数据进行采集的程序同样会导致类似的现象,此外,如果在不对的吋间发生突发事件,打破数据应有的状态,那么正确的程序也会导致不正确结果的出现,而该问题较为隐蔽,不易被査出;第二,对数据进行清洗的过程,导致危险发生的原因一般在于数据质量本身的内部相关性与复杂性。在解决了某一问题后,也许会导致很多类似或者其他有关数据的问题的出现。数据清洗的自动化是由计算机程序操控
8、的,而程序本身存在bug,对大量数据的记录产生一定的影响,数据质量
此文档下载收益归作者所有