etl技术在电信数据运营中的应用

etl技术在电信数据运营中的应用

ID:31365452

大小:108.00 KB

页数:6页

时间:2019-01-09

etl技术在电信数据运营中的应用_第1页
etl技术在电信数据运营中的应用_第2页
etl技术在电信数据运营中的应用_第3页
etl技术在电信数据运营中的应用_第4页
etl技术在电信数据运营中的应用_第5页
资源描述:

《etl技术在电信数据运营中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、ETL技术在电信数据运营中的应用  摘要:在当今“大数据”爆发时代,可用信息是现代企业的重要资源,是企业进行科学有效的管理和进行正确决策分析的基础,如何对数据进行处理也已经成为每个企业在经营过程中的重要环节,使用计算机技术实现数据的自动化地调度更是成为了一种必然趋势。现今,很多企业仍然没有最大化地利用已存在的数据资源,况且对大量数据的重复、粗暴、简陋的处理也.耗费了大量的人力物力,也耽误了最佳的商业决策时机。所以,对数据进行有效地清洗及自动化固化可以极大地减少企业的人力及时间成本,为企业节省更多的成本。而对海量数据的处理就用到了数据仓库技术――ETL(Extrac

2、t-Transform-Load)。  关键词:经营分析;数据处理;Oracle;ETL;数据清洗,数据抽取;数据挖掘  中图分类号:TP393文献标识码:A文章编号:1009-3044(2016)24-0256-02  1ETL技术在电信数据运营中的应用现状  1.1背景介绍  近年来随着“大数据”不断地提出,对海量数据的处理也逐渐面临巨大挑战。而随着中国电信市场份额的日益壮大以及竞争愈加激烈的信息市场,对数据的处理程度将成为重要的一环。6  对于电信行业来说,存在着庞大的数据信息,而运营商想要在市场上站稳脚步,就要建立以目标客户为中心,适应市场机制的运营计划,

3、那么就要必须及时地了解市场的动向,准确的做出战略调整。这激烈的市场竞争要求电信业对客户的需求,以及对隐藏的客户都有着灵敏的感知度,而这所有的有效信息都来源于数据之中,所以如何让对海量数据进行处理,对数据进行有有效、及时的处理成为了电信业企业竞争的一个核心。  1.2国内外现状分析  目前,国外的电信运营公司大部分也都已经有了稳定的框架模型,而且也在实际的运营中,在商业决策中都将数据挖掘提上议程,并且,在此基础上,将数据挖掘提升为成自动化技术,以指导公司运营战略性决策的制定。而在于我国,ETL在电信中的运用已得到极大地重视,但是整体的发展起步较晚,还处于初级阶段,鉴

4、于我国这一国情,我们的电信业经营分析系统数据仓库的构建流程就不得不经常变动随时调整来适应实际运营中的现实问题。通过ETL的构建对大量数据的处理,从而节省人力物力,使运营商的运营成本得以大大减少,所以,如何建立好自己的经营分析系统是每一个运营商和系统开发商都不得不面对的问题和挑战。  1.3ETL技术在电信运营分析中的应用实例  中国电信集团公司**分公司对地下各地市每天都要将大量数据上传至集团公司。6  集团公司需要对对海量数据进行清洗,根据口径整理所需字段,梳理出当天的运营情况,将日数据清洗之后对大量数据还需要再次进行整合成月数据进行处理,并且需要根据这些数据制

5、定电信集团**分公司的具体的运营计划或方针,可是,在对数据的处理过程中或会发现存在大量的重复工冗余作,不但浪费了大量的人力,也会浪费不必要的时间,所以为了避免人力和时间的浪费,所以把以oracle来处理数据的脚本,以存储过程固化,再运用ETL调度平台对其进行任务配置,当集团下分属公司将数据定时提交上来之后,集团公司公司就可以运用ETL调度平台对数据进行自动化的处理,节省人力物力。  2ETL技术介绍  2.1ETL技术的定义  ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transfor

6、m)、加载(load)至目的端的过程。ETL这个词在数据仓库方面用得比较多,但是,ETL的对象并不只是局限于数据仓库一个。  ETL在构建数据仓库当中是非常重要的,用户要将数据加载至数据仓库中,并且需要按照提前规划好的模型数据仓库,首先要将所需数据从数据源抽取出来,第二步再将抽取出来的数据进行清洗。  2.2ETL工具应用  ETL工具的典型代表有:Informatica、Datastage、OWB、微软DTS、Beeload、Kettle、久其ETL等。  开源的工具有eclipse的etl插件:cloveretl。  数据集成:快速实现ETL。  ETL的质量

7、问题具体表现特性主要有:正确性;完整性;一致性;完备性;有效性;时效性;可获取性等。6  而有很多的原因会影响ETL的质量从而导致问题出现,由系统集成和历史数据造成的原因主要包括:1)业务系统不同时期系统之间数据模型不一致;2)业务系统不同时期业务过程有变化;3)旧系统模块在运营、人事、财务、办公系统等相关信息的不一致;4)遗留系统和新业务、管理系统数据集成不完备带来的不一致性。  ETL的实现,第一步是要实现ETL转换的过程。具体体现在以下几个方面:1)空值的处理;2)规范化数据格式;3)拆分数据;4)验证数据正确性;5)数据替换;6)建立ETL过程的主外键约束

8、。  2.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。