电信数据仓库项目实施方法论探讨

电信数据仓库项目实施方法论探讨

ID:10591263

大小:284.11 KB

页数:2页

时间:2018-07-07

电信数据仓库项目实施方法论探讨_第1页
电信数据仓库项目实施方法论探讨_第2页
资源描述:

《电信数据仓库项目实施方法论探讨》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、电信数据仓库项目实施方法论探讨□深圳天源迪科计算机有限公司秦红伟完成数据仓库中未完成的功能一般来说,在带有ODS的数据仓库体系结构中,DW层所存储的数据都是进行汇总过的数据,并不存储每笔交易产生的细节数据,但是在某些特殊的应用中,可能需要对交易细节数据进行查询,这时就需要把细节数据查询的功能转移到ODS来完成,而且ODS的数据模型按照面向主题的方式进行存储,可以方便地支持多维分析等查询功能。在一个没有ODS层的数据仓库应用系统体系结构中,数据仓库中存储的数据粒度是根据需要而确定的,但一般来说,最为细节的业务数据也是需要保留的,实际上也就相当于ODS,但与ODS所不同的是,这

2、时的细节数据不是“当前、不断变化的数据”,而是“历史的,不再变化的”数据。目前电信内部有很多的子系统,如:营业前台、计费帐务、综合结算、1000号系统、联机采集等等。他们之间的信息的重叠和不一致显然存在,如客户资料、客户所使用的电信的业务信息、帐户信息等。如何综合应用这些数据,首要任务就是进行数据整合,ODS的特点恰恰可以担当起这付重任,而且ODS的诞生,也正是因为有了这种需求的存在。在今天的商业环境中,电信行业所面临的经营环境是一个多变复杂的环境,通过有效管理,向管理要效益已经成为企业的选择。为了实现这一点,数据仓库已广泛应用于电信行业。许多数据仓库项目的实施不是很成功或

3、者另客户不满意,原因很多,本文主要从数据仓库项目实施方法论方面进行探讨,希望对读者有所启发。项目规划电信数据仓库的数据来源于现有的各业务系统及外部数据源。由于电信业务发展迅速,因而存在业务系统不断地升级或改造的现象,加上外部数据来源不断拓宽,这都需要数据仓库作出相应的调整,以保证数据的完整性和一致性。建设数据仓库的根本目的是为管理层、决策层提供决策支持,并为操作层提供活动指引,随着时间的推移,越来越多的数据充实到数据仓库中,使得数据仓库蕴藏的信息越来越大,可分析的主题会越来越多。因此上数据仓库的建设不是一个产品,而是一个持续的过程。(见图1)自下而上的建设思路从理论上讲,应

4、该是先有数据仓库的概念,然后才有数据集市。按照这种模式建设数据仓库就是自上而下的建设思路。很多关于“建立企业数据模型,不考虑应用,先建立数据平台”的说法,对于一个规模不大企业而言应该是一种好的选择。而对于象中国电信这样拥有很多业务支撑系统,业务系统模型差异很大的企业而言,采用这种模型建设花费的时间过长,加上业务发展迅速、市场变化大的情形,可以说不是一种理想的模式。自下而上的建设思路是先从数据集市入手,就某一个特定的主题先做数据集市,再建设数据仓库。这种模式能够比较快地让使用者见到效果,应该是比较理想的建设思路。即带有ODS的数据仓库应用系统体系结构和不带ODS的数据仓库应用

5、系统体系结构。ODS(OperationalDataStore)是数据仓库体系结构中的一个可选部分,ODS具备数据仓库的部分特征和OLTP系统的部分特征,它是面向主题的、集成的、当前或接近当前的、不断变化的数据。业务系统与数据仓库的隔离层一般的数据仓库应用系统都具有非常复杂的数据来源,这些数据存放在不同的地理位置、不同的数据库、不同的应用之中,从这些业务系统对数据进行抽取并不是一件容易的事。因此,ODS用于存放从业务系统直接抽取出来的数据,这些数据从数据结构、数据之间的逻辑关系上都与业务系统基本保持一致,因此在抽取过程中极大降低了数据转化的复杂性,而主要关注数据抽取的接口、

6、数据量的大小、抽取方式等问题。(见图2)数据模型设计在数据仓库数据模型设计中有ER模型和维模型。实践表明,ER模型和维模型在数据仓库设计中并非绝对对立。对于部门数据集市,当数据量不大、报表较固定时可以采用星型模式;对于企业级数据仓库(也就是存放细粒度数据层)考虑到系统的可扩展能力、投资成本和易于管理等多种因素,最好采用第三范式。通常在数据仓库中维表的数量比较多,为了减少I/O,有必要减少维表的数量。我个人的意见是对事实表和集市做规范化处理,建议不要对所有维表都做短期见效的应用驱动面对激烈的市场竞争,在瞬息万变的商业环境中,企业的反应速度往往决定着企业的成败,IT系统需要为企

7、业经营活动给予有力的支撑,并创造价值。如果数据仓库不能尽快让业务部门、管理者和公司领导近早看到结果,领导会失去耐心,对项目也会缺乏持续投入的热情,因此数据仓库项目需要尽快见效果。转移部分业务系统细节查询功能在数据仓库建立之前,大量的报表、分析是由业务系统直接支持的,在一些比较复杂的报表生成过程中,对业务系统的运行产生相当大的压力。ODS的数据从粒度、组织方式等各个方面都保持了与业务系统的一致,那么原来由业务系统产生的报表、细节数据的查询自然能够从ODS中进行,从而降低业务系统的查询压力。长期规划需要分步实施任何IT

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。