欢迎来到天天文库
浏览记录
ID:11479574
大小:45.00 KB
页数:12页
时间:2018-07-12
《数据仓库——商业智能的基石_管理信息化_bi_2167》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数据仓库——商业智能的基石_管理信息化_BI1数据仓库的产生和发展 被称为数据仓库之父的W.H.Inmon在他1990年出版的《建立数据仓库(第一版)》一书中第一次为数据仓库给出了明确的定义,真正把数据仓库上升到一个理论高度。他认为数据仓库的历史是伴随着信息处理领域的决策支持系统(DSS)处理的发展过程开始的,在这个发展过程中,随着计算机技术(尤其是计算机存储技术)的发展和抽取处理程序的流行,一种更大规模的体系结构逐渐勾勒出来。在这种体系结构中,数据仓库处于中心位置。 自数据仓库产生至今,在企业的决策支持要求、企业的竞争要求、企业的商业智能(BI)要求的巨大推
2、动下,作为决策支持基础的数据仓库的运用经历了一个不可思议的快速增长过程,数据仓库本身,包括数据仓库体系结构、数据仓库处理规模、数据仓库性能等也经历了一个快速发展过程,数据仓库的价值也产生了质的变化。 不管企业是如何构建数据仓库的,数据仓库通过在收集信息、决策分析、未来趋势预测、制定战术上、战略上的商业策略等方面的支持力度体现自身的价值。现在在业界,当问到为什么需要数据仓库以及数据仓库的价值或重要性时,回答几乎都是一致的,那就是数据仓库能为企业带来战略优势,尤其是能支持全方位地了解客户,但是在数据仓库使用初期,情况却不是这样的。在过去的十年里,数据仓库的价值得到了快
3、速持续的增长。 如图1所示,最开始时数据仓库只是用来制作一些静态的报表,数据转移到数据仓库中就是为了更好地控制数据以及提高数据查询性能,以方便地出一些能够提供简单信息的报表。显然静态报表不能满足决策的需求,数据仓库开始面向对象设计,以产生智能性的信息,面向对象数据仓库的数据是面向主题组织的,从这样的数据仓库中可以很方便地获取某一主题的信息,这些信息主要是面向企业或部门决策的某一方面,比如客户。当不止一个部门纳入到数据仓库的建设中时,数据仓库开始面向整个企业进行决策支持,这时企业的整体利益是根本。当数据仓库利用于面向企业决策支持时,在数据仓库中加入人口统计学、行为分
4、析等知识后就能够获取充分的信息对客户有一个360度的了解,辨识出有价值的客户,并且能为客户提供他所需的,有效地进行cross-sale和up-sale。这时企业的决策周期也大大地缩短了,从以前的2、3年一次,发展到现在一年2、3次。在分析决策支持活动中,静态报表被多维分析、数据挖掘代替,基于数据仓库中的集成化的智能信息所做的决策影响整个企业,提高整个企业的收入。随着商业的全球化,更多的数据和信息纳入到了数据仓库,数据仓库朝着增值战略又迈进了一步,企业运营策略重点转移到:如何为已有的客户提供更好的服务以及如何拓展客户基础,包括公司的资源配置、企业价值链上所有的资源、新的
5、销售和营销渠道,而客户资料(信息)已经扩展到心理特征、行为特征以及潜在竞争对手,这时的数据仓库面向企业的价值链提供个性化集成的智能化信息。以电信为例,数据仓库在各个阶段所能回答的问题如表1所示。图1数据仓库价值曲线表1数据仓库在各个阶段所能回答的问题2数据仓库体系结构 在数据仓库研究领域非常强调数据仓库是一个体系。其实我们可以从两个角度去理解什么是数据仓库:从一种狭义的特定角度来看,如果我们专注的是一个核心,那么可认为数据仓库是一个数据集合,W.H.Inmon的定义也是从这种角度出发归纳出来的;如果从广义上从实践上理解,我们应该把它理解成一个体系结构,一个以所定义
6、的数据集合为中心的、以决策支持为主导的、支持企业运作的IT体系结构。 2.1数据仓库的定义 数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策,数据仓库包含粒状的企业数据。 (1)面向主题的:数据仓库中的数据是按照商业问题或决策进行组织的,通过这样的数据组织,数据被有效地转化成了信息,而决策分析人员也可以很方便地获得决策分析所需要的信息。典型的主题领域一般包括客户、产品、营销活动、帐单、投诉、帐目等,在数据仓库中主要主题领域是以一组相关的表来具体实现的。主题的确定是数据仓库设计中一个很重要也是很复杂的内容,主题的确定直
7、接影响数据仓库的可用性和价值。一般采用建立企业数据模型的方式确定分析主题,必须和相关的业务分析人员进行反复沟通共同建立分析主题。 (2)集成的:在数据仓库的所有特性之中,集成是最重要的特性。由于操作系统的独立建设,在设计时并没有考虑和其他系统的相关性和一致性,所以当数据进入数据仓库时,要采用某种方法来消除应用问题中的许多不一致性,即进行集成。一般常见的一致性处理有:编码的一致性、度量单位的一致性、描述或定义的一致性、格式或类型大小的一致性等。数据的集成和转换(ETL)在数据仓库实施中是最困难最复杂也是最耗时的。数据仓库的数据源主要是企业的各个应用
此文档下载收益归作者所有