资源描述:
《数据仓库概念模型的设计》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第23卷第12期小型微型计算机系统Vol.23No.122002年12月MINI-MICROSYSTEMSDec.2002文章编号:1000-1220(2002)12-1453-06数据仓库概念模型的设计陈明吴国文施伯乐(复旦大学计算机系,上海200433)摘要:要设计一个能够正确反映用户的需求,又能够使用户易于理解的数据仓库概念模型是一项不同于传统事务处理系统概念模式设计的重要工作.文章提出了一个类似于传统事务的ER模型的DWER模型,给出了对DWER模型的评价,并与其它相关的模型进行了比较,最后给出了模型的描述方法
2、.关键词:数据仓库;概念模型;DWER模型;评价;逻辑描述中图分类号:TP311.13文献标识码:A1引言够显示事实的性能变化的定量信息,是事实的定量描述.它能够反映公司的业务运转情况,表明业务活动应该怎样优化等,数据仓库技术是进行数据分析和处理的重要技术,其应例如销售的总量,酒店入住的人数,飞机订座的总数等.在数用也变得越来越广泛.对于数据仓库的研究大都集中在多维据仓库的概念模型中将这些KPI都模型化为相关事实的度数据模型〔6〕、物化视图〔9、10〕、索引的选择〔5、7、8〕等领域上.对于量.因此度量是事实的定量属性
3、,每个事实显然有多个度量属数据仓库的概念模型的设计虽然是一项重要的设计技术但是性.例如,对于销售情况,我们可能关心销售的总量,销售价格没有引起研究界的足够的重视〔11〕.因此我们的目的是设计一的变化,客户的数量等,对于酒店的入住情况可能关心入住的个能够正确表达用户需求和易于理解的数据仓库概念模式,人数,住房的价格变化等.飞机订座关心票价,订票的人数等.这里采用类似传统事务处理系统的ER模型的数据仓库概念为分析数据的需要,对事实的度量信息往往需要从不同模型的图形化表示方法:DWER模式.的角度进行度量,从每个角度又可以以
4、不同的程度来反映度量的精度.例如考虑销售的总量时,可能关心某一天,某一月,2数据仓库概念模型概述某一年的销售情况,也可能关系某个城市,某个地区,某个国数据仓库概念模型必须提供一种从语义和概念层描述多家的销售情况,或将它们结合起来,关心某个时期某个地区的维数据结构的手段.它必须支持数据仓库的概念设计,提供一销售情况等.度量的每个角度都模型化多维数据模型的一个个能够导出实体、联系和聚合之间的内部联系的元模式,并且维.一般来说,当分析信息时,我们可以模型化为:对事实在维提供为减少数据仓库的设计和维护代价所需要的必要集成约1,
5、维2,...,维N上进行度量,例如“我想了解某一时间,某一束和相关的条件.就像传统数据库的概念模式一样,数据仓库地区,某一部门的所有销售情况”,在这种情况下,事实是销售概念模式必须有足够的能力来对相关的应用进行模型抽象,情况,度量是销售总量,三个维分别是:时间、地区和部门.当同时也要能够提供根据用户需要而设计的用户视图,特别是从某个角度度量事实时,我们还可以从不同的程度上进行度聚合.数据仓库概念模型同样必须能够完备地、毫无二意地转量,反映度量的精度.例如如果从时间的角度来考虑销售情化为数据仓库的逻辑模型,实例化视图、查
6、询或数据锥体等逻况,我们可从某一天,某个月,某个季度,某一年等不同的程度辑结构必须能够与概念摸型中的相关实体或对象相一致地关上来反映销售总量.因此维的成员可以根据需要度量的成度联在一起.不同分成彼此相关不同度量等级,这些不同的度量等级构成与传统的关系数据库模型不同的是数据仓库模型是多维维的层次.模型,其中心是事实.事实是决策支持、数据分析或预测分析对事实的度量从不同的角度,不同的程度进行抽象、综合时人们感兴趣的焦点,往往用来模型化一个企业,一个部门所和合计在数据仓库概念模式中模型化为对度量的聚合.例如,需要关心的事件或
7、决策分析的目标.例如,对于销售企业它所求2000年上海地区各种产品的销售总量,平均销售额,它包关心的是各个时期各种产品在不同地区的销售情况,酒店关括对度量“销售额”进行不同的综合:求和以及求平均值.因此心的是不同时期客人的入住率,航空公司关心的是个条航线在模型中聚合是事实的度量沿不同的维,以不同的层次进行各个时期的订座情况等.聚合.对数据进行分析总离不开一个叫做关键性能指示器数据仓库的多维模型是:以事实、度量、维作为基本元素,(KeyPerformanceIndicators,KPI)的基本度量项目.KPI是维有不同的
8、层次,沿不同的维可以在不同的层次上对事实的用来反映相关事实的性能的度量指标.每个KPI都是一条能度量进行不同程度的聚合,并且能够支持切片、钻取、上卷等收稿日期:2001-04-16收修改稿日期:2001-06-18作者简介:陈明,博士,主要研究方向为数据库理论、数据仓库、数据挖掘等.吴国文,博士,主要研究方向为数据库理论、本体及本