欢迎来到天天文库
浏览记录
ID:40609226
大小:131.04 KB
页数:5页
时间:2019-08-05
《范式建模维度建模比较》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、范式建模维度建模一、范式建模这样的设计方式是在关系型数据库中常用的,Inmon的范式建模法的最大优点就是从关系型数据库的角度出发,结合了业务系统的数据模型,能够比较方便的实现数据仓库的建模。1.1范式化模型设计需满足下面三大范式:1.1.1第一范式(1NF):原子性字段不可再分,否则就不是关系数据库;1.1.2第二范式(2NF):唯一性一个表只说明一个事物;1.1.3第三范式(3NF):每列都与主键有直接关系,不存在传递依赖;1.2特点:同一份数据只存放在一个地方,因此只能从一个地方获取,没有数据冗余,保证了数据
2、一致性;解耦(系统级与业务级),方便维护;设计思路自上而下,适合上游基础数据存储,同一份数据只存储一份,没有数据冗余,方便解耦,易维护,缺点是开发周期一般比较长,维护成本高;二、维度建模维度建模是一种将数据结构化的逻辑设计方法,它将客观世界划分为度量和上下文。度量是常常是以数值形式出现,事实周围有上下文包围着,这种上下文被直观地分成独立的逻辑块,称之为维度。维度建模是面向分析,为了提高查询性能可以增加数据冗余,反规范化的设计技术。2.1特点:模型结构简单,星型模型为主开发周期短,能够快速迭代维护成本较高维度建模是
3、面向分析,为了提高查询性能可以增加数据冗余,反规范化的设计技术设计思路是自下而上,适合下游应用数据存储,适合统计多层次维度的汇总,开发周期短,缺点是维护成本高2.2维度建模的常见模式2.2.1星形模式星形模式(StarSchema)是最常用的维度建模方式,下图展示了使用星形模式进行维度建模的关系结构:维度C维度B事实表…….维度E维度A维度DFKFKFKFKFKFK可以看出,星形模式的维度建模由一个事实表和一组维表成,且具有以下特点:a.维表只和事实表关联,维表之间没有关联;b.每个维表的主码为单列,且该主码放置
4、在事实表中,作为两边连接的外码;c.以事实表为核心,维表围绕核心呈星形分布;2.2.2雪花模式雪花模式(SnowflakeSchema)是对星形模式的扩展,每个维表可继续向外连接多个子维表。下图为使用雪花模式进行维度建模的关系结构:维度表C维度表B事实表…….维度表E维度表A维度表DFKFKFKFKFKFK维度表B1维度表B2维度表A1FKFK星形模式中的维表相对雪花模式来说要大,而且不满足规范化设计。雪花模型相当于将星形模式的大维表拆分成小维表,满足了规范化设计。然而这种模式在实际应用中很少见,因为这样做会导致
5、开发难度增大,而数据冗余问题在数据仓库里并不严重。2.3维度建模的设计方法根据根据业务过程的优先级选定业务过程。确定事实表粒度,最好是原子级粒度。有了业务过程和粒度,就要选择相关的维度。选择适用于业务过程的事实。2.4维度建模设计流程图2.5高层模型设计2.6识别维度和度量有了高层模型,就要设计维度和度量,维度和度量清单不仅仅是业务用户所关心,还要从业务过程出发,自上而下的设计所涉及的维度和度量。防止业务用户的需求变化带来的冲击。2.7确定命名规范在详细设计之前,为DW/BI系统制定规范,主要包含源系统、主题、业
6、务术语、报表,物理设计命名、调度任务、文档方面的规范2.8编写详细设计映射文档详细设计文档包括从源系统到维度模型的每个数据层的物理映射文档。2.9.审查和验证模型详细设计文档出来后,要和业务用户和团队成员进行评审,记录下来评审过程中的问题,形成问题清单。.完成设计文档最后确定设计文档,进行下一步的ETL开发。参考资料数据仓库工具箱:维度建模的完全指南(第二版)》三、优缺点比较范式建模优点范式建模缺点从关系型数据库的角度出发,结合了业务系统的数据模型,能够比较由于建模方法限定在关系型数据库之上,在某些时候反而限制了
7、整个方便的实现数据仓库的建模数据仓库模型的灵活性,性能等,特别是考虑到数据仓库的底层数据向数据集市的数据进行汇总时,需要进行一定的变通才能满足相应的需求没有数据冗余,保证了数据一致性,方便维护,方便解耦缺点是开发周期一般比较长维度建模优点维度建模缺点维度建模非常直观,紧紧围绕着业务模型,可以直观的反映出业务模型中的业务问题需要进行大量的数据预处理,因此会导致大量的数据处理工作开发周期短,能够快速迭代当业务发生变化,需要重新进行维度的定义时,往往需要重新进行维度数据的预处理。而在这些与处理过程中,往往会导致大量的数
8、据冗余。模型结构简单,星型模型为主缺点是维护成本高
此文档下载收益归作者所有