欢迎来到天天文库
浏览记录
ID:37791294
大小:2.68 MB
页数:69页
时间:2019-05-31
《数据仓库系统结构模型》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第4章数据仓库系统结构与模型�Inmon数据仓库设计��体系结构化环境三级模型���高级模型中级模型低级模型�性能优化目录�数据仓库设计概述������与数据库设计的区别处理类型应用需求设计目标数据来源设计方法对比内容数据库系统设计数据仓库系统设计面向的处理类型面向应用面向分析应用需求比较明确不太明确系统设计的目标事务处理的并发性、安全性、高效性保证数据的四个特征和全局一致性数据来源业务操作员的输入业务系统系统设计的方法需求驱动数据驱动数据仓库设计概述数据仓库与数据库设计的区别处理类型不同��数据库系统设计�面向应用来进行设计,根据具体的
2、操作事件和操作对象(实体)来进行设计;�目的是建立一个操作型的数据环境。�从需求开始,逐步展开数据仓库设计�面向分析的;�从最基本的主题开始,不断完善已有主题,发展新主题;�最终建立起一个面向主题的分析型数据环境。应用需求不同数据库系统设计�面向明确的应用需求�设计人员能够清晰地了解应用的需求和数据流程数据仓库设计�很难获得对用户需求的确切了解�应用人员往往是企业的中高层人员�他们自己一开始不知道想看什么,需要引导�后期又想什么东西都看,需要解释系统设计的目标�数据库系统设计����为了进行OLTP处理通常是对一个或者一组记录的查询和修改
3、,“一次一集合”主要为企业的特定应用服务的事务处理响应时间、数据的安全性和完整性是系统的目标�数据仓库设计�����为了分析决策主要目标是保证数据的四个特征(面向主题、集成的、稳定的、时变的),建立起一个全局一致的数据环境,作为企业决策支持的基础只有查询而无更新,“一次加载一批”对响应时间不敏感数据量大,海量数据数据来源不同��数据库系统设计�数据来源主要是业务操作员的输入�描述如何通过操作员输入获取数据�描述如何将获取的数据按照OLAP的需求合理存放�如何使得OLTP的性能更加优化�如何保证事务处理的安全性数据仓库设计�数据主要来源于业
4、务系统�主要解决如何从业务系统中得到完整一致的数据�如何对数据进行转换、清洗、综合,ETL�如何有效提高数据分析的效率与准确性系统设计方法不同�数据库系统设计���“需求驱动”;先收集需求、分析需求,再进行设计和开发;系统的需求在收集和分析需求阶段之后就定下来了,一旦进入构建数据库阶段,系统的需求就基本不变了。�数据仓库设计����“数据驱动”从业务系统已经存在的数据出发,获取之后对数据进行集成并检查数据的准确性按照分析领域对数据及数据之间的联系重新考察,组织数据仓库中的主题。“数据驱动”的系统设计方法的优点是可以通过了解原有数据库系统中
5、的数据和需要建设的数据仓库中主题的数据的共同性,最大限度地利用现有系统,减少系统建设的工作量。开发生命周期-CLDS���传统的数据库系统的系统开发生命周期(SDLC)是需求驱动的,而数据仓库系统的开发生命周期则是数据驱动的,与SDLC相反,一般写作CLDS,这种写法没有对应的实际意义,是一种幽默的写法。CLDS由数据开始,一旦数据到手就集成数据。然后,如果数据有偏差,就检验看看数据存在什么偏差。再针对数据写程序,分析程序执行结果。最后,系统需求才得到了理解。因此,CASE工具和技术用于数据仓库领域是不合适的。促销分析销售分析市场分析产品
6、组合分析财务绩效分析合并报表EIS管理报告公司季报、年报投资者报表预测模型指标体系业务模式规划What-if分析投资预算长期发展预算战略规划日常运营预算计划建模分析报表数据仓库/DM螺旋式方式业务需求分析设计建造测试培训试点部署使用运行监控维护确认新需求/改进实施范围业务驱动的需求分析设计建造测试培训试点应用部署使用监控维护发掘新需求和改进阶段1阶段2阶段3两种数据仓库设计�Inmon数据仓库���数据库设计的模式三级模型(高级、中级、低级)存储:关系数据库�Kimball数据仓库���维度建模技术维度设计/度量设计存储:多维数据库/关系
7、数据库�两种数据仓库都需要面临的主要设计问题����粒度与分割元数据ETL索引小结���数据仓库的设计不同于事务处理的数据库的设计,是一个循序渐近的过程。数据仓库的选型是一个非常重要的问题,当前,选用Kimball数据仓库进行设计是很流行的,因此,实践中可优先考虑。面对复杂的数据,基于维度建模技术的Kimball数据仓库显得无能为力,还需要深入探索,因此,面向复杂数据类型的数据仓库是目前的研究热点。数据库设计的三级模型�概念模型���从客观世界到主观认识的映射首先将现实世界抽象为概念模型,然后再用适合计算机世界的模型和语言来描述ER图�逻
8、辑模型����ER模型→关系模型规范化视图约束�物理模型����DBMS选型选择数据库文件的存储结构索引分配存储空间Inmon的三级模型�高级模型(高层模型)(数据库设计-概念模型)��即概念
此文档下载收益归作者所有