4数据仓库与数据挖掘的OLAP技术

4数据仓库与数据挖掘的OLAP技术

ID:39646281

大小:4.11 MB

页数:91页

时间:2019-07-08

4数据仓库与数据挖掘的OLAP技术_第1页
4数据仓库与数据挖掘的OLAP技术_第2页
4数据仓库与数据挖掘的OLAP技术_第3页
4数据仓库与数据挖掘的OLAP技术_第4页
4数据仓库与数据挖掘的OLAP技术_第5页
资源描述:

《4数据仓库与数据挖掘的OLAP技术》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、4数据仓库与OLAP技术4数据仓库与OLAP技术数据仓库:基本概念数据仓库模型:数据立方体与OLAP数据仓库设计与使用数据仓库实现数据泛化:面向属性的归纳数据仓库泛化、合并多维空间的数据。构造数据仓库涉及数据清理、数据集成和数据变换,可以看做数据挖掘的一个重要预处理步骤。什么是数据仓库?数据仓库的定义很多,但却很难有一种严格的定义宽松地讲,数据仓库是一个提供决策支持功能的数据库,它与组织机构的操作数据库分别维护。数据仓库系统允许将各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,对信息处理提供支持。“数据仓库是一个面向主题的、集

2、成的、随时间而变化的、不容易丢失的数据集合,支持管理部门的决策过程.”—W.H.Inmon四个关键词:面向主题的、集成的、时变的、非易失的数据仓库关键特征一——面向主题数据仓库是面向在数据模型中已定义好的公司的主要主题领域的,典型的例子有顾客、产品、销售等关注决策者的数据建模与分析,而不是集中于组织机构的日常操作和事务处理排除对于决策无用的数据,提供特定主题的简明视图数据仓库关键特征二——数据集成一个数据仓库是通过集成多个异种数据源来构造的。关系数据库,一般文件,联机事务处理记录,日志使用数据清理和数据集成技术。确保命名约定、编码结构、属

3、性度量等的一致性。当数据被移到数据仓库时,它们要经过转化。数据仓库关键特征三——随时间而变化数据仓库是从历史的角度提供信息:数据仓库的数据时间范围比操作数据库中的数据时间范围长很多操作数据库含有(可操作的)“当前”数据,时间范围一般是60-90天数据仓库从历史的角度提供信息,比如是过去的5-10年数据仓库中的每一个关键结构都隐式或显式地包含时间元素,而操作数据库中的关键结构可能就不包括时间元素。数据仓库关键特征四——数据不易丢失尽管数据仓库中的数据来自于操作数据库,数据仓库总是物理地、分离存放数据数据仓库中不进行操作型环境中的数据更新不需

4、要事务处理,恢复,和并发控制等机制只需要两种数据访问:数据的初始转载和数据访问(读操作)(?更新)数据仓库与操作数据库系统的区别操作数据库系统的主要任务是联机事务处理OLTP(?abbreviate)日常操作:购买,库存,银行,制造,工资,注册,记帐等数据仓库的主要任务是联机分析处理OLAP(?)数据分析和决策支持,支持以不同的形式显示数据以满足不同的用户需要OLAP与OLTP的比较用户和系统的面向性:面向顾客(事务)VS.面向市场(分析)数据内容:当前的、详细的数据VS.历史的、汇总的数据数据库设计实体-联系模型(ER)和面向应用的数据

5、库设计VS.星型/雪花模型和面向主题的数据库设计数据视图:当前的、企业内部的数据VS.经过演化的、集成的数据访问模式:事务操作VS.只读查询(但很多是复杂的查询)任务单位:简短的事务VS.复杂的查询用户数:数千个VS.数百个度量:事务吞吐量VS.查询吞吐量、响应时间OLAPvs.OLTPOLTPOLAP用户办事员、数据库专业人员知识工人(经理、主管等)功能日常操作长期信息需求,决策支持DB设计面向应用,基于ER模型面向主题,星型/雪花模型数据当前的最新详细数据历史的、综合的、多维的集成数据,跨时间维护视图详细的一般关系汇总的、多维的访问模

6、式读/写操作主关键字上索引/散列大多为读操作大量扫描工作单位短的简单事务复杂查询访问记录数量数十个数百万用户数数千数十DB规模100MB到GB100GB到TB度量事务吞吐量查询吞吐量,响应时间数据仓库实例adventureworksDW主要来源数据库adventureworksMicrosoft SQL Server 2005引入AdventureWorksCycles公司。此公司及其业务方案、雇员和产品是下列示例数据库的基础:AdventureWorks示例OLTP数据库AdventureWorksDW示例数据仓库AdventureWo

7、rksAS示例Analysis Services数据库Adventureworks中的销售部分表关系RelationofAdventureworks,adventureworksDWandothersadventureworksDWadventureworks其它数据源……数据立方体其它数据挖掘分析……数据清洗、集成、转换、归约数据立方体设置SQLServerAnalysisServices教程数据挖掘功能设置http://msdn.microsoft.com/zh-cn/library/ms130214(v=sql.105).aspx作

8、业:对比研究adventureworksandadventureworksDW。查看两数据库中的表、关系。以实体店销售事务为例,列出源数据库中相关表及表关系,列出DW中对应的表和表关系。说明D

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。