欢迎来到天天文库
浏览记录
ID:39711468
大小:1016.50 KB
页数:19页
时间:2019-07-09
《数据仓库的概念与体系结构》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第1章数据仓库的概念与体系结构谢红侠7/17/20211数据仓库与数据挖掘1.1数据仓库的概念、特点与组成数据仓库的概念数据仓库就是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,通常用于辅助决策支持(DDS)7/17/20212数据仓库与数据挖掘1.1数据仓库的概念、特点与组成数据仓库的特点:面向主题;集成的;相对稳定的;反映历史变化。7/17/20213数据仓库与数据挖掘1.1数据仓库的概念、特点与组成数据仓库的组成:数据仓库数据库;数据
2、抽取工具;元数据:技术元数据与业务元数据;访问工具;数据集市(DataMarts);数据仓库管理;信息发布系统。7/17/20214数据仓库与数据挖掘1.2数据挖掘的概念与方法数据挖掘的概念数据挖掘(DataMining),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识,又被称为数据库中的知识发现(KnowledgeDiscoveryinDatabase,KDD)7/17/20215数据仓库与数据挖掘1.2数据挖掘的概念与方法数据挖掘的方法:直接数据挖掘间接数据挖掘。7/17/2
3、0216数据仓库与数据挖掘1.2数据挖掘的概念与方法数据仓库与数据挖掘的关系若将数据仓库(DataWarehouse)比作矿井,那么数据挖掘(DataMining)就是深入矿井采矿的工作数据挖掘是从数据仓库中找出有用信息的一种过程与技术7/17/20217数据仓库与数据挖掘1.3数据仓库的技术、方法与产品联机事务处理(OLTP)与联机分析处理(OLAP)的比较;OLAP技术的有关概念:多维数据集、维度、度量值和多维分析;OLAP根据其存储数据的方式可分为三类:ROLAP、MOLAP、HOLAPOLAP工具7/17/20218数据仓库与数据挖掘1.3数据仓库的技术
4、、方法与产品数据仓库实施中的三个关键环节数据抽取;数据存储与管理数据表现7/17/20219数据仓库与数据挖掘1.3数据仓库的技术、方法与产品数据仓库实施方法论数据仓库不是简单的数据或产品堆砌,它是一个综合集成解决方案和系统工程。在数据仓库的实施过程中,技术决策至关重要,技术选择或决策错误很可能导致项目实施失败7/17/202110数据仓库与数据挖掘1.3数据仓库的技术、方法与产品常用数据仓库产品比较常用OLAP工具介绍;各数据仓库厂商提供的解决方案IBM、Oracle、NCR、Microsoft、SAS等7/17/202111数据仓库与数据挖掘1.4数据仓库系
5、统的体系结构数据仓库系统的体系结构的分类(1)两层架构(GenericTwo-LevelArchitecture)。(2)独立型数据集市(IndependentDataMart)。(3)依赖型数据集市和操作型数据存储(DependentDataMartandOperationalDataStore)。(4)逻辑型数据集市和实时数据仓库(LogicalDataMartandReal-TimeDataWarehouse)。7/17/202112数据仓库与数据挖掘1.4数据仓库系统的体系结构两层数据仓库体系结构7/17/202113数据仓库与数据挖掘1.4数据仓库系统
6、的体系结构基于独立数据集市的数据仓库体系结构7/17/202114数据仓库与数据挖掘1.4数据仓库系统的体系结构基于依赖型数据集市和操作型数据存储(ODS)的数据仓库体系结构7/17/202115数据仓库与数据挖掘1.4数据仓库系统的体系结构逻辑型数据集市和实时数据仓库的体系结构7/17/202116数据仓库与数据挖掘1.5数据仓库的产生、发展与未来数据仓库的产生联机事务处理系统(业务系统)刚上线时,查询不到数据是因为数据太少了,而几十年后查询不到有关数据是因为数据太多了。针对这一问题,人们设想专门为业务数据的统计分析建立一个数据中心,它的数据从联机事务处理系统
7、中来、从异构的外部数据源来、或从脱机的历史业务数据中来,这个数据中心也是一个联机系统,它专门为分析统计和决策支持应用服务,通过它可获取决策支持和联机分析应用所需要的一切数据。这个数据中心就叫做数据仓库。简单地说,数据仓库就是一个作为决策支持和联机分析应用系统数据源的结构化数据环境,数据仓库要研究和解决的问题就是从数据库中获取信息的问题。7/17/202117数据仓库与数据挖掘1.5数据仓库的产生、发展与未来数据仓库的发展以报表为主以分析为主以预测模型为主以营运导向为主以实时数据仓库、自动决策应用为主7/17/202118数据仓库与数据挖掘1.5数据仓库的产生、发
8、展与未来数据仓库的未来在
此文档下载收益归作者所有