数据仓库和数据挖掘复习

数据仓库和数据挖掘复习

ID:13759887

大小:113.50 KB

页数:14页

时间:2018-07-24

数据仓库和数据挖掘复习_第1页
数据仓库和数据挖掘复习_第2页
数据仓库和数据挖掘复习_第3页
数据仓库和数据挖掘复习_第4页
数据仓库和数据挖掘复习_第5页
资源描述:

《数据仓库和数据挖掘复习》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据仓库和数据挖掘复习第一章数据仓库和数据挖掘概述一、概念题1、数据仓库的定义是什么?答:数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理中央决策制定过程。2、数据仓库的特点是什么?答:数据仓库的特点是:(1)数据仓库是面向主题的;(2)数据仓库是集成的;(3)数据仓库是稳定的;(4)数据仓库是随时间变化的;(5)数据仓库中的数据量大;(6)数据仓库软硬件要求较高。3、什么是商业智能?答:商业智能以数据库为基准,通过联机分析处理和数据挖掘技术帮助企业领导者针对市场变化的环境,做出快速、准确的决策。二、简答题1、数据仓库和数据挖掘的区别和联系。区别:数据仓库是

2、一种存储技术,它的数据存储量是一般数据库的100倍,它包含大量的历史数据、当前的详细数据以及综合数据。它能适应于不同用户对不同决策需要提供所需的数据和信息。数据挖掘是从人工智能机器学习中发展起来的。它研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。联系:14数据仓库和数据挖掘都是决策支持新技术。但他们有着完全不同的辅助决策方式。数据仓库中存储着大量辅助决策的数据,它为不同的用户随时提供各种辅助决策的随机查询、综合信息或趋势分析信息。数据挖掘是利用一系列算法挖掘数据中隐含的信息和知识,让用户在进行决策中使用。第二章数据仓库原理一、概念题1、数据仓库结构图是什么?图2.1数据仓

3、库结构图元数据高度综合数据层轻度综合数据层当前基本数据层历史数据层2、数据集市的定义是什么?答:数据集市是指具有特定应用的数据仓库,主要针对某个具有战略意义的应用或者具体部门级的应用,支持用户利用已有的数据获得重要的竞争优势或者找到进入新市场的具体解决方案,它包括两种,即独立的数据集市,它的数据直接来源于各生产系统;从属数据集市,它的数据直接来自于中央数据仓库。3、多维数据模型有哪些?答:对于逻辑数据模型,使用的多维数据模型主要有星型模型、雪花模型、星网模型、第三范式等。4、ETL过程是什么?答:数据仓库的数据获取需要经过抽取、转换、装载三个过程,即ETL过程。5、元数据的定义及特点

4、是什么?14元数据描述了数据仓库的数据和环境,遍及数据仓库的所有方面,是整个数据仓库的核心,元数据可分为四类,分别为关于数据源的元数据、关于数据模型的元数据、关于数据仓库映射的元数据和关于数据仓库使用的元数据。元数据不仅定义了数据仓库有什么,指明了数据仓库中数据的内容和位置,刻画了数据的抽取和转换规则,存储了与数据仓库主题有关的各种商业信息,而且整个数据仓库的运行都是基于元数据的。二、简答题1、数据集市的特性数据集市有如下特性:(1)规模是小的;(2)特定的应用;(3)面向部门;(4)由业务部门定义,设计和开发;(5)由业务部门管理和维护;(6)快速实现;(7)价格较低廉;(8)投资

5、快速回收;(9)工具集的紧密集成;(10)更详细、预先存在的数据仓库的摘要子集;(11)可升级到完整的数据仓库。2、ETL过程的主要步骤(1)决定数据仓库中需要的所有的目标数据;(2)决定所有的数据源,包括内部和外部的数据源;(3)准备从源数据到目标数据的数据映射关系;(4)建立全面的数据抽取规则;(5)决定数据转换和清洗规则;(6)为综合表制定计划;(7)组织数据缓冲区域和检测工具;(8)为所有的数据装载编写规程;(9)维度表的抽取、转换和装载;14(10)事实表的抽取、转换和装载。3、数据装载方式有哪些?答:(1)基本转载按转载的目标表,将转换过的数据输入到目标表中去。(2)追加

6、如果目标表中已存在数据,追加过程在保存已有数据的基础上增加数据。(3)破坏性合并当输入数据记录的主键与一条已存在的记录的键互相匹配时,用新输入的数据更新目标记录数据。(4)建设性合并当输入记录主键与已有记录的键相匹配时,保留已有的记录,增加输入的记录,并标记为旧的记录的替代。4、数据装载类型有哪些?数据装载类型包括三种:最初装载、增量装载和完全刷新。(1)最初装载这是第一次对整个数据仓库进行装载。(2)增量装载由于源系统的变化,数据仓库需要装载变化的数据,这就是增量装载。(3)完全刷新这种类型的数据装载用于周期性重写数据仓库。第三章第四章一、概念题1、OLAP的基本思想是什么?答:O

7、LAP的基本思想是企业的决策者应能灵活地,从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。2、OLAP的定义及特点答:联机分析处理是共享多维信息的快速分析,其特点是:快速性、可分析性、多维性和信息性。3、OLAP的数据模型有哪些?14答:OLAP的数据模型主要有:MOLAP是基于多维数据库的OLAP;ROLAP是基于关系数据库的OLAP;HOLAP即混合OLAP介于MOLAP和ROLAP之间。4、基本多维数据分析的基本操作有哪些?答:基本多维

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。