决策支持系统第四讲数据挖掘概述OLA

决策支持系统第四讲数据挖掘概述OLA

ID:39315929

大小:315.00 KB

页数:54页

时间:2019-06-30

决策支持系统第四讲数据挖掘概述OLA_第1页
决策支持系统第四讲数据挖掘概述OLA_第2页
决策支持系统第四讲数据挖掘概述OLA_第3页
决策支持系统第四讲数据挖掘概述OLA_第4页
决策支持系统第四讲数据挖掘概述OLA_第5页
资源描述:

《决策支持系统第四讲数据挖掘概述OLA》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四讲 决策支持的新技术第一节数据仓库技术4.1.1数据仓库的基本知识4.1.2数据仓库系统的结构4.1.3数据仓库的运行结构4.1.4数据集市的结构第二节数据挖掘技术4.2.1数据挖掘概述4.2.2数据挖掘基本过程与步骤4.2.3数据挖掘的任务与挖掘方法4.2.4数据挖掘与数据仓库的关系第三节联机分析处理技术4.3.1基本概念4.3.2OLAP的数据组织4.3.3OLAP的多维数据分析方法4.3.4OLAP的发展4.1.1数据仓库的基本知识一.从数据库到数据仓库事务处理环境不适宜决策应用的主要原因:1.事务处理环境和分析处理的性能、特性不同2.数据集成问题3.数据动态集成

2、问题4.历史数据问题5.数据的综合问题6.不同的使用对象4.1.1数据仓库的基本知识二.数据仓库的概念1.W.H.Inmon是面向主题的、集成的、稳定的、随时间变化的数据集合,用于支持经营管理中的决策制定过程。面向主题集成稳定随时间变化2.SAS软件研究所的观点DB数据DW数据细节的在存取时准确的可更新的操作需求事先可知道事务驱动面向应用一次操作数据量小支持日常操作综合或提炼的代保过去的数据不更新操作需求事先不知道分析驱动面向分析一次操作数据量大支持决策需求3.DW是作为DSS的基础的分析型DB,用来存放大容量的只读数据,为制定决策提供所需的信息。4.DW是与操作型系统相分

3、离的、基于标准企业模型集成的、带有时间属性的,即与企业定义的时间段相关的、面向主题且不可更新的数据集合。5.……三.数据仓库的特点1.数据仓库是面向主题的。2.数据仓库是集成的。3.数据仓库是稳定的。4.数据仓库是随时间变化的。5.数据仓库中的数据量很大。6.数据仓库软硬件要求较高。四.数据库与数据仓库的区别1.数据库是面向业务的,使用者是企业的一般业务人员,进行企业日常数据处理和维护工作。2.数据仓库是面向决策的,使用者是企业的高层管理人员,它也是使用关系数据库,当数据仓库不负责处理业务。3.数据库注重的是企业运行的当前数据,任务是收集和记录企业的原始业务数据,而DW面对

4、的是非即时性的历史数据,通过从业务数据中提取,加工处理后提供给决策人员。4.1.2数据仓库系统的结构关系数据库数据文件其他数据数据仓库管理工具抽取转换转载元数据库数据建模工具综合数据当前数据历史数据用户查询工具C/S工具OLAP工具DM工具一.数据仓库管理系统1.定义部件2.数据获取部件3.管理部件4.目录部件(元数据)5.DBMS部件二.数据仓库的结构构成1.数据仓库的构成高度综合数据层轻度综合数据层当前基本数据层历史基本数据层二.数据仓库的结构构成2.数据仓库的元数据(1)关于数据源的元数据数据源中所有的物理数据结构,包括所有的数据项和数据类型;所有数据项的业务定义;每

5、个数据项更新频率,以及由谁或哪个过程更新的说明;每个数据项的有效值;其他系统中具有相同业务含义的数据项的清单。2.数据仓库的元数据(2)关于数据模型的元数据I/O对象:支持数据仓库I/O操作的各种对象;关系:两个I/O对象之间的关联;关系成员:描述每个关系中两个I/O对象的具体角色、关系度以及约束条件;关系关键字:描述两个I/O对象如何建立关联。2.数据仓库的元数据(3)关于数据仓库映射的元数据用该类元数据反映数据仓库中的数据项是从哪个特定数据源填充的,经过哪些转换、变换和加载过程。这类数据可以用来生成程序,以完成数据的转换工作,即实现操作型数据转换为面向主体的数据仓库的数

6、据。2.数据仓库的元数据(4)关于数据仓库使用的元数据元数据告诉数据仓库中有什么数据,它们是从哪儿来的,即如何按主题查看数据仓库的内容;元数据提供已有的可重复利用的查询语言信息。2.数据仓库的元数据(5)元数据的作用——DW的核心定位数据仓库的目录作用;数据从业务环境向数据仓库传送时数据的目录内容;指导从当前基本数据到轻度综合数据、轻度综合数据到高度综合数据的综合算法的选择。三.数据仓库的工具集1.分析工具(1)查询工具(2)可视化工具2.挖掘工具四.数据进入DW的过程与建立DW的步骤1.数据进入DW的基本过程(教材p221)提取:从操作型数据库中选择并提取所需要的字段;变

7、换:为来自数据源的数据指定常用的格式和名称;净化:更正错误的数据;加载:把净化过的数据载入到DW数据里;汇总:提前计算出任何期待的DW数据的汇总供以后使用。2.建立DW的步骤收集和分析业务需求建立数据模型和数据仓库的物理设计(包括划分粒度和数据分割两部分内容)定义数据源选择DW技术和平台从操作型DB中提取、转换、净化并加载到DW中选择访问和报表工具选择DB连接软件选择数据分析和数据展示软件更新DW4.1.3数据仓库的运行结构DW服务器客服端客服端DW服务器OLAP服务器两层C/S结构:三层C/S结构:4.1.4数据

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。