数据仓库与数据挖掘

数据仓库与数据挖掘

ID:40219998

大小:437.31 KB

页数:60页

时间:2019-07-26

数据仓库与数据挖掘_第1页
数据仓库与数据挖掘_第2页
数据仓库与数据挖掘_第3页
数据仓库与数据挖掘_第4页
数据仓库与数据挖掘_第5页
资源描述:

《数据仓库与数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二章数据仓库原理数据仓库原理--主要内容2.1数据仓库定义2.2数据仓库特征2.3数据库体系化环境2.4数据仓库构造模式2.5数据仓库概念结构2.6数据仓库总体框架结构2.7数据仓库中的数据组织小节数据仓库原理--主要内容2.1数据仓库定义2.2数据仓库特征2.3数据库体系化环境2.4数据仓构造模式2.5数据仓库概念结构2.6数据仓库中的数据组织小节2.1数据仓库定义不同的定义:数据仓库用来保存从多个数据库或其它信息源选取的数据,并为上层应用提供统一用户接口,完成数据查询和分析。数据仓库是作为DSS服务基础的分析型DB,用来存放大容量的只读数据,为制定决策提供所需要的

2、信息。数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的、面向主题及不可更新的数据集合。W.H.Inmon对数据仓库所下的定义:数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持管理决策的过程。2.1数据仓库定义数据仓库数据的四个基本特征:数据仓库的数据是面向主题的数据仓库的数据是集成的数据仓库的数据是不可更新的数据仓库的数据是随时间不断变化的数据仓库定义:数据仓库就是一个用以更好地支持企业或组织的决策分析处理的、面向主题的、集成的、不可更新的、随时间不断变化的数据集合数据仓库原理--主要内容2.1数据仓库定义2.2数据仓库特征2.

3、3数据库体系化环境2.4数据仓构造模式2.5数据仓库概念结构2.6数据仓库总体框架结构2.7数据仓库中的数据组织小节2.2数据仓库特征数据仓库的第一个特征:面向主题什么是主题主题是指在较高层次上将企业信息系统中的数据综合、归类并进行分析利用逻辑意义:对应企业中某一宏观分析领域所涉及的分析对象要求将数据组织成一个完备的分析领域—主题域独立性:主题域必须具有独立内涵,要求有明确的界限,规定某项数据是否该属于“商品”主题。完备性:主题内包含任何对该主题对象的分析处理要求的一切内容2.2数据仓库特征例:“会员制”商场按照业务处理要求,建立的数据库模式:采购子系统:订单(订单

4、号,供应商号,总金额,日期)订单细则(订单号,商品号,类别,单价,数量)供应商(供应商号,供应商名,地址,电话)销售子系统:顾客(顾客号,姓名,性别,年龄,文化程度,地址,电话)销售(员工号,顾客号,商品号,数量,单价,日期)2.2数据仓库特征库存管理子系统:领料单(领料单号,领料人,商品号,数量,日期)进料单(进料单号,订单号,进料人,收料人,日期)库存(商品号,库房号,库存量,日期)库房(库房号,仓库管理员,地点,库存商品描述)人事管理子系统:员工(员工号,姓名,性别,年龄,文化程度,部门号)部门(部门号,部门名称,部门主管,电话)2.2数据仓库特征传统的面向应用数

5、据组织方式的特点面向应用进行数据组织,需要对企业中相关的组织、部门等进行详细调查,收集数据库的基础数据及其处理的过程调查的重点数据处理组织数据的依据企业的部门组织结构企业各部门的业务活动特点2.2数据仓库特征传统的面向应用数据组织方式的特点数据组织应反映一个企业内数据的动态特征要表达每个部门的实际业务处理的数据流程输入处理输出组织数据的方式按照实际应用即业务处理流程来组织组织数据的目标提高OLTP应用的速度和准确性2.2数据仓库特征传统的面向应用数据组织方式的特点数据库模式与实际的业务处理流程中所涉及的单据或文档具有对应关系从而可以较好的在这些数据库模式上建立起各项实际

6、的应用处理在有些应用中,这种数据组织方式只是对企业业务活动所涉及的数据的存储介质的改变,即从纸介质到磁介质的转变2.2数据仓库特征传统的面向应用数据组织方式的特点没有体现数据库这一概念提出的原本意图:数据与数据处理的分离没有将数据从数据处理或应用中抽象出来,组织成一个和具体的应用独立的数据世界2.2数据仓库特征传统的面向应用数据组织方式的特点结论缺点抽象程度不够高,数据与应用没有完全分离优点能较好地将数据库模式和企业的现实业务活动对应起来,从而具有很好的操作性便于将企业原来的各项业务从手工处理的方式向计算机处理方式的转变可以较好地支持OLTP2.2数据仓库特征面向主题的

7、数据组织步骤:1、抽取主题:按照分析的要求来确定2、确定每个主题所应包含的数据内容例如:商场商品采购在OLTP数据库中,“订单”“订单细则”“供应商”三个数据库模式清晰完整地描述了一笔采购业务所涉及的数据内容,这是面向应用来进行数据组织的方式;在数据仓库中,主要是进行数据分析处理,商品采购时的分析活动主要是要了解各供应商的情况,“供应商”是采购分析时的分析对象。所以不需要组织象“订单”和“订单细则”这样的数据库模式,因为它们包含的是纯操作型的数据;但是仅仅只用OLTP数据库的“供应商”中的数据又是不够的,因而要重新组织“供应商”这么一

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。