数据仓库与数据挖掘考试复习重点

数据仓库与数据挖掘考试复习重点

ID:33583363

大小:829.20 KB

页数:17页

时间:2019-02-27

数据仓库与数据挖掘考试复习重点_第1页
数据仓库与数据挖掘考试复习重点_第2页
数据仓库与数据挖掘考试复习重点_第3页
数据仓库与数据挖掘考试复习重点_第4页
数据仓库与数据挖掘考试复习重点_第5页
资源描述:

《数据仓库与数据挖掘考试复习重点》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第一章由于采用的模型主要是数学模型,所以其辅助决策的能力主要表现在定量分析上,从而发展起把管理信息系统和模型辅助决策系统结合起来的DDS。主要进行的是分析处理。数据的分析应用为信息资源的利用开辟了一条新的道路,基于这种思想,在数据库之上建立一种用于分析的模型,从而构成一种用于数据分析、预测及决策的系统,称为决策支持系统(Decision Support System,DSS),也称为业务智能(Business Intelligence,BI)。DDS与专家系统同时兴起,属于定性的,DDS属于定量的。把两者相结合的系统称为智能

2、决策支持系统IDSS。问题的方面事务处理应用分析处理应用操作频率高,处理和响应的程序运行时间长,消耗大量系性能特性时间短统资源需要集成的、全面而正确的数数据集成数据大多分散而非集成据数据以一定的周期刷新,保证数据动态集成不需要决策的正确性只需要当前数据,或短期内必须以大量的历史数据为依历史数据的数据托需要对细节数据进行不同程数据的综合不具备度的综合,提高分析效率数据仓库概念的提出在数据库的基础进行改造,产生了新的满足决策分析需要的数据环境——数据仓库Data Warehouse,DW数据仓库与数据库的区别数据库的应用是以事务

3、处理为主,强调的是更新数据库,联机事务处理(Online Transaction Processing,OLTP)数据仓库的应用是以分析应用为主,从数据库中提取、分析和利用信息,联机分析处理(Online Analytical Processing,OLAP)对比内容数据库数据仓库历史的、存档的、归纳的、计数据内容当前值算的数据数据目标面向业务操作程序、重复处理面向主题域、管理决策分析应11用静态、不能直接更新、只定时数据特性动态变化、按字段更新添加高度结构化、复杂、适合操作数据结构简单、适合分析计算使用频率高中到低数据访问

4、量每个事务只访问少量记录有的事务可能要访问大量记录对响应时间以秒、分钟、甚至小时为计量以秒为单位计量的要求单位数据仓库是将原始的操作数据进行各种处理,并转换成综合信息,提供功能强大的分析工具,对这些信息进行多方位的分析,以帮助企业领导做出更符合业务发展规律的决策。数据仓库的特征:面向主题性、集成性、不可更新性、时变性(计量的属性会改变)。1995年在美国计算机年会上提出数据挖掘。从技术角度看,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们所不知道的、但又是潜在有用的信息和知识的过程;

5、从商业应用角度看,数据挖掘是一种崭新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转化、分析和模式化处理,从中提取辅助商业决策的关键知识。为商业决策提供真正有价值的信息,进而提高竞争力,获得利润。总之:数据挖掘是按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律,并进一步将其模型化的先进有效的方法。数据挖掘的与数据仓库的关系数据挖掘是数据仓库发展的必然结果:数据挖掘可以看作是OLAP的高级阶段,为数据仓库提供了更好的决策支持,促进了数据仓库技术的发展。数据仓库为数据

6、挖掘提供应用基础:提供了深层次分析所需要的正确、完整和集成的数据;OLAP工具为数据挖掘提供了有关的数据操作支持,给数据挖掘带来便利和功能。数据挖掘在商业上有大量的应用,分为两类:对某种情况的预测(Prediction);寻找事物之间的关联(Association)。应用领域包括生物医药和DNA分析(致病基因)、金融(信用,投资,目标市场客户聚类)、零售业(促销)、电信业2传统数据分析工具数据挖掘工具工具特点回顾型的、验证型的预测型的、发现型的分析重点已经发生了什么预测未来的情况、解释发生的原因从最近的销售文件中列出锁定

7、未来的可能客户分析目的最大客户以减少未来的销售成本数据集大数据维、维中属性数、维中数据维、维中属性数、维中数据均小数据均是少量的是庞大的企业管理人员、系统分析数据与系统启动,少量的人员指导启动方式员、管理顾问启动与控制智能性好统计分析工具已成熟技术状况成熟其他工具正在发展中第二章数据仓库结构数据仓库的体系结构(了解)33数据仓库技术的体系结构(重要)数据预处理功能:对数据源中的数据进行预处理数据仓库管理工具:完成数据仓库的建模、确定数据的粒度级别、指定数据仓库的物理存储模式、确保数据仓库的运行效率,数据仓库的元数据管理应用工

8、具:提供各种应用工具来对数据仓库中的数据进行处理数据仓库是企业级的,数据集市我们可以把它理解成为部门级的数据仓库,满足某个部门的进行分析决策的需求而建立的。如果一个数据集市不依赖于中央数据仓库,则这个数据集市为独立数据集市。独立数据集市可能会造成各数据集市中的数据不一致、形成信息孤岛、维护

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。