数据仓库与数据挖掘的综述

数据仓库与数据挖掘的综述

ID:11907199

大小:422.50 KB

页数:14页

时间:2018-07-14

数据仓库与数据挖掘的综述_第1页
数据仓库与数据挖掘的综述_第2页
数据仓库与数据挖掘的综述_第3页
数据仓库与数据挖掘的综述_第4页
数据仓库与数据挖掘的综述_第5页
资源描述:

《数据仓库与数据挖掘的综述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Southwestuniversityofscienceandtechnology数据挖掘课程报告数据仓库与数据挖掘的综述学院名称计算机科学与技术专业名称计科学生姓名学号指导教师吴珏二〇一六年11月摘要通过对数据仓库与数据挖掘的学习和大致的了解,主要提出了一种基于数据仓库的数据挖掘系统的决策支持系统的框架。该文章把数据仓库、数据挖掘工具和知识库结合在一起,提高了数据挖掘的效率。增加了挖掘数据的效率和价值实用性!一、概述近十几年来,人们利用信息技术生产和搜集数据的能力大幅度提高,千万万个数据库被用于商业管理、政府办公、科学研究和工程开发等等,并且这一势头仍将持

2、续发展下去。于是,一个新的挑战被提了出来:在这被称之为信息爆炸的时代,信息过量几乎成为人人需要面对的问题。如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识,提高信息利用率呢?要想使数据真正成为一个公司的资源,只有充分利用它为公司自身的业务决策和战略发展服务才行,否则大量的数据可能成为包袱,甚至成为垃圾。因此,面对"人们被数据淹没,人们却饥饿于知识的挑战,数据挖掘和知识发现(DMKD)技术应运而生,并得以蓬勃发展,越来越显示出其强大的生命力。数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事

3、先不知道的、但又是潜在有用的信息和知识的过程。还有很多和这一术语相近似的术语,如从数据库中发现知识(KDD)、数据分析、数据融合(DataFusion)以及决策支持等。人们把原始数据看作是形成知识的源泉,就像从矿石中采矿一样。原始数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本、图形、图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门很广义的交叉学科,它汇聚了不同

4、领域的研究者,尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员。数据仓库,英文名称为DataWarehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。今天,越来越多的企业认识到要从以往的事务处理和决策中总结经验,利用现有的数据进行分析和推理,建立企业的决策支持系统(DSS)以提高决策的质量。企业如果不能快速精确的收集和分析信息,将无法进行科学而有效

5、的决策。建立数据仓库(Datawarehouse)将能很的解决这一问题,使企业从大量的业务信息中筛选出所需的信息,并做出正确的决策。数据仓库不是单一的产品,而是综合了多种信息技术的计算环境。它将全企业的运行数据汇集到一个精心设计的关系数据库中,并将它们转换成面向主题(Subject-oriented)的形式,使最终用户很容易的从历史的角度对这些数据进行访问和分析。以银行为例,通常,银行的应用系统是按业务分类的,如储蓄、信贷、信用卡等,一个客户的信息分布在不同的业务系统中,要想得到一个客户的全面信息非常困难。银行通过建立数据仓库,可以将分离在各个业务系统中的数

6、据合并成一个统一的图表,这样就可以看到客户在各个系统中的全貌,而且可以从历史的角度对客户档案进行分析,以便做出为每一个客户进一步服务的决策。二、数据仓库和数据挖掘的基本概念数据仓库和数据挖掘的关系:数据仓库和数据挖掘都是数据仓库系统的重要组成部分,它们既有联系,又有区别。联系是:(1)数据仓库为数据挖掘提供了更好的、更广泛的数据源。(2)数据仓库为数据挖掘提供了新的支持平台。(3)数据仓库为更好地使用数据挖掘这个工具提供了方便。(4)数据挖掘为数据仓库提供了更好的决策支持。(5)数据挖掘对数据仓库的数据组织提出了更高的要求。(6)数据挖掘还为数据仓库提供了广

7、泛的技术支持。区别是:(1)数据仓库是一种数据存储和数据组织技术,提供数据源。(2)数据挖掘是一种数据分析技术,可针对数据仓库中的数据进行分析。数据仓库是支持管理决策过程的、面向主题的、集成的、随时间而变的、持久的数据集合。数据仓库系统负责从操作型数据库中抽取数据,实现对集成和综合后的数据的管理,并把数据呈现给一组数据仓库前端工具,以满足用户的各种分析和决策的需求。数据仓库系统的前端工具以OLAP工具和数据挖掘工具为代表,是用户赖以从数据仓库中提取、分析数据,以及实施决策的必经途径。数据挖掘DM(DataMining),是指从数据中识别出潜在有用的、先前未知

8、的、最终可理解的模式的非平凡过程。研究基于数据仓库的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。