欢迎来到天天文库
浏览记录
ID:14598415
大小:65.20 KB
页数:9页
时间:2018-07-29
《基于数据仓库的数据挖掘技术》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数据仓库技术在超市中的应用[摘要]本文主要介绍数据仓库的技术,以某超市销售决策支持系统为例,叙述了面向超市的数据仓库的建模过程。通过联机分析技术和数据挖掘技术对数据仓库中的数据进行处理得到需要的信息,然后应用到超市中以满足各种潜在的个性化的需求。[关键词]:数据仓库,超市,数据挖掘,数据处理,潜在需求,OLAP,决策支持ApplicationofDataWarehouseintheSuppermarket[Abstract]ThethesismainlyintroducesthetechniqueofDataWarehouseand
2、narratehowtobuildDataWarehouseinsupermarket.WecandodataprocessingbythetechniqueofOLAPandDataMininginthesupermarkettogetsomepotentialinformationtomeetconsumers’potentialdiverserequirements.[Keywords]DataMining,Datawarehouse,Dataprocessing,OLAP,Supermarket;1.引言随着计算方法和信息技
3、术的不断发展,大量数据的产生和收集导致信息爆炸。现代社会的竞争趋势要求对这些数据进行实时的和深层次的分析。虽然现在很多超市都有很大的存储系统和很强的存储系统,但是使用者发现在分析所拥有的信息方面变得越来越困难。数据仓库提供了容纳大量信息的场所,用户可以使用联机分析技术和数据挖掘技术从繁杂的数据中找出真正有价值的信息和知识。数据仓库可以加强企业对信息的管理能力,数据挖掘可以改善企业的经营状况,为超市的管理和决策提供科学的依据,为超市带来巨大的收益,增强企业的竞争优势。超市在经营中积累了海量的历史数据,使用数据仓库对这些数据进行管理和分
4、析,比人工数据管理更有效,更科学。针对不同类型的客户,商家推出不同的策略,以迎合不同客户的购物习惯,这样的策略才具有针对性。针对以上问题,以某个超市的应用数据库为基础,该数据库中存储了大量的客户信息,购买时得交易数据,产品信息等数据,讨论如何构建该数据仓库和进行数据挖掘。1.数据仓库及相关概念2.1数据仓库的概念1993年,WilliamH.Inmon在发表的著作BuildingtheDataWarehouse中首先给出了数据仓库的定义:“数据仓库是一个面向主题的,集成的,非易失的且随时间变化的,用来支持管理人员做出决策的数据集合。
5、”数据仓库的特征:数据仓库是面向主题的数据仓库中的数据是综合或提炼的数据仓库中保存的是过去的和现在的数据数据仓库中数据不可更新操作需求是临时决定的数据常冗余所查询的是经过公的数据支持决策分析综上所述,数据仓库是把企业中异构的历史数据进行抽取,转换,合并和统一管理,从而用来对数据进行进一步的加工以辅助决策分析,数据挖掘,产生报表的应用。因此数据仓库是一个集中式得,集成式的数据存储。2.1数据进入数据库的过程数据进入数据仓库要经过数据提取,数据交换,数据净化,数据加载和数据汇总五个五阶段。交换提取净化加载汇总2.2联机分析处理OLAP用
6、中,对数据库的简单查询已满足不了用户分析和决策者提出的要求,于是我们需要多角度的观察数据,并分析其之间的关系。由于传统的数据库及查询工具对于管理和应用这样复杂的数据已满足不了要求,于是出现了多维数据库和多维分析的OLAP技术。OLAP是一种软件技术,它使分析人员能够迅速,一致,交互地从各个方面观察信息,已达到深入理解数据的目的。OLAP是多维数据分析工具的集合,其目标是满足决策支持和多维环境下特定的查询和报表需求。OLAP分析主要通过对多维数据进行切片,切块,聚合,钻取,旋转等分析操作以求剖析数据,使用户能够从多种维度,多个侧面,多
7、种数据综合度查看数据,从而了解数据背后蕴涵的规律。2.3数据挖掘数据挖掘就是从大量的,不完全的,有噪声的,模糊的,随机的实际应用数据中提取隐含其中的,事先未知的,但又具有潜在价值的信息和知识的过程。从数据分析的角度出发,数据挖掘可以分为两种类型:描述性数据挖掘和预测性数据挖掘。描述性数据挖掘包含关联分析,序列分析,聚类分析等方法。预测性数据挖掘包含分类和统计回归等方法,常用的预测模型有决策树,神经网络,线性回归等。数据挖掘为经营决策,市场策划,金融预测等提供依据,使大型数据库作为一个丰富可靠的资源为知识归纳服务。3数据仓库在超市中的
8、应用根据某超市的需求,建立一个基于数据仓库的决策支持系统。主要分为三个阶段:(1)数据仓库建模,根据超市的经营数据确定分析主题,维度,粒度,事实表,维表等。(2)使用数据仓库提取,转换,加载(ETL)工具中的调度器,抽取转换器,加载器
此文档下载收益归作者所有