小型超市数据仓库系统smdw的研究与实现

小型超市数据仓库系统smdw的研究与实现

ID:33327193

大小:114.00 KB

页数:6页

时间:2019-02-24

小型超市数据仓库系统smdw的研究与实现_第1页
小型超市数据仓库系统smdw的研究与实现_第2页
小型超市数据仓库系统smdw的研究与实现_第3页
小型超市数据仓库系统smdw的研究与实现_第4页
小型超市数据仓库系统smdw的研究与实现_第5页
资源描述:

《小型超市数据仓库系统smdw的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、小型超市数据仓库系统SMDW的研究与实现1国家自然科学基金69773501号支持项目杨富华2撰写本文期间在四川大学作访问学者唐常杰刘欣(泸州医学院计算机教研室)(四川大学计算机系)摘要本文介绍独立开发的小型超市数据仓库系统SMDWV1.0的主要功能、用户界面及设计开发中遇到的特殊困难和相应解决方法,并介绍该系统在关联规则挖掘中实现Aprori算法的具体措施。关键词数据仓库,DBMS,ODS,超市,数据挖掘,关联规则中图法分类号TP391随着信息社会需求的发展和市场竞争的加剧,用户对数据库系统提出了更高的要求:从大量的业务数

2、据中探索业务活动的规律性,进行分析和推理,从而为决策提供依据。为了适应这一需求,数据仓库(DW)技术应运而生。数据仓库概念创始人W.H.Inmon将其定义为:“数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合,用以支持经营管理中的决策制订过程。”[4]数据仓库技术强调了“处理过程”,而不是强调某一个软件或硬件产品。数据仓库是对原始的操作数据从历史的角度组织和储存数据的处理过程,它把各个信息源中与决策支持有关的数据,经过提取、转换、过滤和集成,按主题存放起来,供决策人员查询和分析,从而作出科学性的和战略性的决策。数据

3、仓库已在应用中取得了明显的经济效益。例如世界上最大也是发展最快的零售商Wal*Mart利用数据仓库分析商品之间的关联。其中一个意外的发现是:跟尿布一起购买最多的商品竟是啤酒!原来先生们下班后为小孩买尿布时又随手带回两瓶啤酒。Wal*Mart就将尿布和啤酒摆放在同一货架上,结果是尿布与啤酒的销量双双增长。结合我国国情,我们研制了一个小型超市数据仓库系统SMDWV1.0。1SMDW的数据源及数据仓库管理系统分析作为数据仓库,SMDW保存的是历史数据和总结数据,数据包含相应的时间属性,数据经过集成,是面向分析环境的。尽管数据仓库

4、的创建有着自身的特色,但本质上以传统的数据库技术作为储存数据和管理资源的基本手段。SMDW系统由三部分组成:数据仓库、数据仓库管理系统(DWMS)和数据仓库工具。在整个系统中,数据仓库居于核心地位。而数据仓库中数据及其操作的特点,决定了其ENGINE(DWMS)将比数据库ENGINE(DBMS)简单许多。本系统中DWMS由DBMS担任。SMDW的“主题”是用DBMS中的一系列表实现的。DBMS的关系型结构能较好地适应多维数据的表示和存储。关系数据库在模拟多维数据时将多维结构划分为两类表:事实表和维表。事实表存储事实的度量值

5、和各个维的码值;维表存储维的描述信息,6包括维的层次、成员类别和码值等,事实表通过每一维的码值同维表联系在一起,该结构被称为“星型模式”。对于层次复杂的维,为了避免冗余数据占用大量的空间,可以用多张表来描述该维。这样在“星”的角上出现了分支,这种扩展的星型模式被称为“雪花模式”。关系数据库的XBase系列在我国曾经大量使用并积累了大量的原始操作数据,建立能够包容XBase系列为数据源的数据仓库具有现实意义。基于这一国情,SMDWV1.0版首先以XBase系列为数据源,并将在升级版本中用ODBC连接SQLServer,Ora

6、cle,Access等,以形成多数据源的数据仓库。2SMDW用户界面和主要功能SMDW用户界面如下图一,主菜单有:基础数据处理,数据仓库生成,查询和分析,系统管理。其要点如下:2.1数据提取过滤集成:从超市每日交易的详细数据中提取数据,将不一致的字段长度、不一致的赋值、丢失的数据输入等经过清理过滤,按照统一的编码、统一的格式整合集成,然后装入数据仓库。2.2主题的选择和汇总:SMDW是面向主题的,目前版本选取了超市最重要的两个主题:商品和顾客。超市经理最关心的是商品的销量、销售额和利润;也很关心顾客的购买行为和习惯。某某顾

7、客经常购买哪些商品?然后可以定期给他函寄商品信息。哪些商品经常被顾客一起购买?然后可以合理地摆设货架及商品,比如经典例子中的尿布与啤酒。从商品这个主题汇总了每种商品的日销量、日销售额及日利润。在日汇总的基础上,汇总了每种商品的每周、每月的销量、销售额和利润及这三个数据的日平均、最大和最小值。从顾客这个主题,汇总了每个顾客每日购买的商品的购买量和购买额(未购买商品则无相应数据)。在日汇总的基础上,汇总了每个顾客每周、每月购买商品的购买量和购买额(未购买商品则无相应数据)。2.3查询功能:从商品这一主题,可查询超市每种商品的每

8、日销量、销售额和利润,每种商品的每周销量、销售额和利润及这三个数据的日平均、最大、最小值,每种商品的每月销量、销售额和利润及这三个数据的日平均、最大、最小值,所有查询结果均可以表格和图形(直方图、圆饼图、折线图等)两种方式显示。从查询结果可分析出什么商品最畅销,什么商品最赚钱,用以指导超市的经营策略。从

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。