数据挖掘技术在大型超市中的应用研究

数据挖掘技术在大型超市中的应用研究

ID:4238377

大小:202.64 KB

页数:6页

时间:2017-11-30

数据挖掘技术在大型超市中的应用研究_第1页
数据挖掘技术在大型超市中的应用研究_第2页
数据挖掘技术在大型超市中的应用研究_第3页
数据挖掘技术在大型超市中的应用研究_第4页
数据挖掘技术在大型超市中的应用研究_第5页
资源描述:

《数据挖掘技术在大型超市中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第15卷第3期北方工业大学学报Vol.15No.32003年9月J.NORTHCHINAUNIV.OFTECH.Sept.2003*数据挖掘技术在大型超市中的应用研究王晓红高洪深(北方工业大学经济管理学院,100041,北京石景山)摘要简单介绍了数据挖掘技术和方法,并研究了数据挖掘在超市中的应用,说明了数据挖掘的过程,包括问题的提出,数据的收集、预处理、转换到数据仓库中,算法的选择,模型的评价、优化等,并对此项技术在超市应用中存在的有利因素和不利因素进行了分析.关键词数据挖掘;数据仓库;零售企业分类号TP391随着经济的发展,我国的许多大型零售企段,建立决策树的一个结点

2、,再根据该属性字段业纷纷崛起,各个大型超市每天都积累了海量的不同取值建立树的分支;在每个分支子集中的数据,导致“数据丰富,知识贫乏”,利用数据重复建立树的下层结点和分支的过程.利用决挖掘技术(即按照既定的业务目标对大量的数策树方法可生成可以理解的,可以处理连续和据进行探索,揭示隐藏在其中的规律性并进一种类字段,还能清晰的显示哪些字段比较重要步将之模型化的先进、有效的方法)可以帮助超市的高级管理人员及时、准确地了解顾客的需2数据挖掘在大型超市中的应用求模式,并预测未来,从而获得巨大的利润,提研究高自身的竞争力.假如一家大型超市的高级管理人员欲知每1数据挖掘的技术方法天超市

3、的销售情况,顾客的购买模式,通过顾客特征,采取相应的优惠政策增加顾客满意度和数据挖掘可以用到的技术方法很多,主要顾客保有率.如果只靠以前的传统人工技术,从包括决策树方法(DecisionTrees)、人工神经网络巨大的购买信息中找出相应的答案就像大海里(ArtificialNeuralNetworks)、遗传算法(Genetic捞针,非常困难.数据挖掘技术可以帮助解决这Algorithms)、统计分析方法(statistics)、邻近搜索算一难题.数据挖掘的主要工作流程如下:法(ScoutingaroundNearestNeighborMethod)、集合(1)数据挖掘

4、所要解决的问题.论的粗集(RoughSet)方法、规则推理(RuleInduc-在超市中,数据挖掘所能解决的问题包括tion)、模糊逻辑(FuzzyLogic)、公式发现等.商品的出售情况,顾客的购买行为和习惯,商品本文用到决策树方法,决策树代表着决策摆放,货架安排,购买特定商品的顾客的特征、集的树形结构,是利用信息论中的互信息(信息类型等,本文针对某一问题展开讨论.北京某一增益)寻找数据库中具有最大信息量的属性字超市高级管理人员通过商品的销售情况来增加收稿日期:2003—01—15*北京市自然科学基金项目资助(项目编号:9012001)第一作者简介:王晓红,硕士研究生

5、.主要研究方向:数据挖掘在经济系统中的应用.32北方工业大学学报第15卷顾客满意度和顾客保有率,为了促进商品的销数据加载:在经历了数据提取、清洗、整理售,该超市实行会员卡服务,分成4个等级:金和汇总后,需要将所获得的结果载入数据仓库卡、银卡、铜卡、普通卡,对顾客实行优惠政策,中,这个过程应定时进行,并且不同主题的数据以便更好为顾客提供服务,满足顾客的期望.问加载有各自不同的执行任务.题归结为分析当前销售情况,找出顾客统计信上面的各种处理并非一个应用中全部用息与所申请卡之间的关系.到,这要根据任务的要求和数据的质量来确定.(2)相关数据的收集.应该注意的是,尽管上面的各种

6、处理都有相应根据上述问题收集有关数据.需要收集的的工具来实现,但是这些工具毕竟不具备人类数据包括顾客信息(识别号码、姓名、性别、生智能,有时反而将正确的数据当作错误的数据日、婚姻状况、收入、教育程度、会员卡类别、经来处理,增加了数据的噪声.因此人的参与不可济状况、联系电话、住址等),产品信息(识别号缺少.码、名称、品牌名称、规格、单位数量、重量、单(4)数据仓库的逻辑模型.价、库存量、销售量等),产品分类信息(分类号数据仓库的数据是面向主题的,数据仓库码、分类名称、所属产品族名称等),商店信息的设计应围绕主题展开,最常用的是“星型模(商店代号、名称、类型、地址、负责人名

7、称、电型”,也可以采用“雪花模型”,“雪花模型”是“星话、传真等),员工信息(识别码、姓名、职位、生型模型”的变种,它把一些数据进一步分解到附日、雇用时间、住址、相关描述等)等等,这些数加表中,以实现多维分析.“雪花模型”中包括据通过整合、集成,存入数据仓库形成分析型数“事实表”和“维表”.“事实表”存储事实的度量据,但由于涉及到顾客的隐私,有些数据的收集值和各个维的码值;“维表”存储维的描述信息,和数据的准确性,都较难达到要求,需要对这些包括维的层次,成员类别和码值等.针对前面的顾客进行跟踪记录.问题,最重要的主题是顾客.超市的高级管理

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。