欢迎来到天天文库
浏览记录
ID:21315843
大小:921.64 KB
页数:12页
时间:2018-10-21
《SPSS关联模型步骤》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、SPSSClementines预测分析模型----啤酒+尿片故事的实现机理(使用11版本实现)SPSSClenmentines提供众多的预测模型,这使得它们可以应用在多种商业领域中:如超市商品如何摆放可以提高销量;分析商场营销的打折方案,以制定新的更为有效的方案;保险公司分析以往的理赔案例,以推出新的保险品种等等,具有很强的商业价值。超市典型案例如何摆放超市的商品引导消费者购物从而提高销量,这对大型连锁超市来说是一个现实的营销问题。关联规则模型自它诞生之时为此类问题提供了一种科学的解决方法。该模型利用数据挖掘的技术,在海量数据中依据该模型的独特算法发现
2、数据内在的规律性联系,进而提供具有洞察力的分析解决方案。通过一则超市销售商品的案例,利用“关联规则模型”,来分析商品交易流水数据,以其发现合理的商品摆放规则,来帮助提高销量。关联规则简介关联规则的定义关联规则表示不同数据项目在同一事件中出现的相关性,就是从大量数据中挖掘出关联规则。有关数据挖掘关联规则的具体理论依据这里不做详细讲解,大家可以参看韩家炜的数据挖掘概论。为了更直观的理解关联规则,我们首先来看下面的场景。一个市场分析人员经常要考虑这样一个问题:哪些商品是频繁被顾客同时购买的?顾客1:牛奶+面包+谷类顾客2:牛奶+面包+糖+鸡蛋顾客3:牛奶+面
3、包+黄油顾客4:糖+鸡蛋以上的情景类似于当年沃尔玛做的市场调查:啤酒+尿片摆放在同一个货架上,销售业绩激增的著名关联规则应用。市场分析员分析顾客购买商品的场景,顾客购买面包同时也会购买牛奶的购物模式就可用以下的关联规则来描述:面包=>牛奶[支持度=2%,置信度=60%](式1)式1中面包是规则前项(Antecedent),牛奶是规则后项(Consequent)。实例数(Instances)表示所有购买记录中包含面包的记录的数量。支持度(Support)表示购买面包的记录数占所有的购买记录数的百分比。规则支持度(RuleSupport)表示同时购买面包和
4、牛奶的记录数占所有的购买记录数的百分比。置信度(confidence)表示同时购买面包和牛奶的记录数占购买面包记录数的百分比。提升(Lift)表示置信度与已知购买牛奶的百分比的比值,提升大于1的规则才是有意义的。关联规则 式1的支持度2%意味着,所分析的记录中的2%购买了面包。置信度60%表明,购买面包的顾客中的60%也购买了牛奶。如果关联满足最小支持度阈值和最小置信度阈值,就说关联规则是有意义的。这些阈值可以由用户或领域专家设定。就顾客购物而言,根据以往的购买记录,找出满足最小支持度阈值和最小置信度阈值的关联规则,就找到顾客经常同时购买的商品。此处进
5、行关联规则应用可以使用两种数据格式:1,交易数据格式,2,表格格式。1.交易格式CustomerID ITEM1 bread2 jam3 juice3 j
6、am4 milk2.表格格式CustomerID bread jam juice milk1 T F F F2 F
7、 T F F3 F T T F4 F F F T关联规则挖掘算法Aprior、Carma和序列节点是常用的关联规则挖掘算法,它们都可以使用交易格式和表格格式数据进
8、行挖掘处理。其中 Aprior算法,处理速度快,对包含的规则数没有限制,是一种最有影响的挖掘关
此文档下载收益归作者所有