关于关联分析与聚类分析的研究详细说明

关于关联分析与聚类分析的研究详细说明

ID:43328523

大小:102.94 KB

页数:5页

时间:2019-09-29

关于关联分析与聚类分析的研究详细说明_第1页
关于关联分析与聚类分析的研究详细说明_第2页
关于关联分析与聚类分析的研究详细说明_第3页
关于关联分析与聚类分析的研究详细说明_第4页
关于关联分析与聚类分析的研究详细说明_第5页
资源描述:

《关于关联分析与聚类分析的研究详细说明》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、关联分析与规则归纳分析所谓关联分析,在我们商业研究的一个最常的运用就是购物篮分析。它是根据商家搜集到的某段时间内顾客消费情况的数据,从中找出各个消费品之间的联系,即在海量的消费数据中挑岀哪些商品与哪些商品同时被购买的可能性最大,从而为商家作出决策提供重要信息。因此关联分析对于我们来说在硏究业态组合,品类落位等方面意义重大。当然关联分析最直接适用的地方就是在超市或百货的商品陈列摆放上,好的陈列和摆放对于销量和业绩的增长是不可小觑的。另外,我们还可以通过规则归纳分析挖掘岀最容易消费这些商品的顾客具有什么样的人口统计学特征”从而进行针对性广告设计或者重点营销。关联分析的方法主要有GRI建

2、模和WEB图形法。规则归纳分析主要用到C5.0。(-XGRI1、目的:从众多的购物篮中找出各个商品之间的关联,确定关联性最强的是哪几类商品。2、原始数据要求:商家提供出的数据应包括以下几个字段:消费者信息(性Blk年龄、家庭、教育、收入等等人口统计学特征,其实可以理解成自变量);每个消费者所购买的商品种类(二分变量,即某一类商品此消费者是否有购买。标明是/否X例如:ID性别年龄收入・・・・・•・酒蔬菜水果肉Oil男2550000是是否是012女3545000是否是否013男46100000是是否是3、具体操作:clementine。源节点,导入数据-类型节点-GRI节点即可(具体参

3、数设置略X如果在输出的过程中不需要哪些信息,还可以在GRI节点前添加”过滤〃节点。4、解释:最终数据会将关联性较强的几种商品罗列出来。比如,买了酒和肉/最有可能买的商品会是水果。如图:1后I页前项支持度%羞信度%IcannedvegfreshmeatfrozenmealhRAr3.096.67frozenmealTreshmeatcannedveghppr3.193.55(-1Web1、目的与原始数据要求同GRI方法的要求。2、操作过程与GRI相同只是在类型节点后面添加的是WEB图形节点。3、数据解释:WEB节点是一种图形节点,其输出结果相对于GRI更直观和形象。如图:它将关联性最

4、强的品类之间的线描绘的最粗。很容易通过拖动悬浮条将其找出。(三〉C5.0通过关联分析我们可以做到找出关联性最强的商品品种,从而进行陈列调整。但如果想要知道最容易购买这几类商品的顾客具有怎样的特征和相似性,我们还需要运用到规则归纳方法^clementine中C5.0节点即可做到。操作:将GRI或者WEB执行后的建模导出,作为新节点添加到原来流操作区的类型节点后,然后再在其后添加一个类型节点(参数设置略),最后加上C5.0节点执行,既可以从原始数据的消费者信息中归纳出具备哪些特征的顾客购买以上关联性产品的可能性最大。二.RFM和聚类分析在商业活动中商家往往希望通过在已有的顾客消费数据资

5、料中找到自己的忠实客户或者希望将顾客划分成几个类别有针对性的进行营销活动如要达到这样的要求,我们可以通过Clementine的RFM分析和聚类分析做到。(-1RFM分析R(recency)F(frequency)M(monetary)1、目的:从众多客户消费数据中找岀排名TopN的优质客户以进行下一步商M剿乍。2、原始数据要求:原始数据需要三个字段:客户ID;客户消费的日期;客户消费的金额。(ID是为了最后确定TOPN顾客是谁,消费日期和消费金额是为了转换成R/F/M三个指标)3•操作过程:创建流,导入数据-填充数据节点(假如数据格式不正确,如日期20120313,就应填充为201

6、2-03-13)-RFM汇总节点(将同一个ID的历史数据汇成到一行,生成R/F/M指标)-RFM分析节点(特别注意的是加权比重问题,到底RFM三者权重应该如何分配)-过滤节点(有些得分不需要体现而且占用计算机处理时间,如单个客户的R、F、M得分)->排序节点(RFM得分升序或者降序)-样本节点(选择要输出的TOPN)-表结点,执行输出。4、经过上面的操作,我们便得出了RFM得分最高的TOPN个客户,可以为下一步营销活动提供参考。聚类分析商家不仅仅希望通过RFM找出优质客户,还希望能进一步通过数据将自己的顾客细分成不同的类别,从而逬行更针对性的营销。这样就要用到聚类分析的方法。聚类分

7、析有多种方法,比较常用的有K-means和Two-step两种。K-means和Two-step操作方法大致相同:在RFM分析得出的样本节点处添加一^类型节点,然后添加K-means或者Two-step,执行。或者以新的数据开辟一个新的流进行操作。不同之处在于K算法迅速快捷,但是缺点在于要求数据尽量是连续的数值变量,对于分类变量,虽系统自带调整带会影响结果;K算法再把数据分类时是要求人工设定分成几个组的;K算法易受异常值和极端值的影响。K算法的这些劣势在T算法中可以被

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。