关联分析—购物篮分析

关联分析—购物篮分析

ID:34172241

大小:394.96 KB

页数:21页

时间:2019-03-04

关联分析—购物篮分析_第1页
关联分析—购物篮分析_第2页
关联分析—购物篮分析_第3页
关联分析—购物篮分析_第4页
关联分析—购物篮分析_第5页
资源描述:

《关联分析—购物篮分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、Objectives■Conductanassociationanalysisandinterprettheresults・■Distinguishbetweenassociationanalysisandsequenceanalysis・■Conductasequenceanalysisandinterprettheresults.5.1问题提出考虑下面的情形,一个商店想对客八数据库进行分析,了解在购物时哪些商品会一起购买。为此,商店选择了对客户数据库样本进行购物篮分析。使用的数据集合:SAMPSIO.ASSOCSASSOCS中的变量列表DataUariab1es

2、1nt

3、erua1Uariab1es]ClassUariab1esNameMode1Ro1eMeasurementTypeFormat1nformatCUSTOMERinputinterua1numBEST12・12・TIMEinputordina1numBEST12・12・PRODUCTinputnomina1char$8・$8・数据集合ASSOCS包含了1001个客户所购买的食品,其屮20种见下表:CodeProductapplesAppleartichokartichokesavocadoavocadobaguettebaguettesBordeauxwinebourbonb

4、ourbonchickenchickencokecolacorncd_bcornedbeefcrackercrackerhamhamheinekenbeerherringfishice_creaicccreamolivesolivespepperspepperssardinessardinessodasodawatersteaksteakturkeyturkey10()1个客户中,每个客户均购买了7个物品,因而总共有7007行。数据集中每一行也就代表了客户所购产品的一个组合。在大多数数据集合中,并不是所有客户都购买了相同数量的产品。创建初始流按下图样式建立流程图:Input

5、DataSourceAssociationa.设置输入数据源(InputDataSource)节点1打开输入数据源InputDataSource)节点。2从文件夹SAMPSIO中选择数据集合ASSOCSo3点击变量(Variables)标签。4设置变fflCUSTOMER的模型角色为身份(Id)5设置变量PRODUCT的模型角色为目标变量(target)。6设置变量TIME的模型角色序列(sequence)0注:变量TIME用于识别购买食品的先后次序。此例屮所有商品均在同时购买,因此在这儿的次序只表明商晶在购买时的登记先后次序。当考虑这种先后次序时,关联分析就是所谓的序列分

6、析。7关闭输入数据源(InputDataSource)节点并保存所做改变。b.设置关联(Association)节点8打开关联(Association)节点,按缺省变量(Variables)标签处于活跃状态。查看这一标签。SeiectedOutput1NotesDataUariabIes

7、GeneraI

8、Sequences

9、TimeConstraints]Sort]Output]NameStatusMode1Ro1eMeasurementType1nformatFormatCUSTOMERuseidinterua1num12.BEST12.TIMEusesequenceor

10、dina1num12.BEST12.PRODUCTusetargetnomina1char$8.$8■9选择综合(General)标签,这个标签可让你调整分析模式和设置所生成的关联规则数量。Analysismode:•ByContext「hssociationSequencesec「SpecMaximumnumberofitemsinanassoci曰tion:Minimumconfidenceforrulegeneration:nRio咒nimumTransactionFrequencytoSupport^ssociations:•5天of1argestsing1eite

11、mfrequencyifyasapercentage:if#acount:领会并选择分析模式仔细察看这个对话框所示分析模式。

12、hna1ysismode:QByContext「hssociationSequences

13、分析模式的缺省设置是按上下文她业创。这种分析模式使用输入数据源(I叩utDataSource)节点屮设定的信息确定合适的分析形式。如果输入数据集合包含:■一个身份(ID)变量和一个目标(target)变量,节点自动执行关联分析。■一个序列变量其状态为使用(use),节点则执行序列分析。序列分析要求模型中

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。