欢迎来到天天文库
浏览记录
ID:34172241
大小:394.96 KB
页数:21页
时间:2019-03-04
《关联分析—购物篮分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、Objectives■Conductanassociationanalysisandinterprettheresults・■Distinguishbetweenassociationanalysisandsequenceanalysis・■Conductasequenceanalysisandinterprettheresults.5.1问题提出考虑下面的情形,一个商店想对客八数据库进行分析,了解在购物时哪些商品会一起购买。为此,商店选择了对客户数据库样本进行购物篮分析。使用的数据集合:SAMPSIO.ASSOCSASSOCS中的变量列表DataUariab1es
2、1nt
3、erua1Uariab1es]ClassUariab1esNameMode1Ro1eMeasurementTypeFormat1nformatCUSTOMERinputinterua1numBEST12・12・TIMEinputordina1numBEST12・12・PRODUCTinputnomina1char$8・$8・数据集合ASSOCS包含了1001个客户所购买的食品,其屮20种见下表:CodeProductapplesAppleartichokartichokesavocadoavocadobaguettebaguettesBordeauxwinebourbonb
4、ourbonchickenchickencokecolacorncd_bcornedbeefcrackercrackerhamhamheinekenbeerherringfishice_creaicccreamolivesolivespepperspepperssardinessardinessodasodawatersteaksteakturkeyturkey10()1个客户中,每个客户均购买了7个物品,因而总共有7007行。数据集中每一行也就代表了客户所购产品的一个组合。在大多数数据集合中,并不是所有客户都购买了相同数量的产品。创建初始流按下图样式建立流程图:Input
5、DataSourceAssociationa.设置输入数据源(InputDataSource)节点1打开输入数据源InputDataSource)节点。2从文件夹SAMPSIO中选择数据集合ASSOCSo3点击变量(Variables)标签。4设置变fflCUSTOMER的模型角色为身份(Id)5设置变量PRODUCT的模型角色为目标变量(target)。6设置变量TIME的模型角色序列(sequence)0注:变量TIME用于识别购买食品的先后次序。此例屮所有商品均在同时购买,因此在这儿的次序只表明商晶在购买时的登记先后次序。当考虑这种先后次序时,关联分析就是所谓的序列分
6、析。7关闭输入数据源(InputDataSource)节点并保存所做改变。b.设置关联(Association)节点8打开关联(Association)节点,按缺省变量(Variables)标签处于活跃状态。查看这一标签。SeiectedOutput1NotesDataUariabIes
7、GeneraI
8、Sequences
9、TimeConstraints]Sort]Output]NameStatusMode1Ro1eMeasurementType1nformatFormatCUSTOMERuseidinterua1num12.BEST12.TIMEusesequenceor
10、dina1num12.BEST12.PRODUCTusetargetnomina1char$8.$8■9选择综合(General)标签,这个标签可让你调整分析模式和设置所生成的关联规则数量。Analysismode:•ByContext「hssociationSequencesec「SpecMaximumnumberofitemsinanassoci曰tion:Minimumconfidenceforrulegeneration:nRio咒nimumTransactionFrequencytoSupport^ssociations:•5天of1argestsing1eite
11、mfrequencyifyasapercentage:if#acount:领会并选择分析模式仔细察看这个对话框所示分析模式。
12、hna1ysismode:QByContext「hssociationSequences
13、分析模式的缺省设置是按上下文她业创。这种分析模式使用输入数据源(I叩utDataSource)节点屮设定的信息确定合适的分析形式。如果输入数据集合包含:■一个身份(ID)变量和一个目标(target)变量,节点自动执行关联分析。■一个序列变量其状态为使用(use),节点则执行序列分析。序列分析要求模型中
此文档下载收益归作者所有