欢迎来到天天文库
浏览记录
ID:22985649
大小:1.23 MB
页数:13页
时间:2018-11-02
《银行客户案例-关联分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、银行客户案例分析案例背景和问题:某商业银行试图通过对个人客户购买本银行金融产品的数据进行分析,从而发现交叉销售的机会。数裾集说明:该银行采集了7991个客户的产括(或服务)购买记录,共32000行,数据集名称力BANK。变量说明:ACCT:客户丨标识SERVICE:购买的产品或服务VISIT:购买时间NameModelRoleMeasuiementLevelDescriptionACCTIDNominalAccountNumberSERVICETargetNominalTypeofServiceVISITSequenceOrdinalOrd
2、erofProductPurchase数据集毎一行代表这个顾客拥脊的一种产品,一个顾客可能有多个行。乎均每个顾客拥柯的产品数是3种。数据集屮的13种产品和服务缩写如下所示:AUT0自动贷款CKING支票账户MTG抵押SVG储莕账户CCRD信用卡HMEQLC家居股本信贷CD存款保证TRUST个人信托账户ATM自动取款机CKCRD支票/贷记卞•TRA个人退休账户PL0AN个人消费信贷MMDA货币市场存款帐户实验要求和总体步骤:对BANK数据集进行关联分析和频繁序列分析。•确定数据源•设置变M角色•确定支持度、置信度阈值,进行关联分析•查看和筛选
3、叉联分析结果•设置变量角色,进行频繁序列分析•分析评价频繁购买序列操作步骤准备工作:1.在:D盘建立文件夹:BANK2.启动SAS,建立逻辑库DATA指I4DABANK3.打开企业挖掘机关联分析:1.建立一个新的挖掘项目BANK,保存在D:BANKU录下,第一个DIAGRAM命名为ASSOC。并在右边的工作区中加入“inputdatasource”节点。,2.jJJTInputDataSourcenode(数1W输入节点)。3..在数据库中选择BANK数据集。1.选择Variables(变量)栏。2.将ACCT设为id(身份),SERVI
4、CE设为target(目标),将V1SFT设为sequence(序夕IJ),6.关闭1叩utDataSourcenode(数据输入W点),保存对它的31改。7.工作区十新增Associationnode节点,卯与InputDataSource节点进行违接。如卜图所示:InputDataAssociationSource(Context]然后打开Associationnode(关联节点)。默认的是Variablestab(变量栏),这与I叩utDataSourcenode(数据输入节点)屮的Variablestab(变量栏)足一样的。8.选择
5、General(综合)栏,通过这个栏可以设置分析节点。Association•lalxiHatesData
6、VariablesGeneralTimeLnrkntr
7、Sort
8、OutputAnalysismode:ByContextCAssociationSequencesMinimunTransactionFrequencytoSupportAssociations:of1arejestsingleitemfrequency「QpooiFjwsqo:CSpecifyacount:Maximumnunberofitemsinanassocia
9、tion:4Mininumconfidenceforrulegsneration!10X观察Analysismode(分析方法)选项,默认的方法足ByContext□要根拋前
10、ft
11、的InputDataSourcenode(数掘输入竹点)屮定义的信息来选择适当的方法。如果输入数掘集包括一个ID(身份)变量,一个target(目标)变量,这个节点就会自动地选择associationanalysis(关联分析)。如果有一个sequence(序列)变量且它的状态是use,那么这个节点就会进行一个sequenceAnalysis(序列分析)。因为在
12、输入数掘集屮有个序列变景,所以这里默认的分析方法为sequenceanalysis(序列分析)。这里我们先进行associationanalysis(失联分析),ffi/G•讨论Sequenceanalysis(序列分析)。8.将分析方法改为Association(关联)。没®支持度和®信度的阈值,以及频繁项集的最人元素个数,如上图所示。9.关闭Associationnode(关联节点),弹ili提示时选择保存。10.运行这图里的Associationnode(关联节点),并且观察结果。这个关系栏毡含了所有的关联关系,假设乂•系为A=>B,
13、回顾一下前面的:•A=>B的Support(支持度)是指一个顾客同时拥有A和B的町能性。•A=>B的confidence(_S信度)是给定顾客拥奋A后,乂拥奋B的可能性。•A=〉
此文档下载收益归作者所有