欢迎来到天天文库
浏览记录
ID:51667703
大小:533.52 KB
页数:11页
时间:2020-03-14
《银行客户案例-关联分析.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、银行客户案例分析案例背景和问题:某商业银行试图通过对个人客户购买本银行金融产品的数据进行分析,从而发现交叉销售的机会。数据集说明:该银行采集了7991个客户的产品(或服务)购买记录,共32000行,数据集名称为BANK。变量说明:ACCT:客户标识SERVICE:购买的产品或服务VISIT:购买时间数据集每一行代表这个顾客拥有的一种产品,一个顾客可能有多个行。平均每个顾客拥有的产品数是3种。数据集中的13种产品和服务缩写如下所示:ATM自动取款机AUTO自动贷款CCRD信用卡CKCRD支票/贷记卡CKING支票账户HM
2、EQLC家居股本信贷IRA个人退休账户MTG抵押CD存款保证PLOAN个人消费信贷SVG储蓄账户TRUST个人信托账户MMDA货币市场存款帐户实验要求和总体步骤:对BANK数据集进行关联分析和频繁序列分析。•确定数据源•设置变量角色•确定支持度、置信度阈值,进行关联分析•查看和筛选关联分析结果•设置变量角色,进行频繁序列分析•分析评价频繁购买序列操作步骤准备工作:1.在D盘建立文件夹:BANK2.启动SAS,建立逻辑库DATA指向D:BANK3.打开企业挖掘机关联分析:1.建立一个新的挖掘项目BANK,保存在D:B
3、ANK目录下,第一个DIAGRAM命名为ASSOC。并在右边的工作区中加入“inputdatasource”节点。,2.打开InputDataSourcenode(数据输入节点)。3..在数据库中选择BANK数据集。4.选择Variables(变量)栏。5.将ACCT设为id(身份),SERVICE设为target(目标),将VISIT设为sequence(序列)。6.关闭InputDataSourcenode(数据输入节点),保存对它的更改。7.工作区中新增Associationnode节点,并与InputDataS
4、ource节点进行连接。如下图所示:然后打开Associationnode(关联节点)。默认的是Variablestab(变量栏),这与InputDataSourcenode(数据输入节点)中的Variablestab(变量栏)是一样的。8.选择General(综合)栏,通过这个栏可以设置分析节点。观察Analysismode(分析方法)选项,默认的方法是ByContext。要根据前面的InputDataSourcenode(数据输入节点)中定义的信息来选择适当的方法。如果输入数据集包括一个ID(身份)变量,一个tar
5、get(目标)变量,这个节点就会自动地选择associationanalysis(关联分析)。如果有一个sequence(序列)变量且它的状态是use,那么这个节点就会进行一个sequenceAnalysis(序列分析)。因为在输入数据集中有个序列变量,所以这里默认的分析方法为sequenceanalysis(序列分析)。这里我们先进行associationanalysis(关联分析),稍后讨论Sequenceanalysis(序列分析)。1.将分析方法改为Association(关联)。设置支持度和置信度的阈值,以及
6、频繁项集的最大元素个数,如上图所示。2.关闭Associationnode(关联节点),弹出提示时选择保存。3.运行这图里的Associationnode(关联节点),并且观察结果。这个关系栏包含了所有的关联关系,假设关系为A=>B,回顾一下前面的:lA=>B的Support(支持度)是指一个顾客同时拥有A和B的可能性。lA=>B的confidence(_置信度)是给定顾客拥有A后,又拥有B的可能性。lA=>B的lift是对这个关联的强度的恒量。如果关系A=>B的Lift=2,拥有A的顾客再拥有B的可能性是随机抽样的一
7、个顾客拥有B的可能性的两倍。4.在Support(%)列中单击右键,选择Sort(排序)=>Descending(降序)Support(支持度)是指包含这个关系的所有顾客的百分比。比如说,大约在7991位顾客中有54.17%同时拥有支票与储蓄帐户,而大约有25%的顾客同时拥有支票账户,储蓄账户和ATM(自动取款卡)。1.在Confidence(%)列中单击右键,选择Sort(排序)=>Descending(降序)。Confidence(置信度)表示拥有LHS(左边)业务的顾客中拥有RHS(右边)业务的百分比。比如:所有
8、拥有支票账户的顾客都拥有一张支票卡,而在同时拥有储蓄账户和信用卡的顾客中超过97%的顾客拥有一个支票账户。2.在llift(增益)列中单击右键,选择Sort(排序)=>Descending(降序)。在关联关系中的lift(增益),是RHS(右边)和LHS(左边)形成关系的confidence(置信度)与假设RHS(右边)和LHS(
此文档下载收益归作者所有