欢迎来到天天文库
浏览记录
ID:56422898
大小:2.47 MB
页数:22页
时间:2020-06-17
《基于数据挖掘的信用卡客户细分与目标营销模型研究.ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、基于数据挖掘的信用卡客户细分与目标营销模型研究谢佳斌张兰兰刘朔中国人民大学统计学院目录引言1商业理解2数据理解3数据准备4模型的建立和评估5模型的实施61引言信用卡主要通过个人短期循环借贷获取利润,具有很高的风险性。在个人消费信贷越来越被中国银行业看重的今天,由于受信用卡业务的高额利润和巨大市场空间的引诱,中国的各大商业银行都开始加入或增加了在信用卡业务的投入,将其作为重点业务加以发展,激烈争夺信用卡客户。目前,我国的信用卡发卡行、发卡量和交易量都大幅上升。1引言(续)盲目发卡未合理地选择客户国内推出信用卡业务的
2、商业银行都不同程度地存在以下问题:信用卡信用额度设定不合理上述问题给这些银行造成的损失是巨大的,它们逐渐意识到仅重视信用卡发行量的增加及客户消费金额的提高是不够的。如何衡量客户价值的高低,确立发卡准则,为核发信用卡及信用额度提供参考,防范与信用卡违约、欺诈行为等相关的一系列问题成为了这些银行的首要任务。2商业理解随着国内金融行业竞争程度的日益加剧,国内金融企业必须通过“以客户为中心”建立“一对一”的营销方式来实现。但对每一位客户都进行关系营销,其投入的成本是非常大的,且通常回报却并不高。当前银行业发展的现状,是2
3、0%的客户创造出80%的利润,即服从“二八定律”。所以,银行必须先要对客户进行分类,将有限的资源优先满足最有价值的客户,而非对每一位客户都进行关系营销。如何依据客户价值对其进行分类,怎样对不同类别的客户进行特征提取来指导营销人员进行有针对性的营销、采取策略来减少客户的流失、增加客户的消费就成为非常重要的议题。2商业理解(续)本文将根据国内A银行信用卡中心提供的数据集:首先,从持卡人的收入、刷卡消费及个人信用三方面利用聚类分析方法将该行的所有顾客进行细分;然后,利用持卡人的背景信息变量建立预测模型,对客户所属类别进
4、行预测;最后,利用预测模型输出的决策树规则,帮助银行了解不同类别客户的相关特征,根据这些特征为银行的营销人员寻找、定位有价值的新客户提供帮助,同时对不同价值的客户采取不同的管理营销策略,使营销人员的工作更有针对性、更有效,从而为增进银行与客户之间的互动关系,减少客户流失率,强化客户忠诚度和价值,改进客户关系管理提供参考依据。3数据理解本文的研究数据为A银行信用卡中心提供的客户资料,具体包括:个人基本信息:性别、年龄、职业、学历、户籍、婚姻、个人月收入及支出等家庭情况:家庭月收入、人口数、家庭经济状况等个人持卡消费
5、情况:刷卡频率、月刷卡金额、借款余额及逾期等个人与银行往来的相关情况:呆账记录、退票记录、拒往记录、其它银行强制停卡记录等共27个变量65535条记录。3数据理解(续)变量名变量解释类别申请书来源信用卡申请书的来源及方式8分类变量瑕疵户此信用卡是否为瑕疵户2分类变量逾期此信用卡是否超过30天没有还款2分类变量呆账此信用卡是否有呆帐记录2分类变量借款余额此信用卡持有人是否有借款余额大于800万元2分类变量退票此信用卡持有人是否有退票记录2分类变量拒往记录此信用卡持有人是否有拒往记录2分类变量强制停卡记录此信用卡持有
6、人是否有他行强制停卡记录2分类变量张数此信用卡持有人个人拥有的信用卡张数5分类顺序变量频率此信用卡持有人个人使用信用卡的频率5分类顺序变量户籍此信用卡持有人户籍所在地理区4分类变量都市化程度此信用卡持有人户籍所在地都市化程度3分类变量性别此信用卡持有人之性别2分类变量3数据理解(续)变量名变量解释类别年龄此信用卡持有人之年龄状况9分类顺序变量婚姻此信用卡持有人之婚姻状况3分类变量学历此信用卡持有人之学历5分类顺序变量职业此信用卡持有人之职业22分类变量个人月收入此信用卡持有人之个人平均月收入8分类顺序变量个人月开
7、销此信用卡持有人之个人平均月开销5分类顺序变量住家此信用卡持有人之住家情况6分类变量家庭月收入此信用卡持有人之家庭平均月收入6分类顺序变量月刷卡额此信用卡持有人之平均月信用卡刷卡金额8分类顺序变量宗教信仰此信用卡持有人之宗教信仰7分类变量人口数此信用卡持有人之共同居住人口数9分类顺序变量家庭经济此信用卡持有人之家庭经济客观等级5分类顺序变量血型此信用卡持有人之血型4分类顺序变量星座此信用卡持有人之星座12分类变量4数据准备4.1数据清洗两类不合逻辑的数据:一类为使用信用卡的频率为没有使用(变量频率的取值为5),但
8、刷卡金额大于0的记录;另一类为家庭月收入模拟变量取值小于0,而家庭月收入至少为0的记录。缺失数据:一部分记录的家庭月收入数据缺失(家庭月收入对应的取值为0),该部分缺失数据较少而总数据量很大。处理办法:直接删除。数据清洗总共删除7058条记录,余下58477条记录。接下来的分析都基于清洗后的数据进行。4数据理解(续)4.2衍生目标变量:客户类别此处利用聚类分析方法来对信用
此文档下载收益归作者所有