欢迎来到天天文库
浏览记录
ID:25561787
大小:52.00 KB
页数:5页
时间:2018-11-21
《银行个人客户信用评分模型研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、银行个人客户信用评分模型研究 数据挖掘;决策树;信用评分 中图分类号:F27 文献标识码:A :16723198(2015)19006402 1个人信用评分 一般信用的考察对象有两个:企业和个人。对于不同对象研究方式不同,但考察目的相同,即分析借款人的还款意愿和能力。本文研究的是个人信用,个人信用指的是基于信任、通过一定的协议或契约提供给自然人(及其家庭)的信用,使得接受信用的个人不用付现就可以获得商品或服务。 个人信用评分,是指通过使用科学严谨的分析方法,综合考察影响个人及其家庭的内在和外在的主客观环境,
2、并对其履行各种经济承诺的能力进行全面的判断和评估。针对不同的应用,个人信用评分分为风险评分、收入评分、响应度评分、客户流失(忠诚度)评分、催收评分、信用卡发卡审核评分、房屋按揭贷款发放审核评分、信用额度核定评分等。个人信用评分是对个人信用的一种定量化描述,用客观的方式来预测信用行为。它具有减少和控制风险、辅助准确决策等作用。 2数据采集 2.1指标体系的选择 在实际的环境中,并不是所有的数据项都可为研究所用,因而本文结合专家法和实际可获取数据,选取了衡量客户的信用情况的四大主要因素,即:基本情况、职业情况、家庭情况
3、、与银行的往来业务关系。 2.2数据的采集 指标体系确定后,我们确立了具体的考察指标,并拟出了一份银行客户信息的调查问卷,在银行进行发放,发放总数100分,回收86份,回收率86%。 3数据预处理 现实世界中经过初步采集后的数据多半是有问题的,所以需要对数据源进行清洗和转换。数据预处理技术包括数据清理、数据集成、数据转换与数据归约。本文收集到的数据较少,内容也较简单,不需要进行数据集成与数据归约,所以本文的预处理过程只需进行数据清理和数据转换。 3.1数据清理 初步采集的数据有很多是不完整的,本文对于这些空缺
4、值采取最大频数填充法。下面以“学历”为例,介绍最大频数填充法(参照表1)。在教育程度中,存在6条空缺值,记录显示“大学本科”的频率为27.90%,且这些记录的“行业类别”信息都存在,其中5条都属于“教育”类,再对“教育”行业所有记录进行分析,有56.30%的记录学历为“大学本科”,是该行业最高的学历频率,所以可以将5条“学历”空缺值补为“大学本科”。 在采集到的数据中,有些数据存在明显错误,这类数据称为“伪样本”。如在数据源中发现有数据显示月均收入很低,没有任何担保却得到了大额贷款等。这些“伪样本”必须剔除。 3.2
5、数据变换 本文需要把原始数据中字符型的数据转化为数值型的数据,以达到适用于分析软件的目的。例如:“性别”、“健康状况”、“家庭人均月收入”等字段,要把这些文本型变量转化为数值型变量,以家庭人均月收入为例(如表2)。 经过处理,得到了86条记录,其中每个记录含有14个属性(1个决策属性和13个条件属性)。该数据集作为进入数据挖掘软件的测试数据集。 4建立个人信用评分决策树模型 4.1用spss软件生成树 在spss录入数据并定义变量属性,把“连续拖欠月数”作为本文的决策属性(因变量),而其他的属性都作为为条件属性
6、(自变量),在CRT中选择GINl分类树,输出结果,得到GINI分类的决策树(如图1)。 4.2属性赋权 给14个属性进行赋权量化(如图4)。 4.3个人信用评分模型结果 个人评分模型建立过程(如图5)。 在对86个样本进行分析后,这三种级别的比例为(57.4%,31.08%,11.52%)。根据评估模型评分并结合得出的信用保险系数进行分析,得出信用评分与信用级别对应表(如表3)。 4.4个人信用评分模型的调整 在银行的实际操作中,常常无法对中、低信用用户做出合理评价,对此,需要对其信息采取进一步收集的方法
7、,以得出更完善的个人信用评分模型。具体的情况包含三个方面: (1)实力较强的银行可以放低拒绝标准; (2)在社会整体发展背景形势好的情况下,对于信用卡用户要求可以适当放宽; (3)主客观评价建模方法相结合,才能得出更可靠的信用评分模型,本文只是采用了客观评价建模方法,还应引入主观建模方法(比如:AHP层次分析法、贝叶斯分析方法等)对本文信用评分模型进行调整、完善。
此文档下载收益归作者所有