数据挖掘技术在信用卡业务中的应用分析研究.pdf

数据挖掘技术在信用卡业务中的应用分析研究.pdf

ID:58306284

大小:103.20 KB

页数:1页

时间:2020-05-20

数据挖掘技术在信用卡业务中的应用分析研究.pdf_第1页
资源描述:

《数据挖掘技术在信用卡业务中的应用分析研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、设计分析·数据挖掘技术在信用卡业务中的应用分析研究边红军(陕西财经职业技术学院,陕西咸阳712000)摘要:本文通过对数据挖据技术在信用卡业务中管理模式、应用方法的分析研究,提出数据挖掘技术在信用卡业务中将具有越来越广阔的应用前景。关键词:数据挖掘技术;信用卡;应用分析;研究方法1数据挖掘技术在信用卡业务中的应用(3)数据来源。在我国,由于征信系统还不完善,建模数据数据挖掘技术在信用卡业务中的应用主要有分析型客户关主要来自申请表。随着我国全国性征信系统的逐步完善,未来系管理、风险管理和运营管理。建模的一部分数据可以从征信机构收集到。(1)分析型CR

2、M。分析型CRM应用包括市场细分、客户获取、交(4)数据整理。大量取样的数据要真正最后进入模型,必须叉销售和客户流失。信用卡分析人员搜集和处理大量数据,对经过数据整理。在数据处理时应注意检查数据的逻辑性、区分这些数据进行分析,发现其数据模式及特征,分析某个客户群“数据缺失”和“0”、根据逻辑推断某些值、寻找反常数据、评体的特性、消费习惯、消费倾向和消费需求,进而推断出相应消估是否真实。可以通过求最小值、最大值和平均值的方法,初费群体下一步的消费行为,然后以此为基础,对所识别出来的步验证抽样数据是否随机、是否具有代表性。消费群体进行特定产品的主动营销

3、。(5)变量选择。变量选择要同时具有数学统计的正确性和信(2)风险管理。在风险管理中运用数据挖掘技术可建立各用卡实际业务的解释力。Logistic回归方法是尽可能准确找到类信用评分模型。模型类型主要有三种:申请信用卡评分卡、能够预测因变量的自变量,并给予各自变量一定权重。若自变行为信用评分卡和催收信用评分卡,分别为信用卡业务提供事量数量太少,拟合的效果不好,不能很好地预测因变量的情况;前、事中、和事后的信用风险控制。若自变量太多,会形成过分拟合,预测因变量的效果同样不好。(3)运营管理。虽然数据挖掘在信用卡运营管理领域的应用所以应减少一些自变量,如

4、用虚拟变量表示不能量化的变量、不是最重要的,但它已为国外多家发卡公司在提高生产效率、用单变量和决策树分析筛选变量。优化流程、预测资金和服务需求、提供服务次序等问题的分析(6)模型建立。借助SAS9软件,用逐步回归法对变量进行筛上取得了较大成绩。选。这里设计了一种算法,分为6个步骤。步骤1:求得多变量相2常用的数据挖掘方法关矩阵(若是虚拟变量,则>O.5属于比较相关;若是一般变量,(1)线性回归。简单线性回归分析是量化两个连续变量之间则>0.7-0.8属于比较相关)。步骤2:旋转主成分分析(一般变关系的一种统计技术。这两个变量分别是因变量(预测变量)

5、。量要求>O.8属于比较相关;虚拟变量要求>0.6-0.7属于比较使用这一方法,可以发现一条穿过数据的线,线上的点使对应相关)。步骤3:在第一主成分和第二主成分分别找出l5个变量,数据点的方差最小。共30个变量。步骤4:计算所有3O个变量对好/坏的相关性,找(2)逻辑回归。逻辑回归是使用最广泛的建模技术,与线性出相关性大的变量加入步骤3得出的变量。步骤5:计算VIF。若回归很相似。两者的主要区别在于逻辑回归的因变量(想预测VIF数值比较大,查看步骤1中的相关矩阵,并分别分析这两个变量)不是连续的,而是离散的或者类型变量。变量对模型的作用,剔除相关性

6、较小的一个。步骤6:循环步骤4(3)神经网络。神经网络系统由一系列类似于人脑神经元一和步骤5,直到找到所有变量,且达到多变量相关矩阵相关性很样的节点组成,这些节点通过网络彼此互连。如果有数据输入,而单个变量对模型贡献作用大。它们便可以进行确定数据模式的工作。(7)模型验证。在收集数据时,把所有整理好的数据分为用(4)决策树。决策树的目标是逐步将数据分类到不同的组或于建立模型的建模样本和用于模型验证的对照样本。对照样本分支中,在因变量的值上建立最强划分。由于分类规则比较直用于对模型总体预测性、稳定性进行验证。申请评分模型的模观,所以易于理解。型检验指

7、标包括K_s值、ROC、AR等指标。虽然受到数据不干净3实例分析等客观因素的影响,本例申请评分模型的K_s值已经超过0.4,以下以逻辑回归方法建立信用卡申请评分模型为例,说明达到了可以使用的水平。数据挖掘技术在信用卡业务中的应用。4数据挖掘在国内信用卡市场的发展前景(1)定义好客户和坏客户的标准。一般来讲,在同一样本空总体而言,数据挖掘在我国信用卡业务中的应用处于数据间内,好客户的数量要远远大于坏客户的数量。为了保证模型具质量问题,难于构建业务模型。随着国内各家发卡银行已经建有较高的识别坏客户的能力,取好、坏客户样本数比率为1:1。立或着手建立数据

8、仓库,将不同操作源的数据存放到一个集中(2)确定样本空间。样本空间的确定要考虑样本是否具有代的环境中,并且进行适当的清洗和

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。