资源描述:
《支持向量机在银行贷款客户分类中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、支持向量机在银行贷款客户分类中的应用研究郑启鹏,李秀,刘文煌,李兵(清华大学自动化系,国家CIMS工程技术研究中心,100084,Email:zqp02@mails.tsinghua.edu.cn)摘要:随着客户关系管理系统的不断发展和应用,使用先进的算法进行客户分析变得越来越重要。尤其是象银行这种以客户为导向的行业,客户分析是十分必要的。当前,支持向量机方法作为一种统计学习理论的分类方法已经发展的比较成熟而且成功应用到了很多领域。文章解决的主要问题是对银行的客户数据根据其属性对客户进行分类,为银行的客户关系管理系统提供一种可靠的分类方法。文中主要介绍了银行的客户分类学习的过程
2、和结果,如,客户数据清洗,数据预处理,SVM进行数据分类,多类分类处理,客户属性选择等问题。关键词:客户关系管理;支持向量机;数据挖掘;客户分类;属性选择中图分类号:TP311文献标识码:AApplicationofSupportVectorMachineinBankCustomerClassificationQipengZheng,XiuLi,WenhuangLiu,BingLi(CIMSNationalEngineeringCenter,Dept.ofAutomation,TsinghuaUniversity,Beijing,China,100084,Email:zqp02
3、@mails.tsinghua.edu.cn)Abstract:Withthedevelopmentandapplicationofthecustomerrelationshipmanagement,itbecomemoreimportanttoanalyzethecustomerusingadvanceddataminingalgorithms.AndrecentlySupportVectorMachine,astatisticaltheorymethod,hasbeensuccessfullydevelopedandappliedtomanyareas.SupportVec
4、torMachineischoseasthedataminingmethodintheanalyticalCustomerRelationshipManagementsystem.Themainproblemsarethecustomerclassification,potentialcustomersfindingbasedonbankcreditcustomerdatawhichismainlyaboutthepropertiesofthecustomers.Thecustomerdatapreprocessanddataclassificationprocessbyusi
5、ngSupportVectorMachines,andsomeresultsarepresentedindetail.Keywords:CRM(customerrelationshipmanagement);SVM(supportvectormachine);DM(datamining);customerclassification;attributeselection1简介近年来,中国金融行业尤其是银行信贷发展速度十分迅速,对消费、国民经济、市场成熟等产生了很大的促进作用。同时伴随着各行业信息化程度的不断提高以及银行信息系统的的不断完善,获得了大量的关于的客户信息的宝贵数据资
6、源。而且由于银行业是典型的以客户为导向的服务行业,对客户各类客户的理解程度很大程度上决定了企业的成功与否。对历史数据进行数据挖掘可以将市场和客户分成有意义的群组,也可以预测存(贷)款的趋势,优化存(贷)款策略,从而协助银行更好地策划有促进作用的活动和设计新的市场运动。我们当前进行分析的是国内某银行的实际的客户数据,每条样本都是由30个属性组成的。每个样本都由资深的银行职员进行了预先的标记分类,分为6个大类:AAA,AA,A,BBB,BB和B类。这样有了样本有了类别标号,就很容易抽象成一个有监督的机器学习问题。我们可以把学习到的模式应用到银行接到客户申请后的预分类中,从而为银行提
7、供决策支持。2支持向量机及其应用在上个世纪90年代,V.Vapnik提出了支持向量机方法(SVM),SVM将最优分来超平面的方法与核函数的方法结合起来,充分利用当前的所有样本求得一个最优的学习结果,从而是该方法具有很好的泛化能力。SVM不仅保证了经验风险最小化而且使得期望风险也降到了最低,而且适合于解决高维、非线性等问题,因而它是一个很好的解决客户关系管理系统中分类等问题的工具。[1][3]最优分类面的想法就是求两个类之间的不但能够将他们无误的分开,而且还要使得两类样本到分类面的最近距离相等