资源描述:
《基于Logistic回归和后验概率SVM的住房贷款组合评估模型.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、理论新探基于Logistic回归和后验概率SVM的住房贷款组合评估模型1,222孙彩,姜明辉,袁绪川(1.哈尔滨理工大学经济管理学院,哈尔滨150040;2.哈尔滨工业大学管理学院,哈尔滨150001)摘要:本文针对单一模型存在的分类精度有限的不足,提出了应用组合预测模型进行信用评估的方法。选择Logistic回归和后验概率SVM模型作为单一模型,构建了基于二者的非负权重线性组合预测模型,并将模型应用于住房信贷评估。应用结果表明,组合评估模型的分类精度高于单一模型,并且获得了较好的稳健性,对于构建住房信贷评估模型是一个很好的选择。关键词:Logistic回归;后验
2、概率SVM;组合预测中图分类号:F830;F589文献标识码:A文章编号:1002-6487(2007)23-0019-03组合预测模型作为一种建立在单一模型基础上的方法,即wi≥0。加入权重非负的约束条件之后,权重的计算就能综合不同单一模型的优点,从而提高预测的性能。基于此,变的比较复杂,通常根据Kuhn-Tucker条件转化为二次本文将组合预测方法引入住房信贷评估当中,选择了统计模规划进行求解。型中的Logisitic回归以及新近发展起来的后验概率SVM模建立组合预测模型,单一模型的选择是其中需要考虑型,构建了住房信贷的组合评估模型,期望能在模型预测的的一项重
3、要内容。单一模型的预测结果应当具有相同的形精确性以及稳健性上得到更好的结果。式和性质。信用评估本质上是模式识别中的分类问题,因此,采用基于最大后验概率选择分类的原则,能够满足贝叶1理论背景与模型构建思路斯最优决策。因此,本文将模型输出的结果能否反映信贷申请者的违约概率作为单一模型选择的依据。统计学模型中的1.1组合预测模型与模型构建思路Logistic回归在信用评估中,由于其预测精度较为理想,而且组合预测是将各种预测加权重组而得到结果。Clemen对数据与假设条件要求很少,能处理定性指标,得到了广泛曾指出,组合预测将成为预测研究的主流之一。在组合预测的应用;此外,
4、Logistic回归可以对违约概率与特征变量之间理论中,集结各单项预测模型的方式大致可分为线形组合和的关系进行定量分析,能分辨出哪些变量与人们的信用行为非线性组合,其中线性组合预测模型是研究最多、应用最广有密切的关系。近年来发展起来的后验概率SVM模型,由于泛的。线性组合预测的基本原理如下。其建立在结构风险最小化(SRM)基础之上,所建立的分类模对于同一个预测问题,有m种预测方法,记yt表示实际型分类精度高,并具有较强的稳健性;此外,后验概率SVM观测值;t=1,2,⋯,n,表示样本规模;fit表示第i种预测方法的能够给出客户违约或者守约的概率,得到的预测结果与L
5、o-预测值(t=1,2,⋯,n);wi表示在组合预测模型中第i种方法的gistic回归具有同质性。因此,本文选择后验概率SVM模型权重。则线性组合预测的数学模型为:和Logistic回归作为单一模型,建立基于二者的非负权重线m性组合预测模型,并采用最大后验概率作为分类的准则,期"$ft=!wifit望获得一种实现分类精度和稳健性最优结合的住房信贷评i=1#(1)m估模型。$s.t.!wi=1,t=1,2,⋯,n1.2后验概率SVM%i=1对于训练样本(x,y)d,y∈T-1,1U,标准组合预测的关键在于确定各单项预测模型的权重。文ii,i=1,2,⋯,l,xi∈R
6、献[3]利用误差信息矩阵给出了一种基于误差平方和最小SVM模型通过求解如下的二次规划问题得到最优分类面,使准则的权重计算方法,而根据该方法计算的权重往往会得两类样本尽可能的分开:l出现负数的情况,对于组合预测模型中是否允许负权重"1T$minww+c!ξi的存在,国内外的学者具有不同的看法。多数学者认为,w,b,ξ2i=1((2)subjecttoy(wT"(x+b)≥1-ξ负权重无论是从组合预测的思想,还是从权重的物理意$iii义和经济意义上,都无法做出合理的解释。因此,考虑到%ξi≥0,i=1,⋯,l权重的非负性,应当在模型中加入权重非负的约束条件,其对偶问题
7、可以表示为基金项目:哈尔滨工业大学技术·政策·管理(TPM)国家哲学社会科学创新基地资助项目(htcsr06t06)统计与决策2007年第23期(总第251期)19理论新探"min1αTQα-eTα有较低的违约倾向,那些被拒绝的住房贷款申请者则被认为$α2具有较强的违约倾向。因此,本着谨慎的原则,定义的违约如#T(3)$subjecttoyα=0下:只要借款者的逾期还款天数超过30天,就定义为违约。%0≤αi≤C,i=1,⋯,l剔除存在属性缺失的样本,最终获得了1119个样本,包括其中,e为单位向量,Q=yyK(x,x),K(x,x)="(x)T)ijijijij
8、i"(xj