资源描述:
《基于遗传规划方法的商业银行信用风险评估模型.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、2001年2月系统工程理论与实践第2期文章编号:100026788(2001)0220073207基于遗传规划方法的商业银行信用风险评估模型王春峰,康莉(天津大学金融工程研究中心,天津大学管理学院,天津300072)摘要:利用遗传规划方法研究了我国商业银行的信用风险评估问题,并使用我国商业银丢失实际数据对模型进行了实证检验L检验结果表明,该模型在预测精度、实用价值和鲁棒性方面都优于传统的统计模型、神经网络模型和决策树模型L关键词:遗传规划;信用风险评估中图分类号:F830.49aAModelBasedonGeneticProgrammingforCreditR
2、iskAssesmentinCommercialBanksWANGChun2feng,KANGLi(CenterforFinancialEngineering,SchoolofManagement,TianjinUniversity,Tianjin300072)AbstractInthispaper,amodelbasedongeneticprogrammingispresentedtocreditriskassessmentincommercialbanks.Empiricalresultsshowthatgeneticprogrammingmodelism
3、oreadvantageousthantraditionalstatisticalmodels,neuralnetworkmodelsanddecisiontreemodelsinpredictionaccuracyandrobustness.Keywordsgeneticprogramming;creditriskassessment1引言[1]近年来,商业银行的信用风险问题受到了学术界和金融实业界广泛关注L所谓信用风险,是指供款人由于种种原因,不愿或无力偿还银行贷款本息,导致银行贷款损失的的可能性L《世界银行》对全球银行业危机的研究指出,信用风险管理不善是
4、导致商业银行破产的常见原因L对处于新兴市场和转轨经济时期[1]的我国商业银行而言,加强信用风险管理尤为重要L信用风险管理包括风险识别、风险评估和风险处理,其中信用评估是基础和关键L信用评估是指,对可能引起贷款风险的因素进行定性分析、定量计算,以测量借款人的违约概率,为贷款决策提供依据L当前国际学术界和实业界处理这一问题的主流方法是基于分类的方法,即根据借款人的财务、非财务状况,将其分为正常(按期还本付息)和违约两类,这样信用评估就转化为统计中的分类问题L学术界和金融实业界提出了多种分类模型用于信用评估,这些模型可归为两大类:传统统计模型和人工智能模型L传统的统
5、计模型主要基于多元统计分析方法,其基本思路是,根据已经掌握的历史上每个类别(违约类、正常类)的若干样本,从中总结出分类的规律,建立判别公式,用于对新样本的分类L根据判别函数的形式和样本分布的假定不同,主要的模型有:多元回归分析模型、多元判别分析模型(MDA)、ligit分析模型、[2]近邻法L其中以MDA和Logit分析模型应用最为广泛,已有大量商业化软件L统计模型的最大优点在于其具有明显的解释性L存在的缺陷是过于严格的前提条件L如MDA,它要求数据服从多元正态分布和等协[3]方差,而现实中大量数据严重违背了这些假定(Eisenbeis(1977)总结了MDA
6、应用中的几个主要问题)La收稿日期:1999207205资助项目:国家自然科学基金95重大项目“金融数学、金融工程、金融管理”资助©1995-2005TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.74系统工程理论与实践2001年2月引入对数变换可在一定程度上改进数据的非正态分布,但一方面变换后的变量可能失去经济解释含义,另一方面仍没有满足等协方差的要求;应用二次差别分析(QDA)虽可解决等协方差问题,但一方面没有满足正态性假定,另一方面当数据样本小、维数高(指标多)时(QDA)的性能明显下降(样本少、
7、维数高正是我国信用数据的显著特点,见后面分析),实证结果还表明QDA对训练样本效果较好,而对测试样本并不理[2]想L为了解决这些问题,引入了Logit分析模型和近邻法LLogit模型不需假定任何概率分布,也不要求等协方差,但是当样本点存在完全分离时,模型参数的最大似然估计可能不存在,模型的有效性值得怀疑,另外该方法对中间区域的差别敏感性较强,导致判别结构的不稳定L近邻法不要求数据正态分布,但当数据的维数较高时,存在所谓的“维数祸根(Curseofdimensionality)”——对高维数据,即使样本量很大,其撒在高维空间中仍显得非常稀疏,绝大多数点附近根本没
8、有样本点,这就使得“利用空间中每一附近