欢迎来到天天文库
浏览记录
ID:350551
大小:54.50 KB
页数:4页
时间:2017-07-26
《Improving Personal Credit Scoring with HLVQ-C【外文翻译】》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、本科毕业论文外文翻译外文题目:ImprovingPersonalCreditScoringwithHLVQ-C出处:A.Vieiraetal作者:A.Vieira,JoãoDuarte,B.Ribeiro,J.C.Neves译文:通过HLVQ-C完善个人信用评分体系一、引言本文中,我们使用了多种机械研究算法来研究个人信用评分:多层感知器,LOG回归模型,支持向量机和隐层学习向量量化。这些评分模型对从葡萄牙银行收集的大量数据进行了测试。以所得出的结果为基准来考虑商业应用基础上的传统方法。本文还提出了计分模型的有效性并标明了H
2、LVQ–C是最准确的模型。定量信用评分模型已经制定了通过信用授予决定来将申请分为好或坏,在债务承担上违约可能性极高的被广泛定义为一组。用正确的模型来识别坏的申请人是非常重要的。小额信贷的增加使得信用评分准确性更加重要。线性判别分析法仍然被传统信用评分模型所使用。然而,随着信贷业管理下的大型贷款组合的发展,更准确的信用评分模型正在被积极地研究。这种努力主要是面向非参数统计方法,分类树,和信贷评分的应用神经网络技术。这项工作的目的是针对目前正在调查的模型来考察几个研究模型对信用评分应用的准确度。信用卡产业在经历了分期付款信贷的
3、快速增长后也出现了显著发展,包括单户抵押贷款,汽车贷款,和信用卡债务。信用评分模型,也就是说,客户支付能力的贷款评级,被广泛应用于金融业,以改善现金流量和信用集合。信用评分的优点包括减少信贷成本分析,实现更快的信贷决策,密切监测现有账户,和优先集合。个人信用评分方法是银行进行家庭贷款审批时使用的,用来设置信用卡及其他个人开支的信用额度。然而,随着金融服务项目的增长,出现了因拖欠贷款而带来的损失。例如,最近在金融系统中有次级按揭引发的危机造成了数十亿美元的损失。对此,许多业内的信贷机构正在开发新的模型来支持个人信贷决策。这些
4、新的信用评分模型的目标是提高准确性,这意味着更多的信用申请被授予信用从而提高利润;没有信用价值的申请被拒绝贷款从而减少损失。主要的研究集中于两个方面:预测公司破产和个人信用风险预测。由于信用评分的专有性,有一些研究报告了商业信用评分的应用性能。有学者研究了利用多层感知神经网络预测的储蓄和贷款的财务状况。作者根据科学技术从1986年1月至1987年12月的数据集比较了多层感知器与逻辑回归模型。他们发现对每个数据集而言,神经网络模型相当或优于逻辑回归模型。通过几个作家的研究,个人信用评分使用决策树和神经网络多层感知器对德国和澳
5、大利亚这两个神经网络结构的个人信用数据集进行了测试。结果表明,多层感知神经网络及决策树模型都具有相当的精度水平,而目前仅轻微优于传统的参数化方法。詹森开发了多层感知器神经网络的信用评分与三项成果:收取的义务(11.2%),债务拖欠(9.6%),和实收的义务。这个研究者认为神经网络的信用评分方法应该是很具有潜力的,但是其结果只获得了50例。该研究适用于预测金融危机,无论是在公司或者个人层面进行,研究表明最精的非参数模型显示了一定的潜力但还缺乏对传统的统计技术压倒性的优势。最近,我们已经成功地应用新的数据挖掘模型,像隐层学习向
6、量量化及支持向量机的破产预测。然而,使用这些模型的主要缺点是他们很难让人理解且无法对作出的决定进行明确区分。本文结构如下,首先讨论使用的数据集,数据处理和特征选择。接着介绍了模型的实用性和措施,之后对结果进行讨论,最后提出结论。一、正文该数据库包含约400万将个人信用征集到银行的客户,并且包括了5到40万欧元和付款期限12至72个月不等。该数据库还包含了默认设置,可以为每个客户提示关于银行的每月按揭供款天数。这个量通常被称为“拖欠天数”,在大多数情况下是零。被认为是一个客户端时,这个数目是拖欠超过30天。我们发现数据库中的
7、953数据库实例包括这个类别。要创建一个平衡数据集,可以随机选择一个没有违约的实例进行相同数量的选择。我们称为数据集1我们还创造了第二个数据集,那里的信贷拖欠定义设置成拖欠45天。这个数据集含有18%的违约和82%的非违约值,因此更不平衡。这就是所谓的数据集2几个特征选择算法用于排除无用的属性和降低分类的复杂性。由于存在许多类别的属性,特征选择是困难的。几种方法被用来测试选择的一致性:属性综合评判和卡方准则。每个方法选定的属性略有不同集。对数据进行机械学习算法有四个:回归模型,多层感知器,支持向量机和隐层学习向量量化。对于
8、多层感知器,我们用一个单一的4层神经元的神经网络。研究率设定0.3和0.2。支持向量机算法,他使用了带有径向为核心的基础上与成本参数C=1功能。HLVQ-C的算法是高维数据进行分类,这包括四个步骤。首先,利用多层感知器进行训练倒传递。第二,监督学习向量量化应用到最后隐藏层的输出获取代码载体WCI的每个类
此文档下载收益归作者所有