欢迎来到天天文库
浏览记录
ID:23535796
大小:4.09 MB
页数:50页
时间:2018-11-08
《基于非平衡数据分类贷款违约预测的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、原创性声明本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。作者签名:学位论文版权使用授权书本人了解中南大学有关保留、使用学位论文的规定,即:学校有权保留学位论文并根据国家或湖南省有关部门规定送交学位论文,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以采用复印、缩印或其
2、它手段保存学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。燃名:嘲毓销Ⅱ基于非平衡数据分类的贷款违约预测研究摘要:如何在发放贷款前有效的评价和识别借款人潜在违约风险,计算借款人的违约概率,是现代金融机构信用风险管理的基础和重要环节,也是数量经济学、金融学等领域中的研究热点问题。现有的贷款违约数据大部分都是非平衡的,以往的研究并未足够注意这一特征也就重视这一问题的深入研究,本文主要研究如何借助非平衡数据分类的思想对银行等金融机构的历史贷款数据进行分析,预测贷款违
3、约的可能性。对于非平衡数据问题,采用基于数据平衡的方法构造随机森林;针对数据较大的问题,采用具有并行特性的随机森林算法。基于上述研究,本文提出了一种改进的带权重的并行平衡随机森林算法(WPBRF)。WPBRF算法在构造随机森林的每个决策树的同时利用OOB数据估计该决策树的预测性能,并据此赋予每个决策树不同的权重;此外,WPBRF算法利用了随机森林算法的可并行计算的特点,减少了单个决策树的训练时间。实验结果表明,WPBRF在准确率和平衡准确率等方面超过了SVM、KNN、C4.5等常见分类算法和随机森林算法。此外,利用随机森林的并行性
4、的WPBRF算法大幅降低了算法的学习时间,提高了算法的执行效率。关键词:贷款违约预测;非平衡数据;随机森林;并行计算分类号:F224IIILoanDefaultPredictionBasedonImbalancedDataClassificationAbstract:Howtoevaluatetheloandefaultriskandcalculateitsdefaultprobabilityisthebasisandanimportantprocessincreditriskmanagementinmodemfinanciali
5、nstitutions.Loandefaultpredictionproblemandtherelatedcreditscoringproblemarealsohottopicsineconometricsandfinance.Mostloandefaultdataareunbalancedwhilepreviousstudieshavesimplyignoredthisproblemorpaidlittleattentiontothisproblem.Usingideasfromtheresearchonimbalancedcl
6、assificationandconsideringthebigdataproblem,wedecidetoadoptrandomforestswhichareparallelableinnatureastheclassificationmethod.Inthisthesis,weproposeanimprovedrandomforestalgorithm(WPBRF,WeightedandParallelableBalancedRandomForest)whichallocatesweightstodecisiontreesin
7、theforestduringtreeaggregationforpredictionandtheirweightsareeasilycalculatedbasedonout-of-bagerrorsintraining.WPBRFalsoexploitstheparallelideaincomputingandgreatlyreducethetrainingtimeofsingledecisiontree.ExperimentsresultsshowthatOurproposedWPBRFalgorithmbeatstheori
8、ginalrandomforestandotherpopularclassificationalgorithmssuchasSVM.KNNandC4.5intermsofbothbalancedandoverallaccuracymetrics.E
此文档下载收益归作者所有