随机森林在企业信用评估中的应用

随机森林在企业信用评估中的应用

ID:33366830

大小:2.90 MB

页数:64页

时间:2019-02-25

随机森林在企业信用评估中的应用_第1页
随机森林在企业信用评估中的应用_第2页
随机森林在企业信用评估中的应用_第3页
随机森林在企业信用评估中的应用_第4页
随机森林在企业信用评估中的应用_第5页
资源描述:

《随机森林在企业信用评估中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要企业信用评估是商业银行资产业务,特别是贷款业务经营的核心内容。对贷款客户的信用评价是否科学可靠、是否健全,关系到商业银行经营的成败。我国银行的信用评估目前还停留在传统的比例分析阶段,亟需建立一套更为科学的评估模型。近年来,人工神经网络(ANN)和支持向量机(SVM)等智能模型已被引入信用评估领域,取得了令人鼓舞的研究性成果。但前人的研究大多着重子单分类器的模型,由于信用评估数据分布较为复杂,噪声较多,这使得单分类器模型难以达到令人满意的效果。于是本文引入了一种能较好容忍噪声,且稳定性较高的组合分类器算法——随机森林(RF),探索研究商业银行

2、的企业信用评估问题。本文简要介绍了随机森林方法的相关理论:着重研究了随机森林在企业信用评估中的应用。我们利用RF算法定义的野点度量尺度,对原始数据进行预处理,剔除明显奇异的部分野点;然后利用RF算法能计算单个特征重要性的特点,对用于企业信用评估的可用指标集进行特征选择,并以此为基础建立信用评估模型。本文还进一步研究了RF对噪声的容忍程度和对不平衡分类问题的处理方法,并对信用评估模型的参数选择问题进行了实验分析,得出了一些实用性的结论,为后续的研究工作奠定了一个较好的基础。本文针对RF模型,单个SVM模型和单个NN模型进行了对比实验。实验表明,R

3、F模型在均衡了各类别准确率的基础上,还具有较高的整体准确率,这表明RF算法更加适用于构建信用评估模型。此外,本文还将代价敏感分类的思想引入了RF模型,以期提高误判代价较高的类别的准确率,从而降低整体误判代价,使我们的模型更具实用性。关键词:信用评估:随机森林;特征选择AbstractEnterprisescreditassessmentisthekeystepincapitalbusiness,especiallyloanbusiness,ofcommercialbanks.Therationalityandreliabilityofcredi

4、tassessmentwillgreatlyaffecttheachievementsofabank.ThecommerciaIbanksinChinaneedsomemuchbetterassessmentmethodstoimprovetheircompetitionability,inwhich,nowadays,thetraditionalratio—analysismethodispopularlyadopted.Recently,theintelligentmodels,suchasArtificialNeuralNetworks(

5、ANN)andSupportVectorMachines(SVM),havebeenintroducedintothecreditassessmentdomainandhavealreadyachievedsomepromisingresults.Theexistingresearchesaremainlyfocusedontheestablishmentofthesingleclassifier.But,creditassessmentdataarewithcomplexdistributionandwithmuchnoise,SOsingl

6、eclassifiercannotgainsatisfyingresults.Inthispaper,weintroduceanewclassifiercombinationalgorithm⋯⋯RandomForests(Rf),whichisratherstableandrobustwithnoise,toresearchenterprisecreditassessmentofcommercialbanks.Inthispaper,wehavebrieflyintroducedthetheoryofRandomForestsandstudi

7、edtheapplicationsofRFonenterprisescreditassessment.WehaveusedRFtoeliminateoutliersbasedontheSO—called‘outliermeasure’,deletingsomeobviouslyodditysamples;then,wehaveperformedfeature—subsetselectionbasedonRFwhichcanmeasuretheimportanceofthefeatures;atlast,wehaveutilizedRFtocon

8、structtheassessmentmodel.Thetolerancetonoiseandthemethodsofdealingwithimbal

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。