基于信息增益和bagging集成学习算法的个人信用评估模型研究

基于信息增益和bagging集成学习算法的个人信用评估模型研究

ID:13303978

大小:188.00 KB

页数:45页

时间:2018-07-21

基于信息增益和bagging集成学习算法的个人信用评估模型研究_第1页
基于信息增益和bagging集成学习算法的个人信用评估模型研究_第2页
基于信息增益和bagging集成学习算法的个人信用评估模型研究_第3页
基于信息增益和bagging集成学习算法的个人信用评估模型研究_第4页
基于信息增益和bagging集成学习算法的个人信用评估模型研究_第5页
资源描述:

《基于信息增益和bagging集成学习算法的个人信用评估模型研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于信息增益和Bagging集成学习算法的个人信用评估模型研究//.paper.edu.cn-1-中国科技论文在线基于信息增益和Bagging集成学习算法的个人信用评估模型研究邵笑笑,曹杰**作者简介:邵笑笑(1989-),女,硕士研究生,主要研究方向:信息管理通信联系人:曹杰(1973-),男,管理学博士,教授,博士生导师,主要研究领域是系统工程、应急管理、信息管理(南京信息工程大学经济管理学院,南京210044)5摘要:集成学习的算法是一种基于统计理论以计算机实现的良好机器学习方法。本文阐述了集成学习的基本思想和实现步骤,运用Bagging集成学习算法试图建立一个个人信用

2、评估模型,以期取得更好的预测结果。运用信息增益法筛选指标,采用V折交叉确认法,利用UCI的信用数据对单个分类器、Bagging集成分类器模型的分类精度和稳健性进行试验比较。结10果表明,Bagging-决策树有效的提高了样本的精确性,在个人信用评估的分析中占有较强的优势。关键词:个人信用评估;集成算法;Bagging;信息增益中图分类号:F15AnalysisofPersonalCreditEvaluationMethodBasedonInformationGainandBaggingIntegrationLearningAlgorithmShaoXiaoxiao,CaoJi

3、e(CollegeofEcologicsandManagement,NanjingUniversityofInformationScience&Technology,20Nanjing210044)Abstract:Ensemblelearningalgorithmisagoodmachinelearningmethodbasedonstatisticaltheorywithcomputertorealize.Thispaperintroducesthebasicthoughtandrealizedstepsofensemblelearningalgorithms.w

4、euseanimprovedintegratedclassifier,Bagging,tobuildamodelforpersonalcreditscoring,hopingtoobtainbetterresults.Theclassificationaccuracyandthe25robustnessofthemodelarecomparedwithsingleclassifierandbaggingusingtheUCIdatasets.TheresultshowsthatBagging-decisiontreecaneffectivelyimprovetheclassi

5、ficationaccuracyandhavestrongeradvantagefortheevaluationofpersonalcredit.Keywords:personalcreditevaluation;ensembielearningalgorithm;Bagging;InformationGain300引言中国经济目前仍然处于社会主义市场经济制度的转型期,在市场经济飞速发展的同时,社会信用制度体系的建设却明显滞后。部分企业和个人在经济交易过程中的信用缺失情况已经严重影响了正常的市场经济运行秩序,成为完善社会主义市场经济体制和建设信用社会的障碍。加快完善信用制度、

6、建立健全的社会信用体系已经成为当前亟待解决的问题。这就要35求我国的商业银行、保险公司等金融机构不断加大对新的个人信用评估方法的探索。个人信用评价是指商业银行根据个人信用信息给出每个贷款申请者能够偿还贷款的可能性[1]。信用评分方法中具有代表性的是1968年EdwardAltman创建的Z-Score模型[2]和之后在此基础上改进的Zeta模型。此外,判别分析法[3,4]、贝叶斯决策模型、Logistic回归[5]、//.paper.edu.cn-2-中国科技论文在线主成分分析、聚类分析等统计方法也被大量运用。刘淑莲等人采用因子和聚类分析,对抽样40选取的上市公司的信用风险进

7、行综合评价,确定评级标准,构建评级模型[6]。20世纪80年代以来,随着人工智能技术的发展,方法包括专家系统、决策树、人工神经网络(Artificialneuralnetworks,ANN)、支持向量机(Supportvectormachine,SVM)、遗传算法(Geneticalgorithm,GA)、粗糙集(Roughset,RS)等人工智能方法被运用到信用评级中来。每种模型在预测的精度和解释性方面都有各自的优缺点[7]。45集成学习的思路是在对新的实例进行分类的时候,把若干个单个分类器集成起来,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。