欢迎来到天天文库
浏览记录
ID:10320798
大小:3.47 MB
页数:71页
时间:2018-07-05
《基于MCDM的分类模型评价与SMOTEBagging模型改进--以P2P个人信用风险预测为例》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、4占科政走爹UNIVERSITYOFELECTRONICSCIENCEANDTECHNOLOGYOFCHINA硕士学位论文MASTERTHESIS论文题目碁于MCDM的分类模型评价与SMOTEBagging模型改迸—以P2P个人信用风险预测为例学科专业管理科学与工程学号2Q1421110516_作者姓名李辉指导教师彭怡教授独创性声明‘本人声明所呈交的学位论文是本人在导师指导下进行的研宄工作及取得的研宄成果。据我所知,除了文中特别加以标注和致谢的地方,论文中不包含其他人己经发表或撰写过的研究成果外,也
2、不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研宄所做的任何贡献均己在论文中作了明确的说明并表示谢意。作者签名:日期:7年 ̄月1(日论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文^(保密的学位论文在解密后应遵守此规定)作者签名:导师签名:%^曰期:如7年0月#曰
3、分类号密级注1UDC学位论文基于MCDM的分类模型评价与SMOTEBagging模型改进——以P2P个人信用风险预测为例(题名和副题名)李辉(作者姓名)指导教师彭怡教授电子科技大学成都(姓名、职称、单位名称)申请学位级别硕士学科专业管理科学与工程提交论文日期2017.9论文答辩日期2017.10.19学位授予单位和日期电子科技大学2017年12月答辩委员会主席评阅人注1:注明《国际十进分类法UDC》的类号。EvaluationofClassificationModelsandImprovementofSMOTEBaggingModelBasedonMCDMInTheCaseofP2PPer
4、sonalCreditRiskPredictionAMasterThesisSubmittedtoUniversityofElectronicScienceandTechnologyofChinaDiscipline:ManagementScienceandEngineeringAuthor:HuiLiSupervisor:Prof.YiPengSchool:SchoolofManagementandEconomicsofUESTC摘要摘要互联网金融的发展和个人信用商业化进程的加快,不仅使得人们可以凭借个人信用享受越来越多便利的服务,也给国家完善信用体系提供了新的思路。对提供这些服务的企业
5、来讲,对用户的个人信用风险进行有效的预测,发现潜在的违约用户,是提高风险管理水平,保证服务质量的基础,因此,对个人信用风险预测模型进行研究,有着重要的价值和意义。传统的预测模型已经不能满足当下风险管理的需求,以分类模型为代表的数据挖掘技术成为了构建个人信用风险预测模型的主流技术,面对不同的分类模型,如何选择出能在自己的数据集上有最好表现的分类模型来进行个人信用风险预测成为了企业所关心的问题。本文基于MCDM方法,主要研究了两个问题,一是如何在单个数据集下对分类模型进行评价和选择,二是如何提高分类模型发现潜在违约用户的能力。针对第一个问题,本文把特征空间对模型表现的影响纳入了考虑,使用多种特
6、征选择方法,并结合MCDM方法,构造了一种多空间多准则的模型综合评价框架。在此框架的基础上,本文以美国著名P2P网贷平台Prosper.com的数据集为例,使用TOPSIS方法,综合六个评价指标对五种单分类器模型在个人信用风险预测问题上的表现进行了评价和比较,为企业在特征空间的构建和分类模型的选择上提供借鉴和参考。实验发现,BPNN模型、LR模型以及SVM模型在Prosper.com的个人信用风险预测中有着较好的综合表现。为了进一步提高对违约用户的预测准确率(TPR),本文以这三个分类模型作为基分类器,用SMOTEBagging模型来进行集成学习。个人信用风险预测是数据不平衡问题,SMOT
7、EBagging模型在这种情况下有比传统Bagging模型更好的TPR表现。本文基于AHP方法对其进行了改进,构建了一种AHP-BasedBagging模型,以在不牺牲SMOTEBagging模型整体表现的情况下提高TPR表现。本文先在27个不平衡数据集上对AHP-BasedBagging模型的有效性进行了验证,发现其能以相当于SMOTEBagging模型一半的集成规模,在0.05的置信度下,得到显著优于SMOTEBag
此文档下载收益归作者所有