资源描述:
《大数据背景下网络借贷的信用风险评估——以人人贷为例》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、大数据背景下网络借贷的信用风险评估以人人贷为例柳向东李凤暨南大学经济学院摘要:在大数据时代,网贷平台每天流动着海量交易数据。为充分利用这些数据控制信用风险,运用数据挖掘算法建立了信用风险评估模型。由于网贷数据多为非平衡数据,所以通过多次尝试使用SMOTE算法进行处理,提高了模型评估性能。研究发现:随机森林模型更适合用于信用风险评估,其次是CART、ANN、C4.5o用户的婚姻、房/车产(贷)等信息重要程度较低,而公司规模、工作吋间等信息,历史借款、信用评分等信用档案信息在信用风险评估屮尤为重要。关键词:P
2、2P网络借贷;非平衡数据;SMOTE算法;数据挖掘;随机森林;作者简介:柳向东,男,湖南浏阳人,理学博士,教授,博士牛导师,研究方向:大数据理论及统计分析;作者简介:李凤,女,重庆黔江人,硕士生,研究方向:大数据统计与计量分析。收稿日期:2015-11-18基金:国家自然科学基金面上项目《带Ldvy跳的多因子市道轮换框架下的仿射利率结构模型》(71471075)TheEvaluationoftheBorrower"sCreditRiskinPeer一to-PeerLendingundertheBackgr
3、oundofBigData:EvidencefromRenRenDaiLIUXiang-dongLIFenSchoolofEconomics,JinanUniversity;Abstract:MassivetransactiondataisflowingonthePeer-to-Peerlendingplatformseverydayintheageofbigdata.Forthepurposeofmakingthemostofthesedatatocontrolthecreditriskeffectiv
4、ely,weestablishedthecreditriskevaluationmodelofPeer-to-Peerlendingusingdataminingmethods.Moreover,duetotheimbalaneeofthedata,wedecidedtousethesyntheticminorityover-samplingtechnique(SMOTE)toimprovetheperformanccofthecreditriskmodelafterseveraltrics>Theemp
5、iricalstudyfoundthatRandomForestsismoresuitablefortheevaluationofcreditrisk.CART,ANNandC4.5alsoperformwell.Inaddition,theborrower'smaritalstatusandpossessionofhouse,car,mortgageandautoloanisofnoimportemce,buttheirpersonalinformation(companysize,cmployment
6、length,etc.)andcreditinfonuation(loaninformation,creditscore,etc.)playanimportantroleintheevaluationofcreditrisk.Keyword:Peer-to-Peerlending;imbalaneeddata;SMOTE;datamining;remdomforests;Received:2015-11-18一、引言随着互联网的发展和民间借贷的兴起,P2P网络借贷作为一种依托于互联网的新型金融模式开始兴起
7、并迅速发展壮大。互联网金融平台利用搜索引擎、社交平台、云计算等,搜集和记录数据,基于这些数据,运用数据挖掘技术可以提高金融风险监控能力。用户信息、历史交易数据等的收集和记录,促进了资金供求双方的信息交流,在一定程度上降低了由于信息不对称等带来的金融风险。然而,由于中国P2P网络借贷起步较晚,信用体系不完善,相关法律法规缺失,平台跑路和借款人不按时还款其至携款潜逃等问题仍时有发生,暴露出了较为严重的资金安全问题。另一方而,步入大数据时代,P2P网络借贷平台每日产生的交易数据数量大,包含的借贷信息多样,更新速
8、度快,如何及时、合理、有效地利用这些数据获取有用信息,提高平台的风险监控能力至关重要。由此,利用平台的海量交易数据,釆用数据挖掘技术,建立信用风险评估模型,为P2P网络借贷平台监管、投资者选择投标项目提供依据,具有重要的现实意义。目前,国外在P2P网络借贷方面的研究较为系统深入,在P2P网络借贷的基本理论、风险问题、借款成功率等方面研究较多。在借款成功率方面,学者们研究了个人信息如性别、相貌等对借款决策和借款成功率的影响,并运