欢迎来到天天文库
浏览记录
ID:8136112
大小:7.64 MB
页数:24页
时间:2018-03-06
《互联网金融风控中的数据科学-王婷》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、互联网金融风控中的数据科学王婷数据科学家宜人贷技术架构未来thegiac.com个人介绍§计算机专业PH.D.§近5年从事数据挖掘、⼤规模社交⺴络分析、社会计算、知识图谱等机器学习算法实践⼯作§现任宜⼈贷数据科学家,从事反欺诈建模和创新技术⾃动化⻛控系统thegiac.com背景§互联⺴⾦融⾏业在解决什么问题?⾯临怎样的⻛险?⽤什么样的技术⼿段来应对?‒传统⾦融V.S.互联⺴⾦融‒信⽤⻛险V.S.欺诈⻛险‒传统⻛控V.S.数据科学技术⻛控thegiac.com互联网金融风控中的数据科学1互联⺴⾦融服务⾯临的⻛险2知识图谱在⾦融⻛控中的应⽤场景3⼤规模⾦融服务中的实时架构thegiac.c
2、om互联网金融风控中的数据科学1互联⺴⾦融服务⾯临的⻛险2知识图谱在⾦融⻛控中的应⽤场景3⼤规模⾦融服务中的实时架构thegiac.com互联网金融-个人对个人的信用贷款 thegiac.com宜人贷:极速信任-自动化信用评估#()"%21 )65,).-+4/*)3 !$'&0thegiac.com互联网金融行业中的风险⼈群团体化地区集中化⻛险遇到的问题业界通常解决⽅法业界的⽅法为什么⽆效收集收入水平、消费无权威数据、数据收集信⽤
3、⻛险还款能力水平、负债情况等对难度大、传统评分卡有用户进行风险评分效特征挖掘难度大⽅式多样化⼯具智能化人工效率低、无权威黑伪冒申请和人工审查、信用黑名欺诈⻛险名单、无法自动发现异欺诈交易单、基于规则常、欺诈手段更新快thegiac.com互联网金融风控中的数据科学1互联⺴⾦融服务⾯临的⻛险2知识图谱在⾦融⻛控中的应⽤场景3⼤规模⾦融服务中的实时架构thegiac.com互联网金融中的风控是一种机器学习过程§Y⺫标:Benchmark选取信⽤‒好、坏⽤户定义‒训练、测试和跨时间验证样本消费§X变量:特征⼯程通讯‒⼈⼯特征⼯程社交‒图谱特征挖掘技术ü知识图谱技术⾏为ü图挖掘技术⻛险控制数据⾦
4、字塔thegiac.com知识图谱在金融风控中的优势thegiac.com构建金融知识图谱:FinGraphFinGraph平台系统知识图谱体系§10种实体应用场景层面‒电话、⾝份证、银⾏卡、智能搜索、反欺诈、贷后管理、营销分析、运营支撑等信⽤卡、IP、设备号、地理位置等系统支持层面§约1.3亿节点特征工程、模型开发、异常监控、推荐系统等Spark+GraphX+Mllib+Streaming+TensorFlow§约10亿边关系数据整合层面§预计到2017年增⻓20倍信用数据、金融消费数据、行为数据、社交数据、网络安全、第三方数据等图数据库neo4jthegiac.com风险分析实践:
5、人以群分(1)§借款⽤户通信社交⺴络与欺诈⻛险‒结论:与坏⽤户有⼤量关联的借款⽤户的坏账率是未关联⽤户的2.9倍2.9倍thegiac.com风险分析实践:人以群分(2)§从整体借款群体的⾓度,⽤PageRank算法探索哪些⽤户与⼤量借款⽤户有关联关系thegiac.com风险分析实践:人以群分(2)§借款⽤户通信社交⺴络与欺诈⻛险‒结论:PageRank⾼分段⽤户的坏账率是低分段⽤户的3.3倍3.3倍thegiac.com风险分析实践:识别组团欺诈风险§通过社区发现算法来实时评估每个⽤户的组团欺诈⻛险thegiac.com欺诈案例调查的挑战:失联用户找寻§通过社区发现算法挖掘失联⽤户的
6、通信社交⺴络thegiac.com欺诈案例调查的挑战:失联用户找寻§在社区内使⽤最短路径算法来发现失联⽤户与⼀个正常还款⽤户的关系链thegiac.com风控建模中的数据科学thegiac.com互联网金融风控中的数据科学1互联⺴⾦融服务⾯临的⻛险2知识图谱在⾦融⻛控中的应⽤场景3⼤规模⾦融服务中的实时架构thegiac.comFinGraph是实时风险监控的重要支撑§基于实时数据采集平台和图数据库,可实时捕捉⻛险特征,控制⻛险‒数据在采集、传输、存储时达到99.999%的可靠数据应用层风控规则反欺诈服务平台实时欺诈监控预警系统数据平台层数据服务平台图数据库SYNC图数据库数据存储层读集
7、群写集群HBase集群Codis集群实时数据流实时数据采集平台层日志->Flume集群->Kafka集群thegiac.comFinGraph是线上风控系统中的关键一环thegiac.com总结:数据科学在互联网金融风控中发扬互联网金融实时⻛险控制图挖掘技术数据科学风控工作在线上P2P借款与理财可以把风控工已逐渐渗透到是一种机器咨询服务⾏业中,是全作,从局部考量离线建模流程学习过程⾃动信⽤评估的关键提升到全局考量中的多个环节FinG
此文档下载收益归作者所有