基于组合分类器的信用卡欺诈识别研究_论文

基于组合分类器的信用卡欺诈识别研究_论文

ID:8566615

大小:23.48 KB

页数:9页

时间:2018-04-01

基于组合分类器的信用卡欺诈识别研究_论文_第1页
基于组合分类器的信用卡欺诈识别研究_论文_第2页
基于组合分类器的信用卡欺诈识别研究_论文_第3页
基于组合分类器的信用卡欺诈识别研究_论文_第4页
基于组合分类器的信用卡欺诈识别研究_论文_第5页
资源描述:

《基于组合分类器的信用卡欺诈识别研究_论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于组合分类器的信用卡欺诈识别研究摘要随着我国信用卡发卡量和交易量的不断增长,信用卡交易中的欺诈交易也呈现出上升趋势。如何较早的识别欺诈交易,将成为金融业普遍关注的一个重要问题。本文提出了一种基于AdaBoost组合分类器的信用卡欺诈识别模型,并通过实证研究证明模型能较为准确的识别欺诈交易。关键词欺诈识别;数据挖掘;机器学习;分类1引言随着世界经济的不断增长和信息技术的迅猛发展,全球的信用卡使用量持续上升,信用卡已成为支付领域的主要媒介。截至2017年底,美国的信用卡发行规模达到亿张,平均每个家庭拥有张信用卡。在零售业的所有客户支付工具中,借记卡和贷记卡的交易额已经超过了总交易额的50%

2、,大有取代现金和个人支票交易的趋势。而我国从2017年开始,各大银行都把信用卡的发行作为业务重点,宣传战、产品战、地域战随处可见,信用卡规模急速扩大。发达国家的经验显示,随着发卡量的增大,信用卡的欺诈风险将直线上升,由于信用卡欺诈而给银行造成的损失也将居高不下。据Visa和MasterCard两大信用卡联盟的统计,全球信用卡欺诈涉及金额已超过100亿美元[1]。如何加强对信用卡欺诈的识别和防范,将成为银行风险控制的一个焦点。9/9对于处于“跑马圈地”阶段的我国银行业,能否未雨绸缪,及时的建立一套信用卡欺诈识别和防范体系,既是我国信用卡业务健康发展的重要保障,又是一项兼有前瞻性和现实性的有

3、益探索。2信用卡欺诈风险与欺诈识别模型研究信用卡的欺诈风险是指持卡人由于遭人冒申请、盗领、伪造、失窃等原因而发生损失的风险。由于欺诈风险所造成的损失绝大部分都由发卡行承担,因此对信用卡欺诈的识别和防范是银行风险控制的一项重要内容。从欺诈者在信用卡交易中的不同角色进行分类,信用卡欺诈可以分为商家欺诈、持卡人欺诈和第三方欺诈[2]。商家欺诈来源于合法商家的不法雇员或者与欺诈者勾结的不法商家。在现实中,商家雇员有条件接触到顾客的卡信息,甚至持卡离开顾客的视线,这都给不法雇员带来了复制或保留卡信息的机会。持卡人欺诈是由不道德的真实持卡人进行的,通常是持卡人充分利用信用卡的责任条款,在收到货物后称

4、没有进行交易或者没有收到货物。第三方欺诈是目前信用卡欺诈的主要形式,是指不法分子非法获取他人信息,并利用这些信息伪造或骗领信用卡进行交易。由于非法获取信息的渠道较多,欺诈方式也不尽相同。9/9按照不同的欺诈手段,信用卡欺诈又可以分为身份盗窃欺诈、未达卡风险、遗失被窃风险、道德风险、欺诈犯罪风险五种[3]。由于信用卡欺诈带来了巨大的风险和损失,因此银行一直在寻求一个行之有效的欺诈识别模型。最初是利用业务人员的经验知识对欺诈交易进行手动识别,但是随着信用卡发卡量的大幅增长和交易量的不断提高,信用卡欺诈愈演愈烈,且由于欺诈手法的不断翻新,业务人员很难迅速有效的从海量交易记录中觉察出欺诈交易。这

5、时,需要有一个能对持卡者和信用卡交易进行快速判断的模型或系统来辅助业务人员的工作,而基于判别分析和回归分析的统计方法能通过给持卡者或信用卡交易进行信用评分的方式来识别欺诈交易,得到了广泛的应用。近年来,数据挖掘技术的兴起使人们开始关注基于数据挖掘技术的信用卡欺诈识别模型。利用数据挖掘中的分类方法,可以通过建立一个分类模型来准确的将欺诈交易和非欺诈交易区分开来,从而为欺诈防范和风险控制提供决策支持。人工神经网络[4][5][6]、决策树[7]等分类算法在欺诈识别上都进行了有益的尝试,取得了较好的预测效果。但是单一分类器的分类效能相对有限,不能得到一个很高的分类准确率,本文试图利用组合分类器

6、来建立一个更为准确的信用卡欺诈识别模型。3组合分类器与AdaBoost算法9/9实践中人们发现,分类算法实际上对样本集是敏感的,也就是说,在不同的训练样本和测试样本上,或者是在相同样本的不同特征空间上,同一分类器会有不同的表现。没有哪种分类算法是最优的,但是将多个分类器组合起来却能有效的提高分类的精度[8]。所谓组合分类器是指几个分类器通过某种策略组合在一起对某个事例进行分类。组合的策略可以是模型组合,可以是不同的算法组合,也可以通过对样本取样,变化事例空间,构造不同的分类器,然后按照一定的加权方法对分类器进行组合,得到最后的分类器。组合分类器的应用,克服了单一分类器的诸多缺点,如对样本

7、的敏感性,难以提高分类精度等等,在字符识别[9]、文本分类[10]、面部表情识别[11]等领域已经获得了较好的应用效果。9/9AdaBoost[12]是Boosting算法的一种,其主要思想是给每一个训练样本分配一个权重,表明它被某弱分类器选入训练集的概率,初始时权重设为1/m,m为样本个数。用一个弱分类算法在训练集上进行训练,训练后对样本权重进行调整,训练失败的样本权重增大,训练成功的样本权重减少,使分类算法能在下一轮训练中集中力

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。