基于组合分类器的信用卡欺诈识别研究论文

基于组合分类器的信用卡欺诈识别研究论文

ID:10328927

大小:48.50 KB

页数:2页

时间:2018-07-06

基于组合分类器的信用卡欺诈识别研究论文_第1页
基于组合分类器的信用卡欺诈识别研究论文_第2页
资源描述:

《基于组合分类器的信用卡欺诈识别研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于组合分类器的信用卡欺诈识别研究论文摘要随着我国信用卡发卡量和交易量的不断增长,信用卡交易中的欺诈交易也呈现出上升趋势。如何较早的识别欺诈交易,将成为金融业普遍关注的一个重要问题。本文提出了一种基于AdaBoost组合分类器的信用卡欺诈识别模型,并通过实证研究证明模型能较为准确的识别欺诈交易。关键词欺诈识别;数据挖掘;机器学习;分类1引言随着世界经济的不断增长和信息技术的迅猛发展,全球的信用卡使用量持续上升,信用卡已成为支付领域的主要媒介。截至2004年底,美国的信用卡发行规模达到6.57亿张,平均每个家庭拥有6.3张信用卡。在零售业的所

2、有客户支付工具中.freel,m为样本个数。用一个弱分类算法在训练集上进行训练,训练后对样本权重进行调整,训练失败的样本权重增大,训练成功的样本权重减少,使分类算法能在下一轮训练中集中力量对训练失败的样本进行学习。然后,在权重更新后的训练集上继续训练,不断调整样本权重,循环往复,从而得到一系列的弱分类器。这些弱分类器就构成组合分类器,组合分类器最终预测结果的产生采用了有权重的投票方式,而权重就是各个弱分类器的准确率。这种方法不要求单个分类器有高的识别率,但经过多分类器融合的组合分类器则具有了高的识别率。AdaBoost算法过程如下:在多数情

3、况下,只要每个分类器都是弱分类器,即分类准确率超过50%,比随机猜想好,那么组合分类器的训练误差就能随着T的增大而变得任意小,同时,在T很大的情况下也很少会发生过拟合(Overfitting)现象。4基于AdaBoost的信用卡欺诈识别模型4.1建模思路信用卡欺诈者的消费行为习惯通常与真实持卡人会具有较大的不同,而持卡人的账户数据和交易数据在很大程度上能反映和刻画消费习惯和模式,因此可以将账户资料和交易资料作为输入变量来建模。由于欺诈交易只是少数,因此样本集中存在着两类样本的不对称分布(Skepling)的方法,即从非欺诈交易样本中随机选取

4、与欺诈交易数量大致相当的部分样本,来与欺诈交易样本组成一个两类样本数量相当的样本集。同时,将这一样本集按照7:3的比例分成训练集和测试集,分别用作模型的训练和测试。实证研究以.Syeda,Y.Zhang,Y.Pan.ParallelGranularNeuralNets,.freelbleMethodsinMachineLearningA.In:Springer-Verlag.ultipleClassifierSystems.LectureNotesinputerScienceC.2000,1857(1):1-159LXu,C.Krzyzak

5、,C.Suen.MethodsofbiningMultipleClassifiersandTheirApplicationstoHands,ManandCyberics,1992,22(3):418-43510RobertE.Schapire,YoramSinger.BoosTexter,Aboosting-basedsystemfortextcategorizationJ.MachineLearning,2000,39(2/3):135-16811杨国亮,王志良,任金霞.采用AdaBoost算法进行面部表情识别J.计算机应用,2005,2

6、5,(4):946-94812Y.Freund,R.E.Schapire.Decision-TheoreticGeneralizationofOn-LineLearningandanApplicationtoBoostingJ.JournalofputerandSystemSciences,1997,55(1):119-139

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。