欢迎来到天天文库
浏览记录
ID:23534975
大小:3.37 MB
页数:52页
时间:2018-11-08
《基于共同交易行为的在线交易欺诈检测模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、重庆大学硕士学位论文1绪论下研究问题:拥有在线交易平台的用户信息和他们之间的交易记录,我们如何检测出具有潜在欺诈行为的用户,如何去发现那些欺诈团伙?以及我们该如何设计一个系统,更快、更准的用于在线交易平台中的欺诈团伙检测。1.2国内外研究现状国内目前公开发表对欺诈检测模型的研究很少,大部分关注于如何去防范,[3]以及对在线交易评价机制的改进。国外目前针对在线交易欺诈检测提出的方法,可以将它们分成三类:统计方[4]法、数据挖掘方法和社交网络分析方法。1.2.1基于统计的方法关于统计的方法,Rubin等人在2005年对在线交易网站提出了一种全新的信誉系统,通过警告用户当前交易存在着
2、的欺诈风险来保护他们的利益。这个模型使用了三个指标,平均交易数、平均最低开始交易和交易用户的个人资料,来鉴别一个用户是否具有典型的欺诈行为。2009年F.Dong提出使用D-S证据理论法[5]来发现潜在的欺诈者。1.2.2基于数据挖掘的方法关于数据挖掘的方法,在2009年J.S.Chang提出了基于时间分段模型的在线[6]交易早期欺诈检测机制。由于之前其它研究学者提出的欺诈检测方法考虑了众多用户特征属性,但是却没有考虑欺诈者行为对时间的依赖性。在文中将欺诈者的生命周期划分为潜伏期和作案期,将用户的交易记录根据累积的评分进行分段,[7]分成80%、85%、90%、95%和100%
3、五段,然后利用Weka3.6中的分类回归树[8](ClassificationViaRegression)对各个时间段分别进行训练,最终使用AdaBoost集成算法将弱分类器构建成强分类器。美国卡内基梅隆大学(CarnegieMellonUniversity,CMU)的D.H.Chau等人对在线交易欺诈检测进行了比较完备的研究与系统设计。早在2005年D.H.Chau就提出从在线交易用户的个人资料和交易记录中抽取出一些重要的特征属性,包括最近15天、30天买卖物品的均价和方差,总共包含17个特征属性。然后,利用这些特征属性和获取的真实欺诈用户名单对C5.0决策树进行训练,最终使
4、用训[9]练模型来发现潜在的欺诈用户。当构造交易图和对用户进行标识(诚实者、欺诈者)的过程之中,他们还对用户间交易行为构成的图进行了研究,发现有些欺诈者会经常与一些特定用户进行交易,并通过这些交易来提高自身的信誉度,他们将那些特定用户标识为同盟者,但是并没有提出方法用于识别同盟者。在2006年D.H.Chau他们又提出了2LFS(2-LevelFraudSpotting)方法用于[10]发现欺诈者,并且还分析了欺诈者使用的典型欺诈行为。2LFS方法由两层构成:2重庆大学硕士学位论文1绪论[7]第一层为用户级别特征,利用中提出的17个特征属性和决策树分类算法得到用户的类别标识(诚
5、实者、欺诈者);第二层为图级别特征,将第一层获得的用户类别标识作为交易图中用户的初始类别标识,并利用马尔可夫随机场(Markov[11][12]RandomField,MRF)模型和置信传播(BeliefPropagation,BP)算法进行迭代计算。在对图级别特征的计算过程之中,引入了同盟者用户类别标识,并且还针对同盟者和欺诈者的联合欺诈行为提出了近似BipartiteCores现象。并且他们还分析了融合用户级别特征和图级别特征进行分类预测会产生以下两点好处:1)适当的先验知识将会有利于BP(BeliefPropagation)算法在更短的时间内收敛,并获得更精确的结果;2)
6、对用户级别的有误推断能够通过图级别的传播特征进行纠正。[13]在2007年D.H.Chau等人再次提出在线交易欺诈检测模型并开发了NetProbe系统,而且他们还针对用户和交易数据的不断更新设计了IncrementalNetProbe系统,它是NetProbe系统的近似变体,但却能够适用于真实交易数据的动态可变性。在保持NetProbe系统检测性能的前提下,大大减少了计算时间,使得能够用于真实的在线交易平台。[14]在2011年L.Zhang提出利用机器学习技术设计提前主动审核系统,这个审核系统用于提前发现在线交易中的潜在可疑事件,并反馈给人类专家做进一步检验。该系统使用了少量
7、有标记的用户和大量无标记的用户作为样本,并利用有界逻辑线性回归进行训练。1.2.3基于社交网络分析的方法关于社交网络分析(SocialNetworkAnalysis,SNA)的方法,在2007年台湾[15]元智大学的Y.H.Ku等人提出利用SNA和决策树分类算法来发现潜在的欺诈者。他们选取了SNA中的K-core值作为特征属性,并且还选取了一些其它的特征属性(如信誉度、正负信誉频率、商品详细信息等),然后对决策树进行训练,最终将训练模型用于预测。在2008年Wang使用SNA中的K-core
此文档下载收益归作者所有