基于数据挖掘的商户套用欺诈检测研究与应用

基于数据挖掘的商户套用欺诈检测研究与应用

ID:35065690

大小:4.66 MB

页数:76页

时间:2019-03-17

基于数据挖掘的商户套用欺诈检测研究与应用_第1页
基于数据挖掘的商户套用欺诈检测研究与应用_第2页
基于数据挖掘的商户套用欺诈检测研究与应用_第3页
基于数据挖掘的商户套用欺诈检测研究与应用_第4页
基于数据挖掘的商户套用欺诈检测研究与应用_第5页
资源描述:

《基于数据挖掘的商户套用欺诈检测研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、——Ai种成*^巧与3ECHNOLOGYFCHA庭UNIVERSITYOFELECTRONICSCIENCEANDTOIN硕±学位论文IMASTERTHESIS从''.r作叙论文题目基于数据挖掘的商户套用欺诈检测妍究与应用学科专业计算机钦件与理论学号201321060255作者姓名林霞霞指导教师刘震副教授—■.■?分类号密级注1UDC学位论文基于数据挖掘

2、的商户套用欺诈检测研究与应用(题名和副题名)林霞霞(作者姓名)指导教师刘震副教授电子科技大学成都(姓名、职称、单位名称)申请学位级别硕士学科专业计算机软件与理论提交论文日期2016.3.29论文答辩日期2016.5.19学位授予单位和日期电子科技大学2016年6月答辩委员会主席评阅人注1:注明《国际十进分类法UDC》的类号。TheResearchandApplicationofDetectingTheIllegalUsingofMerchantCategoryCodeBasedonDataMiningAMasterThesisSubmittedtoUniversi

3、tyofElectronicScienceandTechnologyofChinaMajor:ComputerSoftwareandTheoryAuthor:XiaxiaLinSupervisor:ZhenLiuSchool:SchoolofComputerScienceandEngineering独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加标注和致谢的地方夕h论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同

4、工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。?〇^:期:文作者签名妹极舊曰(年6月巧曰论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部口或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可W将学位论文的全レ、部或部分内容编入有关数据库进行检索,可ッ采用影印缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)作者签名:妹黎它导师签名;曰期:年^月^曰摘要摘要随着电子商务不断发展,人们出门不

5、再携带大额现金,更多的是刷卡消费,这带动了越来越多商户办理了POS机。收费机构在不同行业的POS机上所提取的费率也不一样。第三方支付机构根据商户所经营的行业主要营业收入为商户拟制一个类别码--商户类别码(MerchantCategoryCode),中国银联就是根据商户类别码收取不同手续费。因此衍生出了套用商户类别码的违法行为。“商户类别码套用”是指第三方支付机构套用商户类别码享受低手续费率的行为。欺诈检测作为目前国内外研究热点,是金融领域的一个重要课题。为此本文主要做了以下工作:1)基于商户类别码的标准行为模式库建立本文将不同的行业有不同的营业时间区间、营业高峰或

6、者低谷等的现象称为该行业的“行为模式”。不同商户类别码的行为模式不同,本文采用机器学习的层次聚类算法,得到同一个商户类别码下具有代表性的N个行为模式。2)商户套用欺诈检测模型的建立。本文利用商户的交易行为与商户信息提取特征。在分类器选择上面,本文采用概率分类器—逻辑斯蒂回归解决该类问题。通过实验结果也表明了利用本文的检测方法,准确率,召回率均在80%以上,同时,即使训练样本数据量较少的情况下,该分类器准确率,召回率也没有很大的降低。3)欺诈检测模型的分布式实现。面对爆炸式增长的数据需求,分布式计算是未来大数据发展的重要方向。因此,基于这方面的要求,本文设计了商户类

7、别码欺诈模型的分布式版本,即利用Hadoop平台,通过HDFS分布式文件系统存储海量数据文件,并使用MapReduce计算模型并行计算提高检测效率,包括如何上传数据到HDFS,然后如何利用三个Job对原始数据进行预处理,以及最后如何设计分类器,本文都进行了详细介绍。综上所述,本文所提出的商户类别码欺诈检测模型,不但具有优秀的准确率,也具有良好的时间效率。本文的研究不但解决了实际问题,也为其他金融领域的大数据问题提供了很好的借鉴意义。关键词:数据挖掘,欺诈检测,商户类别码,逻辑回归,HadoopIABSTRACTABSTRACTWiththerapiddevelop

8、mento

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。