基于时间序列孤立点检测的可疑外汇资金交易识别研究.pdf

基于时间序列孤立点检测的可疑外汇资金交易识别研究.pdf

ID:52386483

大小:247.09 KB

页数:4页

时间:2020-03-27

基于时间序列孤立点检测的可疑外汇资金交易识别研究.pdf_第1页
基于时间序列孤立点检测的可疑外汇资金交易识别研究.pdf_第2页
基于时间序列孤立点检测的可疑外汇资金交易识别研究.pdf_第3页
基于时间序列孤立点检测的可疑外汇资金交易识别研究.pdf_第4页
资源描述:

《基于时间序列孤立点检测的可疑外汇资金交易识别研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、理论新探基于时间序列孤立点检测的可疑外汇资金交易识别研究孙景,张成虎,陈善新(西安交通大学经济与金融学院,西安710061)摘要:尽管洗钱模式复杂多变,但洗钱行为在整个金融活动中只占有极少的比例,这给监测洗钱交易增加了难度。作为数据挖掘重要方法之一的孤立点分析是在大数据集中发现有趣小模式的有效方法。文章提出了一种适用于可疑外汇资金交易识别的孤立点检测方法,可以持续地从大量的日常交易中发现极少数的与正常交易显著不同的异常交易。从孤立点分析角度,提出了基于非频繁模式挖掘思想和概念漂移处理的混合属性空间上时间序列孤立点检测方法;从可疑金融交易识别的角度,提出

2、了对每天持续动态产生的海量金融交易数据进行分析的一种新思路。关键词:反洗钱;可疑金融交易识别;数据挖掘;孤立点检测中图分类号:F224.9文献标识码:A文章编号:1002-6487(2010)18-0026-04报,已成为反洗钱研究领域的重要课题,其中数据挖掘技术0引言在可疑交易识别中的应用是其中的一个研究热点。尽管洗钱模式复杂多变,但洗钱行为在整个金融活动中只占有极少的关于“孤立点”,至今还没有一个正式的、被人们普遍接比例,这给监测洗钱交易增加了难度。作为数据挖掘重要方受的定义。中文存在孤立点、离群点、奇异点、异常点、偏离点法之一的孤立点分析是在大数

3、据集中发现有趣小模式的有等多种称谓。英文文献中存在Outlier、Anomaly、Unusualness、效方法。尽管犯罪分子力图使洗钱交易表现出与正常交易相Novelty、Deviant、Noise、Exception等叫法。在本文中,统一称似的模式,但无论怎样掩饰,这些洗钱交易一定存在一些与其为孤立点,英文Outlier。Hawkins[1]给出了孤立点的本质定其他大量正常交易所不同的可疑特征。因此可以利用孤立点义:孤立点是这些观测,它们在数据集中是如此的与众不同,分析,发现那些极少数的与其它正常交易显著不同的反常交使人们怀疑这些数据并非来自随机偏

4、差,而是产生于完全不易。孤立点检测方法往往需要结合特定的检测背景而提出,同的机制。Grubbs[2]认为孤立点是显著偏离样本中其他数据而适用于我国可疑金融交易识别的孤立点检测的有效方法的观测。尽管对孤立点的定义不尽相同,但都反映了孤立点并不多见。的特点:(1)孤立点看起来是异常的,这是其关键特征之一;本文拟提出一种适用于可疑外汇资金交易识别的孤立(2)孤立点是一个相对的定义,如果定义孤立点的假设不同,点检测方法,基本思想是:(1)根据金融机构上报的大额和可对于相同数据集所产生的结论则不同;(3)孤立点有较强的疑外汇资金交易数据特征,利用非频繁模式挖掘方

5、法建立混主观性,几乎所有研究者在进行孤立点检测时都定义特有的合属性类型空间上的孤立点检测模型。(2)将每个新产生的检测背景。孤立点检测是孤立点分析的关键环节。孤立点检大额和可疑外汇资金交易上报数据记录作为孤立点检测的测可以形式化的描述为:给定一个有n个对象或观测点的数当前观测点,首先根据此观测更新孤立点检测模型,然后计据集合及预期的孤立点数目k,发现与大多数对象相比显著算出新观测的前向孤立度分值,并根据分值判别新观测是否异常的、孤立的或不一致的前k个对象的过程[3]。孤立点检测为前向孤立点。(3)对于确定为前向孤立点的观测,在延迟指问题可以分解为两个子

6、问题:首先是在给定的数据集中定义定的时间之后,计算此观测的后向孤立度分值,并结合其前什么样的数据是孤立点,其次是找到一个有效的方法来检测向孤立度分值判断此观测是否为孤立点,即可疑外汇资金交易。这样的孤立点。可疑金融交易识别是反洗钱领域的核心问题。面对海量1外汇资金交易孤立点的定义且持续快速增长的金融交易数据,单纯依靠手工识别可疑交易已显得力不从心。如何从每天持续产生的海量金融交易数本文所采用的金融交易源数据是某省金融管理部门根据中发现可疑的洗钱线索,为洗钱监测机构提供有价值的情据《金融机构大额和可疑外汇资金交易报告管理办法实施细作者简介:孙景(1963

7、-),女,陕西西安人,硕士,副教授,研究方向:金融数据分析。26统计与决策2010年第18期(总第318期)理论新探表1外汇资金交易则》中《金融机构大额和可疑外汇资金交即项集d的支持度sup(d)为M中满足d哿Xi的观测数目数据集的各属性易60项》的要求,由金融机构上报的与M中总观测数的比值。令列名类型2005年12月31日至2008年6月27peer(d)=Πk(attribute)编号Numericattribute∈d交易发生日Date日的企业大额和可疑外汇资金交易数式中:k(attribute)为M中离散型属性变量attribut可能值识别报告

8、标准Nominal据。在对源数据进行分析整理后,可用于交易编码Nominal的个数,peer(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。