资源描述:
《数据挖掘技术在海关查验和价格瞒骗辅助决策中的应用-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、数据挖掘技术在海关查验和价格瞒骗车甫助决策中的应用任尔伟牟青杰孙学文,摘要本文分析了海关加入wT()后面临的打击走私和加强税收的严峻形势提出运用数据挖掘技术寻找查验和价格分析规,,。律的系统解决方案帮助海关业务人员加强查验和审价工作的针对性和有效性以提高查获率和打击价格瞒骗行为;;;关键词数据挖掘技术系统解决方案海关查验价格瞒骗,,,。作者简介任尔伟男青岛海关技术处处长高级工程师.,,。牟青杰男青岛海关技术处电脑四科副科长高级工程师,.,。孙学文男威海海关技术科工程师、,一前言的动作为每个用户都建立一个用户特征表通,加,入世贸组织以后海关面临两个最主要过比较当前特征与已存储定
2、型的以前特征从。。的压力是贸易便利最大化和海关税收任务而判断是否是异常行为贸易便利最大化的要求给海关通关效率和误用检测系统对已知的入侵情节进行编码,服务水平提出。:了新的更高的要求有效监管和和匹配这种系统的主要缺点是已知的入侵。高效运作之间的矛盾会更加突出海关在确保;模式必须被手工编码它不能用于检测任何未管理目标得到落实的同时,应当努力提高海关知的入侵模式。,,通关手续的便利化加速货物验放加快通关速本系统研究的目标是尽可能地减少在建立。“”度海关查验工作。主要解决申报单货不符问一个欺诈识别系统中的手工和经验成分这里题,是保证海关监管到位的一项重要手段,但目采用以数据为中心的观
3、点且把欺诈识别间题看前查获率过低又严重影响了正常货物的通关速作是一个数据分析过程,其中心思想是运用数。,,度哪些货物应该查验哪些货物不该查验既据挖掘技术来解决欺诈识别问题。要严密又要高效,这是一个值得研究的课题。同统计概率方法相比,数据挖掘方法具有新《估价协:定》对海关估价工作的要求更高如下优点基于数据挖掘的方法尽量减少了手,。了打击价格瞒骗的走私行为难度加大了特工和经验的成分;数据挖掘体现了一个完整的、别是在税率大幅度下调税收保护,、职能相对消数据分析过程它一般包括数据准备数据预处,、、税收征理;弱而海关税收任务仍然较重的情况下建立挖掘模型模型评估和解释等另外它。管,工作面
4、临着极大的挑战如何采用新方法创也是一个动态的过程通过不断地调整方法和,,新审价模式做。到应收尽收打击价格瞒骗行为参数以得到较好的模型呢?、二查验和价格风险分析辅助决策解决方案如何识别单货不符风险和价格瞒骗行为,(一)系统原理一般的计算机欺诈识别软件使用了误用检测和数据挖掘提供的算法可以自动寻找所关心。基。,于统计分析的异常检测技术本系统采用的的规律人无法直接从海量数据中得到规律方案可以将最新数据挖掘技术运行到异常检测而数据挖掘通过计算机的计算能力解决这个问,。。之中从而增强欺诈识别软件的功能题数据挖掘得到的规律是一个动态更新的过概率统计方法是异常检测中。,应用最早也是程这是对
5、统计数据的动态管理从而可以适。,最多的。一种方法首先检测器根据用户对象应查验规律变化上海海关高等专科学校学报_2002年第3期(总第73期)时总结价格变动主要因素,为进一步的政策指根据历史查验结果和影响查验结果的历史统计数据,利用数据挖掘技术统计出“单货不导提供依据。”,。符的规律并利用这些规律识别查验风险海(三)数据挖掘算法选择决策树关人员可以此作为查验、布控的一个依据,从而数据挖掘现在已给出了一些适用的算法,、、提高查获率;根据报关单历史价格统计指标对主要包括决策树神经元网络k个最近邻居(K,、,、一NNa?ve一Bayes新报关单数据进行估价利用方差寻找最匹配)和N等分
6、类器聚类关、、。,联规则序贯模的价格统计信息并计算当前报关单申报价格型时间序列分析和粗糙集等的概率,海关人员可以根据概率指标对报关单其中决策树、神经元网络和序贯模型对欺诈识。审价。别尤其有用,(二)系统目标由于欺诈识别要从海量数据里发现规则,:而以供进一步地分查验风险辅助决策系统主要解决报关申且要求能解释发现的规则报单货不一致的问题。为了进一步的提高海关析,所以需要的是一种高精度的海量数据挖掘,,,,。通关效率减少通关成本加强查验的针对性方法而且最好同时提供较好的解释性神经发现潜在的单货不符的问题,需要对由现有的元网络虽然可以提供较高的精度,但同时需要,,H83/EDI通关系
7、统获取的数据加以分析预测多次反复训练才能得到较好的结果不适应海。由于存在欺诈行为而开箱检验的可能性和必要量数据挖掘的要求回归的海量数据挖掘的精,。,。:度不高也不符合要求性其目标要求预测准确性具体指标为对正,,确报关估计准确性超过90%对报关欺诈行为其次在海量数据里筛选算法的过程是一。,的捕获率达到10%海关业务人员可以根据查个反复的不断尝试的过程最后才能确定实用。,验模型的结果对报关单进行布控,对查验工作的模型为保证算法的可靠性和稳定性在当。前商业性数据挖掘软件行为提出建议和相关学术资料介绍的。:方法