基于数据挖掘的大数据审计技术应用探究.doc

基于数据挖掘的大数据审计技术应用探究.doc

ID:29442976

大小:77.50 KB

页数:9页

时间:2018-12-19

基于数据挖掘的大数据审计技术应用探究.doc_第1页
基于数据挖掘的大数据审计技术应用探究.doc_第2页
基于数据挖掘的大数据审计技术应用探究.doc_第3页
基于数据挖掘的大数据审计技术应用探究.doc_第4页
基于数据挖掘的大数据审计技术应用探究.doc_第5页
资源描述:

《基于数据挖掘的大数据审计技术应用探究.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于数据挖掘的大数据审计技术应用探究姓名:徐志刚单位(职务):江苏省连云港市连云区审计局办公室主任电话:15861225003邮编:2221009基于数据挖掘的大数据审计技术应用探究摘要:大数据时代给审计带来了挑战和机遇。本文介绍了国内外审计大数据环境下应用数据挖掘技术的现状,探讨了审计领域应用数据挖掘技术的步骤,并以财政决算收入审计应用决策树分类预测算法为案例具体阐释,最后对大数据审计应用数据挖掘技术提出了具体建议。关键词:大数据;审计;数据挖掘一、引言作为第三次社会浪潮的大数据时代悄然到来,拉开了一场新的信息技术革命的大幕。据互联网数据中心(IDC)预测,

2、至2020年全球以电子形式存储的数据量将达32ZB(1021字节)。与此同时,如何收集、管理和分析数据也正在从信息技术领域扩散到社会各个层面。在这样的大数据环境下,探索在审计实践中运用大数据技术的途径,加大数据综合利用力度,提高运用信息化技术查核问题、评价判断、宏观分析的能力,成为审计服务国家治理的内在要求和必然选择。大数据审计采用的分析方法和传统审计技术存在很大差别,其中数据挖掘方法占据重要地位。数据挖掘技术通过建模、识别、预测和评估,能够发现海量数据中的异常和规律,提取潜在未知的有用信息,服务审计人员决策分析。利用数据挖掘技术对大数据进行发掘式审计,是现代

3、审计方法的有益探索和重大机遇,具有开拓性意义。二、国内外技术应用简介世界发达国家走在大数据审计领域应用数据挖掘技术的前沿。以美国为例。针对20世纪70年代和80年代的重大地方政府违约事件,美国向各州提出了加强对地方政府财政风险监控的建议。数据挖掘技术使人们通过高级手段分析可获得的海量信息,找出地方政府违约的迹象。随后,俄亥俄州建立了由该州审计局负责的“地方财政监控计划体系”,规定了六种测试,即是否有债务违约、是否有工作拖欠、是否要求额外转移支付、是否有其他支付欠款、是否赤字规模过大、是否现金短缺严重,作为地方政府财政危机的条件。在税收征管方面,1996年美国国

4、家税务局利用海量数据库平台和数据挖掘技术追回补交税款两亿笔,增收200亿美元的税金和罚款,并进行了120万笔账目审计。9在国内,各政府机关正在大力推进部门数据中心建设并开展了数据挖掘应用:国有大型商业银行实现了业务及财务信息总行数据集中,国家海关实现了全国进出口通关数据大集中,国税部门实现了税务数据省级集中存储,社保领域实现了基本社会保险基金数据省级集中存储和使用,下一步还将探索实现全国社保数据大集中。近年来,审计署注重整合审计力量,探索“集中分析、发现疑点、分散核查、系统研究”的大数据审计模式,提高了审计的质量和效率。为加强审计信息资源收集、存储、运用等工作

5、的规范化,审计署陆续出台了中央部门预算执行、地方财政、社保、中央企业、国税、外资、住房公积金、医保及定点医疗机构等行业或领域的审计数据规划和国家审计数据中心系统规划,全国各级审计机关审计管理和审计业务数字化工作正在稳步推进。三、基础理论(一)大数据的特征。互联网数据中心(IDC)为大数据下了定义,得到了业内的普遍认可,即“大数据”是指为了更经济更有效地从高频率、大容量、不同结构和类型的数据中获取价值而设计的新一代架构和技术,用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。大数据的4V特点:第一,数据体量巨大(Volume);第二,处

6、理速度快(Velocity);第三,数据类型繁多(Variety);第四,价值密度低,商业价值高(Veracity)。(二)数据挖掘是打开大数据时代之门的钥匙。大数据分析的理论核心是数据挖掘算法。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的但又潜在有用的信息和知识的过程。数据挖掘是自动的或方便的模式提取,这些模式代表隐藏在大型数据库、数据仓库或其他大量信息存储中的知识。数据挖掘的任务一般分为两类:描述和预测。描述性数据挖掘任务,刻画数据存储中数据的一般特性;预测性数据挖掘任务,则在当前数据上进行推断预

7、测。大数据分析最重要的应用领域之一就是预测性分析,从大数据中挖掘出特点,通过科学的建立模型,之后便可以通过模型发现新的知识和规律,从而预测未来的数据。数据挖掘的方法主要有:分类挖掘、关联挖掘、聚类挖掘、异类挖掘、文本挖掘(非结构化数据)、视频挖掘(非结构化数据)等。主要的数据挖掘工具有:R语言、SPSS、SAS等。四、审计在大数据环境下应用数据挖掘技术的具体步骤面对大数据所带来的新思维、新技术和方法的变革,审计人员需要应时而变来适应思维模式和数据处理模式的变化,要能够挖掘数据、分析数据、驾驭数据,9要及时、准确地从大量繁杂的数据中,辨认出对审计的意义和价值,做

8、出最佳审计决策。开展审计领域数据挖掘既

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。