欢迎来到天天文库
浏览记录
ID:44421451
大小:32.05 KB
页数:7页
时间:2019-10-21
《数据挖掘技术在会计舞弊诊断中应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、数据挖掘技术在会计舞弊诊断中应用一、数据挖掘的含义与方法(一)数据挖掘的含义数据分析本身已经有多年的历史,长期以来,数据收集和分析的目的是用于科学研究,但随着全球信息化大潮和网络、存储等技术的迅猛发展,数据的传播和积累的速度不断提高,数据采集和存储技术的进步导致庞大的数据库日益增多,能否从这些已有的庞大的、杂乱无章的数据库中提取出有价值的信息,已成为数据拥有者和数据使用者非常感兴趣的问题,近年来对这一问题的相关研究已形成一门新兴学科,称之为"数据挖掘”。从广义的角度来看,数据挖掘(DM,DataMining)指从大量的、不完全的、有噪声的、模糊
2、的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。与此定义相近的、实际应用中的术语还包括数据分析、知识提取、模式分析、数据考古、数据采集等,国内有些学者也将DataMining翻译为数据采集或数据开采。数据挖掘技术从一开始就是面向应用的,它不仅是面向特定数据库的简单检索查询调用,而且需要对这些数据进行微观和宏观的统计、分析、综合和推理,以指导实际问题的求解,企图发现事件间的相互关联,甚至利用已有的数据对未来的活动进行预测。(二)数据挖掘的基本方法数据挖掘技术有各种不同的方法,一般来说可分为六类:数据
3、描述(Datadescription)、关联分析(DependencyAnalysis)、分类和预测(ClassificationandPrediction)、聚集分析(ClusterAnalysis)、离群分析(OutlierAnalysis)和演化分析(EvolutionAnalysis)等。以下重点介绍几种常用的数据挖掘方法:一是分类和预测。数据分类是指在数据库的各个对象中找出共同特征,并按一定的分类模型对其进行分类。通过建立“分类器”的决策制定系统,把基本单位分为几组,分类结果典型的表现为一个具有行为可预测性的值。常用的分类方法有决策树
4、分类法、统计方法,粗集方法等。分类和预测是数据挖掘中发展最充分的领域。二是聚类。聚类是指将资料数据中较接近的划归一类。通过聚类,可以把一组个体按照相似性归成若干类,使属于同一类别数据问的相似性尽可能大,而不同类别的数据间相似性尽可能小。三是离群数据挖掘。离群数据是明显偏离其他数据,不满足一般模式或行为的数据。离群数据挖掘包括离群数据发现和分析。其中,离群数据发现可以使人们获悉一些真实但又出乎意料的知识。而离群数据的分析则可能比一般数据包含更有价值的信息。四是关联和序列发现。关联发现是通过分析资料,找出某一事件或资料中会同时出现的东西。序列发现和
5、关联关系密切,不同的是序列发现中相关对象是以时间来区分的。二、数据挖掘技术诊断会计舞弊的优势会计舞弊是指上市公司管理层为了自身利益,恣意违背会计准则,践踏国家有关会计法律法规,采取伪造、掩饰等手法编造假账,从而向资本市场进行的有目的、有意图的虚假会计信息传递。会计舞弊给国家和社会带来的危害是多方面的,一方面,会计舞弊使企业内部经营管理混乱,导致经济效益下降,因为会计舞弊“使自身的会计核算体系遭到破坏,使经营管理者需要用来考核、分析、评价、预测的完整的、系统的、全面的会计信息失去真实性”。另一方面,会计舞弊使国家宏观调控失误,导致资源配置失效,市
6、场经济程序混乱,这是因为“国家的宏观调控,主要依据的是国民经济运行的状况及出现的新情况和新问题”。纵观中国的上市公司,从原野公司股票财务作假第一案曝光,到琼民源、银广厦、蓝田股份会计舞弊的狂风骤雨,这些财务丑闻沉重打击了投资者和社会公众对整个资本市场和会计界的信心,形成了空前的信任危机。美国学术界继安然事件之后,扎比霍拉哈•瑞扎伊出版了一部关于会计舞弊最全面、最深刻、最系统的力作,书中将会计舞弊的手段分为六类:不适当的收入确认;夸大除应收账款外的其他资产;少报费用或债务;资产滥用;不适当的披露;其他五花八门的技术。可见,会计舞弊的手段多种多样,
7、并且较为隐蔽,无法进行门类齐全的罗列;另一方面,面对瞬息万变的经济业务,会计舞弊所借助的客体也更加复杂多变,会计舞弊手段的隐蔽性、复杂性和抗审计性等特点,使得国家反会计舞弊的斗争更加艰难。KPMG(1998)调查发现超过三分之一的舞弊事件是在偶然的情况下被发现的。目前诊断会计舞弊的方法包括分析性复核、核对、查询、抽样、内控测试、实质性测试六种方法,其中用到的主要方法是统计学。统计学是一门关于数据资料的收集、整理、分析和推理的科学。数据挖掘和统计'分析之间有明显的联系,因为他们都是以发现数据间隐藏的关系为目标,但其之间也存在不同:一是应用的技术不
8、同。数据挖掘技术是通过计算机对大量的复杂数据集的自动探索性分析,数据挖掘技术不仅涉及统计学原理,而且包括数据库管理、人工智能、机器学习、模式识别以及数
此文档下载收益归作者所有