detecting a fraudulent financial statement and reducing internal fraudusing data mining techniques by amos iseorukarima iruenabere

detecting a fraudulent financial statement and reducing internal fraudusing data mining techniques by amos iseorukarima iruenabere

ID:33962532

大小:1.79 MB

页数:45页

时间:2019-03-02

detecting a fraudulent financial statement and reducing internal fraudusing data mining techniques by amos iseorukarima iruenabere_第1页
detecting a fraudulent financial statement and reducing internal fraudusing data mining techniques by amos iseorukarima iruenabere_第2页
detecting a fraudulent financial statement and reducing internal fraudusing data mining techniques by amos iseorukarima iruenabere_第3页
detecting a fraudulent financial statement and reducing internal fraudusing data mining techniques by amos iseorukarima iruenabere_第4页
detecting a fraudulent financial statement and reducing internal fraudusing data mining techniques by amos iseorukarima iruenabere_第5页
资源描述:

《detecting a fraudulent financial statement and reducing internal fraudusing data mining techniques by amos iseorukarima iruenabere》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要欺诈检测在许多行业是比较实用的研究对象,例如银行、金融领域、保险、政府机关和执法部门等等。最近)UF-欺诈事件急剧增加,使欺诈检测比以往更加重要。尽管在受影响的一些机构做了很多这方面努力,但每年洲欺诈损失数以亿计。尤其足虚假财务报表,不仅对个人投资者,也对伞球经济的整体稳定性带来不利影响。虽然在定义方面稍有差异,tu.欺诈财务报表是由注册欺诈协会定义,注册欺诈“蓄意,刻意,虚假陈述或遗漏事实,以及会计数据引起的误导,当所有这些信息符合,会造成读者改变或更改他(她)的判断或决定。”在实际情况中,欺诈财务报表包含:..

2、.(1)财务记录篡改(2)故意遗漏大事、交易、账目和财政报表中需要准备的其他重要信息,或滥用会计原则、政策,以及滥用用于测量、确认、报告的程序,以及泄露商业交易。这篇论文中使用数据挖掘技术帮助确认欺诈性财政报表,以及使用决策树、神经网络和贝叶斯信念网络减少内部欺诈。这些技术是有利的,尤其是当有新的欺诈财政报表方法适应这些检测技术。“用不同的模型使用相

3、_J数据样本对这三种技术进行了比较,结果显示BBN技术优于其他两种模式,而能达到更好的分类精度。”本文也探讨了一种涉及多领域知识的自适应框架(基于响应曲面模型),来检测欺

4、诈财务报表以及如何减少内部欺诈。最后,即本文建议,在如今财政欺诈发展的时代,在一些专业领域知识,计算机辅助自动欺诈检测机制将会非常有效和高效。三种模型分别基于不同的方法建立。首先,决策树模型是利用Sipina调查版软件建立的。该模型建立置信度水平为0.05。本文使用整个样本作为训练设置。该模型是以训练样本为测试并设法恰当地分成73例(一般性能达到96%)。更确切地说,决策树分类为所有非欺诈例和35/38欺诈例(92%)。算法使用变量Z分数作为第一个分析法。35/38欺诈企业提出一个相当低的z分数值(z分数<1.49)。

5、因为Altman认为Z分数值1.8l作为一个切断点来规定美国生产公司的财政危机(Altman,2001),可以推断出样本中财政危机的公司包含试图篡改财政报表。作为第二个水平分析法,使用了两个与盈利有关的变量(NPTA和EBIT)。高Z分数的非欺诈企业表明具有高盈利能力,而低z分数的欺诈企业表明具有低盈利能力。在第二个实验中,我们构建了神经网络模型,使用分类软件中商标注册为7的非线性网络来构建一个多层感知前馈网络。在测试一些替代性设计和执行初步训练后,选择了一个包含5个隐藏节点的隐藏层的拓扑。当使用全部的样本对所选择的网

6、络进行测试,这个网络‘n’“匕100%地成功分类这些实例。但是,软件没有对突触权重的连接提供透明的接口,因此我们不能对每一个输入变量的重要性进行评估。在第三个试验中,我们开发贝叶斯信任度网络。我们使用BNPowerPredictor软件。这个软件能从数据中获得分类器。这个能执行的算法是基于条件无关的测试的,并且不需要结点的排序(Cheng&Greiner,2001)。由于软件的限制,我们使用数值离散化办法。在测试不同的离散方法(相等的深度,相等的宽度)后,我们选择被监管的离散方法。与其他的离散方法不同,基于熵的被监管离

7、散方法利用了类的信息。这样就使得被定义的间隔信息可以帮助提高分类的准确率(Han&Camber,2000)。对贝叶斯信任度网络里进行测试,我们把全部的样本作为i)lI练集,这个网络能分来72个实例(达到了95%的正确率)。特别的是,该网络能正确分出37个伪实例(97%)与35个非伪实例(92%)。这个贝叶斯信仟度网络能用于更加广泛的方面,例如针对财务报表的篡改。在网络中,网络骗了强烈依赖输入的变量Z—SCORE,DEBTEQ,NPTA,SALTAandWCTA。上述的每一个变量表现公司经济数据的一个方面。Z—SCORE

8、指的是财政窘迫,DEBTEQ指的是影响,NPTA指利润,SALTA指销售情况,WCTA指解决办法。因此这个信任度网络能记录金融数据与篡改数据之间的依赖关系,能记录一个公司的巨大金融状况的数据。这个结果指出了NN模型能有效识另IJFFS公司与non.FFS公司,仅次于BBN与ID3模型。使用训练集来评估模型的性能会有倾向性的问题。在很多情况下,这个模型倾向于去记忆样本而不是学习。为了消除这样的一个倾向问题,评估上述模型的性能要相对于之前未被发现的样式。现在有一些方法用于模型的认证,相当于把样本切分成训练的与单独拿出的,每

9、10个折叠的进行认证就有一个要拿出的。虽然我们使用的3个软件包有认证能力,但是不可能做到跟踪一个常见的认证程序而不是3个软件包的方法学与数据。因此,我们只好周期性地拆分样本,创建训练集与验证集。我们选择跟踪10次折叠的交错验证方法。在lO次折替的交叉核实中,样本分割成lO次折叠。在一个分层的方法里,每个折叠包含了相同数量的伪实例与

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。