欢迎来到天天文库
浏览记录
ID:19184636
大小:20.14 KB
页数:10页
时间:2018-09-29
《审计数据转换系统的设计与研究_1》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、审计数据转换系统的设计与研究「内容摘要」本文从计算机审计中审计数据转换的必要性入手,给出了审计数据转换涉及的相关操作,结合这些操作设计出审计数据转换系统,并对审计数据转换日志进行了深入探讨。1、引言审计数据转换是计算机审计中非常重要的一环。以下两个方面决定了在计算机审计过程中必须进行审计数据转换。提高数据质量审计数据来源众多,这些来源于不同被审计单位的数据中可能存在方方面面的质量问题,具体表现为数据不清洁、不完整,甚至有些数据可能是不真实的、错误的。数据质量问题必然会影响数据分析的结果。例如,对错误的数据进行分析将得不到正确的结果。为了
2、有效开展审计,必须最大程度地消除这些数据质量问题。形成集成的数据一方面,被审计单位的数据组织通常是面向业务处理的,不是面向分析的。而审计工作要求根据审计目标和分析主题来组织数据,这就需要将不同的数据经过整理和转换后集成到一起,形成审计分析用的统一数据集合。这个集合通常称为审计中间表。也就是说,审计分析必须建立在一个数据清洁、结构良好的审计中间表的基础上。另一方面,审计所需的数据并不单单局限于某个系统或某家被审计单位。利用不同系统间的数据以及外部数据进行关联分析已经成为一种有效的手段,它可以有效克服信息不全面带来的审计风险。例如财务数据和
3、业务数据之间的对比分析,利用商业银行的存贷款数据、人民银行的统一授信数据、税务部门的纳税申报数据和金税工程数据、工商部门的企业登记数据、社保部门的社会保险数据、技术监督局的企业编码数据、海关部门的进出口数据及退税数据、电力公司的电费数据、自来水公司的水费数据进行企业行为的综合分析,等等。从多个数据源中抽取数据进行集成,必须消除数据的不一致性和冲突。这些都对数据转换提出了很高的要求。、相关概念.1审计中间表数据转换过程中经常使用审计中间表。审计中间表是指将清理、转换后的数据按照提高审计分析效率、实现审计目标的要求进一步选择、整合而形成的数
4、据集合。它有两个特点:一是面向分析主题。审计中间表的构建总是针对具体的审计项目进行的。同样的数据库,如果审计目的不同,构建的中间表也不相同。在构建的过程中,审计人员应该依据审计方案既定的审计目标进行数据的选择、整合,构建出面向主题、满足审计目标的数据集合。二是相对稳定。审计中间表是在具体的审计项目实施过程中所形成的,是对采集到的被审计单位数据进行清理、转换,并进一步根据审计目标选择、整合而形成的数据集合。由于这些集合具有比较固定的结构,并且保存的是被审计单位的历史数据,一般不进行更新,所以审计中间表是相对稳定的。.审计元数据所谓审计元数
5、据,指的是描述审计中间表内部数据的结构和建立方法的数据。在审计数据的采集和转换系统中,元数据可以帮助审计人员非常方便地找到他们所关心的数据。它有两方面用途。首先,审计元数据能提供审计人员所需的,基于计算机审计的各种信息,如被审计单位数据项的业务描述信息和审计中间表的结构与关系信息等,从而帮助计算机审计人员有效使用各种与审计任务相关的数据。其次,审计元数据能支持系统对审计数据的管理和维护,如关于审计中间表数据项存储方法的元数据能支持系统以最有效的方式访问数据。、审计数据转换系统中涉及的相关操作审计数据转换系统的功能是否强大,在很大程度上取
6、决于转换规则集是否健全。通过分析被审计单位数据和审计项目的具体需求,我们发现几乎所有被审计单位数据都是采用关系数据库来存放的,审计中间表的设计与存储也是建立在关系数据库基础之上的,因此我们制定的审计数据转换规则都是针对关系数据库来定义的。同时,我们的转换规则集设计采用开放的方式进行管理,也就是说审计人员可以根据自己的需求添加转换算法。如果审计人员需要复杂的审计数据转换,可以通过一系列的转换操作组合来达到目的,这个转换组合就是一个转换活动。.1数据的合法性检查审计中间表中的数据来自于被审计单位的多种数据源,这些数据源可能是在不同的硬件平台
7、上,使用不同的操作系统,因而数据往往以不同的格式存在不同的数据库中。所以,在审计数据转换的过程中,有时需要对被审计单位的数据进行合法性检查,将那些语义相同但格式不同的数据转换成统一的格式,以便更加适用于审计中间表的设计,这也就是数据的格式化的过程。.数据清理数据清理主要涉及到数据的匹配与合并。通过匹配,发现重复的对象;通过合并,保留或生成一个完整的对象。数据清理活动的核心是近似重复对象的识别。所谓近似重复对象是指表现形式不同但语义上相同的对象。从狭义的角度来看,如果两条记录在某些字段上的值相等或足够相似,则认为这两条记录互为近似重复数据
8、清理包括以下几个步骤:记录排序:选择一个或几个字段作为关键字进行排序;识别重复记录;合并重复记录:从相似记录集中获得记录的完整信息,并作为该记录的表示。.数据变换常见的数据变换操作包括:简单变换,日期、时间
此文档下载收益归作者所有