欢迎来到天天文库
浏览记录
ID:25904538
大小:56.50 KB
页数:7页
时间:2018-11-23
《olap多维分析——流通行业审计新思路》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、OLAP多维分析——流通行业审计新思路[摘要]信息技术全面发展的今天,财务信息系统的应用范围越来越广,特别是在流通行业,作用越来越大。同时,审计风险模型不断演变,风险导向审计的概念日益流行。在商品数据丰富的流通行业,审计亟待利用现有强大的财务数据仓库来进行数据分析,利用信息技术进行有效的审计决策。本文探讨了在流通行业中利用OLAP分析技术对数据进行多个维度的查询分析,快速确定审计风险数据和挖掘分析风险数据的审计新思路。 [关键词]OLAP多维分析审计数据仓库 一、OLAP多维分析技术介绍 联机分析处理(OLAP)的概念最早是由关系数据库之父E.F.Codd于199
2、3年提出的,他同时提出了关于OLAP的12条准则。 联机分析处理的用户是专业分析人员及管理决策人员,他们在分析业务经营的数据时,从不同的角度来审视业务的衡量指标是一种很自然的思考模式。例如在流通行业分析销售数据,可能会综合时间周期、产品类别、分销渠道、地理分布、客户群类等多种因素来考量。 联机分析处理的主要特点,是直接仿照用户的多角度思考模式,预先为用户组建多维的数据模型,在这里,维指的是用户的分析角度。例如对销售数据的分析,时间周期是一个维度,产品类别、分销渠道、地理分布、客户群类也分别是一个维度。一旦多维数据模型建立完成,用户可以快速地从各个分析角度获取数据,也能动
3、态的在各个角度之间切换或者进行多角度综合分析,具有极大的分析灵活性。这也是联机分析处理在近年来被广泛关注的根本原因,它从设计理念和真正实现上都与旧有的管理信息系统有着本质的区别。 数据仓库与OLAP的关系是互补的,现代OLAP系统一般以数据仓库作为基础,即从数据仓库中抽取详细数据的一个子集并经过必要的聚集存储到OLAP存储器中供前端分析工具读取。 随着数据仓库的发展,OLAP也得到了迅猛的发展。数据仓库侧重于存储和管理面向决策主题的数据:而OLAP则侧重于数据仓库中的数据分析,并将其转换成辅助决策信息。OLAP的一个重要特点是多维数据分析,这与数据仓库的多维数据组织正好
4、形成相互结合、相互补充的关系。 OLAP技术使数据仓库能够快速响应重复而复杂的分析查询,从而使数据仓库能有效地用于联机分析。OLAP的多维数据模型和数据聚合技术可以组织并汇总大量的数据,以便能够利用联机分析和图形工具迅速对数据进行评估。当分析人员搜寻答案或试探可能性时,在得到对历史数据查询的回答后,经常需要进行进一步查询。OLAP系统可以快速灵活地为分析人员提供实时支持。 我们利用SQLServer2000下的AnalysisServices来进行数据仓库应用下的OLAP实现,帮助我们进行审计的决策支持。模式如图1所示。 图1OLAP实现模式 二、利用OLAP进行审
5、计多维分析的过程 1.我们需要获取流通行业审计数据源 本文案例中我们从某市烟草销售公司获得烟草销售财务数据。当我们从该单位直接采集过来的时候数据可能是凌乱的,无法被我们直接应用的。如图2所示。 图2烟草销售公司销售财务数据 原始的数据源数据难免有各种错误、可能不完整或不一致。数据预处理技术可以大大提高数据的质量,从而有助于提高其后的挖掘过程的精度和性能。 2.构建用于多维分析的数据仓库 通过了解被审计单位提供的数据字典,了解基础数据中各表中存储数据的内容、各字段的含义以及各表之间的关联关系,然后从与某业务类别相关的基础数据表中选择反映该业务类别主要信息的字段,组
6、织这些字段,来构建我们的数据仓库模型。 构建数据仓库的过程中,首先确定数据分析所包含的主题域,即审计风险的统计量(销售数量、销售金额、销售税额)。然后对主题域内容进行较明确的描述,包括时间、公司部门、产品、客户等维度的属性组。 根据概念模型确定的主题域,结合项目背景,设计数据仓库的维表和事实表的逻辑模式。维表设计中一个很重要的问题是维粒度的层次划分。粒度指的是数据仓库中数据单元的细节程度或综合程度的级别。细节程度越高,粒度级就越低;相反,细节程度越低,粒度级就越高。例如,时间维按照粒度层次由高到低可划分为年、月、日三个等级。粒度层次划分适当与否直接影响到数据仓库重要存储
7、的数据量、查询方法和数据仓库整个体系结构。事实表描述用户关心的主题信息,比如销售金额的大小、销售需要上缴税金的多少等。维表和事实表通过公共码联系在一起,形成一个完整的主题域。事实表依靠外键和维表建立联系。例如,销售收入事实表与时间维表的联系就是依靠外键联系实现的。最终我们确定的数据仓库模型。 接下来要做的就是根据我们设计好的数据仓库模型建立数据仓库的事实表和维度表,然后导入相应的数据,并且做一定程度的数据清洗。根据我们设计的数据仓库模型,我们要建立1个事实表,4个维度表。按照关键字段建立关系。到此,我们的小型数据
此文档下载收益归作者所有