资源描述:
《数据仓库的多维数据分析器设计与实现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第41卷第6期厦门大学学报(自然科学版)Vol.41No.62002年11月JournalofXiamenUniversity(NaturalScience)Nov.2002文章编号:04380479(2002)06069704数据仓库的多维数据分析器设计与实现段江娇,薛永生,令狐荣珊(厦门大学计算机科学系,福建厦门361005)摘要:实现多维数据分析是数据仓库系统需要具备的一个主要功能,它接受用户的多维数据查询请求,生成多维数据集,为建立数据挖掘模型提供基础数据.本文讨论了基于MicrosoftSQLServer2000的多维数据分析器的实现.简要介绍了多维数据分析
2、的基本原理,并在DSO、ADOMD及MDX(多维数据表达式)等技术的基础上,构造了一个多维数据分析器.最后,给出了多维分析器的实现实例.关键词:数据仓库;OLAP;多维数据集;多维分析中图分类号:TP311.131联机分析处理OLAP(On_LineAnalyticalProcessing)是数据仓库技术的一个重要组成部分.OLAP技术是通过OLAP服务器,将数据仓库的数据抽取和转换为多维数据结构,以反映用户所能理解的企业的真实的维,然后通过多维分析工具对信息的多个角度、多个侧面,进行快速、一致和交互的存取,从而使分析人员、经理和管理人员能够对数据进行深文献标识码:A多维分析
3、对多维形式组织起来的数据采取切[1]终用户能从多个角度、多侧面地观察数据库中的数据.在进行多维分析时,分析的目标数据称为事实数据,如销售量、销售额等.这些数据日积月累,数量庞大.事实数据的属性称为维,如销售的时间、客户、产品、地区等.它们的内容一般变化不大,数量也相入的分析和观察[1].其中,数据抽取和转换工具将数[2]据按照一定的要求,导入到多维数据仓库中,数据仓库的使用者通过前端访问和分析工具,对多维数据分析产生的数据集按照一定的方式进行显示输出.而多维数据分析,则根据前端工具输入的数据查询日月年这三个层次,地区维可以具有城市省地区三个层次.在数据仓库中维可以具有不
4、同的粒度级,例如,年对应于高粒度级,日对应于低粒度级.请求获取数据,并生成一定格式的数据集.[3,4]:多维OLAP上述多维数据分析过程是由多维数据分析器操作而成,本文着重讨论基于MicrosoftSQLServer2000的多维数据分析器的设计以及基于DSO、ADOMD及MDX(多维数据表达式)等技术的实现方法.(MOLAP)、关系OLAP(ROLAP)和混合OLAP(HOLAP).本文中所讨论的多维数据分析是基于ROLAP,在ROLAP体系结构中,数据的组织方式分为星形模1多维数据分析的基本原理[1,5]都划分为两类表:一类是事实(fact)表,用来存储事联机分析
5、处理OLAP是对数据的一系列交互查询过程,这些查询过程要求对数据进行多层次、多阶段的分析处理,在OLAP中,多维数据集(cube)是分析的基本单位.一个多维数据集代表了一个特殊的可查询区域,是由一定数目的维度和度量结合而成的整体存储单位.收稿日期:20020513作者简介:段江娇(1972-),女,讲师.实的度量(measure)值及各个维的码值;另一类表是维表,即维的描述信息,包括维的层次及成员类别等.基于关系数据库的OLAP的维表和事实表都是用二维关系表的方式存放的.进行多维数据分析的几个基本步骤如下:1)创建一个分析服务数据库,并指定该数据库的数据源;2)创建多维数据集
6、,创建事实表、维度表,定义度量的数据列,并根据业务要求,设定维度的粒度;3)选择存储方式:MOLAP,ROLAP或HOLAP;4)处理多维数据集,创建多维数据集的聚合.片、切块、旋转等各种分析动作,以求剖析数据,最对小.维通常是有层次的,例如,时间维可以具有多维数据集的存储模式有三种型和雪花模型.星形模型和雪花模型的多维结构!698!厦门大学学报(自然科学版)2002年本文所描述的多维数据分析器即是实现以上步骤的一个集成器.2基于SQLServer2000的多维数据分析器实现的关键技术2.1SQLServer2000对多维数据分析开发的支持MicrosoftSQLServ
7、er2000提供了相关的数据仓[3]应用程序.多维表达式MDX(MultidimensionalExpress)支持对多维数据集的操作.ADOMD是ADO的扩展,它允许基于COM的应用程序通过用于OLAP的OLEDB接口实现对多维数据源的操作.包括在OLAP数据库中对多维数据集层次结构的只读图1基本的DSO对象模型访问;查询处理和数据检索功能.DSO(DecisionSupportObject,决策支持对象)提供了对OLAP数据库的管理能力.基本的DSO对象模型如图1所示.本文所讨论的多