欢迎来到天天文库
浏览记录
ID:50047245
大小:136.00 KB
页数:32页
时间:2020-03-08
《数据库基础与应用 第2版 教学课件 王珊 李盛恩 第13章_联机分析处理(OLAP)技术-完成.ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第13章联机分析处理(OLAP)技术13.1什么是OLAP13.2多维数据模型13.3OLAP的实现13.4小结13.1什么是OLAPOLAP(On_LineAnalyticalProcessing)即联机分析处理,是以海量数据为基础的复杂分析技术。OLAP概念是由E.F.Codd于1993年提出的。OLAP软件提供的是多维分析和辅助决策功能。对于深层次的分析和发现数据中隐含的规律和知识,则需要数据挖掘(DataMining)技术和相应的数据挖掘软件来完成。13.2多维数据模型变量(Measure)
2、变量也称度量,是数据的实际意义,即描述数据“是什么”。例如:数据“10000”本身并没有意义或者说意义未定,它可能是一个学校的学生人数,也可能是某产品的单价,还可能是某商品的销售量等。一般情况下,变量是一个数值的度量指标,例如:“人数”、“单价”、“销售量”等都是变量或称为度量,而“10000万元”则是变量的一个值,销售量10000万元常称为度量值。13.2.1基本概念13.2多维数据模型13.2.1基本概念维(Dimension)维是人们观察数据的特定角度。例如,企业常常关心产品销售量随时间的变化
3、情况,这时他是从时间的角度来观察产品的销售,所以时间就是一个维(时间维)。企业也时常关心自己的产品在不同的地区的销售分布情况,这时他是从地区分布的角度来观察产品的销售,所以地区也是一个维(地区维)。“维”是OLAP中十分重要的概念。13.2多维数据模型13.2.1基本概念维的层次(Hierarchy)人们观察数据的某个特定角度(即某个维)还可能存在细节程度不同的多个描述方面,我们称这多个描述方面为维的层次。例如:描述时间维时,可以从年、季、月、日等不同层次来描述,那么年、季、月、日等就是时间维的一种
4、层次;同样,县、市、省、大区、国家等构成了地区维的一种层次。13.2多维数据模型13.2.1基本概念维成员(Member)维的一个取值称为该维的一个维成员,也称作维值。如果一个维的某种层次具有多个层,那么该维的维成员是不同维层的取值的组合。假设时间维的层次是年、月、日这三个层,分别在年、月、日上各取一个值组合起来,就得到了时间维的一个维成员,即“某日某月某年”。一个维成员并不一定在每个维层上都要取值,例如,“某年某月”、“某月某日”、“某年”等都是时间维的维成员。13.2多维数据模型13.2.1基本
5、概念多维立方体(Cube)多维数据模型的数据结构可以用这样来一个多维数组来表示:(维1,维2,···,维n,度量值),例如:图13.1所示的电器商品销售数据是按时间、地区、商品,加上变量“销售额”组成的一个三维数组:(地区,时间,商品,销售额)。三维数组可以用一个立方体来直观的表示。一般地多维数组用多维立方体CUBE来表示。多维立方体CUBE也称为超立方体。13.2多维数据模型13.2.1基本概念图13.1按商品、时间和地区组织的电器商品销售数据销售额(万元)时间地区商品电视机洗衣机电冰箱北京123
6、413.2多维数据模型13.2.1基本概念数据单元(Cell)多维立方体CUBE的取值称为数据单元。当多维立方体的各个维都选中一个维成员,这些维成员的组合就唯一确定了一个变量的值。对于三维以上的超立方体,很难用可视化的方式直观地表示出来。为此人们用较形象的星型模式”(StarSchema)和“雪片模式”(SnowFlakeSchema)来描述多维数据模型。13.2多维数据模型13.2.1基本概念星型模式通常由一个中心表(事实表)和一组维表组成。销售事实表销售员维顾客维时间维产品维制造商维图13.2星
7、型模式13.2多维数据模型13.2.1基本概念星型模式的事实表与所有的维表相连,而每一个维表只与事实表相连。维表与事实表的连接是通过码来体现的,如图13.3所示。顾客代码顾客维表制造商维表销售事务表销售员维制造商代码日期顾客代码制造商代码销售员代码产品代码销售额销售员代码产品维表产品代码图13.3星型模式示例13.2多维数据模型13.2.1基本概念雪片模式就是对维表按层次进一步细化后形成的。如图13.4,在“星型”维表的角上又出现了分支,这样变形的星型模式被称为“雪片模式”(SnowFlakeSch
8、ema)。13.2多维数据模型13.2.1基本概念销售事实表销售员维顾客维时间维产品维制造商维日月周位置顾客地区工厂类型产品类型地区销售员图13.4雪片模式13.2多维数据模型13.2.2多维分析的基本操作切片(Slice)在超立方体cube的某一维上选定一个维成员的操作称为切片。一次切片使原来的Cube维数减一,即结果为一个维数减一的subcube,如图13.5所示。切块(Dice):在超立方体Cube上选定两个或更多个维成员的操作称为切块。13.2多维数据模型13
此文档下载收益归作者所有