多维数据集的构建及其数据仓库ola

多维数据集的构建及其数据仓库ola

ID:30512801

大小:816.18 KB

页数:22页

时间:2018-12-30

多维数据集的构建及其数据仓库ola_第1页
多维数据集的构建及其数据仓库ola_第2页
多维数据集的构建及其数据仓库ola_第3页
多维数据集的构建及其数据仓库ola_第4页
多维数据集的构建及其数据仓库ola_第5页
资源描述:

《多维数据集的构建及其数据仓库ola》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、多维数据集的构建及其数据仓库OLAP071070012李骁数据仓库是决策支持系统和联机分析应用数据源的结构化数据环境,用以支持经营管理中的决策支持过程,数据模型是数据仓库研究的核心问题之一,由于传统数据模型不能有效地表示数据仓库的数据结构和语义,也难以有效地支持OLAP,因此,需要建立多维数据模型来支持分析。本报告创建了多维数据模型,定义了数据仓库的度量和维度结构,并以此为基础,进行了简单的OLAP操作并得到了相关结论。由于数据仓库操作面向的是大量的、各阶段的详细数据,直接创建是不现实的,这里直接采用了SQLServer自带的Foodmart2000数据源作为操作基础。数据仓库包含了4个层次

2、的体系结构,分别是数据源、数据的存储和管理、OLAP服务器和前端工具。报告只深入到基于数据的存储和管理的简单OLAP服务分析,microsoft的Analysisserver在人性化方便做得很好,容易上手,基本不存在较大的操作问题。(一)建立用于OLAP的数据库及数据源连接本次作业是在系机房的windowsserver2003系统环境中完成的,建立数据源连接首先单击“开始”按钮,指向“设置”,单击“控制面板”,然后双击“管理工具”,再双击“数据源(ODBC)”。在弹出的“ODBC数据源管理器”中选定“系统DSN”选项卡,单击“添加”添加数据源,由于本人并没有好的数据源,因此直接采用系统数据库

3、中的样本作为数据源对象。具体操作是在随后弹出的“ODBCMicrosoftAccess安装”中命名并找到样本数据库(windowsserver2003在D盘),点击“确定”即可在SQLServer2000中,右击数据库名,建立新数据库如下:建立好数据库后,在AnalysisManager树窗格中,右击“教程”数据库下的“数据源”文件夹,然后单击“新数据源”命令。在随后弹出的“数据链接属性”对话框中,单击“MicrosoftOLEDBProviderforODBCDrivers”。单击“下一步”(自动跳到“连接”选项卡),将数据源名称中选定“lixiao_DW”:单击“测试连接”以得到“测试连

4、接成功”的对话框,说明连接成功。在消息框中单击“确定”按钮。单击“确定”按钮关闭“数据链接属性”对话框。这样,OLAP的准备工作就完成了。(二)构建多维数据集构建多维数据集是要构建一种数据的多维结构,多维数据集由维度和度量值的集合进行定义,因此在具体操作时应建立多种维度表,包括时间维度、客户维度、产品维度、机构维度等等。在之前,需向多维数据集添加度量值,度量值是要进行分析的数据库中的量化值。常用的度量值为销售、成本和预算数据。度量值根据多维数据集不同的维度类别进行分析。在之前建立的数据库中,右击“多维数据集”,选到“向导”,如下图:在“从数据源中选择事实数据表”中,选择合适的事实表,这个数据

5、源中共有5个事实表,为简单起见,选定sales_fact_1997事实表作为分析对象:单击“浏览数据”按钮可以查看“sales_fact_1997”表中的数据,其中数据量相当大,关闭“浏览数据”窗口,然后单击“下一步”按钮。在弹出的向导中,选择类型为数值的后三项为数据集度量值:在下一步中就可以建立具体的维度了,前面已经提过需要建立时间维度、客户维度、产品维度、机构维度等等。首先单击“新建维度”命令。此操作将调用维度向导:选择OLAP较为常用的星型架构,之后选择“time_by_day”表(先建立时间维度):单击“下一步”按钮,选择“时间维度”:仔细观察“time_by_day”表可以发现,数

6、据分得很细,每一天都有新事件,从分析角度来看,以月为计量单位较为合适,点击“下一步”后,选择时间级别到“月”即可,随后的操作按过程来,最后用“time”作为维度名,其维度级别依次为“年”、“季度”、“月”。时间维度创建好后,以相似的方法创建好关于该表的客户维度与商店维度,在操作上,在“选择维度表”步骤,单击“customer”,然后单击“下一步”按钮。定义维度的级别中按顺序双击“Country”、“State_Province”、“City”和“lname”列确定粒度。将其名称定义为“customer”。商店维度:选择“store”表作为维度表,其粒度级别按照“store_country”列

7、、“store_state”列、“store_city”列和“store_name”列降次。以“store”作为维度名,并保持“与其它多维数据集共享此维度”复选框的选中状态。单击“完成”按钮。随后的产品维度表,由于产品表从多个联接的表内选择一列,所以这里采用雪花模型更为方便,product表和product_class表一起可以作为维度表,仔细阅读“选择维度级别”的可选项,“product_category”

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。