数据仓库数据挖掘实验

数据仓库数据挖掘实验

ID:28356739

大小:1.31 MB

页数:26页

时间:2018-12-09

数据仓库数据挖掘实验_第1页
数据仓库数据挖掘实验_第2页
数据仓库数据挖掘实验_第3页
数据仓库数据挖掘实验_第4页
数据仓库数据挖掘实验_第5页
资源描述:

《数据仓库数据挖掘实验》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、-数据仓库与数据挖掘学号:姓名:任课教师:朱焱二零一四年十二月.---目录目录1实验1.1数据仓库的构建与OLAP分析11.实验题目及实验目的12.实验内容13.实验相关的算法原理或所设计的模型介绍14.实验结果分析与总结25.收获与问题分析4实验1.2创建OLAP数据立方体51.实验题目及实验目的52.实验内容53.实验相关的算法原理或所设计的模型介绍54.实验结果分析与总结55.收获与问题分析6实验1.3通过OLAP进行数据分析71.实验题目及实验目的72.实验内容73.实验相关的算法原理或所设计的模型介绍7

2、4.实验结果分析与总结75.收获与问题分析9实验1.4/1.5“Frequent-Flyerflightsegment“信息进行数据仓储化管理1.实验题目及实验目的101.实验题目及实验目的题目:“Frequent-Flyerflightsegment”信息进行数据仓储化管理.102.实验内容103.实验相关的算法原理或所设计的模型介绍所建立的数据库模型为雪花模型,一个事实表对应多个飞机事件,一个飞机事件对面3个机场表:起始机场、中转机场、终点机场。雪花模型中还有时间表、顾客模型等。如图1-13:114.实验结果

3、分析与总结115.收获与问题分析12实验2.1Apriori关联规则算法应用实例13.---1.实验题目及实验目的132.实验内容133.实验相关的算法原理或所设计的模型介绍134.实验结果分析与总结145.收获与问题分析15实验2.2KMeans聚类算法应用实例161.实验题目及实验目的162.实验内容163.实验相关的算法原理或所设计的模型介绍164.实验结果分析与总结175.收获与问题分析17实验2.3KNN分类算法应用实例181.实验题目及实验目的182.实验内容183.实验相关的算法原理或所设计的模型介

4、绍184.实验结果分析与总结185.收获与问题分析192.4在SQLServer2008上完成上述的数据挖掘实验201实验目的202实验内容203实验相关的算法原理或所涉及的模型介绍204实验结果与总结20.---实验1.1数据仓库的构建与OLAP分析1.实验题目及实验目的(1)熟悉SSIS工具,初步掌握数据仓库数据的ETL过程及操作流程(2)加深对ETL(提取、转换、加载的理解)2.实验内容此实例的背景是基于AdventureWorkscycle公司,该公司新增了5个销售区域,以前这5个销售区域的数据没有汇总到

5、数据仓库中,现在需要用到这些数据,于是公司让这5个区域的主管把客户信息全部导入到一个文本文件中,命名为customers.txt。因为这几个区域的数据完全混合在一起,而且有一些数据是无效销售区域的数据,现在的任务就是要通过SSIS的数据提取、转换和加载功能把customers.txt的数据分区域导入数据仓库中,同时对于一个错误的数据用一个特定的文件保存起来。3.实验相关的算法原理或所设计的模型介绍ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程)作为BI/DW(Busine

6、ssIntelligence)的核心和灵魂,能够按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。ETL是数据仓库中的非常重要的一环。它是承前启后的必要的一步。相对于关系数据库,数据仓库技术没有严格的数学理论基础,它更面向实际工程应用。所以从工程应用的角度来考虑,按着物理数据模型的要求加

7、载数据并对数据进行一些系列处理,处理过程与经验直接相关,同时这部分的工作直接关系数据仓库中数据的质量,从而影响到联机分析处理和数据挖掘的结果的质量。数据仓库是一个独立的数据环境,需要通过抽取过程将数据从联机事务处理环境、外部数据源和脱机的数据存储介质导入到数据仓库中;在技术上,ETL主要涉及到关联、转换、增量、调度和监控等几个方面;数据仓库系统中数据不要求与联机事务处理系统中数据实时同步,所以ETL可以定时进行。SSIS是MicrosoftSQLServer2005IntegrationServices的简称,是

8、生成高性能数据集成解决方案(包括数据仓库的提取、转换和加载(ETL)包)的平台。IntegrationServices包括用于生成和调试包的图形工具和向导;用于执行工作流函数(如FTP操作)、执行SQL语句或发送电子邮件的任务;用于提取和加载数据的数据源和目标;用于清理、聚合、合并和复制数据的转换;用于管理IntegrationServices的管理服务Integrati

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。