欢迎来到天天文库
浏览记录
ID:57528637
大小:910.46 KB
页数:23页
时间:2020-08-26
《《商务智能》实验指导书.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、精品文档《商务智能》实验指导实验1:数据仓库的建立一.实验目的与任务:1.了解SQLServer2005环境,掌握建立数据库的基本操作。2.设计并创建基于维度模型的“超市销售分析”数据库。二.实验时间:2学时三.实验步骤:1.构建并熟悉SQLServer2005实验环境。2.在指定磁盘上建立“超市销售分析”数据库。3.在数据库中分别建立事实表和维表,并设置主键及参照约束:事实表(序号,日期,商店编号,商品编号,销售数量,销售金额)商品表(商品编号,商品名称,规格型号,单位,售价,大类别,小类别)商店表(商店编号,商店名称,地址
2、,经理,省市,地市)时间表(日期,年份,月份,日)4.向各表中输入部分数据。注意:输入的数据要有一定的代表性。5.熟悉各种SQL命令。6.分离数据库,将数据库文件复制到优盘,或发送到邮箱。1欢迎下载。精品文档实验2:联机分析系统的建立与应用一.实验目的与任务:1.学习联机分析系统的建立步骤与常用分析方法。2.创建超市销售分析联机分析星形(或雪花)模型,并具体分析。二.实验时间:2学时三.实验步骤:1.创建一个名称为超市销售分析的商务智能项目。图22欢迎下载。精品文档在上图中的“名称”栏输入项目的名称(自己命名),在“位置”栏选
3、定该项目内容存放的位置。确定后,屏幕右上方出现“解决方案资源管理器”。以后的分析操作按照此处指定的步骤进行。2.定义数据源:指出分析数据的来源,即数据所在的数据库。在“管理器”中选择“数据源”后,在快捷菜单中选“新建数据源”。然后按照向导提示操作。在上图中选择“新建”。3欢迎下载。精品文档在上图中输入数据库所在的服务器名称,并选择数据所在的数据库。2.定义数据源视图:在数据库中,选择要用到的表、视图。在“管理器”中选“数据源视图”中的“新建”功能。按照向导提示操作。在上图中选择是需要的表。4欢迎下载。精品文档4生成多维数据集:
4、确定事实表(度量值)、维表(层次)等。5欢迎下载。精品文档在上图中选“使用数据源生成多维数据集”。不选“自动生成”。在上图中指明事实表和外表。6欢迎下载。精品文档设置各维度的层次结构:7欢迎下载。精品文档5.将多维数据集部署到联机分析服务器。6.以建好的多维数据集为基础,练习切片、切块、旋转、钻取等典型的数据分析技术。.8欢迎下载。精品文档9欢迎下载。精品文档实验3:关联分析方法的应用一.实验目的与任务:1.了解关联分析算法的实际应用方法。2.创建“购物篮”关联分析数据表,挖掘关联模型。二.实验时间:2学时三.实验步骤:1.创
5、建“数据挖掘实验”数据库。2.在数据库中建立与“购物篮”相关的表(与实际相比,表的结构和内容作了适当简化),以及主键与参照约束:销售单表(销售单号,销售时间,收款员,其它)销售单明细(销售单号,商品名称,销售数量,销售单价)3.向各表中输入部分数据。注意:输入的数据要有一定的代表性,不需要的数据可以不输入。4.创建一个名称为“购物篮分析”的项目,并定义数据源、定义数据源视图。5.创建关联挖掘结构。在“资源管理器”中选“挖掘机构”中的“新建挖掘结构”。然后按照提示操作。10欢迎下载。精品文档11欢迎下载。精品文档6.建立关联规则
6、挖掘模型。根据下图提示设置参数。12欢迎下载。精品文档7.部署并查看挖掘结果。13欢迎下载。精品文档14欢迎下载。精品文档实验4:聚类分析方法的应用一.实验目的与任务:1.了解聚类分析算法的实际应用方法。2.创建“城市综合数据表”,挖掘城市综合聚类模型。二.实验时间:2学时三.实验步骤:1.创建“数据挖掘实验”数据库。2.在数据库中建立“城市综合数据表”:城市综合数据表1(城市编号,城市名称,行政级别,人口数,总产值,房价,最低工资)3.向各表中输入部分数据。注意:输入的数据要有一定的代表性。4.应用数值化、归一化等数据预处理
7、方法,对数据进行预处理,处理结果存入“城市综合数据表2”中,该表与“城市综合数据表1”的属性个数相同,但部分列的类型需要调整。5.创建一个名称为“城市聚类分析”的项目,并定义数据源、定义数据源视图。6.创建聚类挖掘结构,设置相关参数。15欢迎下载。精品文档16欢迎下载。精品文档7.建立聚类挖掘模型。8.查看挖掘结果。17欢迎下载。精品文档实验5:分类分析方法的应用一.实验目的与任务:1.了解分类分析算法的实际应用方法。2.创建“顾客信用分析数据表”,利用决策树算法,挖掘顾客信用分析模型。二.实验时间:2学时三.实验步骤:1.创
8、建“数据挖掘实验”数据库。2.在数据库中建立“顾客信用分析数据表”:顾客信用数据表1(顾客编号,姓名,性别,年龄,单位类别,职业,年收入,信用等级)3.向各表中输入部分数据。注意:输入的数据要有一定的代表性。4.应用离散化、概念提升等数据预处理方法,对数据进行预处理,处理结果
此文档下载收益归作者所有