欢迎来到天天文库
浏览记录
ID:31833638
大小:709.50 KB
页数:18页
时间:2019-01-20
《天津商业大学商务智能实验报告4 (2).doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、天津商业大学学生实验报告开课实验室:信息专业实验室403开课时间2016-3-2实验报告学院名称信息工程学院年级、专业、班电子商务1303班学号20134307姓名席鑫同组姓名无课程名称商务智能实验项目名称实验四数据挖掘指导教师张晓琴实验类型验证√综合□设计□创新□成绩教师评语教师签名:年月日实验报告内容一般包括以下几个内容:1、目的要求2、仪器用具及材料(仪器名称及主要规格、用具名称)3、实验内容及原理(简单但要抓住要点,写出依据原理)4、操作方法与实验步骤5、数据图表格(照片)6、实验过程原始记录7数据处理及结果(按实验要求处理数据、
2、结论)8、作业题9、讨论(对实验中存在的问题、进一步的想法等进行讨论)实验四数据挖掘一、实验目的1.利用数据挖掘模型对多维仓库中的数据进行聚类分析。3.浏览分类关系图,并对查看分类剖面图和特征,得出挖掘信息,进行辅助决策。二、实验内容1.聚类分析对已有数据仓库中数据的数据挖掘,选择聚类分析,通过分类关系图和结构剖面图来进一步了解客户的分类情况。3.辅助决策通过聚类得到可利用的信息,用此信息来确定来达到辅助决策的目的。三、实验要求掌握数据挖掘的实现过程,并进行数据的分析处理。四、实验准备认真理解教材中的数据挖掘的概念,聚类算法,以及算法结束
3、后得到的分析结果处理。五、实验原理、方法和手段六、实验条件SQLServer200517七、实验步骤使用给定的foodmart数据库和实验一的数据源视图。1.创建数据挖掘模型(1)在“解决方案资源管理器”中,右键单击“挖掘结构”,在弹出的快捷菜单中选择“新建挖掘结构”项。系统将打开“数据挖掘向导”。(2)在“选择定义方法”窗口中,确认以选中“从现有关系数据库或数据仓库”项,单击“下一步”按钮。(3)在“创建数据挖掘结构”页的“你们要使用何种数据挖掘技术?”下,选中列表中的“Microsoft聚类分析”,再单击“下一步”。(4)在“选择数据
4、源视图”窗口中,已默认选中xixin。在数据源视图中,单击“浏览”按钮查看各表。(5)指定表类型。17(6)指定定型数据,在“指定定型数据”页上,键列为顾客ID,可预测列为年收入,点击建议,可以提供相关列的建议。(7)指定列的内容和数据类型,进行检测,完成向导。17(8)在“完成向导”页的“挖掘结构名称”中,键入“xixin1”(自己的名字)。(9)在“挖掘模型名称”中,键入“xixn1”。(10)选择“允许钻取”选项,然后单击“完成”。2.处理数据挖掘模型(1)在BusinessIntelligenceDevelopmentStudio
5、的“挖掘模型”菜单上,选择“处理挖掘结构和所有模型”。(2)看到询问是否要生成和部署项目的警告时,请单击“是”。“处理挖掘结构”对话框随即打开。17(3)单击“运行“。模型处理完成后,在“处理进度”对话框中单击“关闭”。在“处理挖掘结构”对话框中单击“关闭”。3.浏览数据挖掘模型。(1)在“数据挖掘设计器”中,选择“挖掘模型查看器”选项卡。默认情况下是分类关系图,设计器显示10个分类,所有链接居中。颜色深表示事例多,颜色浅表示事例少。(2)当左边的“所有链接”向上滑动时,显示所有的链接。其中深色灰线表示两个聚类的关联度强,浅色线表示两个聚
6、类的关联度弱。17(3)当左边的“所有链接”向下滑动时,显示最强的链接。17(4)点击“分类剖面图”,可以看到十个分类的概要信息。挖掘图例显示根据教育程度,会员卡,孩子数量、职业及年收入进行分类的情况。其中分类6主要是高中学历,铜卡,2-3个孩子,以技工和工人为主,年收入在30-50K。八、思考题1、将客户分为五类进行分析,找到最强关联的两个分类,分析其学历、收入、孩子数目、会员卡等情况。答:首先将客户分为5类,进行如下操作:(1)点击“挖掘模型”中“customerID”右侧的“key”选项。(2)点击“挖掘模型”中的“设置算法参数”选
7、项。如下图所示。17(1)在“算法参数”选项卡中“CLUCTER_COUNT”右侧的“值”列输入“5”自动将数据分为5类。如下图所示。17(4)重新进行部署,如下图所示。17(5)部署成功后,数据分为5类,如图所示。(6)查看最强链接,如图所示,可以知道最强链接是分类2和分类4.17(7)分类关系图如图所示。(8)分类剖面图如图所示。17(9)分类特征图如图所示。(10)分类对比图如图所示。17由前面的分类关系图中可以得知最强关联的二个类是分类2和分类4,所以对着二个类进行分析,分析其学历、收入、孩子数目、会员卡等情况。(1)首先点击查看
8、“分类对比”图,在“分类一”框中选择“分类二”,在“分类二”框中选择“分类四”,进行这2个类的对比,如图所示。由图可知,可以得知分类2的人群中大多数人均信用卡个数为3个,分类4的人群中大多数人
此文档下载收益归作者所有