数据挖掘实验指导3

数据挖掘实验指导3

ID:46241107

大小:646.07 KB

页数:10页

时间:2019-11-22

数据挖掘实验指导3_第1页
数据挖掘实验指导3_第2页
数据挖掘实验指导3_第3页
数据挖掘实验指导3_第4页
数据挖掘实验指导3_第5页
资源描述:

《数据挖掘实验指导3》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、实验4:微软聚集■挖掘模型建立及应用1•实验目的1)学习使用Microsoft聚集创建OLAP数据挖掘模型。2)深入理解聚集的数据挖掘意义。2.实验软硬件环境1)安装SQLServer2000AnalysisServices的计算机系统。2)AnalysisServices中已经安装了FoodMart演示数据。3.实验说明数据挖掘对杳找和描述特定多维数据集小的隐藏模式非常有用。随着多维数据集小的数据迅速增长,手动查找信息变得非常困难。数据挖掘提供的算法允许口动模式查找及交互式分析。市场部想增加客户满意度和客户保有率。创办《每周赠券》杂志,将杂志送给客户群,以鼓励他们访问FoodM

2、art商店。市场部已有创建三个版本的《每周赠券》杂志的财政预算,市场部想将客户群划分为三个类别,根据三个组的特征,市场部可以选择赠券的类型,以便插入各个版本的《每周赠券》杂志。市场部还将能够知道哪一类客户应该接收哪一个版本的杂,忐O木实验将使用“Microsoft聚集”算法将客户群划分为三个类别。请将客户设置为要调查的维度(事例维度)。然后将StoreSales(商店销售)度量值设直为数据挖掘算法划分Customer(客户)维度所用信息。接下来,请选择想要在算法中表示各个客户类别特性的人口统计特征列表:婚姻状况、年收入、在家子女数、教育程度••…然后训练此模型,最终使其能够浏览受

3、训数据并从中分析三种客户类別。市场部将根据每个客户类別的人口统计加性,选择将要插入《每周赠券》杂,忐各个版本中的赠券列表。4.实验内容和步龙4.1聚集的建立1)•在AnalysisManager树窗格中展开“多维数据集”文件夹,右击“Sales”多维数据集,然后单击“新建挖掘模型”命令。2).在挖掘模型向导的“选择数据挖掘技术”步骤中,在“技术”框中单击“Microsoft聚集”。单击“下一步”按钮。3).在“选择事例”步骤中的“维度''框中,选择“Customer在“级别”框中,确保已经选择了“name”。单击“下一步”按钮。挖掘模型向导2d选择爭例爭例是挖掘模型的基本分析单

4、位。在OLAP数据中,毎个维度成员代表一个爭例。例如,在客戶信用应用程序中,爭例就是客户。谙选择一个维度及包含要分析的爭例集的级别。对于父子錐度,将以最低级别为爭例级别。下一步迥)>取消I帮助(旦)I錐度(0):

5、Customers级别(L):(NameJ4).在“选择训练数据”步聚中,在“Customer”维度中清除“Country”、“StateProvince”和“City”复选框,因为没有必耍使用汇总级别划分客户群。然后,在“Measures”维度中只选择“StoreSales”。单击“F—步”按钮。5).在最后一个步骤中,在“模型名称”框中输入uCustomersegm

6、entation^选择“保存,但现在不处理”。单击“完成”按钮。6).当前在OLAP挖掘模型编辑器屮。可以使用此编辑器编辑模型属性或浏览其结果。7)・在编辑器的左窗格的属性窗格中,在“ClusterCount”框中,用“3”代替“10”。8).保存所做更改。9).单击“工具”菜单上的“处理挖掘模型”命令。10).注意:处理数据挖掘模型可能会花费一些时间。11).出现“处理”窗口,显示正在处理模型。处理完成之后出现一则消息,说切“己成功完成处理”。单击“关闭”按钮。4.2如何读取包含在各个聚集(客户段)中的信息1).现在己回到OLAP挖掘模型编辑器。分段树显示于右窗格中。右窗格山四

7、个窗格组成:中间的“内容详情”窗格(1)显示焦点所在的分段树的部分。“内容选择区”窗格(2)显示树的完整视图。该窗格使您可以将焦点设置到树的其它部分。其它的两个窗格分别是“特性”窗格(3)(特性信息可以用“合计”选项卡以数值方式査看或者用“总方图”选项卡以图形方式查看)和与焦点所在节点相关联的“节点路径”区域(4)o2).在“内容详情”窗格中,在分段树区域中,颜色代表事例的密度(在此事例中为客户的密度)。颜色越深则节点中包含的事例就越多。单击“全部”节点。该节点为黑色,因为它代表100%的事例(客户)。3).单击XIuster1”。特性窗格显示一个下拉列表和一个网格。下拉列表可用

8、于选择特定的客户人口统计特征。网格显示以人口统计特征的各个值为基础对聚集中客户的重新分区。4)•对于“Cluster1”,请选择“节点特性集”框中的uCustomer.Name.MaritalStatus”,然后转到“特性”网格。网格显示“Cluster1”包括2878个事例,对于“婚姻状况”特征,事例分布如下:21.12%的客户已婚,其余78.88%单身。5).让我们从另一个角度查看这些相同的2878个事例。在“节点特性集”框中,选择uCustomer.Name.YearlyI

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。