数据挖掘实验(实验三-七)

数据挖掘实验(实验三-七)

ID:38700942

大小:1.54 MB

页数:23页

时间:2019-06-17

数据挖掘实验(实验三-七)_第1页
数据挖掘实验(实验三-七)_第2页
数据挖掘实验(实验三-七)_第3页
数据挖掘实验(实验三-七)_第4页
数据挖掘实验(实验三-七)_第5页
资源描述:

《数据挖掘实验(实验三-七)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、实验三关联规则1.实验目标•使用SSAS进行关联规则挖掘实验2.实验要求(1)按“实验内容”完成操作,并记录实验步骤;(2)回答“问题讨论”中的思考题,并写出本次实验的心得体会;(3)完成实验报告。3.实验内容生成市场篮方案。AdventureWorks的市场部希望改进公司的网站以促进越区销售。在更新网站之前,需要根据客户的在线购物篮中已有的其他产品创建一个可预测客户购买需求的数据挖掘模型。这些预测还有助于市场部将可能被集中购买的项统一放置在网站的一个位置上。通过实验,创建关联规则模型,可预测可能出现在购物篮中的其他项或客户想要放入购物篮的项。4.实验步骤(1

2、)创建市场篮挖掘模型结构1.在BusinessIntelligenceDevelopmentStudio的解决方案资源管理器中,右键单击“挖掘结构”,再选择“新建挖掘结构”。此时,系统将打开数据挖掘向导。2.在“欢迎使用数据挖掘向导”页上,单击“下一步”。3.在“选择定义方法”页上,确保已选中“从现有关系数据库或数据仓库”,再单击“下一步”。4.在“选择数据挖掘技术”页的“您要使用何种数据挖掘技术?”下,选中“Microsoft关联规则”,再单击“下一步”。“选择数据源视图”页随即显示。默认情况下,“可用数据源视图”下的AdventureWorksDW为选中状

3、态。5.单击“下一步”。1.在“指定表类型”页上,选中vAssocSeqOrders表旁的“事例”复选框,选中vAssocSeqLineItems表旁边的“嵌套”复选框,再单击“下一步”(注意先在视图中建立两个表之间的关联)。如下图所示视图的内容显示1.如下图设置输入输出列或多维如下1.“指定定型数据”页上,LineNumber旁边的“键”和ordernumber设为键。1.选中Model列旁边的“输入”和“可预测”复选框。单击“下一步”。2.在“指定列的内容和数据类型”页上,单击“下一步”。3.在“完成向导”页的“挖掘结构名称”中,键入Association

4、。4.在“挖掘模型名称”中,键入Association,再单击“完成”。(2)调整关联模型的参数和处理关联模型在处理上一个任务中与“关联”挖掘结构一起创建的初始挖掘模型之前,必须更改以下两个参数的默认值:Support(支持数)和Probability(概率,置信度)。Support定义规则被视为有效前必须存在的事例百分比。Probability定义关联被视为有效前必须存在的可能性。调整关联模型的参数步骤如下:1.打开数据挖掘设计器的“挖掘模型”选项卡。2.右键单击设计器网格中的“关联”列,然后选择“设置算法参数”。系统将打开“算法参数”对话框。3.在“算法参

5、数”对话框的“值”列中,设置以下参数:MINIMUM_PROBABILITY=0.1指定规则为True的最小概率。例如,如果将该值设置为0.5,则指定不生成概率低于50%的规则。MINIMUM_SUPPORT=100指定包含该项集的最小事例数,只有达到该数目,才能生成规则。如果将该值设置为小于1的数,则最小事例数将通过其在总事例数中所占的百分比来加以指定。如果将该值设置为大于1的整数,则指定最小事例数为必须包含该项集的事例绝对数。如果内存有限,算法可能会增大此参数的值。4.单击“确定”。处理关联模型步骤如下:1.在BusinessIntelligenceDev

6、elopmentStudio的“挖掘模型”菜单上,选择“处理挖掘结构和所有模型”。系统将打开“处理挖掘结构-关联”对话框。2.单击“运行”。系统将打开“处理进度”对话框,以显示有关模型处理的信息。模型处理可能需要一些时间,具体时间取决于您的计算机。1.处理完成之后,在“处理进度”和“处理挖掘结构-关联”对话框中,单击“关闭”。(3)浏览市场篮模型使用数据挖掘设计器的“挖掘模型查看器”选项卡中的Microsoft关联查看器浏览该模型。浏览模型时,可以轻松地查看可能同时出现的产品,并可浏览项之间的关系。还可以筛选出较弱的关联,并对新浮现的模式有一个总体的概念。Mi

7、crosoft关联查看器包含三个选项卡:“项集”、“规则”和“依赖关系网络”。“项集”选项卡“项集”选项卡显示与Microsoft关联算法发现的项集相关的三种重要信息:支持度(发生项集的事务的数量)、大小(项集中项的数量)以及项集的实际构成。根据算法参数的设置方式,算法可以生成大量的项集。使用“项集”选项卡顶部的控件,可以筛选查看器,使其仅显示包含指定的最小支持度和项集大小的项集。也可以使用“筛选项集”框来筛选查看器中显示的项集。例如,若要仅查看包含有关Mountain-200自行车信息的项集,可在“筛选项集”中输入Mountain-200。您将在查看器中看到

8、,只有包含“Mountain-200”

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。