数据仓库与数据挖掘技术 第五章 关联规则.doc

数据仓库与数据挖掘技术 第五章 关联规则.doc

ID:55551854

大小:2.92 MB

页数:22页

时间:2020-05-16

数据仓库与数据挖掘技术 第五章 关联规则.doc_第1页
数据仓库与数据挖掘技术 第五章 关联规则.doc_第2页
数据仓库与数据挖掘技术 第五章 关联规则.doc_第3页
数据仓库与数据挖掘技术 第五章 关联规则.doc_第4页
数据仓库与数据挖掘技术 第五章 关联规则.doc_第5页
资源描述:

《数据仓库与数据挖掘技术 第五章 关联规则.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第5章关联规则方法5.1关联规则的概念和分类5.1.1关联规则的概念5.1.2关联规则的分类1.基于规则中处理的变量类别分类2.基于规则中数据的抽象层次分类3.基于规则中涉及的数据维数分类4.基于模式与规则之间的相互关系分类5.2Apriori算法5.2.1产生频繁项集1.求频繁1项集L12.求频繁k+1项集Lk+1(即执行apriori-gen(Lk))图5-1示例数据库5.2.2产生频繁项集的实例1.第1次迭代,产生频繁1-项集3.第3次迭代,产生频繁3-项集5.2.3从频繁项集产生关联规则5.3FP-Growth算法5.3.1FP-Growth算法计算过程图5-2示例数据库图

2、5-3FP-tree5.3.2FP-Growth算法示例图5-4I5的条件模式树5.4利用SQLServer2005进行关联规则挖掘1.数据准备图5-5客户基本情况表图5-6贷款余额表图5-7合并表数据图5-8合并产生的表2.实现挖掘任务图5-9启动MicrosoftVisualStudio图5-10新建AnalysisServices项目图5-11AnalysisServices项目信息图5-12新建数据源视图图5-13数据源视图向导图5-14选择数据源图5-15选择表和视图图5-16命名数据源视图图5-17数据源视图具体信息图5-18新建挖掘结构图5-19数据挖掘向导欢迎界面图

3、5-20选择创建挖掘结构所用的方法图5-21选择挖掘结构所用的数据挖掘技术图5-22选择数据源视图图5-23指定表类型图5-24指定列图5-25指定列内容和数据类型图5-26为挖掘结构命名图5-27挖掘模型图5-28设置算法参数图5-29参数设置图5-30启动部署图5-31显示部署进度图5-32处理挖掘结构和所有模型图5-33选择挖掘结构图5-34处理成功3.查看挖掘结果图5-35加载挖掘模型进度图5-36查看项集图5-37设定支持度和项集尺寸图5-38查看规则图5-39显示依赖关系图5-40查找感兴趣的结点图5-41“房地产开发”的关系网络图5-42选择事例表图5-43选择可预测

4、列图5-44显示提升图图5-45显示分类矩阵习题51.说明关联规则挖掘的目的和作用。2.简要说明在频繁模式发现技术中,产生候选项集和不产生候选项集两种技术各自的特点和优缺点。3.图5-1所示的数据库,如果分别设定最小支持度s=10%和s=40%,置信度c=70%,计算该示例数据库中的频繁项集和规则。4.根据图5-3所示的FP-tree,找出以I4,I3,I1,I2为后缀的频繁模式。5.根据图5-3所示的FP-tree,找出其中所有的关联规则及他们的置信度。6.练习使用SQLServer2005的关联规则挖掘模型。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。