第五章_____关联规则挖掘.ppt

第五章_____关联规则挖掘.ppt

ID:60741323

大小:892.50 KB

页数:95页

时间:2020-02-02

第五章_____关联规则挖掘.ppt_第1页
第五章_____关联规则挖掘.ppt_第2页
第五章_____关联规则挖掘.ppt_第3页
第五章_____关联规则挖掘.ppt_第4页
第五章_____关联规则挖掘.ppt_第5页
资源描述:

《第五章_____关联规则挖掘.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第五章关联挖掘5.1概述一.关联规则挖掘:在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性、或因果结构。关联规则与传统的分类规则的区别:在某条规则中以前提条件出现的属性可以出现在第二条规则的结论中。传统的分类规则通常将规则的结果限定为一个单一的属性值,关联规则生成器允许其结果包含一个或多个属性值。举例:规则形式:“Head®Body[support,confidence]”.buys(x,“diapers”)®buys(x,“beers”)[0.5%,60%]major(x,“CS”)^takes(x,

2、“DB”)®grade(x,“A”)[1%,75%]应用:顾客购物分析、目录设计、商品广告邮寄分析、追加销售、商品货架设计、仓储规划、网络故障分析以及根据购买模式对用户进行分类给定:(1)交易数据库(2)每笔交易是:一个项目列表(消费者一次购买活动中购买的商品)查找:所有描述一个项目集合与其他项目集合相关性的规则应用*护理用品(商店应该怎样提高护理用品的销售?)家用电器*(其他商品的库存有什么影响?)规则度量:支持度与可信度查找所有的规则X&YZ具有最小支持度和可信度支持度s:一次交易中包含{X、Y、Z}的可能性可信度c,包含{X、Y}的交易

3、中也包含Z的条件概率设最小支持度为50%,最小可信度为50%,则可得到AC(50%,66.6%)CA(50%,100%)买尿布的客户二者都买的客户买啤酒的客户二、关联规则挖掘分类1、根据规则中所处理的值类型划分:如果规则考虑的关联是项的在与不在,则它是布尔关联规则(Booleanassociationrule)。例如,规则Buys(X,”computer”)Buys(X,”financial_management_software”)[support=2%,confidence=60%][5.1]是由购物篮分析得到的布尔关联规则。如果规则描述

4、的是量化的项或属性之间的关联,则它是量化关联规则(quantitativeassociationrule)。如:age(X,“30...39”)income(X,“42K...48K”)buys(X,“computer”)(5.2)注意,量化属性age和income已离散化。2、根据规则中涉及的数据维划分:如果关联规则中的项或属性每个只涉及一个维,则它是单维关联规则(5.1)是单维关联规则,因为它只涉及一个维buys。如果规则涉及两个或多个维,则它是多维关联规则,(5.2)是一个多维关联规则,因为它涉及三个维age,,income和buys。a

5、ge(X,“30...39”)income(X,“42K...48K”)buys(X,“car”)3、根据规则集所涉及的抽象层划分:有些挖掘关联规则的方法可以在不同的抽象层发现规则。例如,假定挖掘的关联规则集包含下面规则:age(X,“30...39”)buys(X,”notebook_computer”)age(X,“30...39”)buys(X,”computer”),(5.3)购买的商品涉及不同的抽象层,所挖掘的规则称为-------多层关联规则。反之,如果在给定的规则集中,规则不涉及不同抽象层的项或属性,则该集合包含单层关联规则5

6、.1三.购物分析作为商家主管,想更加了解顾客的购物习惯。尤其希望了解在一次购物过程中,那些商品会在一起被购买,这就需要进行市场货物分析,即对顾客在商场购物交易记录数据进行分析。所分析的结果可帮助商家制定有效的营销策略如果把商店中所有销售商品设为一个集合,则每种商品(Item)可看成一个布尔变量,表示该商品是否被购买。每次购物可用一个布尔向量表示。这样就可以分析布尔向量,得到反映商品频繁关联或同时购买的购买模式。这些模式可以用关联规则的形式表示。例如,购买计算机也趋向于同时购买财务管理软件可以用以下关联规则表示:Buys(X,”computer”)

7、Buys(X,”financial_management_software”)[support=2%,confidence=60%][5.1]规则的支持度和置信度是两个规则兴趣度度量,分别反映发现规则的有用性和确定性。如果关联规则满足最小支持度阈值和最小置信度阈值,则该关联规则被认为是有趣的。另外有趣的模式:(1)规则显示出某个商品的销售额上升,而销售额的上升是与一个或多个其它商品关联的结果。可利用这个信息来促销因相互关联而销售额增加的商品(2)规则显示出某个关联的置信度低于所期望的值--------关联规则列出的商品在争夺同一市场典型的关联规则算

8、法是R.Agrawal等1994年提出的Apriori算法。Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。