《关联规则七章》ppt课件

《关联规则七章》ppt课件

ID:27129521

大小:713.01 KB

页数:35页

时间:2018-12-01

《关联规则七章》ppt课件_第1页
《关联规则七章》ppt课件_第2页
《关联规则七章》ppt课件_第3页
《关联规则七章》ppt课件_第4页
《关联规则七章》ppt课件_第5页
资源描述:

《《关联规则七章》ppt课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第7章关联规则7.1关联规则7.2关联规则的挖掘方法7.3算法与讨论7.4Apriori算法(操作实例)7.1关联规则-引言关联:是两个或多个变量取值之间存在的一类重要的可被发现的某种规律性关联可分为简单关联、时序关联、因果关联关联分析:目的是寻找给定数据记录集中数据项之间隐藏的关联关系,描述数据之间的密切度关联规则:是关联分析的常见结果,用于寻找在同一个事件中出现的不同项的相关性关联规则发现的主要对象是交易型数据库;关联规则是描述在一个交易中物品之间同时出现的规律的知识模式,更确切的说,关联规则是通过量化的数字描述物品A的

2、出现对物品B的出现有多大的影响7.1关联规则-例子购物篮分析-引发关联规则挖掘的例子问题:什么商品组或集合顾客多半会在一次购物中同时购买?购物篮分析:设全域为商店出售的商品的集合(即项目全集),一次购物(即事务)所购商品为项目全集的子集。若每种商品用一个布尔变量表示该商品的有无,则每个购物篮可用一个布尔向量表示。通过对布尔向量的分析,得到反映商品频繁关联或同时购买的购买模式,这些模式可用关联规则描述如:computerfinancial_management_software[support=2%,confidence=6

3、0%]support为支持度,confidence为可信度;该规则表示:在所分析的全部事务中,有2%的事务同时购买计算机和财务管理软件;在购买计算机的顾客中60%也购买财务管理软件7.1关联规则-概念-1关联(Associations)分析的目的是为了挖掘隐藏在数据间的相互关系,即对于给定的一组项目和一个记录集,通过对记录集的分析,得出项目集中的项目之间的相关性项目之间的相关性用关联规则来描述,关联规则反映了一组数据项之间的密切程度或关系形式化定义:令I={i1,i2,…,in}是项的集合,即项集,包含k个项的项集为k-项集

4、;事务T是I上的一个子集,集合TI,每个事务用唯一的标志TID来标识;D是全体事务的集合关联规则(语法):是形如A→B的蕴含式,其中AI,BI且AB=,A称为规则的条件,B称为规则的结果7.1关联规则-概念-2关联规则的支持度和可信度支持度是重要性的度量;可信度是准确度的度量规则A→B具有支持度S,表示S是D中事务包含AUB的百分比,即联合概率P(AUB),也可以表示为:support(A→B)=P(AUB)=(包含A和B的事务数/事务总数)×100%规则A→B具有可信度C,表示C是包含A项集的同时也包含B项集,即

5、条件概率P(B

6、A),也可以表示为:confidence(A→B)=P(B

7、A)=(包含A和B的事务数/包含A的事务数)×100%7.1关联规则-概念-3阈值:为了在事务数据库中找出有用的关联规则,需要确定两个阈值:最小支持度阈值min_sup和最小可信度阈值min_conf频繁项集:满足最小支持度min_sup的项集频繁项集中,任意子项集中各项出现的联合概率(即项集的支持频度sup(T))都大于最小支持度min_sup关联规则(语义):支持度和可信度均不小于给定最小支持度阈值和最小置信度阈值的规则,是有意义有价值的,即:A

8、→B,若满足:S(A→B)>min_sup,且C(A→B)>min_conf7.1关联规则-概念-4期望可信度:设事务集D中有e%的事务支持项集B,e%称为关联规则A→B的期望可信度(与A无关);描述了在没有任何条件影响时,项集B在所有事务中出现的概率,即P(B)作用度:是可信度与期望可信度的比值;描述项集A的出现对项集B的出现有多大影响,即概率P(B

9、A)/P(B)7.1关联规则-概念-小结表:各参数的含义及计算公式名称描述计算公式支持度事务中项目A和B同时出现的概率P(AUB)可信度出现项目A的事务中,B也出现的概率P(

10、B

11、A)期望可信度事务中出现项目B的概率P(B)作用度可信度与期望可信度的比值P(B

12、A)/P(B)7.2关联规则挖掘过程可以把关联规则挖掘划分为以下两个子问题/子过程:找出所有的频繁项集项集的支持频度vs.最小支持度阈值可以从1到k递推查找k-频繁项集;是过程的核心步骤,关键技术,实现较困难由频繁项集产生关联规则,即找出满足最小支持度和最小可信度的关联规则关联规则的可信度vs.最小可信度阈值相对较容易7.2关联规则挖掘过程-简例已知交易记录数据库D中有9条交易记录(事务):T1:A,B,ET2:B,DT3:B,CT4:A,

13、B,DT5:A,CT6:B,CT7:A,CT8:A,B,C,ET9:A,B,C设定最小支持度为20%,最小可信度为60%找到所有的频繁项集,有{A,B,C}、{A,B,E}及其全部子集;(还有哪些?)产生关联规则,举例有:A∧E→B(?,?)A→B(?,?)B∧E→A(?,?)A→C(?,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。