数据挖掘2015最新精品课程完整课件(第6讲)---挖掘各种关联规则.ppt

数据挖掘2015最新精品课程完整课件(第6讲)---挖掘各种关联规则.ppt

ID:56477135

大小:1.04 MB

页数:21页

时间:2020-06-19

数据挖掘2015最新精品课程完整课件(第6讲)---挖掘各种关联规则.ppt_第1页
数据挖掘2015最新精品课程完整课件(第6讲)---挖掘各种关联规则.ppt_第2页
数据挖掘2015最新精品课程完整课件(第6讲)---挖掘各种关联规则.ppt_第3页
数据挖掘2015最新精品课程完整课件(第6讲)---挖掘各种关联规则.ppt_第4页
数据挖掘2015最新精品课程完整课件(第6讲)---挖掘各种关联规则.ppt_第5页
资源描述:

《数据挖掘2015最新精品课程完整课件(第6讲)---挖掘各种关联规则.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、挖掘各种关联规则内容多层关联规则多维关联规则约束性关联规则总结关联规则改进9/1/2021AA12关联规则史忠植3挖掘多种规则或规律多层(Multi-level),量化(quantitative)关联规则,相关(correlation)和因果(causality),比率(ratio)规则,序列(sequential)模式,浮现(emerging)模式,temporalassociations,局部周期(partialperiodicity)分类(classification),聚类(clustering),冰山立方体(icebergcubes),等等.多层关联规则项通常形成分层结构低层的

2、项通常有低支持度.基于维数和层级可对事务数据库编码利用共享的多级挖掘一致支持度computer[support=10%]Laptopcomputer[support=6%]Desktopcomputer[support=4%]Level1min_sup=5%Level2min_sup=5%Level1min_sup=5%Level2min_sup=3%递减支持度渐进的多层挖掘方法自顶向下,渐进加深的方法,在每层挖掘所有的频繁项集:首先挖掘高层频繁项:milk(15%),bread(10%)然后挖掘低层的“较弱”频繁项集:2%milk(5%),wheatbread(4%)跨层时不同的min

3、_support门限,算法不同:一致支持度若项的祖先非频繁,则丢掉该项,类似Apriori的优化策略递减支持度只检查那些祖先为频繁的或不可忽略的项多维关联规则多维关联规则概念单维规则:buys(X,“milk”)buys(X,“bread”)多维关联规则:2维or谓词维间关联规则(无重复谓词)age(X,”19-25”)occupation(X,“student”)buys(X,“coke”)混合维关联规则(重复谓词)age(X,”19-25”)buys(X,“popcorn”)buys(X,“coke”)分类属性:有限个可能值,值间无序—数据立方体方法量化属性:数值,值间隐

4、含顺序—离散化,聚类和梯度法量化关联规则挖掘的技巧根据量化值的处理方式进行分类,如{age,salary}基于预定义的概念分层进行静态离散化(数据立方体方法)基于数据分布的动态离散化(量化规则,e.g.,Agrawal&Srikant@SIGMOD96)聚类:基于距离的关联(e.g.,Yang&Miller@SIGMOD97)一维聚类然后关联偏差:(suchasAumannandLindell@KDD99)Sex=female=>Wage:mean=$7/hr(overallmean=$9)量化属性的静态离散化概念分层挖掘前离散化范围代替数值在关系数据库中,查找所有的k-阶谓词的频繁集需

5、要k次或k+1次表扫描数据立方体适合于挖掘n-维立方体对应的定点对应谓词从数据立方体挖掘速度更快(income)(age)()(buys)(age,income)(age,buys)(income,buys)(age,income,buys)挖掘量化关联规则动态离散化使挖掘规则的置信度和紧致度最大2-D量化关联规则:Aquan1Aquan2Acat以2-D网格对相邻关联规则聚类成更泛化的规则Exampleage(X,“34-35”)income(X,“30-50K”)buys(X,“highresolutionTV”)约束性关联规则基于约束的挖掘数据挖掘是交互的过程自动从数据库中

6、挖掘出所有的模式不现实用户的引导下完成,需要用好约束才有可能基于约束的挖掘用户提供约束,提示待发现的模式或规则形式可用的约束知识类型约束:分类和关联规则等etc.数据约束:SQL-like查询找出2008年10月1日卖出的球拍和球鞋维/层约束:和区域、价格、品牌、消费者类别相关.规则约束小额销售(price<$10)触发大额销售(sum>$200).兴趣度约束:强规则(min_support3%,min_confidence60%).规则约束两种类型规则约束规则的形式约束:元规则引导约束挖掘P(x,y)^Q(x,w)®takes(x,“databasesystems”).实例:age

7、(X,”30…39”)^income(X,”41k…60k”)=>buys(X,”office”)规则内容约束:基于规则约束引导的挖掘规则中变量的期望的集合/子集联系、变量的初始化和聚集函数sum(LHS)<100^min(LHS)>20^count(LHS)>3^sum(RHS)>10001-变量vs.2-变量约束1-变量:只在规则的单边形成约束.2-变量:在两边都形成约束sum(LHS)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。