含负项的关联规则挖掘研究综述

含负项的关联规则挖掘研究综述

ID:34244225

大小:62.58 KB

页数:12页

时间:2019-03-04

含负项的关联规则挖掘研究综述_第1页
含负项的关联规则挖掘研究综述_第2页
含负项的关联规则挖掘研究综述_第3页
含负项的关联规则挖掘研究综述_第4页
含负项的关联规则挖掘研究综述_第5页
资源描述:

《含负项的关联规则挖掘研究综述》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、含负项的关联规则挖掘研究综述•,年月四川师范大学学报自然科学版・・・第卷第期含负项的关联规则挖掘研究综述冯山・游晋孥•四川师范大学数学与软件科学学院,四川成都;•晋中师范高等专科学校数学系,山西晋中摘要:关联规则挖掘是数据挖掘研究的一个重要领域,传统的关联规则仅反映了正项之间的关联关系,无法反映出数据Z间隐藏的负关联关系•从以下方面对含负项的关联规则挖掘进行了综述:引入负项的原因,包含正、负项的关联规则概念及相关术语,最新的含负项关联规则研究情况,经典算法的讨论•最后,展望了含负项关联规则领域未来的研究方向.关键词:一般化

2、关联规则;负关联规则;负项口;数据挖掘中图分类号:文献标志码:文章编号:?一一:・/・・?・・・关联规则是数据挖掘研究的重要课题之一,其感兴趣的.为避免混淆,我们将这种关系,即形如目的是发现大量数据之间有趣的联系?•自从•、,及,的关联规则称为负关联规则•其中,和】,是出现在事务中的项目的集合,出现在等提出关联规则的挖掘问题以来,许多事务中的项目称为正项目简称正项,而和学者对此进行了大量的研究•传统的关联规则是不出现在事务中的项目的集合,对应的项目称为描述的是事务库中岀现的事务之间的蕴涵关系,即负项目简称负项•把规则的前件

3、或后件屮既包含形如的表达式•其中,和是出现在事务数正项又包含负项的形如,的关联规则据库中的事务,它们是构成事务的项目的集合,分称为一般化关联规则.别称为规则的前件和后件•显然,关联规则所反映目前,不同的学者从不同的角度对包含负项的的蕴含关系在现实生活中可以用来指导人们进行关联规则进行了研究,指出了此类关联规则研究的某种决策•例如,对商店的顾客事务零售数据进行重要性,但研究思路、方法和内容差异各有侧重,研分析时,一个可能的规则是:顾客购买计算机的同究的结果往往也只能适应特定情境•为此,本文对时也会购买杀毒软件•它可以帮助商家

4、完成商品的现有的含负项的关联规则挖掘算法的各类研究成组合销售规划或进行售后数据分析.果进行了分析和归类,对其中的一些经典算法进行],形式的规则称为正关联规则•在实际应了讨论,在此基础上提出了该领域在未来的研究中用屮,我们会发现还存在除此以外的有价值的规则需要解决的几个主要问题.形式,它们反映了完全不同的决策问题.问题顾客购买了某些商品,是不是一定不基本概念购买某些其他商品.问题顾客不购买某些商品,是不是一定购假设任务相关的事务数据库的项集9买某些其他商品.,,,,是任务相关的事务数据库,问题顾客不购买某些商品,是不是一定不

5、,为的第•『个事务,则,,购买某些其他商品・,,是项集,中的项所构成的子项集,即面对这样的决策问题,用传统的规则挖掘方法每一个;有唯一的标识,记作・无法得到其对应的蕴含关系或规则,用传统的规则假设是项集,的子集,是某个事务,如果形式也无法回答或表述它们,而它们往往是我们所,那么称事务包含收稿丹期:??基金项目:四川省教育厅自然科学重点基金资助项目作者简介:冯山一,男,副教授,主要从事智能软件平台开发和数据挖掘的研究第期冯山,等:含负项的关联规则挖掘研究综述如果某项G,称该项为正项•与此对应,如支持度计数为•,那么的支持度计

6、数为・果项厶,称该项为负项,记为・?・,其中,表示数据库中假设是某个事务,对于项W,,如果隹事务的总个数・WW凡,则由负项,构成的集合称为负项集,记负关联规则的支持度和置信度的计算为已,厶,WW•显然,负项集负关联规则是一般化关联规则的特殊情形.由是指不出现在事务屮的项的集合,它不是事务于它的特殊性,其支持度和置信度可以利用正频繁中的项集的补集,只表示不岀现在事务中的项项集的支持度和置信度得到.目的子集•相应地,正项的集合称为正项集,类似地定理设非空项集,】,,,且,有:记为,,厶w,WW•—;定义如果,,,,口,称一;蕴

7、涵式为正关联规则.一;定义如果,,,,,,,】,,且、、一一、中的任意两个的交集为空,称蕴涵式、,及为负关联规则或含负项的关联规则.可见,涉及负项的关联规则的支持度的计算可定义如果、,、、都包含于,且和以由正项集的支持度获得.由定理及置信度的定不同时为空,,与雪不同时为空,、、、中任意义,很容易得到负关联规则的置信度计算方法.两个的交集为空,则蕴涵式称为一般推论设非空项集,,且,有:化关联规则•即对每一条支持该规则的事务,只。兰巳一有、,同时出现在事务中,而、不出现在事务屮•可见,负关联规则和正关联规则是一般化;关联规则的

8、特殊情形•若无特别说明,后面的讨论啦;中均表示一般化关联规则.给定一个事务集,关联规则挖掘就是产生支持度和置信度分别满足用户给定的最小支持度:坡.计数和最小置信度的规则•它首先从数据库事务集'、一。合中发现所有满足用户给定的最小支持度的频繁推论设非空项集,,,,M项集,然后在频繁项集的基础上生成所有满足

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。