简谈关联规则数据挖掘技术及其应用

简谈关联规则数据挖掘技术及其应用

ID:24401273

大小:50.50 KB

页数:4页

时间:2018-11-14

简谈关联规则数据挖掘技术及其应用_第1页
简谈关联规则数据挖掘技术及其应用_第2页
简谈关联规则数据挖掘技术及其应用_第3页
简谈关联规则数据挖掘技术及其应用_第4页
资源描述:

《简谈关联规则数据挖掘技术及其应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、简谈关联规则数据挖掘技术及其应用导读:此篇文章是规则和算法相关的论文标准格式字体,供需要写此方面相关本科和硕士以及专科生毕业论文的学子们鉴赏。关键词:关联规则数据挖掘Apriori算法应用关联规则的发现是数据挖掘中最成功和最重要的一项任务,的目标是发现数据集中有的频繁模式:目前进行的大部分研究工作集中开发有效的算法上,而对关联规则的理论基础工作的研究却很少.关联规则用于发现交易数据库中不商品项间的联系,这些规则找出顾客行为模式,购买了某一商品对购买其他商品的影响:然而,这样的规则以应用于商品货架设计,存货安排以及根据购买模式对用户进行分类.一、关联规则挖掘原理1.关联规则挖掘概述数据挖掘

2、(DaMining)是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,本篇简谈关联规则数据挖掘技术及其应用论文范文综合参考评定下度:经典选题提取隐含其中的、人们事先不知道的、但又是潜有用的信息和知识的过程,也称作知识发现(KnoinimumSupport)和最信任度(MinimumConfdence).3.关联规则的定义:假设I是项的集合.给定一个交易数据库,其中每个事务t是I的非空子集,即每一个交易都与一个唯一的标识符TID对应.关联规则是形XY的蕴涵式,其中且,X和Y分别称为关联规则的先导LHS和后继RHS.关联规则D中的支持度是D中事务包含的百分比,即概率:置信度是包含

3、X的事务中时包含Y的百分比,即条件概率.关联规则是有趣的,果满足最支持度阈值和最置信度阈值.这些阈值由用户或者专家设定4.关联规则挖掘的一般步骤给定一个事务数据库,关联规则挖掘的基本任务是首先通过用户指定最支持度和最置信度,挖掘出大型数据库中的强关联规则.分成两个步骤:1)挖掘频繁项集:通过用户给定的最支持度,找出有频繁项集,即支持度不于最支持度的有项集.2)生成关联规则:使用频繁项集生成置信度大于预先给定的最置信度阈值的关联规则.挖掘关联规则的整个性能主要是由第一步(挖掘频繁项集)决定的,以有效地计算频繁项集成了关联规则挖掘算法研究的重点.这篇原创出处:lunargin:0auto;f

4、ont-size:12px;color:#666666;">规则和算法论文标准格式字体iori算法原理Apriori算法是由美国学者R.Agrawal等1993年提出的一种从大规模商业数据中挖掘关联规则的有效方法,也是一种最有影响力的挖掘布关联规则频繁项集的算法,其通过对数据库D的多趟扫描来发现有的频繁项集.现经被广泛用于商业决策、社会科学、科学数据处理等种数据挖掘领域中.l。Apriori算法的基本原理Apriori是最有影响的挖掘布关联规则频繁项目集的经典算法.Apriori算法中,通过遍历数据库得到一项集Ll.果Ll非空,由Ll产生长度为2的候选项集合C2,然后对事务数据库中的每一

5、个事务t,求出tC2中的全部子集Ct,对于Ct中的每一个长度为2的候选项集c,令c的计数加l.当扫描事务数据库一遍后,筛选出候选项集合C2中有计数满足最支持度的项集组成了长度为2的频繁项集合.用以上步骤重复处理新得到的频繁项集合,直到没有频繁项集合产生.其中候选项集产生的过程被分为连接与剪技两个部分.采用这种方式,使得有的频繁项集既不会遗漏又不会重复.为提高频繁项集逐层产生的率,Apriori算法利用了两个重要的性质用于压缩搜索空间.性质1.k维数据项目集X是频繁项目集的必要条件是的有kl维子集均是频繁项目集.性质2.若k维项目集X中有J(kl)维子集不是频繁项集,则X不是频繁项集.2。

6、Apriori算法的核心思想该算法的核心思想是使用候选项集找频繁项集.采用两阶段挖掘的思想,且基于多次扫描事务数据库来执行的为了生成有频集.其核心思想简要描述下:

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。