欢迎来到天天文库
浏览记录
ID:36781446
大小:251.67 KB
页数:6页
时间:2019-05-15
《广义关联规则及算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、广义关联规则及算法研究欧阳军$马稳$沈钧毅$史保怀!(西安交通大学计算机科学与技术系,西安J$""KL)(陕西省教育学院数学系,西安J$""M$)NO9&
2、"/0##(&-$*-()!1,"#$)/0,2(%-*’3#415$)261)78$9")7:’");1)<-7:’-=$(’1$->($R
3、9&8:2,3(-#+&-)X,8*W<-C&’*,3)I&*
4、"1,且在0中不存发现有用的关联规则。例如在商场事物库中,销售模式在原始在是.中数据项的祖先的数据项。事物集&中的规则."/0数据上可能不能显示规则,但在某些高层次上可能显示有价值由置信度*和支持度2加以约束。的知识。如图$所示,在低概念层次上,如%&’()*和+,,*-之间值得一提是在0中不存在.中数据项的祖先的原因是:很难发现购买规则,但统计销售信息发现."/购买01*2)&3的关联规则."/.,的置信度*"$""/,根据关联规则挖掘的约束顾客也买+,,*-,所以在归纳抽象或多层次上进行关联规则的语义,可推知本规则是冗余的。挖掘有着非常重要的现实
5、意义。现在挖掘关联规则已从单一概另外之所以称."/0为广义关联规则,是因为.和0中念层发展到多概念层,在概念层次上一层层往下,从一般到具含有的数据项来自分类%的任何层。体,所发现的关联规则其所提供的信息也更具体,显然这是一由于数据挖掘中规则主要是基于大样本的统计规律,故可个逐步深化的数据挖掘过程。用概率论的知识从理论上研究探讨数据挖掘,改进低效算法。;广义关联规则挖掘算法广义关联规则的挖掘分为三个子问题:($)找出事物数据库&中所有具有用户指定最小支持度图$多概念层的规则挖掘的项目集(<*)9-)*,=的一个非空子集)。具有最小支持度的项目集称为频繁
6、项目集(>3)?1)8*=*)9-)*),反之就称为非频繁项目在多级概念层次上的数据挖掘过程称为广义关联规则的集。挖掘。(!)利用频繁项目集生成所需要的广义关联规则。对于频繁项目集@+AB和@+,如果比率’,8CD-1EE,3(*@+AB)F-1EE,3*!广义关联规则的形式化描述(@+)大于9<8’,8C,就生成广义关联规则@+#AB。设!"4#$,#!,⋯,#$5是一个数据项集,类%(6&7,8,9:)是作(;)从所得到的广义关联规则集中修剪非兴趣规则。用在!上的一个有向无环图(&’(),%的一个边表示隶属关系,问题(!)和(;)较为容易和直观,
7、故关键集中在问题($)上。用%表示一个分类集。在%中有一条边从)到*,称)为*的;#$相关工作双亲,*为)的孩子()表示对*的抽象)。在%的传递闭包中有已提出的许多算法中,G@H3&2&I的@E3<,3<算法最有影响作者简介:欧阳军,博士研究生,研究方向:数据挖掘,数据仓库及智能数据库系统等。马稳,博士研究生,研究方向:网络及智能数据库系统。沈钧毅,博士生导师,研究方向:智能数据库系统理论,数据挖掘等。史保怀,副教授,研究方向,数据挖掘及智能算法。计算机工程与应用!""!#!"!"$的。大多数算法都是以$%&’(&’为核心,以其作为基本框架,引)#计
8、算出+"中具有最小支持度的候选集,将+"中不具有进新的优化技术,进行扩展。算法均基于引论)。最小支持度的候选
此文档下载收益归作者所有