欢迎来到天天文库
浏览记录
ID:58314293
大小:186.50 KB
页数:3页
时间:2020-09-06
《基于概念格的规则提取算法研究及改进_赵凯 (1).pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、科技通报第28卷第2期Vol.28No.22012年2月BULLETINOFSCIENCEANDTECHNOLOGYFeb.2012基于概念格的规则提取算法研究及改进赵凯(淄博职业学院,山东淄博255314)摘要:提出了一个基于概念格的规则算法的改进算法。该算法可以大大提高数据挖掘的效率,提高查找时的速度。关键词:数据挖掘;概念格;算法中图分类号:TP399文献标识码:A文章编号:1001-7119(2012)02-0123-03ConceptLatticebasedRuleExtractionAlgo
2、rithmResearchandImprovementZHAOKai(ZiboVocationalInstitute,Zibo255314,China)Abstract:Thispaperpresentsarulesbasedonconceptlatticealgorithmtoimprovethealgorithm,thisalgorithmcangreatlyimprovetheefficiencyofdatamining,improvethesearchspeed.Keywords:datamin
3、ing;conceptlattice1关联规则挖掘算法对每个规则的支持度和信任度不能很好地支持,只支持满足本身支持度和信任度的相关规则。关联规则挖掘就是从数据库中挖掘出所有的强关2.2算法的描述联规则和数据。它可以分为以下几个问题:S是一个规则集合,F=Xi是闭合集合S中的大部分(1)在事务数据库中找出所有的相关频繁数据项规则闭合子集中的集合。目集。即找出用户指定的最小关联频繁数据项,而且要MaYjmalOenerators(Y,S);不小于指定的项目集。Omax(Y)=ф;(2)在事务数据库找出的频繁
4、数据项目集,经过J=Y-Yj;//集合X中的新项目集一系列动作,产生相关的强关联规则。Forallj∈J//每一个子集项目作为最大生成器maxmaxO(Y)=O(Y)∪{j};2算法改进O1={j
5、j∈Y-J};//剩余的项目集t=1;WhjleOT≠ф2.1算法的提出FORALLO∈OT新的算法相对以前的规则产生集来说,大大减少UJFOYjFORALLYj∈S了规模,并且大大提高了相应的数据挖掘的效率。为了maxmaxO(Y)=O(Y)∪{O};和以前的传统规则的产生集相区别,我们把这个新的Ot=Ot
6、–O;产生集称为组规则产生集。它和传统的提取规则算法//做为下一轮的候选最大生成器相比,由于产生集的规模大大减少了,由此,用户可以A很好地理解相应的规则,更容易推导出其他的新规则,Ot+1={O’=j1…jtjt+1
7、1jt+1,EOj∈Ot,Oj=j1…jj-1jj+1…jt+1}t=t+1;避免了大量的对用户来说无用的新规则的产生,对于创建一个新的概念格,从中取出相应的规则。设定大型的数据库来说,也避免了产生大量的规则产生集。支持度的最小值为A,信任度的最小值为B。但是该算法相对传统规则集来说也有不
8、足,比如新的收稿日期:2011-10-26作者简介:赵凯(1981-),硕士,助教,研究方向:网络数据库。124科技通报第28卷通过取出的规则,创建一个规则的最小集合C。因为num(A2+A1)=num(A),所以说故A2==A1与步骤一:初始化C=0。根据获取的规则数计算求出C==minterion(An)-A1的支持度是一样的,但是信任度所需要的事务节点总数D,把事务节点总数D=n+1,并是不一样的。因此由A==minterion(Bn)+C且把事务节点数存储在创建的最小集合H中。可导出C==min
9、terion(An)-A1,用A2==A1和A2==步骤二:经过计算,求出H中所有的根节点和子节minterion(An)+C就可导出num(A2+A1)=num(A)。点的上级和下级节点中的指针数,然后求出最小指针通过上面的理论证明,同理可得,(A2<=Ai<=An(2<数Fmin和最大指针数Fmax。i10、推导出来相应的组节点规则。经过计算求出子节点D的外延指数,自定义为q。3.2实例描述根据子节点D的外延指数,直接求出相应的上级把信任度设置为40%,支持度设置为5,创建一个和下级节点的数量,然后存储在最小集合H中。根节点0#,自定义3组数据,例如:(1)4,6,8,2,4,9;(2)根据规则生成一个产生集合相应的节点K和Kn,0,5,3,6,8,4;(3)5,7,8,3,5,1。从第一组数据开始搜他们之间的支持度和信任度都设置为最小,放入集
10、推导出来相应的组节点规则。经过计算求出子节点D的外延指数,自定义为q。3.2实例描述根据子节点D的外延指数,直接求出相应的上级把信任度设置为40%,支持度设置为5,创建一个和下级节点的数量,然后存储在最小集合H中。根节点0#,自定义3组数据,例如:(1)4,6,8,2,4,9;(2)根据规则生成一个产生集合相应的节点K和Kn,0,5,3,6,8,4;(3)5,7,8,3,5,1。从第一组数据开始搜他们之间的支持度和信任度都设置为最小,放入集
此文档下载收益归作者所有