资源描述:
《基于多事务的关联规则增量更新》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、"!!!!!!!!"!·!"数!据!库!与!信息!处!理!·!"基于多事务的关联规则增量更新段琢华&蔡自兴!(&韶关学院计算机科学系,广东韶关<&!""")(!中南大学信息科学与工程学院,长沙#&""K:)LMC*2,:N8*9O68368*P&=:$G3C摘要在多次挖掘结果上进行增量更新可以显著地降低对原始交易数据库的访问,但一般都认为这是一种以空间换时间的方法。文章指出,只需要增加极少量的存储空间就可以存储同一交易数据库多个最小支持度下的所有频繁项目集,并给出相应的表示模型。在此基础上系统地研究了在
2、已有的多次挖掘结果上的增量更新问题。理论分析和实验结果都表明,该文的方法充分利用已有的多次挖掘结果,降低了算法的复杂度。关键词知识发现数据挖掘关联规则增量更新文章编号&""!MK::&M(!""#)!%M"!"!M"#文献标识码’中图分类号FQ&K!"#$%&%"’())*+,-(’."/0112#.(’.2"34)%15(1%-2"64)’.,)%7$(#(#’.2"184("9:42:4(;<(.9.=."/>(&071*)BC79B3J53C18B7)RG279G7,R6*3(8*9S92T7)D
3、2BU,R6*3(8*9,V8*9(N39(<&!""")(!RG633,3JA9J3)C*B239RG279G7*9NL9(2977)29(,579B)*,R38B6S92T7)D2BU,56*9(D6*#&""K:)0?1’$(#’:A9G)7C79B*,,U81N*B29(*DD3G2*B239)8,7DW*D7N39B+33)C3)7G,*DD7D3JJ)7X879B2B7CD7BDC*U)7N8G7B67G3DB3JDG*9929(B673)2(29*,N*B*W*D7)7C*)Y*W,U$Z
4、3+7T7),2B2DG39D2N7)7N*D*C7B63N3JD*T29(B2C7+2B6C3)7DB3)*(7D1*G7$AB2D18BJ3)+*)N29B62D1*17)B6*B*,,J)7X879B2B7CD7BD3JB673)2(29*,N*B*W*D729*D7)2*,3JC292C*,D8113)BDG*9W7DB3)729*B*W,7+2B6*,2BB,7*NN2B239*,DB3)*(7$’)71)7D79B*B239C3N7,2D(2T79$E*D7N39B62DC3N7,,B62D
5、1*17)DUDB7C*B2G*,,UN2DG8DD7DB671)3W,7C3J29G)7C79B*,81N*B29(39N2DG3T7)7N*DD3G2*B239)8,7D3JD7T7)*,C292C*,D8113)BD$F7DBDD63+B6*BB67*11)3*G6B*Y7DJ8,,*NT*9B*(73JB671)7T238D)7D8,BD*9N)7N8G7DB67G3C1,7[2BU3J29G)7C79B*,81N*B29(*,(3)2B6CD$@%*A2$-1:Y93+,7N(7N2DG3T7
6、)U,N*B*C2929(,*DD3G2*B239)8,7,29G)7C79B*,21N*B29(&引言以及记号,第:节提出多个最小支持度下频繁项目集的表示模关联规则数据挖掘是’()*+*,-&,!.等人首先提出的一个重要型,第#节深入研究在已有的多个挖掘结果基础上的增量更新的/00研究课题,其目的是从交易数据库中挖掘出有潜在价算法,第<节对文章方法的空间以及时间效率进行分析,第=值的关联规则。’1)23)2-&,!.是’()*+*,等提出的经典算法,’1)23)2节为文章的结论。要多次访问交易数据库。
7、由于交易数据库一般都很庞大,为了减少对交易数据库的访问,0$4$56789(-:.等人提出关联规则的!基本概念增量更新算法。此后许多学者对关联规则的增量更新算法进行!>?"&,"!,$$$,"#@是全部项目构成的集合,A的任意非空子集称了广泛的研究-#;%.。在多次挖掘结果上进行增量更新可以显著地为项目集(AB7CD7B);0E是A上的交易(F)*9D*GB239)数据库。每降低对原始交易数据库的访问,但一般认为这是一种以空间换一交易$是!的一个子集($!!)。关联规则就是形如%"&的时间的方法-%.。
8、蕴含式,其中%!!,&!!,且%#&’!。该文指出,只需要增加极少量的存储空间就可以存储同一交易数据库0E中包含项目集%的交易数称为项目集%交易数据库多个最小支持度下的所有频繁项目集,并给出相应的支持数,记为%$G389B。项目集%的支持度为D8113)(B%)>%$的表示模型。在此基础上系统地研究在已有的多次挖掘结果上G389BHI()*。的增量更新问题。理论分析和实验结果都表明,该文的方法最项目集%$&的支持度称为关联规则%"&的支持度