欢迎来到天天文库
浏览记录
ID:33801463
大小:1.40 MB
页数:56页
时间:2019-03-01
《关联规则增量式更新算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、哈尔滨工程大学硕士学位论文关联规则增量式更新算法的研究姓名:王绍锋申请学位级别:硕士专业:计算机应用技术指导教师:张健沛20070301哈尔滨一[程大学硕士学位论文摘要关联规则是数据挖掘研究方向的一个关键技术。自Agrawai引入关联规则的概念并提出第一个关联规则算法Apriori算法以来,由于其具有巨大的商业应用价值和理论研究价值,诸多研究人员对关联规则挖掘算法进行了广泛的研究并提出了许多新的关联规则挖掘算法。这些关联规则挖掘算法都是在Agrawai提出的Apriori算法的基础上不断优化、改进,从而使挖掘的效率不断提高。这些经过改进和优
2、化的关联规则挖掘算法虽然各具特点,但同时也存在着许多不足。除此之外,在关联规则挖掘中还普遍存在两个问题:当挖掘的数据不断更新时,如何高效即时地获得所需要的结果?用户在挖掘规则的过程中需要预先设定一些挖掘参数来获取想要的规则,但这些参数设置往往要通过多次的调整才能达到预期的目的,那么如何在多次调整中进行高效的计算呢?关联规则增量式更新算法正是为了解决以上的问题而提出的。本文针对第一个问题,通过对一些关联规则增量式更新算法的研究,并针对FLIP算法需要多次扫描原数据库、NEWFUP算法没有考虑后备频繁项目集的生成代价的缺点,提出了在数据增加情况
3、下,基于后备频繁项目集的增量式更新算法UMMFUP算法。并通过实验验证了UMMFUP算法是有效的。同时提出了在数据删除情况下基于后备频繁项目集的UMMFUF2算法。并通过试验验证了UMMFUP2算法在少量删除数据的情况下,后备频繁项目集的利用效率会更高,算法会更有效。关键词:数据挖掘;关联规则;增量式更新;后备频繁项目集哈尔滨1二程大学硕十学位论文AbstractAssociationruleshavebeen∞gardedasavery蛳rtanttopicofdataminingmseareh.Sin∞Agrawalproposedth
4、econe.,eptof鹪soeiationnll鹤andthefirst蠲soeiationnll嚣峨algorithm,thatisApri耐,alotofre.archershavebroadlyresearehedonApriorialgorithmbecauseithas嗍me∞ial、枷uesand岫retievalues.Onthisbasis,manyn唧鹤咖枷∞rulesmil血g蛔fithms雠proposedbyoUtmaizingandinlpmVingApfiofialgofithmcc咀血啪峭lyinordert
5、oimpovetheeffiei∞eyofdatamining.Whereasthee‰eiesofthesealgofithmsa∞enhanced,也aeremainsomedefici锄ci鼯iIltlle∞algofithro_s.Inaddmomnma坞twoprcv如tproblemsinassoci舶nnll船mining:Howtoacquirethe如siltdl℃sIIltse币ciennyandimmediateIywhentheminingdamuNatesc0璐ta
6、my?Usually,甜snecessaryto
7、set涨parametersforcllslomcrsbcf0豫mining,andmostlytheyhavet0adjustt11esepa姗ete培manyHm髓toaequirethesatisfaetoryrules,也l膪howt0caleulalee蚯ciennyduringtherepetitiomproems?mmainpurposeforproposingmemerem训ul,dati赡algofithmsistosolVethe∞problems.TosolVethefirstproblem,basedOnsome坞9
8、黜h船abomthemerem酬UlXlatiIlgalgofithras,wimregardtothedetiei∞eiesthatFUPalgorithmneedscandatabasemanytimesandNEWFUPalgorithmdoes’t黜iderthecostofproducingthemothballfrequentitemsets,anewmerementalupdatingalgofithm懈iIlgmothballfl℃quentitemsets啊恤chi3caJledUMMFUPisproposedtobeus
9、ediIIthec救ofaddingnewdatatothedatabase.Thefeasibili锣andeffiei∞eyofUMMFUPalgorithmisdemons
此文档下载收益归作者所有