欢迎来到天天文库
浏览记录
ID:54374373
大小:592.66 KB
页数:5页
时间:2020-05-01
《一种改进的LIPI数据挖掘算法的仿真分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第31卷第8期计算机仿真2014年8月文章编号:1006—9348(2014)08—0268—05一种改进的LIPI数据挖掘算法的仿真分析蔡坤,杨扬(I.河南大学计算机与信息工程学院,河南开封475000;2.河南大学软件学院,河南,开封475000)摘要:在传统LIPI数据挖掘算法中,需要反复扫描投影数据库寻找局部频繁项并重复构造大量重复投影,造成数据挖掘耗时,效率低下的不足。为了提高算法的计算速度,提出改进的LIPI数据挖掘算法。算法借助连接2一序列位置信息表(LI—PI)找到序列模式的下一项,完成K一1序列位置信息与2一序列位置信息的连接,实现序列模式放缩
2、式增长,得出K一序列与K一序列相应的位置信息数据,避免对投影数据库反复扫描;引入了BIDE算法的前后向剪枝策略,检查相同末项序列位置信息表进行前向剪枝,消除大量重复投影的构建,提高挖掘算法的效率。实验结果表明,改进后的算法能快速的寻找到局部频繁项,有效提高了数据挖掘的效率。关键词:放缩式增长;序列模式挖掘;位置信息;投影数据库;频繁前缀中图分类号:TP301.06文献标识码:BSimulationAnalysisofanImprovedLIPIDataMiningAlgorithmCAIKun.YANGYang(1.SchoolofComputerandInfo
3、rmationEngineeringHenanUniversity,KaifengHenan475000,China;2.SoftwareSchodofHenanUniversity,KaifengHenan475000,China)ABSTRACT:InthetraditionalLIPIdataminingalgorithm,itneedstoscanproj’ectiondatabaserepeatedly,tolookforlocalfrequentitems,andtorepeatedlyconstructalargenumberofrepeatpr0
4、jection,whichresultsintime—con—sumingandinefficiencyofdatamining.Tosolvethisproblem,thispaperpresentedanimprovedLIPIdataminingal-gorithm.Firstly,thenextitemofsequencemodeisfoundbymeansofconnection2~theserialpositioninformationtable(LIPI)inthealgorithm,tocompletetheconnectionofK一1sequ
5、encepositionand2sequencepositioninfor-marion,achievethescalingtypegrowthofsequentialpattern,andgettheK—sequenceanditscorrespondingposi—tioninformationdata,whichcanavoidtoscanprojec~ondatabaserepeatedly.Then,BIDEalgorithmisintroducedintotheforward—backwardpruningstrategy,andthesamelas
6、titemofthesequenceinformationtableischeckedfortheforwardpruningtoeliminatealargenumberofconstructionsofrepeatprojection,andimprovetheeficiencyofminingalgorithm.Theexperimentalresultsshowthattheimprovedalgorithmcanfindlocalfrequentitemsquicklyandim—provetheefficiencyofdataminingeffect
7、ively.KEYWORDS:Scalingtypegrowth;Sequentialpatternmining(SPM);Locationinformation;Projectiondatabase;Frequentprefix是成为数据挖掘的一个突出的研究方向,已在客户购买行为1引言模式预测、疾病诊断、网络入侵检测、购物信息预测、Web访序列模式挖掘是在一组有序的数据列组成的数据集合问模式预测等多个方面取得了良好效果。n序列模式的概中,对频繁出现的那些序列组合的挖掘⋯。与关联规则挖掘念最早是由Agrawal和Srikant提出的。不同,序列模式挖掘的目标都是
8、有序的。序列模式挖掘目前
此文档下载收益归作者所有