一种改进的LIPI数据挖掘算法的仿真分析.pdf

一种改进的LIPI数据挖掘算法的仿真分析.pdf

ID:54374373

大小:592.66 KB

页数:5页

时间:2020-05-01

一种改进的LIPI数据挖掘算法的仿真分析.pdf_第1页
一种改进的LIPI数据挖掘算法的仿真分析.pdf_第2页
一种改进的LIPI数据挖掘算法的仿真分析.pdf_第3页
一种改进的LIPI数据挖掘算法的仿真分析.pdf_第4页
一种改进的LIPI数据挖掘算法的仿真分析.pdf_第5页
资源描述:

《一种改进的LIPI数据挖掘算法的仿真分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第31卷第8期计算机仿真2014年8月文章编号:1006—9348(2014)08—0268—05一种改进的LIPI数据挖掘算法的仿真分析蔡坤,杨扬(I.河南大学计算机与信息工程学院,河南开封475000;2.河南大学软件学院,河南,开封475000)摘要:在传统LIPI数据挖掘算法中,需要反复扫描投影数据库寻找局部频繁项并重复构造大量重复投影,造成数据挖掘耗时,效率低下的不足。为了提高算法的计算速度,提出改进的LIPI数据挖掘算法。算法借助连接2一序列位置信息表(LI—PI)找到序列模式的下一项,完成K一1序列位置信息与2一序列位置信息的连接,实现序列模式放缩

2、式增长,得出K一序列与K一序列相应的位置信息数据,避免对投影数据库反复扫描;引入了BIDE算法的前后向剪枝策略,检查相同末项序列位置信息表进行前向剪枝,消除大量重复投影的构建,提高挖掘算法的效率。实验结果表明,改进后的算法能快速的寻找到局部频繁项,有效提高了数据挖掘的效率。关键词:放缩式增长;序列模式挖掘;位置信息;投影数据库;频繁前缀中图分类号:TP301.06文献标识码:BSimulationAnalysisofanImprovedLIPIDataMiningAlgorithmCAIKun.YANGYang(1.SchoolofComputerandInfo

3、rmationEngineeringHenanUniversity,KaifengHenan475000,China;2.SoftwareSchodofHenanUniversity,KaifengHenan475000,China)ABSTRACT:InthetraditionalLIPIdataminingalgorithm,itneedstoscanproj’ectiondatabaserepeatedly,tolookforlocalfrequentitems,andtorepeatedlyconstructalargenumberofrepeatpr0

4、jection,whichresultsintime—con—sumingandinefficiencyofdatamining.Tosolvethisproblem,thispaperpresentedanimprovedLIPIdataminingal-gorithm.Firstly,thenextitemofsequencemodeisfoundbymeansofconnection2~theserialpositioninformationtable(LIPI)inthealgorithm,tocompletetheconnectionofK一1sequ

5、encepositionand2sequencepositioninfor-marion,achievethescalingtypegrowthofsequentialpattern,andgettheK—sequenceanditscorrespondingposi—tioninformationdata,whichcanavoidtoscanprojec~ondatabaserepeatedly.Then,BIDEalgorithmisintroducedintotheforward—backwardpruningstrategy,andthesamelas

6、titemofthesequenceinformationtableischeckedfortheforwardpruningtoeliminatealargenumberofconstructionsofrepeatprojection,andimprovetheeficiencyofminingalgorithm.Theexperimentalresultsshowthattheimprovedalgorithmcanfindlocalfrequentitemsquicklyandim—provetheefficiencyofdataminingeffect

7、ively.KEYWORDS:Scalingtypegrowth;Sequentialpatternmining(SPM);Locationinformation;Projectiondatabase;Frequentprefix是成为数据挖掘的一个突出的研究方向,已在客户购买行为1引言模式预测、疾病诊断、网络入侵检测、购物信息预测、Web访序列模式挖掘是在一组有序的数据列组成的数据集合问模式预测等多个方面取得了良好效果。n序列模式的概中,对频繁出现的那些序列组合的挖掘⋯。与关联规则挖掘念最早是由Agrawal和Srikant提出的。不同,序列模式挖掘的目标都是

8、有序的。序列模式挖掘目前

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。