欢迎来到天天文库
浏览记录
ID:33193340
大小:3.28 MB
页数:81页
时间:2019-02-21
《关联规则基本技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、西安科技大学硕士学位论文关联规则基本技术研究姓名:郭运凯申请学位级别:硕士专业:计算机应用技术指导教师:杨君锐20090420论文题目:专业:硕士生:指导教师:关联规则基本技术研究计算机应用技术郭运凯杨君锐摘要(签名)室垦塾(签名)生老趁数据挖掘是指从大型数据库中发现潜在的、新颖的、有价值的、可用的及能被用户理解的模式和信息的过程。关联规则挖掘是数据挖掘的一个重要研究领域,主要是发现数据库中属性之间的关联关系。本文在广泛查阅国内外文献的基础上,针对关联规则算法的若于问题进行了深入地分析研究,论文的主要研究内容和成果如下:首先
2、,提出了基于排序FP.Tree(SortedFP.Tree,简称SFP.Tree)的最大频繁项目集挖掘算法SFP.Miner。在SFP.Miner算法中,通过两次扫描数据库将其中每个事务所包含的频繁项目压缩存储在SFP—Tree中。在挖掘过程中,充分利用SFP.Tree的特点,并采用合并子树和预剪枝策略在SFP.Tree上进行深度优先挖掘,而不需要扫描数据库,减少了算法在挖掘过程中使用的存储空间和计算时间。实验结果表明,该算法有较好的性能。其次,提出了基于完全合并SFP.Tree的最大频繁项目集更新挖掘算法UAMFI。该算法
3、基于完全合并SFP.Tree,直接在树上进行深度优先搜索,能够快速地进行最大频繁项目集的更新挖掘。实验测试和结果分析,该算法可以高效的更新最大频繁项目集。最后,针对多值属性关联规则挖掘问题,提出了基于高维聚类的多值属性关联规则挖掘算法DBSMiner。该算法借鉴ARCS思想,先将高维数据集的各维进行划分,然后将密度单元进行排序,并提出一种基于网格的高维聚类算法对划分后的数据进行聚类挖掘。理论分析和试验结果表明,DBSMiner算法具有较好的执行效率和精确度,能有效的进行多值属性关联规则的挖掘。关键词:数据挖掘;关联规则;最大
4、频繁项目集;排序频繁模式树;高维聚类研究类型:理论研究Subject:ResearchontheBasicTechnologyofAssociationRulesSpecialty:ComputerApplicationTechnologyName:GnoYunkaiInstructor:YangJunruiABSTRACT(Signature)(Signature)白伽孙如Dataminingmeansaprocessoffindingnontrivial,extractionofimplicit,perviousunkn
5、ownandpotentialusefulinformationfromdataindatabase.Associationruleminingasanimportantfieldofdataminingdiscoversinterestingrelationshipsamongattributesinthosedata.Bystudyingtheliteraturedomesticandabroad,weresearchsomebasicproblemsofassociationrulesminingalgorithms.
6、Themaincontextsareshowedasfollows:Firstly,amaximalfrequentitemsetminingalgorithmSFP-Miner,whichbasedonSortedFP-TreeWasproposed.TheSFP—MinerscannedDatabasetwiceandcompressstoredthefrequentitemsetinSFP-Tree.Byusingdepth—firststrategy,thealgorithmprunedthesearchingspa
7、cebypre—pruneandmergencestrategyanddiscoveredallthemaximalfrequentitemsetefficientlyanddidn’tneedtoSCantheDatabase.TheexperimentalresultindicatedthatSFP-Minerisanefficientalgorithm.Secondly,wepresentedanewupdatingalgorithm,UAMFI,forminingmaximalfrequentitemsetsfrom
8、transactiondatabasewhenminimumsupportWaschangedbycustomer.ThealgorithmadoptedanewdatastructureFMSFP—Tree(FullMergedSFP.Tree)whichstoredallthefreq
此文档下载收益归作者所有