关联规则基本技术研究

关联规则基本技术研究

ID:33193340

大小:3.28 MB

页数:81页

时间:2019-02-21

关联规则基本技术研究_第1页
关联规则基本技术研究_第2页
关联规则基本技术研究_第3页
关联规则基本技术研究_第4页
关联规则基本技术研究_第5页
资源描述:

《关联规则基本技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西安科技大学硕士学位论文关联规则基本技术研究姓名:郭运凯申请学位级别:硕士专业:计算机应用技术指导教师:杨君锐20090420论文题目:专业:硕士生:指导教师:关联规则基本技术研究计算机应用技术郭运凯杨君锐摘要(签名)室垦塾(签名)生老趁数据挖掘是指从大型数据库中发现潜在的、新颖的、有价值的、可用的及能被用户理解的模式和信息的过程。关联规则挖掘是数据挖掘的一个重要研究领域,主要是发现数据库中属性之间的关联关系。本文在广泛查阅国内外文献的基础上,针对关联规则算法的若于问题进行了深入地分析研究,论文的主要研究内容和成果如下:首先

2、,提出了基于排序FP.Tree(SortedFP.Tree,简称SFP.Tree)的最大频繁项目集挖掘算法SFP.Miner。在SFP.Miner算法中,通过两次扫描数据库将其中每个事务所包含的频繁项目压缩存储在SFP—Tree中。在挖掘过程中,充分利用SFP.Tree的特点,并采用合并子树和预剪枝策略在SFP.Tree上进行深度优先挖掘,而不需要扫描数据库,减少了算法在挖掘过程中使用的存储空间和计算时间。实验结果表明,该算法有较好的性能。其次,提出了基于完全合并SFP.Tree的最大频繁项目集更新挖掘算法UAMFI。该算法

3、基于完全合并SFP.Tree,直接在树上进行深度优先搜索,能够快速地进行最大频繁项目集的更新挖掘。实验测试和结果分析,该算法可以高效的更新最大频繁项目集。最后,针对多值属性关联规则挖掘问题,提出了基于高维聚类的多值属性关联规则挖掘算法DBSMiner。该算法借鉴ARCS思想,先将高维数据集的各维进行划分,然后将密度单元进行排序,并提出一种基于网格的高维聚类算法对划分后的数据进行聚类挖掘。理论分析和试验结果表明,DBSMiner算法具有较好的执行效率和精确度,能有效的进行多值属性关联规则的挖掘。关键词:数据挖掘;关联规则;最大

4、频繁项目集;排序频繁模式树;高维聚类研究类型:理论研究Subject:ResearchontheBasicTechnologyofAssociationRulesSpecialty:ComputerApplicationTechnologyName:GnoYunkaiInstructor:YangJunruiABSTRACT(Signature)(Signature)白伽孙如Dataminingmeansaprocessoffindingnontrivial,extractionofimplicit,perviousunkn

5、ownandpotentialusefulinformationfromdataindatabase.Associationruleminingasanimportantfieldofdataminingdiscoversinterestingrelationshipsamongattributesinthosedata.Bystudyingtheliteraturedomesticandabroad,weresearchsomebasicproblemsofassociationrulesminingalgorithms.

6、Themaincontextsareshowedasfollows:Firstly,amaximalfrequentitemsetminingalgorithmSFP-Miner,whichbasedonSortedFP-TreeWasproposed.TheSFP—MinerscannedDatabasetwiceandcompressstoredthefrequentitemsetinSFP-Tree.Byusingdepth—firststrategy,thealgorithmprunedthesearchingspa

7、cebypre—pruneandmergencestrategyanddiscoveredallthemaximalfrequentitemsetefficientlyanddidn’tneedtoSCantheDatabase.TheexperimentalresultindicatedthatSFP-Minerisanefficientalgorithm.Secondly,wepresentedanewupdatingalgorithm,UAMFI,forminingmaximalfrequentitemsetsfrom

8、transactiondatabasewhenminimumsupportWaschangedbycustomer.ThealgorithmadoptedanewdatastructureFMSFP—Tree(FullMergedSFP.Tree)whichstoredallthefreq

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。