关联规则挖掘的相关问题研究

关联规则挖掘的相关问题研究

ID:33802111

大小:3.59 MB

页数:80页

时间:2019-03-01

关联规则挖掘的相关问题研究_第1页
关联规则挖掘的相关问题研究_第2页
关联规则挖掘的相关问题研究_第3页
关联规则挖掘的相关问题研究_第4页
关联规则挖掘的相关问题研究_第5页
资源描述:

《关联规则挖掘的相关问题研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西安科技大学硕士学位论文关联规则挖掘的相关问题研究姓名:张铁军申请学位级别:硕士专业:计算机应用技术指导教师:杨君锐20090420论文题目:专业:硕士生:指导教师:关联规则挖掘的相关问题研究计算机应用技术张铁军(签名)杨君锐(签名)摘要关联规则挖掘是数据挖掘领域中~个重要研究方向,而频繁模式挖掘又是关联规则、时序模式挖掘等应用中的关键技术和步骤。然而,由于挖掘频繁模式内在的计算复杂性,为了提高挖掘效率,业界相继提出了频繁闭合模式挖掘和最大频繁模式挖掘问题。在规模上,频繁闭合模式和最大频繁模式均小于频繁模式。

2、同时频繁闭合模式集可以唯一地确定频繁模式完全集以及它们的准确支持度,而最大频繁模式隐含了所有的频繁模式,并且在某些数据挖掘应用中仅需挖掘出最大频繁模式;另外,在实际挖掘应用中,由于事务数据库可能发生变化,而且用户还会调整最小支持度以满足新的需要,因此如何对挖掘结果进行更新是一个值得研究的问题;再有,针对关联规则新的度量标准一兴趣度的度量方法也是业界关心的一个热点问题。因此,对这些问题进行研究具有重要意义。本文主要研究了关联规则挖掘中的相关问题,主要包括以下内容:首先,提出了用于挖掘频繁闭合模式的FCI.Min

3、er算法,以及挖掘最大频繁模式的BFP.Miner算法。两个算法均利用改进的FP.Tree来压缩存储数据库中的事务,并充分利用该树的特点,使得在挖掘频繁闭合模式和最大频繁模式的过程中不需产生条件FP—Tree和候选模式,从而减少了挖掘过程中使用的存储空间和计算时间,实验结果表明,算法具有较好的性能。其次,提出了用于解决最小支持度和数据库都发生变化的综合更新挖掘最大频繁模式问题的IUMFPA算法。该算法利用完全FP.Tree并通过调整最大频繁模式进行快速最大频繁模式更新挖掘,实验测试和分析表明,该算法有较好的时

4、空效率。最后,针对当前基于支持度一置信度框架挖掘关联规则时所反映的不足,提出了一种能反映项目集之间相关性和稀有性的度量标准一兴趣度,通过其可用来发现数据库中支持度低,而置信度强和紧密性高的规则。通过实例分析说明了该度量标准在一些应用中的有效性和实用性。关键词:数据挖掘;关联规则;频繁模式;频繁闭合模式;最大频繁模式;综合更新挖掘;频繁模式树(FP.Tree);兴趣度研究类型:理论研究Subject:TheResearchontherelatedProblemsofAssociationRuleSpecialt

5、yNameMining:ComputerApplicationTechnologyZhangTiejanInstructor:YangJunrui(Signature)(Signature)ABSTRACTTheassociationruleminingisaveryimportantproblemindatamining.Theissueofminingfrequentpatternsplaysacrucialroleinassociationrulemining、sequentialpatternmini

6、ng,etc.Becauseofthetime·consuminginminingfrequentpatterns,miningfrequentclosedpatternsandminingmaximalfrequentpatternshavebeenproposedtoimprovetheminingefficiency.Thesetoffrequentclosedpatternsormaximalfrequentpatternsisordersofmagnitudesmallerthanthesetoff

7、requentpatterns.Thesetoffrequentclosedpatternsstillcontainsenoughinformationofthefrequentpatternsanditsaccuratesupport.Thesetofmaximalfrequentpatternscontainsallthesetofthefrequentpatternsandtherealeapplicationswherethesetofmaximalfrequentpatternsisadequate

8、.Insomeapplications,usersmayadjusttheminimumsupportwhiledatabasechanged,andhavetoupdatetheformerminingresults,SOitisworthofstudyinginthiscase.Miningtheinterestingrulesisanotherinterestingissue.Inall,it

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。