浅论含负项目的关联规则挖掘算法研究

浅论含负项目的关联规则挖掘算法研究

ID:35140923

大小:2.18 MB

页数:51页

时间:2019-03-20

浅论含负项目的关联规则挖掘算法研究_第1页
浅论含负项目的关联规则挖掘算法研究_第2页
浅论含负项目的关联规则挖掘算法研究_第3页
浅论含负项目的关联规则挖掘算法研究_第4页
浅论含负项目的关联规则挖掘算法研究_第5页
资源描述:

《浅论含负项目的关联规则挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、含负项目的关联规则挖掘算法研究重庆大学硕士学位论文学生姓名:王灿指导教师:张玉芳副教授专业:计算机系统结构学科门类:工学重庆大学计算机学院二OO八年四月StudyonAlgorithmofMiningAssociationRuleswithNegativeItemsAThesisSubmittedtoChongqingUniversityinPartialFulfillmentoftheRequirementfortheDegreeofMasterofEngineeringbyWangCanSupervisor:AssociateProf.ZhangYufangMajor:ComputerSy

2、stemArchitectureCollegeofComputerScienceofChongqingUniversity,Chongqing,ChinaApril2008重庆大学硕士学位论文中文摘要摘要近年来,随着计算机技术的发展、数据管理技术的成功应用、企业内部信息化程度的不断提高,各个应用领域的数据库中都积累了海量的数据。利用数据挖掘技术能够从大规模的数据中获取正确的、有趣的、潜在有价值的知识。而关联规则挖掘则是其中一个重要的研究方法,具有重要的理论价值和广泛的应用前景。当前,传统的正关联规则的挖掘受到了相当的关注,对于包含负项目的关联规则却并未给予足够的重视。然而在很多领域中,只挖掘出

3、传统的关联规则往往是不够的,需要对数据项的否定项进行挖掘。因此有必要研究事物负属性之间的关联关系。现有的挖掘含负项目的关联规则算法为数不多,而且多是基于Apriori思想的迭代算法,需要对数据集进行多次扫描,同时生成大量的候选频繁项集。针对这些不足论文提出一种基于频繁模式树的频繁项集挖掘算法。算法借用FP-growth算法中频繁模式树这种压缩存储事务的数据结构,因此具有无需多次扫描数据库,不用生成大量候选项集的优点。除此之外,算法对频繁模式树中每个节点增加一个位串来存储该项目的前缀项目,以避免在模式扩展的时候频繁的遍历子树。实验表明,论文提出的算法比现有的同类挖掘算法具有更好的效率。另外,在含

4、负项目的关联规则挖掘中,由于负项目的引入使得频繁项集的搜索空间变得更加巨大,而同时挖掘出的负关联规则数量也随之增大。但其中很多规则对用户来说是不感兴趣的,而且可能包含一些冗余和错误的规则。因此在传统的―支持度——置信度——兴趣度‖评价标准之上,引入了最大支持度的概念,在生成频繁项集阶段就将没有意义的项集排除掉,以使得挖掘结果更有意义。实验结果表明,论文提出的改进算法是正确有效的。关键词:负项目,频繁项集,最大支持度I重庆大学硕士学位论文英文摘要ABSTRACTInrecentyears,withdevelopmentofcomputertechnology,datamanagementtech

5、nologywassuccessfullyapplied,andenterpriseinformationcontinuouslyimproves.Vastamountsofdataaccumulateinthedatabaseonvariousapplicationfields.Usingdataminingtechniquescanaccesstothecorrect,interestingandpotentiallyvaluableknowledgefromthelarge-scaledata.MiningAssociationRulesisoneofthesignificantrese

6、archmethods,andhaveimportanttheoreticalvalueandbroadapplicationprospects.Atpresent,theresearchfieldmainlyfocusesonthetraditionalpositiveassociationrules.Theresearchtothenegativeassociationruleshasnotbeenattracted.However,inmanyfields,onlyminingpositiveassociationrulesisnotenough,andit’sneedtominingt

7、hedenialofthedata.Itisthereforenecessarytostudytherelationsbetweennegativeattributes.Thereareonlyafewalgorithmofminingnegativeassociationrules,andmostofthemarebasedonAprioriideawhichneedtoscandatasets

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。