欢迎来到天天文库
浏览记录
ID:33504486
大小:1.33 MB
页数:49页
时间:2019-02-26
《关联规则挖掘算法研究 (1)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、西南交通大学硕士学位论文关联规则挖掘算法研究姓名:陈凯申请学位级别:硕士专业:通信与信息系统指导教师:冯全源20050501西南交通大学硕士研究生学位论文第1页摘要数据挖掘就是从海量数据中提取知识,因此又被称为数据库中的知识发现,它是一个跨学科的新兴研究领域。关联规则分析是其中的一个重要分支,用'丁二发现存在于数据库中的项或属性间的有趣联系,这些联系是事先未知且隐藏的,即不能通过传统的数据库逻辑操作或统计的方法得出。因此关联规则挖掘不是基于数据自身的固有属性,而是基于数据项的同时出现特征。本文首先介绍了数据挖掘的基本概念、存在问题及发展方向。其次介绍了关联分析的基本概念、分类及一些
2、常见的算法思想,其中着重讨论了关联规则算法。关联规则描述了给定数据集中项与项间的有趣联系。目前对海量数据集关联规则的研究主要集中在生成频繁闭项集的挖掘算法上。经典的频繁闭项集挖掘算法CLOSET+根据不同的数据集结构特征,选择自下而上投影FP—tree策略或自上而下伪投影FP.tree策略生成候选频繁闭项集,然后再检测候选项集,筛选出频繁闭项集,计算的成本较高。本文提出了一种基于栈结构的FP.tree挖掘算法S—growth,其仅需构造一棵全局FP.tree,此后利用压栈与出栈过程实现对FP—tree的挖掘,挖掘过程中无需构造条件FP.tree,也不需引入递归策略遍历FP—tree
3、,而且在挖掘过程中可以直接得到完备且非冗余的频繁闭项集。关键词:数据挖掘:关联规则;频繁项集;频繁闭项集;栈西南交通大学硕士研究生学位论文第1I页AbstractDataMiningdistillsknowledgefromamassofdata.So.itiSalsocalledKnowledgeDiscoverfromDatabase.Itisanewresearchareainvolvingseveralbranchsoflearningandcontainingmanydomains.Associationruleisoneofthemostimportantdomains
4、amongthem,whichfindstheinterestingrelationsbetweeniternsorattributesofdatabase.Theserelationsareunknownandhide,i.e.itcannotbegottenwithlogicoperationsorstatisticmethodsoftraditionaldatabaseoperationtechniques.So,miningassociationruledonotbaseonself-attributesbutonco—appearancecharacteramongite
5、msofdatabase.Atthebeginthispaperfirstlyintroducessomebasicprincipaltheories,directionsofdevelopmentandproblemsinthefaceof.Andthen,thispaperpresentstheconceptions,classesandgeneralthoughtsofthealgorithmsaboutassociationrule.Amongthose,someassociationrulealgorithmsal'ediscusseddeeply.Theinterest
6、ingrelationsamongitemsofdatasetal'ereleasedbyassociationrule.Currentresearchinterestingintheassociationrulefocusesonthealgorithmaboutminingfrequemcloseditemsets.Basedonthecharacterofdifferentdatasetstructure,theclassicalgorithmaboutminingfrequentcloseditemsetsCLOSET+needtoadoptbottom-upphysica
7、ltree—projectionortop+downpseudotree—projectionstrategytogetcandidatefrequentcloseditemsets,andthenchecksitforobtainingfrequentcloseditemsets.So,thecostishi曲.ThispaperpresentsanovelminingfrequentcloseditemsetsalgorithmS-growthtomineFP-t
此文档下载收益归作者所有