关联规则算法及并行化研究

关联规则算法及并行化研究

ID:45576907

大小:238.22 KB

页数:52页

时间:2019-11-15

关联规则算法及并行化研究_第1页
关联规则算法及并行化研究_第2页
关联规则算法及并行化研究_第3页
关联规则算法及并行化研究_第4页
关联规则算法及并行化研究_第5页
资源描述:

《关联规则算法及并行化研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、密级:分类号:TP391学校代码:10075学号:033773工学硕士学位论文关联规则算法及并行化研究学位申1请人:王涛指导教师:袁方教授学位类别:工学硕士学科专业:计算机应用技术授予单位:河北大学答辩日期:二oo六年六月CODE:10075U-DeC:ClassifiedIndex:TP391NO:033773ADissertationfortheDegreeofM.EngineeringResearchontheAssociationRuleAlgorithmandParallelizationW

2、angTaoProf.YuanFangMasterofEngineeringComputer&ApplicationHebeiUniversityJune,2006Candidate:Supervisor:AcademicDegreeAppliedfor:Specialty:University:DataofOralExamination:河北大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包

3、含其他人已经发表或撰写的研究成果,也不包含为获得河北大学或其他教育机构的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了致谢。作者签名:H期:年—刀LI学位论文使用授权声明本人完全了解河北大学右关保留、使用学位论文的规定,W:学校有权保留并向国家冇关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。学校可以公布论文的全部或部分内容,可以釆用影印、缩印或其他复制手段保存论文。本学位论文屈于1、保密□,在年月H解密后适用本授权声明。2、不保密口。

4、(请在以上相应方格内打)作者签名:H期:年月R导师签名:日期:年月EI摘要关联规则挖掘是数据挖掘领域的一个重要研究课题,它可以在海量的数据屮揭示某些特定的规律,来辅助决策者进行决策。关联规则挖掘在分析决策、Web日志分析、个性化信息推荐、市场调研等诸多方面发挥着重耍的作用。关联规则挖掘,主要包括两部分,一部分是频繁项集的挖掘,一部分是关联规则的生成。其中频繁项集的挖掘决定着关联规则的生成。通过挖掘频繁项集,可以从大量的事务集中发现各个项目之间的相关关系。对于频繁项集挖掘,Apriori算法和FP-Gr

5、owth算法是两个比较典型的算法。木文参考了有关压缩树的相关概念,提TTreeMatrix算法,将所冇事务压缩到一个压缩树屮,再利用矩阵的方式存储压缩的事务序列,进而利用堆栈进行有效的挖掘。在TreeMatrix算法的基础上,进行了一系列的优化改进,其中包括树的层层挖掘、频繁项集大小限制等对算法的效率起着比较关键作用的改进。实验表明TreeMatrix算法及改进的TreeMatrix算法能够有效地提高频繁项集的挖掘效率。本文还对TreeMatrix算法进行了并行化研究,实现了挖掘部分的并行化,实验表明

6、达到了初步的并行化效果。关键字数据挖掘关联规则挖掘频繁项集TreeMatrix算法并行处理AbstractTheDiscoveringAssociationRulesisanimportantresearchtopicindataminingdomain,whichmayfindcertainspecificrulesinthemagnanimousdata.Theassociationrulescanassistthepolicy-makertocarryonthedecision,whichpla

7、ysanimportantroleintheanalysisofstatcgy,theanalysisofweblog,thepersonalizationinfbnnationrecommendation,themarketinvestigationandsoon.InthealgorithmsresearchofDiscoveringAssociationRules,itmainlyincludestwoparts,onepartisdataminingofthefrequentitemsets,

8、andotherpartisthegenerationoftheassociationrule.Thedataminingoffrequentitemsetsdecidesthegenerationoftheassociationrule.Throughthedataminingoffrequentitemsets,wemayfindthecorrelationaldependencebetweeneachitemfromthemassivetransa

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。