不确定数据topk高期望权香项集挖掘研究

不确定数据topk高期望权香项集挖掘研究

ID:33481586

大小:2.46 MB

页数:63页

时间:2019-02-26

不确定数据topk高期望权香项集挖掘研究_第1页
不确定数据topk高期望权香项集挖掘研究_第2页
不确定数据topk高期望权香项集挖掘研究_第3页
不确定数据topk高期望权香项集挖掘研究_第4页
不确定数据topk高期望权香项集挖掘研究_第5页
资源描述:

《不确定数据topk高期望权香项集挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文不确定数据Topk高期望权重项集挖掘研究ResearchonTopkHighExpectedWeight-basedItemsetsMiningwithUncertainDatasets作者姓名:昱明玉学科、专业:让箕扭座届堇盔学指导县.教师:21109249迢拄大连理工大学DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包

2、含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:丕盗塞数堡!Q然壶翅望拯重亟塞揎壑盟塞作者签名:皇亟堕日期:塑!丝年—厶月旦日大连理工大学硕士学位论文摘要随着科技日新月异的进步,各种各样的数据充斥着生产生活的各个领域,如何有效地获取数据中的精华并运用到各行各业中去,成为科研人员关注的焦点。基于这一实际需求,数据挖掘技术应运而生。关联规则挖掘作为数据挖掘领域的重要分支也一直受到科研人员的重视。通过生成关联规则获得项集之间隐藏的关

3、联,对于决策的提出有十分有效的指导意义。频繁项集的获取是生成关联规则最关键的步骤,针对频繁项集挖掘的科研工作主要从两个方面展开:应用扩展和算法效率提升。前者发展出了最大频繁项集,高效益项集,概率频繁项集等等;后者主要是针对各类频繁项集的挖掘算法提出时间空间上的改进。本文着眼于频繁项集挖掘,从传统数据到不确定数据以及数据流,详细回顾了经典的挖掘算法及其相应改进方法。在深入了解与学习这些科研成果的同时,发现己有的不确定数据挖掘算法虽然考虑了项目的出现概率,但是忽略了项目本身重要程度,导致出现概率比小,但是含有重要项目的项集被舍弃,可能使挖掘结果丢失重

4、要信息。另外考虑到频繁项集挖掘时阂值选取的实际困难,本文从应用扩展的角度出发,在概率频繁项集的基础上,提出了高期望权重项集(HEWIs)的Topk挖掘,有效地解决了这两个问题。具体的内容有:(1)结合不确定数据的频繁项集挖掘,给出了TopkHEWIs挖掘的概念与意义,并在经典概率频繁项集挖掘算法MBP和UF—Growth的基础上,提出了针对TopgHEWIs挖掘的算法,TKWMB和TKWUG。两个算法各自代表一类算法,从层次递进和模式增长两种挖掘方向出发,实现了TopkHEWIs的挖掘。本文通过在多个数据集上运行两种算法,对比了算法的效率差异。实

5、验表明TKWUG算法在各类数据集上的运行都比较稳定,随着k选取值的改变,运行时间呈正比变化,且在稀疏集上运行比较高效;TKWMB算法随k值变化起伏比较剧烈,在稀疏集上虽然运行速度快,但是却容易内存溢出。(2)考虑到近年数据流的大趋势,本文选取平稳性较好的TKWUG算法扩展出TWUS完成了数据流的TopkHEWIs挖掘。本文考虑了数据流单次单向无限的特性,在滑动窗口技术的基础上,结合了TKWUG和CPS算法的特性,给出了TWUS算法的实现过程。TWUS算法将当前窗口内的数据维护到WUSTree上压缩存储,通过增量式更新树结构与对应的索引头表体现数据

6、流动。算法采取局部更新以及延时处理的方式,有效且高效的响应用户的挖掘请求,实现了TopkHEWIs的数据流挖掘。关键字:频繁项集;权重;Topk;不确定数据;数据流不确定数据Topk高期望权重项集挖掘研究ResearchonTopkHighExpectedWeight—basedItemsetsMiningwithUncertainDatasetsAbs仃actWiththerapidlydevelopingofscienceandtechnology,amassofdataappearsindifferentapplicationareas.H

7、owtoextractmeaningfulinformationfromdataandutilizetheinformationeffectivelyhasbeenthefocusofscientificresearch.Basedonthispracticalrequirement,thedataminingtechnologyarisesatthehistoricmoment.Associationrulemining,asanimportantbranchofdatamining,hasarosemuchattentionandthinki

8、ngofresearchers.TocatchthehiddenconnectionsbetweenitemsetsiSthepurpo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。