面向数据流的高效用项集挖掘算法研究

面向数据流的高效用项集挖掘算法研究

ID:33870554

大小:1.91 MB

页数:56页

时间:2019-03-01

面向数据流的高效用项集挖掘算法研究_第1页
面向数据流的高效用项集挖掘算法研究_第2页
面向数据流的高效用项集挖掘算法研究_第3页
面向数据流的高效用项集挖掘算法研究_第4页
面向数据流的高效用项集挖掘算法研究_第5页
资源描述:

《面向数据流的高效用项集挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、AthesissubmittedtoZhengzhouUniversityforthedegreeofMasterTheResearchofHighutilityItemsetsMiningAlgorithmOverDataStreamByHuanhuanMuSupervisor:Prof.YumeiChaiComputerSoftwareandTheoryCollegeofInformationandEngineeringMay2014原创性声明本人郑重声明:所里交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中

2、已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。学位论文作者;亲浓砼日期:力修年}月形日学位论文使用授权声明本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、缩印或者其他复制手段保存论文和汇编

3、本学位论文。本人离校后发表、使用学位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑州大学。保密论文在解密后应遵守此规定.学位论文作者:赤识劝日期.≯,乒年}月名日摘要随着数据存储技术的快速发展,从大量数据中发现潜在的、有用的信息成为巨大的挑战。特别是随着数据流广泛呈现在各个应用领域,对数据流的挖掘成为了目前数据挖掘研究领域的一个新的方向,与传统的静态数据库不同,数据流是连续的、无限的、高速的。数据流挖掘中一个重要的研究方法是频繁项集挖掘,但传统的频繁项集挖掘以项集的支持度来衡量其重要性,挖掘过程中会丢失一些非频繁

4、但效用高、用户更加感兴趣的项集,因此在数据流中挖掘高效用项集成为一个新的研究课题。同时,已存在的高效用项集挖掘算法在挖掘过程中产生大量的候选项集,使用户很难从大量模式中筛选出有用的信息。针对这种情况,本文对数据流中高效用项集挖掘问题进行分析研究。首先对数据流挖掘技术及高效用项集挖掘问题给以描述,对目前存在的高效用项集挖掘算法从数据结构和处理方法方面进行总结和阐述,指出当前数据流高效用项集挖掘算法所存在的问题,从而提出本论文的研究点。本文提出一种数据流高效用项集挖掘算法HUIDE,弥补了传统高效用项集挖掘算法的不足,能更好的满足用户实

5、际应用的决策需求。该算法基于已存在的高效用项集挖掘算法,综合考虑数据流数据信息特征和用户对项集效用(利润)的要求,首先定义一种有效的效用度量方法,该方法设定项集的效用不仅考虑项集的支持度,更注重项集的实际效用。然后在数据流中采用基于时间的滑动窗口技术更加准确的描述数据分布,窗口滑动过程中为数据信息构建一种树结构HUI—tree,树中各节点采用项目加权效用的降序保存数据信息,使得构建的树结构更加的紧凑,有效的减少候选项集的产生。最后采用自底向上策略遍历整个树结构挖掘高效用项集。该算法通过扫描一次数据库获取挖掘结果,为挖掘过程减少了时间

6、和空间的消耗。在人工和真实数据流上的实验结果表明该算法能够有效地挖掘高效用项集。关键词:高效用:数据流;效用度量;树结构:AbstractW.ththerapiddevelopmentofdatastoragetechnology,discoverthepotemiallyusefulinformation丘omlargeamountsofdatahasbecomeahugechallenge.Especiallywiththedatastreamiswidelypresentedinvariousapplicationareas,

7、thedatastreammininghasbecomeanewdirectioninthecurrentresearchfieldofdatamining.Unliketraditionalstaticdatabases,datastreamiscontinuous,unbounded,andhigh—speed.Frequentitemsetsminingisanimportantresearchmethodinadatastreammining,butthetraditionalffequemitemsetminingmeas

8、uredtheimportanceofitemsetswithsupport.Itwilllosesomeinfi:equembuthighutility;useTsaremoreinterestedintheitemsetsinth

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。