基于FP-tree的极大频繁co-location模式挖掘.pdf

基于FP-tree的极大频繁co-location模式挖掘.pdf

ID:50115981

大小:5.02 MB

页数:58页

时间:2020-03-05

基于FP-tree的极大频繁co-location模式挖掘.pdf_第1页
基于FP-tree的极大频繁co-location模式挖掘.pdf_第2页
基于FP-tree的极大频繁co-location模式挖掘.pdf_第3页
基于FP-tree的极大频繁co-location模式挖掘.pdf_第4页
基于FP-tree的极大频繁co-location模式挖掘.pdf_第5页
资源描述:

《基于FP-tree的极大频繁co-location模式挖掘.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号密级公开编号右摩碎士蚵究噠嗲像儉式题目基于的极大频繁模式挖掘学院(所、中心)急专业名称研究生姓名张晓露学号导师姓名王丽珍职称教授年月扉页:论文独创性声明及使用授权本论文是作者在导师指导下取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,不存在剽窃或抄袭行为。与作者一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。现就论文的使用对云南大学授权如下:学校有权保留本论文(含电子版),也可以采用影印、缩印或其他复制手段保存论文;学校有权公布论文的全部或部分内容,可以将论文用于查阅或借阅服务;学校

2、有权向有关机构送交学位论文用于学术规范审查、社会监督或评奖;学校有权将学位论文的全部或部分内容录入有关数据库用于检索服务。内部或保密的论文在解密后应遵循此规定)摘要摘要许多不同的领域,比如工商,公共卫生,地质,交通等每天都会产生大量的数据,如果把这些数据收集起来进行分析,我们就有可能从中得到许多潜在的很有意义的信息,这些信息会对这些领域提供许多有价值的参考。用数据挖掘的一些知识,我们已经在一些应用领域中得到了有价值的模式,例如比较经典的例子,在某一个大型超市中,啤酒,面包经常被一起购买,通过制定营销策略或调整商品在货架上的摆放位置,超市就能够增加销售额,赚取更多利、

3、£在英文中是协同定位的意思,顾名思义,模式就是某些经常一起出现在同一空间中的特征的集合。一个频繁模式则是一个项目集,它的支持度满足之前用户定义的最小支持度阈值。随着近些年的研究,挖掘频繁模式经历了从基于候选的产生测试的算法到基于投影的算法的巨大的转变。模式与频繁模式在很多方面相似,但是,前者挖掘中缺少事务的概念,这就使得挖掘后者的一些算法很难直接用在挖掘前者的模式上。本文结合了由挖掘频繁模式和用和算法挖掘模式的优缺点,借鉴算法的通用框架,给出了一个挖掘极大频繁模式的算法,通过分析,新算法是正确的,完备的和高效的,实验结果也表明该算法要比之前有关算法的效率高。关键词:

4、数据挖掘频繁模式,模式;支持度;参与度星型实例AbstractAbstractManydifferentareas,suchasindustrial,,,,,,,,,,,目录目录艘目录第章绪论频繁模式挖掘模式挖掘频繁模式与模式的区别本文的成果本文的组织结构第章频繁模式挖掘频繁模式挖掘中的术语关联规则挖掘的步骤最大频繁模式和闭频繁模式算法算法和算法的比较总结第章空间模式挖掘问题陈述和基本概念问题陈述基本概念特征中心参考模型算法介绍算法介绍基于有序团白勺极大挖掘算法相关概念介绍基于有序团的算法目录总结第章挖掘算法基于的极大频繁模式挖掘框架算法描述事务化(算法第步)挖掘极

5、大频繁模式(算法第,步)组合模式(算法第步)模式过滤,挖掘极大频繁算法第步)总结第章算法分析和实验评估算法分析算法完备性算法正确性算法的计算效率实验评估实验环境参与度阈值的影响距离阈值的影响实例个数的影响结;第章结论参考文献賴第章绪论第章绪论当今世界是信息世界,在信息时代的每一个角落都存在着巨大的数据:互联网、企业数据库、数据仓库等,目前,不同类型的大量数据产生的速度似乎更快了,这的确是数据爆炸的时代!然而,数据本身既不是信息,也不是知识。我们要做的就是怎样高效的从这些海量的数据中挖掘到需要的知识。这就促进了数据挖掘和知识发现的发展,其任务是从存储在数据库、数据仓库

6、或其他信息存储介质中的大量数据中发掘有价值的模式丨,,。数据挖掘技术可以被应用在许多不同种类的数据,例如交易数据库,多媒体数据库,数据仓库,空间数据库,关系数据库,万维网等。数据挖掘可用于许多领域,例如市场调研,企业管理,工程设计,科学探索,以及产品控制。本篇文章主要探讨在数据挖掘领域里一个特殊问题:在空间数据库中发现极大频繁模式。在本章中,和节分别回顾在交易数据库中的频繁模式挖掘和在空间数据库中的模式挖掘,节比较频繁模式挖掘和模式挖掘,第和第节分别讨论本文的创新点和本文的组织结构。频繁模式挖掘一条事务含有唯一的一个事务编号和一个项集,例如,在某一商店中被一顾客同时

7、购买的商品。事务数据库是一个包含了很多信息的文件,其中的每条信息代表一个事务。频繁模式定义为:设是一个项集,『;是一个包含《个事务的事务集。一个项集构成了中的一条事务,。;的支持度为蕴含的事务在数据库£里所占的百分数,假如;的支持度不小于最小支持度那么;就是一个频繁模式。例如,如果鸡蛋,面包丨的支持度在一个事务数据库中满足它就是一个频繁模式。从大型数据库中寻找频繁模式对于挖掘关联规则,,,来说是举足轻重的,此外,探讨与频繁模式有关的相关性、最大模式、序列模式和其它数据挖掘问题也相当有趣。从事务数据库中找出的频繁模式在业务决策时是相当有意义的,很多时候可以提供众多

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。