浅析数据挖掘技术与关联规则挖掘算法.doc

浅析数据挖掘技术与关联规则挖掘算法.doc

ID:49868086

大小:64.50 KB

页数:6页

时间:2020-03-05

浅析数据挖掘技术与关联规则挖掘算法.doc_第1页
浅析数据挖掘技术与关联规则挖掘算法.doc_第2页
浅析数据挖掘技术与关联规则挖掘算法.doc_第3页
浅析数据挖掘技术与关联规则挖掘算法.doc_第4页
浅析数据挖掘技术与关联规则挖掘算法.doc_第5页
资源描述:

《浅析数据挖掘技术与关联规则挖掘算法.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、浅析数据挖掘技术与关联规则挖掘算法摘要:随着人们对侍息数据量的急速增长从而数据挖掘技术也随之应运而生,这使得人们对知识与信息的渴求得到了进一步满足。对于如何才能快速高效的获取知识,对于信息处理技术来说已经成为当前热门的研究课题。审视当前对于关联规则的研究现状,针对关联研究的现状,分析实际问题对于关联规则总结出一种新的研究方式,结论为关联规则算法在今后的出路和进一步的研究上指明了方向。研究过程中通过对文献的查询分析和比较分析两种方法,进一步阐述对典型关联产生影响的各种方法,其中最为重要的是把核心Apriori算法作为一个

2、研究的基点。关键词:数据挖掘;关联规则;典型关联;Apriori算法1数据挖掘技术1.1数据挖掘概念从数据挖掘的本质上说它是一种具有更高商业价值的新型信息处理技术,数据挖掘技术的作用是对数据的应用来说的,其目的是使人们从低层次的联机查询过渡到对数据决策支持分析预测上,从而成为更高层次的应用。1.2数据挖掘技术的分类关于数据挖掘针对其挖掘的对象,大致的可以做出以下分类,具体分为时态数据库、异质数据库、文本数据源、关系数据库面向对象数据库(Object-OrientedDatabase)>空间数据库、遗产数据库、多媒体数据

3、库以及web等比较具有针対性的挖掘对象。针对数据挖掘的方法人致的可以归纳为:计算机学习法、数理统计法、信息聚类分析法、遗传算法GeneticAlgorithm>神经网络NeuralNetwork探索性分析法、不确定性推理和近似推理法、数据分析法、证据理论和元模式法、数据集成方法、当代数学分析法等。根据数据挖掘技术的知识类型可以分为:广义范围的知识挖掘、差异范围的知识挖掘、关联范围的知识挖掘、预测范围的知识挖掘等。1.3数据挖掘的应用分析根据麻省理工学院内部数据整理其科技评论杂志对数据挖掘技术的应用分析提出了10大新兴的

4、科学技术数据挖掘能够在未来5年对人类的产生生活带来重大影响。根据种种数据分析所表明的问题我们不难发现数据挖掘技术面向实际应用方面不是一时的,随着时代的发展社会信息化进程不断加剧各行业的业务操作也随之逐渐向现代化流程转变,这一转变促使企业在处理业务时产生大量的业务信息数据。对于一般地企业内部的业务信息数据来说,其主要是由企业进行商业运作而产生的数据,这些数据的量一般比较少。这是都是企业为了获得市场分析而进行收集的,关于此类的数据挖掘的应用终将成为企业进行高层次数据分析,为行政决策提供技术支持的骨干技术。2关联规则挖掘理论

5、的研究2.1发现频繁项目集该技术可以通过用户给定的minsupport寻找所有与用户给定的频繁项冃集FrequentItemset即满足support不小于minsupport的项冃集。但是从实际出发不难看出,诸如此类的频繁项目集从某种意义上来讲具有互相包含的关系,因而我们一般只关心那些不被数据挖掘所包含的所谓频繁大项集FrequentLargeIteinset的集合,对于这些频繁大项集來说它们只是促使关联规则形成的基础。2.2生成关联规则通过用户给定的(minconfidence)在每个最大频繁项目,项目集中寻找co

6、nfidence不小于minconfidence的关联规则。近年来关联规则挖掘算法研究的重点,比较流行的方法是基于Agrawal等人建立的项目集格空间理论。这个理论的核心是这样的原理,频繁项日集的子集是频繁项目集,非频繁项目集的超集是非频繁项目集。对于子问题2而言,也许在每个频繁大项集中逐一匹配规则并进行。ConfidenceII-*12minconfidence的测试是必需的,因此这部分工作相对比较成熟。为了完善了一个称为Apriori的关联规则挖掘法这个算法一直作为经典的关联规则挖掘算法被引用,随着数据库容量的增大

7、重复访问数据库,外存将导致性能低下,因此探索新的理论和算法来减少数据库的扫描次数和侯选集空间占用已经成为近年来关联规则挖掘研究的热点之一。3时态约束关联规则挖掘问题及算法3.1聚焦挖掘任务,提高挖掘效率数据挖掘理论最初的研究侧重点是模型的建立以及算法的设计。随着应用于不同的场合,得出的结果证明单纯而又孤立的挖掘工具效果并不理想。传统的数据挖掘项目中,会进行详尽而反复的调研分析,并根据用户的需求制定细致的任务计划,最终的结果却并不理想,不能得到想要的结果。在算法中,如果想要得到用户的挖掘日标,除了算法之外,还需要有特定的

8、实现机制,使得我们的挖掘计划能够转变成对一个系统工作的控制,这样才能使得挖掘项目能有期望的结果。这样的约束,不需要局限于某一个挖掘数据的阶段,在任何阶段都可以实现。而这样的算法机制,也是交互式数据挖掘算法的基本形式,通过这样的过程,来达到更好以及快速地完成挖掘任务。3.2保证挖掘的精确性从数据挖掘的算法也可以看出,结果具有不可预测

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。