apriori算法及其改进算法

apriori算法及其改进算法

ID:36680737

大小:663.01 KB

页数:27页

时间:2019-05-13

apriori算法及其改进算法_第1页
apriori算法及其改进算法_第2页
apriori算法及其改进算法_第3页
apriori算法及其改进算法_第4页
apriori算法及其改进算法_第5页
资源描述:

《apriori算法及其改进算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、陕西理工学院开放性实验结题论文学生姓名丁侃所在班级专业01级计算机本科乙班所在系别数学与计算机科学系指导教师姓名周涛陕西理工学院数学与计算机科学系制2005年6月1日Apriori算法改进及其实现内容摘要信息技术的不断推广应用,将企业带入了一个信息爆炸的时代。如何充分利用这些数据信息为企业决策者提供决策支持成为一个十分迫切的又棘手的问题,人们除了利用现有的关系数据库标准查询语句得到一般的直观的信息以外,必须挖掘其内含的、未知的却又实际存在的数据关系。著名的Apriori算法是一种挖掘关联规则的算法。本文通过对参与候选集的元素计数的方

2、法来减少产生候选集的组合和减少数据库的扫描次数来达到要求。这有利于提高挖掘的速度和减少数据库的I/O操作时间的开销。关键字:数据挖掘,关联规则,Apriori算法AprioriAlgorithmAndImprovedAprioriAlgorithmAbstract:AninformationburstageiscomingwiththevariousapplicationofInformationtechnology.Howtomaximizetheinformationisaveryimportantproblemforthede

3、cision-makerofthecompanies.BesidesgettingtheregularinformationfromtheDatabasebySQL-query,peoplestillneedtominethedatarelationwhichisunclearbutreallyexists.Associationrulesisoneofthedataminingmethods,thefamousalgorithmAprioriisamethod,whichcanbeusedtosolutethoseproblems

4、.ThisarticleanalyzesandstudiestheimprovedalgorithmAprioribasedonthealgorithmofminingassociationrulesApriori.ThemainideaistodecreasethenumberofcandidateitemsandtodecreasethetimesofDatabasescanning.Thesolutionisavailable.Itupgradesthespeedofdatamininganddecreasescomputer

5、'sI/Ooperation.It'sprovedtobemoreefficientthanthetraditionalKeywords:Datamining,associationrules,Apriorialgorithm,目录1数据挖掘-1-1.1技术上的定义及含义-1-1.2商业角度的定义-2-1.3数据挖掘与传统分析方法的区别-2-1.4数据挖掘不能干什么-3-2数据挖掘的几种主要形式:-3-2.1:规则挖掘:-3-2.2聚类分析:-4-3关于关联规则的讨论-4-3.1购物篮分析-4-3.2关联规则基本问题描述-4-3.3

6、关联规则挖掘举例-6-3.4关联规则问题的分解-8-4Apriori算法的描述-8-4.1Apriori算法的说明-8-4.2Apriori算法的描述-9-4.3Apriori算法的举例-11-5一种Apriori的改进算法-14-5.1算法产生的思路-14-5.2算法的图例说明-15-5.3本算法的评价:-15-附录1程序运行图示-18-附录2程序代码-20-陕西理工学院数学与计算机科学系开放性实验结题报告1数据挖掘1.1技术上的定义及含义数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据

7、中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。与数据挖掘相近的同义词有数据融合、数据分析和决策支持等。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。----何为知识?从广义上理解,数据、信息也是知识的表现形式,但是人们更把概念、规则、模式、规律和约束等看作知识。人们把数据看作是形成知识的源泉,好像从矿石中采矿或淘金一样。原始数据可以是结构化的,如关系数据库中的数据;也可以是半

8、结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理,查询优化,决策支持和过程控制等,还可以用于数据自身的维护。因此

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。