欢迎来到天天文库
浏览记录
ID:36680737
大小:663.01 KB
页数:27页
时间:2019-05-13
《apriori算法及其改进算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、陕西理工学院开放性实验结题论文学生姓名丁侃所在班级专业01级计算机本科乙班所在系别数学与计算机科学系指导教师姓名周涛陕西理工学院数学与计算机科学系制2005年6月1日Apriori算法改进及其实现内容摘要信息技术的不断推广应用,将企业带入了一个信息爆炸的时代。如何充分利用这些数据信息为企业决策者提供决策支持成为一个十分迫切的又棘手的问题,人们除了利用现有的关系数据库标准查询语句得到一般的直观的信息以外,必须挖掘其内含的、未知的却又实际存在的数据关系。著名的Apriori算法是一种挖掘关联规则的算法。本文通过对参与候选集的元素计数的方
2、法来减少产生候选集的组合和减少数据库的扫描次数来达到要求。这有利于提高挖掘的速度和减少数据库的I/O操作时间的开销。关键字:数据挖掘,关联规则,Apriori算法AprioriAlgorithmAndImprovedAprioriAlgorithmAbstract:AninformationburstageiscomingwiththevariousapplicationofInformationtechnology.Howtomaximizetheinformationisaveryimportantproblemforthede
3、cision-makerofthecompanies.BesidesgettingtheregularinformationfromtheDatabasebySQL-query,peoplestillneedtominethedatarelationwhichisunclearbutreallyexists.Associationrulesisoneofthedataminingmethods,thefamousalgorithmAprioriisamethod,whichcanbeusedtosolutethoseproblems
4、.ThisarticleanalyzesandstudiestheimprovedalgorithmAprioribasedonthealgorithmofminingassociationrulesApriori.ThemainideaistodecreasethenumberofcandidateitemsandtodecreasethetimesofDatabasescanning.Thesolutionisavailable.Itupgradesthespeedofdatamininganddecreasescomputer
5、'sI/Ooperation.It'sprovedtobemoreefficientthanthetraditionalKeywords:Datamining,associationrules,Apriorialgorithm,目录1数据挖掘-1-1.1技术上的定义及含义-1-1.2商业角度的定义-2-1.3数据挖掘与传统分析方法的区别-2-1.4数据挖掘不能干什么-3-2数据挖掘的几种主要形式:-3-2.1:规则挖掘:-3-2.2聚类分析:-4-3关于关联规则的讨论-4-3.1购物篮分析-4-3.2关联规则基本问题描述-4-3.3
6、关联规则挖掘举例-6-3.4关联规则问题的分解-8-4Apriori算法的描述-8-4.1Apriori算法的说明-8-4.2Apriori算法的描述-9-4.3Apriori算法的举例-11-5一种Apriori的改进算法-14-5.1算法产生的思路-14-5.2算法的图例说明-15-5.3本算法的评价:-15-附录1程序运行图示-18-附录2程序代码-20-陕西理工学院数学与计算机科学系开放性实验结题报告1数据挖掘1.1技术上的定义及含义数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据
7、中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。与数据挖掘相近的同义词有数据融合、数据分析和决策支持等。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。----何为知识?从广义上理解,数据、信息也是知识的表现形式,但是人们更把概念、规则、模式、规律和约束等看作知识。人们把数据看作是形成知识的源泉,好像从矿石中采矿或淘金一样。原始数据可以是结构化的,如关系数据库中的数据;也可以是半
8、结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理,查询优化,决策支持和过程控制等,还可以用于数据自身的维护。因此
此文档下载收益归作者所有