欢迎来到天天文库
浏览记录
ID:6675514
大小:1001.00 KB
页数:44页
时间:2018-01-21
《2868.经典关联规则挖掘算法(apriori算法)实验分析及应用探讨》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、详细源代码及数据库请联系本人目录摘要第一章引言11.1本文的研究目的与意义11.2研究进展概述11.3本文的主要工作21.4本文的组织结构3第二章关联规则挖掘技术42.1基本概念42.2关联规则的分类52.3关联规则挖掘算法6第三章Apriori算法113.1算法概述113.2算法伪代码描述113.3实例分析133.4算法分析(算法的优缺点)16第四章实验分析184.1试验内容和技术路线184.2频繁项集的产生19394.3规则的生成244.4实验结果分析26第五章关联规则挖掘在空间数据库中的应用分析285.1关联规
2、则在GIS空间数据挖掘中的应用285.2关联规则挖掘在图像数据挖掘中的应用31第六章总结与展望38参考文献39致谢4039摘要随着数据库与互联网技术的发展,人们每天可以获得的数据及信息量呈指数级增长。为解决随之带来的如何从浩瀚的数据海洋中提取有用的知识以便为决策者提供决策支持的问题,数据挖掘技术应运而生。关联规则是数据库中某些特定事件一起发生的概率的简单陈述。关联规则挖掘就是利用特定方法发掘数据库中潜藏的关联规则的过程。目前,关联规则挖掘己经成为数据挖掘领域重要的研究方向之一。本文主要研究了关联规则挖掘,首先介绍了数
3、据挖掘及关联规则挖掘的一些基础知识、概念描述等,然后对关联规则挖掘的常用算法进行了分类探讨,并分析了其中的几种典型算法。并主要介绍了关联规则挖掘的经典算法-Apriori算法,而且通过试验分析了Apriori算法。目前数据挖掘技术在国外应用非常广泛,但是国内在这方面的发展相对缓慢。作者在本文主要介绍了关联规则挖掘的经典算法-Apriori算法,这些工作也只是对数据挖掘进行一个简单而浅显的研究,希望在今后的工作中更加深化和具体的分析和研究。关键字:数据挖掘关联规则频繁项集Apriori算法39AbstractWitht
4、hedevelopmentofdatabaseandInternettechnology,thevolumesofdataandinformationwhichcanbeobtainedincreaseatthespeedofexponent.Dataminingcomesuptosolvetheproblemthathowtodistilltheusefulknowledgewhichcanbeusedfordecisionsupportingfrommassesofdata.Associationruleisas
5、implestatementaboutthecooccurrenceprobabilityofsomecertaineventsindatabase.Associationruleminingaimedtofindtheassociatedrelationshipofagreatdealofitemsetsinthedatabase.Atpresent,associationrulemininghasbecomeanimportantbranchofdataminingresearch.Thisthesisempha
6、sizesonassociationrulemining.Atfirst,thebackgroundknowledgeofdataminingandassociationruleminingareintroducedbriefly.Afterthat,somekindsofcommonusedassociationruleminingalgorithmsarediscussed;Itmainlydiscussesaclassicarithmetic-theAprioriarithmetic,andanalysesth
7、earithmeticbyaexperiment.Atpresent,theDataMininghasbecomethehot-topic.Thisthesismainlydiscussesaclassicarithmetic-theAprioriarithmetic,TheworkinthisthesisisanonlybeginningonDataMining,moreworkswillbedoneinthefuture.Keywords:DataMining;associationrules;frequenti
8、temset;theAprioriarithmetic;39第一章引言1.1本文的研究目的与意义数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。与数据挖掘相近的同义词有数据融合、数据分析和决策支持等。这个定义包括以下几层含义:数
此文档下载收益归作者所有