欢迎来到天天文库
浏览记录
ID:32959845
大小:56.34 KB
页数:5页
时间:2019-02-18
《数据挖掘电子商务论文范文-试谈关联规则挖掘的算法及商务应用word版下载》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
数据挖掘电子商务论文范文:试谈关联规则挖掘的算法及商务应用word版下载导读:本论文是一篇关于关联规则挖掘的算法及商务应用的优秀论文范文,对正在写有关于数据挖掘论文的写作者有一定的参考和指导作用,论文片段:数量与日俱增,从而使得数据挖掘技术的重要性日益加强,关联规则挖掘是数据挖掘中最活跃的研究策略之一。该文先介绍了关联规则挖掘的研究情况,进一步提出和实现了一种有效的基于矩阵的Apriori改善算法,最后探讨和实现Apriori算法在商务中的应用。关键词:数据挖掘;关联规则;Apriori算法;商务应用1009-3044(2013)14摘要:随着数据库技术的迅速发展,数据的存储数量与日俱增,从而使得数据挖掘技术的重要性LI益加强,关联规则挖掘是数据挖掘中最活跃的研究策略之一。该文先介绍了关联规则挖掘的研究情况,进一步提出和实现了一种有效的基于矩阵的Apriori改善算法,最后探讨和实现Apriori算法在商务中的应用。关键词:数据挖掘;关联规则;Apriori算法;商务应用1009-3044(2013)14-3217-031数据挖掘体系结构与关联规则1.1数据挖掘体系结构数据挖掘(DataMining)从定义上可以将其界定为从大量的、不完全 的、有噪声的、模糊的、随机的数据屮识别有效的、新颖的、潜在有用的,以及最终可理解的模式的过程[1]。通过对数据挖掘的定义的分析可以看出,数据挖掘是一个高级的处理过程,其最终要达到的目的就是能够实现从数据集中识别出以模式来表示的知识。Ftl此可以看出,数据挖掘作为一门学科,涉及的学科知识十分广发,最主要的是涉及到机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化等多个领域。借助数据挖掘这一工具和策略,其最终的分析结果和成果可以用在信息管理、过程制约、科学研究、决策支持等许多方面。一般来说,一个完整的数据挖掘过程由以下七个步骤组成:数据清理、数据集成、数据选择、数据变换、数据挖掘、模型评估和知识表示。1.2关联规则关联规则的挖掘(ARM)是数据挖掘的一项重要的任务。关联规则挖掘最根本的目的就是能够快速有效地发现大量数据屮项集之间有趣的关联或相关联系。其目的就是从事务数据库、关系数据库中发现项目集或属性之间的相关性、关联性以及因果性。随着数据挖掘相关研究的不断深入,许多研究学者更多地将研究的目光集中在了挖掘关联规则方面。从数据挖掘的本质特征来分析可以看出,关联规则更多地反映一个事件和其他事件之间依赖或关联的知识。通过关联规则的定义可以发现,如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。 2一种基于矩阵的Apriori改善算法挖掘关联规则的对象是含有大量事务的事务数据库,所以如何设计一个高效的算法,以提高挖掘的计算效率,降低数据库的扫描次数,是研究关联规则挖掘的重要课题。虽然现在对于挖掘算法Apriori相关的改善和发展不断涌现,但是仍然有着自身的一些缺陷,最具有代表性的就是对数据库进行多次扫描而造成的精确度的降低,以及显著地存在由候选集CK产生频繁集LK等不足。正是由于这些缺陷的存在,本节提出一种基于矩阵的改善算法来产生频繁集LK,这种算法只对数据库扫描一次,并且无需候选集CK,即可得到频繁集LKo2.1与算法相关的几个概念3Apriori算法在商务中的应用3.1理由提出假如一家大型超市的管理人员想要知道每天超市的销售情况,顾客的购买模式,通过顾客特征,采取相应的货价摆放以增加顾客满意度和销售额。如果仅仅靠传统人工技术,从巨大的购买信息中找出相应的答案就像大海里捞针,非常困难。本章利用数据挖掘技术针对这一理由进行研究。研究对象是顾客在一次购物的过程中,购买相关范文由第的不同商品之间联系,进而借助数据挖掘来进一步深入地分析顾客的购买习惯。在对不同商品种类和数量进行充分分析的基础上,进一步地分析出哪些商品最受顾客欢迎,从而购买 频率很高,进而借助这种关联的发现可以帮助零售商制定营销策略。理由归结为分析当前销售情况,找出商品统计信息之间的关系。3.2数据来源对于一个实际的数据挖掘应用来说,数据是进行数据挖掘的基础和根本,同时数据挖掘技术的应用对数据量也有一定的要求,只有这样数据挖掘才能有实际作用0数据的获取确实是这次研究数据挖掘面对的很大的理由。通过仔细的搜索和分析,我最终选择了Belgium的一家的超市的销售数据。整个数据源是在三个非连续的时期收集的,在每一个间隔期,没有可获的数据。数据收集期跨时近5个月,总共收集到的数据记录有88163条。在整个数据收集期间里,该超市总共出售了16470种商品,共有5133位顾客在该超市购买了至少一种商品。但是与我们期望的数据还是有许多不同之处,数据表结构与我们需求的也存在很大的差别,这里可以采用等同和类比的策略,从而实现了对表结构的修改和数据的替换,这样以来就有效地实现了对大量的数据替换和表结构重组,解决了数据来源理由。3.2.1数据处理由于数据仓库中各个主题中的数据是按照前端应用需求存放的,因此在数据应用前必定存在一个数据处理和转换的过程,这一过程需要对数据进行变形,使之适应前端应用需要。为了能够提高关联规则的效率,充分实现数据挖掘需要达到的既定目标,在进行数据挖掘之前,需要对交易数据库中的销售数据进行…定的预处理才能有效地应用数据挖掘技术和策略。这里采用超市销售表中的相关信息来进行数据挖掘,具体的每一条 记录包括以下信息:顾客编号发票编号购买日期商品1名称商品1总价商品2名称商品2总价…商品n名称商品n总价总计通过分析可以发现,这种数据结构的特点是数据库的每一条记录能够对每一位顾客在一次进入商店进行购物的详细信息进行充分的记录,•次完整的交易记录通常由多种商品的名称和支付的价钱组成,这种数据结构提供的信息比较详细,但是不利于关联规则挖掘的。因为关联规则所描述的只是不同项目之间的关系,它只关注一次交易中有哪些商品被同时购买。我们不用去考虑顾客在一次交易中所购买物品的数量、价格等信息,每种商品(也就是物品)都由一个二进制变量代替,而不管它是否在交易中被购买与否。由于我们挖掘的交易数据库中关联规则最根本要实现的目的是反映岀各种物品之间的关联关系,因而,我们需要从综合数据库中取出当前主题需要的数据,将上述的交易记录的数据结构转换成如下结构形式:相关范文由写
此文档下载收益归作者所有
举报原因
联系方式
详细说明
内容无法转码请点击此处