欢迎来到天天文库
浏览记录
ID:26848664
大小:50.00 KB
页数:4页
时间:2018-11-29
《组合营销策略中基于约束的关联规则挖掘方法(1)》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、组合营销策略中基于约束的关联规则挖掘方法(1)摘 要:网络销售是电子商务的一种重要的形式,而组合营销是提升网络销售业绩的一种重要手段。针对目前我国网络销售的基本模式,在已发现的组合营销策略特点的基础上,提出了一种基于约束的关联规则挖掘新算法。 关键词:组合营销策略;数据挖掘;关联规则 1 引言 随着全球化浪潮的推进,电子商务正不断发展壮大。网络销售作为电子商务的一种重要组成形式为企业寻求更大的市场空间提供了一种新的有益尝试。我国目前网络销售的主流模式为:“订单一物流”模式。即用户下订单后
2、,企业通过物流将商品交付给客户。由于物流用度一般由客户承担,客户为减少购物的物流本钱,往往会在购买主目标商品的同时,搭配几件价格不高的次目标商品。这就为企业实施商品的组合营销策略提供了机遇。 2 题目描述 组合营销是指企业通过对不同种别、不同价格的商品的公道组合,向客户一次提供多种商品的营销方式。数据挖掘中的关联规则分析方法,通过挖掘出以往销售数据中哪些商品频繁的被顾客同时购买,形成关于商品间搭配的知识,从而指导今后销售的商品组合。但经典的关联规则挖掘方法由于缺乏用户控制,导致产生的规则过多
3、,且部分规则对用户毫无意义。为了解决该题目,人们引进了基于约束的关联规则挖掘方法。R.T.NG等学者提出了受约束的关联查询概念R.Srikant等人研究了项集受约束的关联规则挖掘,挖掘出了包含某布尔表达式的频繁项集RobertJ.Ba-yardoJr等人研究了稠密数据库的特点,并提出了改进度的概念 本文首先先容了关联规则的基本概念,在指出传统关联规则挖掘方法缺陷的基础上,提出了一种受用户指定数据约束的关联规则挖掘算法(UD-Apriori)。实验分析表明,该算法能在短时间内找到用户感爱好的规则,算法效
4、率有明显进步。 3 关联规则的基本概念 3.1关联规则的描述 设I={i1i2,im}是项的集合,其中的元素称为项(item)。记D为交易T的集合,这里交易T是项的集合,并且T I。设X是I中项的一个集合,假如X T.那么称交易T3X。一个关联规则是形如“X Y的蕴含式,这里X I,Y I,并且X Y= 。 规则“XjY”在事务数据库中的支持度(support)是事务集中包含X和Y的事务数与所有事务数之比,记为suppog(X Y),即: suooort(XY):l{T,XYT,TD}
5、
6、/
7、D
8、 对项目集I和事务数据库D,T中所有满足用户指定的最小支持度(minsupportl的项目集,称为频繁项目集。 规则XY在事务集中的置信度(confidence)是指包含X和Y的事务数与包含X的事务数之比,记为confidence(XY),即: Confidence(XY)=
9、{T,X Y T,T D,T D}
10、/
11、T:X T,T D}
12、 3.2经典关联规则挖掘算法及其缺陷 经典的关联规则挖掘算法分两个阶段:首先,产生达到指定最小支持度的项集(即频繁项集),然后从每个频繁项集中找出能
13、够达到指定最小置信度的规则。其中,第一步天生满足最小支持度的项集是关键。1994年Agrawal等人在提出了著名的Apfiofi算法此算法使用递回方法天生所有的频繁项集。首先天生频繁1-项集L1,然后天生频繁2-项集L2,…,一直到某个r使得Lr为空,算法结束。当求Lk时,首先通过Lk-1的自连接天生候选项集Ck;检验Ck中的每个元素,满足用户指定的最小支持度的元素就是Lk中的元素。从以上算法描述可看出由于Lk-1候选集Ck是呈指数增长的,例如104个1-频繁项集就有可能产生接近107个元素的2-候选项
14、集。如此大的候选项集对时间和主存空间是一种巨大的挑战。另外,由于基于“支持度一置信度”的关联规则挖掘度量框架本身不具有关联规则天生的先决指导性,导致产生的部分规则对终极用户毫无意义,而一些较长的规则又难于理解。这些都导致算法效率的低下。
此文档下载收益归作者所有