欢迎来到天天文库
浏览记录
ID:25926019
大小:55.50 KB
页数:6页
时间:2018-11-23
《组合营销策略中基于约束的关联规则挖掘方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、组合营销策略中基于约束的关联规则挖掘方法 摘 要:网络销售是电子商务的一种重要的形式,而组合营销是提升网络销售业绩的一种重要手段。针对目前我国网络销售的基本模式,在已发现的组合营销策略特点的基础上,提出了一种基于约束的关联规则挖掘新算法。 关键词:组合营销策略;数据挖掘;关联规则 1 引言 随着全球化浪潮的推进,电子商务正不断发展壮大。网络销售作为电子商务的一种重要组成形式为企业寻求更大的市场空间提供了一种新的有益尝试。我国目前网络销售的主流模式为:“订单一物流”模式。即用户下订单后,企业通过物流将商品交付给客户。由于物流费用一般由客户
2、承担,客户为减少购物的物流成本,往往会在购买主目标商品的同时,搭配几件价格不高的次目标商品。这就为企业实施商品的组合营销策略提供了机遇。 2 问题描述 组合营销是指企业通过对不同类别、不同价格的商品的合理组合,向客户一次提供多种商品的营销方式。数据挖掘中的关联规则分析方法,通过挖掘出以往销售数据中哪些商品频繁的被顾客同时购买,形成关于商品间搭配的知识,从而指导今后销售的商品组合。但经典的关联规则挖掘方法由于缺乏用户控制,导致产生的规则过多,且部分规则对用户毫无意义。为了解决该问题,人们引入了基于约束的关联规则挖掘方法。R.T.NG等学者提出了
3、受约束的关联查询概念R.Srikant等人研究了项集受约束的关联规则挖掘,挖掘出了包含某布尔表达式的频繁项集RobertJ.Ba-yardoJr等人研究了稠密数据库的特点,并提出了改进度的概念 本文首先介绍了关联规则的基本概念,在指出传统关联规则挖掘方法缺陷的基础上,提出了一种受用户指定数据约束的关联规则挖掘算法(UD-Apriori)。实验分析表明,该算法能在短时间内找到用户感兴趣的规则,算法效率有明显提高。 3 关联规则的基本概念 3.1关联规则的描述 设I={i1i2,im}是项的集合,其中的元素称为项(item)。记D为交易T的集
4、合,这里交易T是项的集合,并且T I。设X是I中项的一个集合,如果X T.那么称交易T3X。一个关联规则是形如“X Y的蕴含式,这里X I,Y I,并且X Y= 。 规则“XjY”在事务数据库中的支持度(support)是事务集中包含X和Y的事务数与所有事务数之比,记为suppog(X Y),即: suooort(XY):l{T,XYT,TD}
5、/
6、D
7、 对项目集I和事务数据库D,T中所有满足用户指定的最小支持度(minsupportl的项目集,称为频繁项目集。 规则XY在事务集中的置信度(confidence)是指包含X和Y的事务数与包含X的事
8、务数之比,记为confidence(XY),即: Confidence(XY)=
9、{T,X Y T,T D,T D}
10、/
11、T:X T,T D}
12、 3.2经典关联规则挖掘算法及其缺陷 经典的关联规则挖掘算法分两个阶段:首先,产生达到指定最小支持度的项集(即频繁项集),然后从每个频繁项集中找出能够达到指定最小置信度的规则。其中,第一步生成满足最小支持度的项集是关键。1994年Agraax_sumprice)。 该算法的基本思想是:首先利用用户指定商品A为约束条件对事务数据库D进行扫描,包含A的实例加入到实例集Dt中,其余被过滤掉。然后在经典Apfio
13、fi算法的频繁项集生成过程中应用受max_sumprice参数约束的剪枝策略,生成符合约束条件的频繁K-项集,最后由频繁项集生成受约束的关联规则。 4.3剪枝策略 定义1 约束Ca是反单调的是指对于任意给定的不满足Ca的项目集S,不存在S的超集能够满足Ca。 下面给出了与A相关联商品的反单调性约束表达式: sum_price(Bl,B2,…,Bn)≤max_sumprice。 其中,sum_price(B1,B2,…,Bn)为在频繁项集的项(item)中与A相关联的商品价格的总和。 证明:反证法。假设sum_price(B1,B2,…,
14、Bn)>max_sumprice,且有sum_price(B1,B2,…,BnBn+1)≤max_sumprice,其中Bi>0。则有sum_price(B1,B2,…,Bn)>sum_price(B1,B2,…,BnBn+1),即:Bn+1+l<0,与假设Bi>0矛盾,故sum_price(B1,B2,…,Bn)≤max_sumprice为反单调性约束条件。由定义1可以确定,如果在Apriofi算法中生成的任何一个频繁项集不满足反单调约束条件,则它的任何超集都不满足此约束条件。因此,在经典的apriori算法产生K-1-频
15、繁项集后,我们可以直接将不满足约束的频繁项集剔除掉。这样从客观上,减少了频繁项集
此文档下载收益归作者所有