加权关联规则挖掘算法在电子商务中的应用

加权关联规则挖掘算法在电子商务中的应用

ID:32363566

大小:97.70 KB

页数:3页

时间:2019-02-03

加权关联规则挖掘算法在电子商务中的应用_第1页
加权关联规则挖掘算法在电子商务中的应用_第2页
加权关联规则挖掘算法在电子商务中的应用_第3页
资源描述:

《加权关联规则挖掘算法在电子商务中的应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、1282008,44(17)ComputerEngineeringandApplications计算机工程与应用加权关联规则挖掘算法在电子商务中的应用余波112,朱东华,刘卓君112YUBo,ZHUDong-hua,LIUZhuo-jun1.北京理工大学管理与经济学院,北京1000812.61062部队,北京1000911.SchoolofManagementandEconomics,BeijingInstituteofTechnology,Beijing100081,China2.61062PLATroops,Beijing10

2、0091,ChinaE-mail:bitboyu@gmail.comYUBo,ZHUDong-hua,LIUZhuo-jun.ApplicationstudyinE-businessusingweightedassociationruleminingalgorithm.ComputerEngineeringandApplications,2008,44(17):128-130.Abstract:Introducetheprimaryprincipleandtheoryofassociationrules,andstudythest

3、andardApriorialgorithm.Followingthis,presentanewweightedassociationruleminingalgorithmagainsttheshortagesofthestandardApriorialgorithm,andanalyzethemaintraitsofit.ThenapplythisnewalgorithminE-businessdatamining,experimentalresultsshowthatthenewweightedassociationrulem

4、iningalgorithmoutperformsthanthestandardApriorialgorithm.Keywords:datamining;associationrules;Apriorialgorithm;E-business摘要:介绍了关联规则的常用理论,研究了关联规则中的标准Apriori算法,针对其不足进行了有益的改进,提出了一种新的加权关联规则挖掘算法,并分析了其主要特点。通过把该算法用于电子商务数据挖掘中,并与标准Apriori算法的对比分析,证明了这种新的加权关联规则挖掘算法的有效性。关键词:数据挖掘;

5、关联规则;Apriori算法;电子商务DOI:10.3778/j.issn.1002-8331.2008.17.038文章编号:1002-8331(2008)17-0128-03文献标识码:A中图分类号:TP3911引言个事务都有一个标识符,称作TID。设X是一个项集,事务T包关联规则(AssociationRule)是表示数据库中一组对象之含X当且仅当X′!T。关联规则是形如X"Y[S%,C%]的蕴涵间的某种关联关系的规则。关联规则挖掘由RakeshAgrawal式,其中X!I,Y!I,并且X∩Y=!。规则X"Y在事务集D中等人

6、于1993年提出[1],主要用于发现不同事件之间的关联性,成立,具有支持度S,其中S是D中事务包含X∪Y的百分比,即一事物发生时,另一事物也经常发生。其重点在于快速发现它是概率P(X∪Y)。规则X"Y在事务集D中具有置信度S,那些有实用价值的关联发生的事件,关联规则挖掘的主要依据即D中包含X事务的同时也包含Y的百分比C,这是条件概是事件发生的概率和条件概念应该符合一定的统计意义。率P(Y/X)。即当前,关联规则挖掘技术在许多领域已经得到广泛应用,其support(X"Y)=P(X∪Y)典型实例是购物篮分析,通过发现顾客放入其购物篮

7、中不同商confidence(X"Y)=P(Y/X)品之间的联系,分析顾客的购买习惯,并利用这种关联制定更同时满足最小支持度min_sup和最小置信度min_conf的规则好的营销策略。但是,把关联规则挖掘技术用于电子商务网站货称作强关联规则[2]。架的布置,从而更有效地指导网络营销,目前的研究还不多见。2.2频繁项集项的集合称为项集(itemset)。包含K个项的项集称为K-项2关联规则的基本概念集,例如集合{computer,software}是一个2-项集。项集的出现频2.1关联规则的定义率是包含项集的事务数,简称为项集的频

8、率。项集满足最小支持设I={i,i,⋯,i}是项的集合,设任务相关的数据D是数度min_sup,如果项集的出现频率大于或者等于min_sup与D12m据库事务的集合,其中每个事务T是项的集合,使得T!I。每中事务总数T的乘积。则称它为频繁项集(fr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。