欢迎来到天天文库
浏览记录
ID:5991780
大小:333.41 KB
页数:7页
时间:2017-12-30
《【大数据分析技术系列】之电商数据挖掘关联算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、【大数据分析技术系列】之电商数据挖掘关联算法目录概述..........................................................................................................................................1关联算法的两个概念.............................................................................................................
2、.1关联规则的发现过程可分为两步:..................................................................................2第一步是迭代识别所有的频繁项目集(FrequentItemsets),要求频繁项目集的支持度不低于用户设定的最低值..............................................................................2第二步是从频繁项目集中构造置信度不低于用户设定的最低值的规则,产生关联规则..........
3、......................................................................................................................2关联规则数据挖掘阶段.........................................................................................................2案例..............................................
4、............................................................................................3概念层次的数据挖掘..............................................................................................................4支持度的设置策略..............................................................
5、....................................................5同层关联规则可以采用两种支持度策略:.....................................................................5统一的最小支持度..............................................................................................................5递减的最小支持度...............
6、...............................................................................................6概述所谓关联,反映的是一个事件和其他事件之间依赖或关联的知识。当我们查找英文文献的时候,可以发现有两个英文词都能形容关联的含义。第一个是相关性relevance,第二个是关联性association,两者都可以用来描述事件之间的关联程度。其中前者主要用在互联网的内容和文档上,比如搜索引擎算法中文档之间的关联性,我们采用的词是relevance;而后者往往用在实际的事物之上
7、,比如电子商务网站上的商品之间的关联度我们是用association来表示的,而关联规则是用associationrules来表示的。如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。简单地来说,关联规则可以用这样的方式来表示:A→B,其中A被称为前提或者左部(LHS),而B被称为结果或者右部(RHS)。如果我们要描述关于尿布和啤酒的关联规则(买尿布的人也会买啤酒),那么我们可以这样表示:买尿布→买啤酒。关联算法的两个概念在关联算法中很重要的一个概念是支持度(Support),也就是数据集中包含某几个特定项的概率。比如在1000
8、次的商品交易中同时出现了啤酒和尿布的次
此文档下载收益归作者所有