【大数据分析技术系列】之电商数据挖掘关联算法

【大数据分析技术系列】之电商数据挖掘关联算法

ID:5991780

大小:333.41 KB

页数:7页

时间:2017-12-30

【大数据分析技术系列】之电商数据挖掘关联算法_第1页
【大数据分析技术系列】之电商数据挖掘关联算法_第2页
【大数据分析技术系列】之电商数据挖掘关联算法_第3页
【大数据分析技术系列】之电商数据挖掘关联算法_第4页
【大数据分析技术系列】之电商数据挖掘关联算法_第5页
资源描述:

《【大数据分析技术系列】之电商数据挖掘关联算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、【大数据分析技术系列】之电商数据挖掘关联算法目录概述..........................................................................................................................................1关联算法的两个概念.............................................................................................................

2、.1关联规则的发现过程可分为两步:..................................................................................2第一步是迭代识别所有的频繁项目集(FrequentItemsets),要求频繁项目集的支持度不低于用户设定的最低值..............................................................................2第二步是从频繁项目集中构造置信度不低于用户设定的最低值的规则,产生关联规则..........

3、......................................................................................................................2关联规则数据挖掘阶段.........................................................................................................2案例..............................................

4、............................................................................................3概念层次的数据挖掘..............................................................................................................4支持度的设置策略..............................................................

5、....................................................5同层关联规则可以采用两种支持度策略:.....................................................................5统一的最小支持度..............................................................................................................5递减的最小支持度...............

6、...............................................................................................6概述所谓关联,反映的是一个事件和其他事件之间依赖或关联的知识。当我们查找英文文献的时候,可以发现有两个英文词都能形容关联的含义。第一个是相关性relevance,第二个是关联性association,两者都可以用来描述事件之间的关联程度。其中前者主要用在互联网的内容和文档上,比如搜索引擎算法中文档之间的关联性,我们采用的词是relevance;而后者往往用在实际的事物之上

7、,比如电子商务网站上的商品之间的关联度我们是用association来表示的,而关联规则是用associationrules来表示的。如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。简单地来说,关联规则可以用这样的方式来表示:A→B,其中A被称为前提或者左部(LHS),而B被称为结果或者右部(RHS)。如果我们要描述关于尿布和啤酒的关联规则(买尿布的人也会买啤酒),那么我们可以这样表示:买尿布→买啤酒。关联算法的两个概念在关联算法中很重要的一个概念是支持度(Support),也就是数据集中包含某几个特定项的概率。比如在1000

8、次的商品交易中同时出现了啤酒和尿布的次

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。