大数据在B2C电商中的应用32.ppt

大数据在B2C电商中的应用32.ppt

ID:50613612

大小:4.51 MB

页数:32页

时间:2020-03-12

大数据在B2C电商中的应用32.ppt_第1页
大数据在B2C电商中的应用32.ppt_第2页
大数据在B2C电商中的应用32.ppt_第3页
大数据在B2C电商中的应用32.ppt_第4页
大数据在B2C电商中的应用32.ppt_第5页
资源描述:

《大数据在B2C电商中的应用32.ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、大数据在B2C电商中的应用——旅游事业部频道组举例…2大数据相关应用用户行为分析价格预测推荐系统评分预测问题流量分析供应链管理实时定制报表广告精准投放行业信息监控评论挖掘分析传播热点分析销量预测CRM社会化图谱挖掘LBS3推荐系统4流程架构推荐系统…用户行为数据库用户属性数据库行为提取行为特征转换特征向量特征物品相关推荐候选物品集合相关表1相关表2相关表N初始推荐结果过滤排序推荐解释选择最终推荐结果用户行为反馈物品属性ABC5推荐系统推荐算法简介6推荐系统协同过滤算法——基于商品/用户间的相似度余弦距离Jaccard距离欧氏距离海明距离7推荐系统典型应用

2、新闻推荐电子商务、图书/电影推荐推荐原理有共同爱好的用户喜欢与用户之前喜欢的物品类似推荐结果小群体的热点用户的兴趣传承个性化要求不太明显强烈内容数量多较少更新速度快较慢适用领域时效性强、个性化不明显长尾丰富、个性化需求强烈举例GroupLens、DiggAmazon、Netflix用户的新行为推荐结果不一定立即变化推荐结果实时变化推荐解释难容易以历史行为解释协同过滤算法8推荐系统奇异值分解——探索相似度背后隐含根源分类1分类2分类3兴趣1XXXXXXXXX兴趣2XXXXXXXXX兴趣3XXXXXXXXX9推荐系统二分图模型——一个游走在用户和商品之间的爬

3、虫高相似性的判断标准:两个顶点间有很多路径相连;连接两个顶点间的路径长度都比较短;连接两个顶点间的路径不会出现大的顶点;10推荐系统算法总结用户用户商品特征商品喜欢、购买有相似兴趣的好友喜欢、具有相似喜欢包含相似性判断特征聚类11推荐系统预测准确度用户满意度覆盖率多样性新颖性惊喜度信任度实时性健壮性商业目标系统评测12推荐系统新的挑战和方案——用户意图模糊情景下的多维度补充;平台电商的店铺定向、季节定向;反作弊问题;考虑用户本身的权重和行为频度;冷启动问题;用户疲劳;……13评论挖掘14评论挖掘维克托·迈尔-舍恩伯格大数据互联网数据挖掘计算机应用信息管理

4、畅销书“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。喜欢作者说的知道“是什么”就够了,没必要知道“为什么”这个理论。奥伦*埃奇奥尼因为自己买到了比同一架飞机乘客贵的机票而非常气愤,因此他创造了最早的互联网搜索引擎。且不说这个引擎的后续,至少埃奇奥尼创立的预测系统帮助乘客节省了很多钱。我们不需要知道机票为什么涨或者跌,我们只想着用最少的钱去买到同样的机票,如此,这样有预见性的数据库就是起到了重要的作用。而在其他领域上,同样的可以用这样的大数据的思维方式去思考。数据不是静止不动的,需要有变革的思维

5、去看它。而现在的数据已经成了一种商业资本,可以创造新的经济利益。从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。基本上,人们比以往任何时候都与数据或信息交互。谷歌搜索、Facebook的帖子和微博消息使得人们的行为和情绪的细节化测量成为可能。挖掘用户的行为习惯和喜好,凌乱纷繁的数据背后找到更符合用户兴趣和习惯的产品和服务,并对产品和服务进行针对性地调整和优化,……相关度分析自然语言处理这个商品不错~15评论挖掘TF1*I

6、DF1+TF2*IDF2+…+TFN*IDFNTF——词频:关键词在文本中出现的频率IDF——逆文本频率指数log(D/DW):关键词在所有文本集中出现的频率越高,IDF越低e.g.“原子能”“的”“应用”TF:0.002、0.035、0.005IDF:8.96、0、1TF*IDF——文本与关键词相关度的科学度量16评论挖掘大数据+自然语言处理技术(NLP)分词消歧互信息特征筛选主题LDA情感分析特征词聚类词性标注向量空间模型TF*IDF17评论挖掘(当当网)评论挖掘A/B测试结果:顾客体验提升;购买决策时间变短;点击评论次数减少;页面停留时间降低;转化

7、率提升;全年贡献过亿;18评论挖掘19评分预测问题——?分预测帮助用户决策20评分预测问题常用算法:基于平均值;基于相似物品;隐语义与矩阵分解模型;算法融合;……21销量预测模型满位率↓买断风险↓毛利↑运营效率↑22一个旅游业的案例Farecast.com——近十万亿条价格记录;票价预测准确率达75%;平均每张机票为旅客节省50美元;2008年以1.15亿美元被微软收购,并入必应;23Ongoing——大数据+实时处理24延伸阅读25谢谢!附——大数据有多大1分钟产生的数据量:48小时新视频@Youtube2000000次搜索请求@Google68447

8、8条分享消息@Facebook100000条新微博@Twitter3600张照片

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。