欢迎来到天天文库
浏览记录
ID:44391076
大小:41.00 KB
页数:3页
时间:2019-10-21
《浅谈推荐系统——财富产品》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、最近喃喃无语帮XX零售部门构建其有关财富产品的推荐系统,在构建过程中遇到无限多个坑,由此想到要写这篇文章来分享,让关注我的小伙伴能绕开这些大坑,当然冇关此类问题可以探讨的朋友欢迎可以添加“数据分析挖掘(SAS&R&SPSS)"来做进一步的交流。要构建一个完整的推荐系统,就要覆盖所有用户,新注册的用户,忠实的用户(买了很多产站),一般购买用户等等,要对所有用户进行推荐。构建一个推荐系统首先要从财富产品——推荐对象的特点讲起:1.财富产品一般对于客户的评价和反馈信息比较缺乏,不像电商商品可以与客户进行更多的互动,比如可以线上的
2、话捕捉客户对其以购买商品的评分和评价;2.财富产品的分类不像商品这样具有多样性,和对来讲种类还是有些单一,还是比较局限;3.财富产晶一•般具有时限性,比如该类财富产站每天发售的,每一天的产站都会有差别4.财富产品种类对应的购买比例成极度不均匀分布,比如买周期比较短的产品交易数量可以占到所有交易数量的百分Z40以上,甚至更多。其次从可以捕捉的历史数据谈起:1.如今互联网的兴起,各个公司都在做数据整合,各个公司基本都有其CRM系统,客户的基本信息,主要包括年龄,持卡等级,资产层级等等;2.大部分的业务都采用线上化的交易,客户的
3、交易数据,客户的购买行为等动态数据都町以很好的捕捉,比如客户的购买产品,交易数量,交易金额,浏览记录等等;3.除此之外各个网站平台及客服系统都提供了评价及投诉建议模块,相对普通商品而言,财富产品虽没有对每-次购买记录的评分和评价,但客户的投诉和建议一般是相当重要的字段,此项数据需要整合多个平台数据进行分析。结合以上产品及现有数据的特点,下一步需要讲的就是推荐算法的采用:1.最熟悉和常用的当然是关联分析,关联分析就是发现存在大量数据集中的关联性或相关性,从而描述了一个事物中某些属性同时出现的规律和模型,最典型的例子是购物篮分
4、析。常用的算法包括Apriori算法、FP-growth算法,实现的工具儿乎每个统计软件都有,比如SPSS,SASEM,R等,根据支持度和置侑度结合业务选择出规则中比较猱谱的儿条规则,我们就会发现规则中机会选出的规则都是数据量占比很大产品的规则,比如购买了A类产品购买B类产品,或者是购买A类和B类产品再购买C类产品,应用该算法对川户进行推荐的前提是要已经购买了规则屮的前项,同时经过历史交易数据得到的规则数量不是很多,而且得到的规则屮很人一部分都是购买数量超级多的产品。根据对财富产品的经历告诉我们这个可以做为一般或者是过渡性
5、的推荐,需要挖掘更个性化的推荐算法;1.棊于协同过滤的推荐协同过滤推荐算法包括基于用户的协同过滤算法和基于物品的协同过滤算法,基于用户的协同过滤算法是基于这样一种假设,跟你相似的人喜欢的东西你也很可能喜欢(进一-步來说就是构建的宽表维度一定意义上基木相同),基于用八的协同过滤主要任务就是找出用八的最近邻居,从而根据最近邻居的喜好做出耒知项的评分预测。基于物品的协同过滤更加强调把和你喜欢的物品相似的物品推荐给你。具体操作案例如下:根据历史交易数据及评分数据得到如下表:用户ID,购买的产品item,以及用户的对购买的产品的评分
6、,产品的评分如果我们的数据库没有直接的评分数据,我们可以根据客户的购买频数,购买时间,购买金额等维度综合来进行评分,经过整理得到如下宽表。UserItemPre1210.61230.81270.22230.82270.3数据准备结束后就是建模,协同过滤因为每一个用户要与其它用户计算相似度,计算量比较人一般是采用分布式计算,可以在HADOOP.SPARK等上边宜接运行,鉴于客户自身的存储情况,采用的是HADOOP±进行的,MAHOUT±有己经封装的算法,直接调用调整参数即町。在我看來采川协同过滤算法做为推荐系统冇一个很大的优
7、势就是可以实时的根据丿力史数据来更新结果,并且可以规定推荐个数,比如可以对用户输出前五个可能购买的产品,而且产品对于该客户是没有购买过的新鲜产品。输出的结果如下所示UserItemlPrelItem2Pre2Item3Pre3Item4Pre41210.86240.79220.78290.672250.89230.87210.75260.71根据以上输出结果就可以对部分客八进行个性化推荐了,同时根据反馈结果我们可以计算召冋率,点击率等指标来评价该算法的准确性,当然这个可以建议同吋进行AB测试来比较,单凭那些检验占比是不能比
8、鮫的。由此采用基丁协同过滤算法来个性化推荐的就已经完成了。在实施过程中如果检测结果不是很理想,我们就需要从稀疏问题(在将川户做为行向最,产品做为列向最时就会有好多置空的情况)来进行优化。假设我们的测试结果告诉我们这种算法是有效的,但是在推荐的时候我们就会发现我们的推荐对象是对己经购买过产站的用八进行的推
此文档下载收益归作者所有