欢迎来到天天文库
浏览记录
ID:31264585
大小:86.67 KB
页数:17页
时间:2019-01-07
《基于专家系统的个性化推荐系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于专家系统的个性化推荐系统的设计与实现摘要:随着互联网及物流运输行业的快速发展,越来越多的人选择在网上挑选服饰类商品。基于服饰类商品具有重复购买率低、搭配性强、受当季流行因素影响大等特点,提出了一种基于协同过滤与专家推荐的混合推荐策略,在为商品引入流行因子的基础Z上,为用户提供了一种更为个性化、时尚化的推荐结果。由于业务系统涵盖了海量的商品及用户数据,单机计算系统难以满足推荐系统对计算资源的需求,在基于Hadoop平台的基础之上,构建了一套离线分布式推荐系统,为解决大数据应用背景下的数据计算问题提供了可行性案例。关键词:推荐系统;专家推荐;协同过滤;Hadoop;分布式计算中图分类号:T
2、P311.5文献标识码:A1弓I(Introduction)随着互联网的不断发展,市面上出现了越来越多的垂直类服装电子商务平台,极大的丰富了人们购买服饰类商品的选择。然而,随着商品数量的逐渐增多,信息冗余给用户带来了极大的选择困难。如何帮助用户从海量的商品中,筛选出用户喜欢且满意的商品,以提高用户的购买率,成为当下服饰类电商平台面临的一大严峻考验。当前,电商推荐系统的推荐策略,一般可分为以下儿类:协同过滤推荐、基于内容的推荐[1,2]0前者又可分为基于商品的协同过滤推荐和基于用户的协同过滤推荐,其本质是在商品集中寻找相似的商品,为冃标用户予以推荐,或寻找兴趣、行为相似的用户,根据相似用户的
3、购买行为,为目标用户做推荐。上述的推荐策略在电影、图书等•商品类目应用较为成熟,但是在服饰类电商中,效果不够理想,原因如下:(1)对于用户已经购买过的服饰,与其相似的商品,用户再次购买的概率极低;(2)服饰类商品,更注重商品间的搭配;(3)服饰类商品,除了受用户兴趣、品味影响外,更易受到时尚潮流的驱动。为适应服饰类屯商的用户消费特点,以及服饰搭配的时效性,木文提供了一种基于多种推荐方法的混合推荐策略。首先,提供了一种基于SVD分解的协同过滤推荐,该推荐方法能较快得寻找到与目标用户最为相似的用户群,从该用户群的历史购买行为中,挖掘目标用户可能喜欢的商品,予以推荐。然后,根据时尚达人、一线设计
4、师等领域内专家提供的当季时尚搭配数据集,结合用户已经存在的购买行为,为用户提供当季流行的潮流搭配。同时定义商品的流行因子,将专家推荐与商品的流行因子相结合,达成专家推荐结果。将协同过滤推荐数据集,以及专家推荐数据集二者加权、排序、筛选,获得最终的推荐结果。本文为某服装类电商设计了一套基于Hadoop技术的推荐系统。该系统通过对用户的行为进行分析,根据协同过滤以及专家推荐的计算,并将二者结果加权、排序、筛选等计算,获得最终的推荐结果,并将最终的离线计算结果,存储在分布式存储系统文件中。业务系统通过接口访问的形式,将推荐数据推送至指定页面。2推荐系统的推荐策略(Strategyoftherec
5、ommendsystem)2.1基于用户的系统过滤推荐基于用户(User-based)协同过滤就是利用用户历史行为数据集,根据用户历史购买行为数据、用户历史浏览行为数据,挖掘出与冃标用户的相似度最大的若干用户,从该用户群屮,分析出用户可能感兴趣的商品[3-5]o基于用户的协同过滤推荐算法步骤如下:第一步,建立用户一商品评价矩阵。根据用户历史购买行为,构建用户与商品之间购买关系的矩阵,该矩阵中,数字1代表某用户曾购买过某商品,数字0代表某用户未曾购买过该商品。该表示方法虽然较简单,但并不能准确的表示出用户对于未购买的商品的兴趣程度。用户购买被标记为0的商品,可能是用户不感兴趣的商品,也可能是
6、用户感兴趣但并没有看到的商品。所以,有必要在用户购买矩阵中,引入负评分,即标记出用户不感兴趣的商品。引入负评分的具体方法如下:(1)在冃标用户浏览商品集中,剔除用户已购买的商品,得到浏览未购买商品集S。(1)从商品集S中,随机选择和用户已购买商品集N数量相等的商品,作为负评分商品。(2)如果商品集S的数量小于商品集N的数量,则差额从系统商品库中,剔除N和S集后随机挑选。(3)将负评分的閤品评分置为数字J”,得到新的评分矩阵Ro在完成负评分的引入后,用户一商品的评分矩阵变为一个由“・1”“0”鋼”组成的矩阵。第二步,挖掘目标用户的相似用户群。系统以余弦相似性作为用户与用户之间相似度的计算方法
7、。假设用户i和j对商品的评分向量为I、J,则用户i和j的余弦相似性为:sim(ij)=cos(/.J)=IxJ但由于在系统中,用户有购买行为的商品,只占商品总数极小一部分,故整个用户一i筍品的评分矩阵是一个以数字⑪'为主的稀疏矩阵。绝大多数用户之间的相似度为0,故需要将稀疏矩阵,进行相似矩阵变换,以得到低稀疏度的关系矩阵,从而计算用户之间的相似度。本文釆用奇异值分解(SVD)的方法[6,7],求得用户—商品评分矩阵的相似
此文档下载收益归作者所有