欢迎来到天天文库
浏览记录
ID:11562810
大小:26.50 KB
页数:3页
时间:2018-07-12
《基于用户的协同过滤推荐技术.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于用户的协同过滤推荐技术 [摘要]随着因特网普遍使用和电子商务迅猛发展,推荐系统已成为重要研究领域,人们对推荐技术作了广泛的研究。个性化的推荐系统以个性化方式向用户推荐商品,帮助用户找到他们所需要的商品,并便捷地完成购买过程。介绍了电子商务系统中的协同过滤推荐技术,详细分析了基于用户的协同过滤推荐算法,同时指出了它的优点和缺点。 [关键词]电子商务协同过滤推荐系统推荐技术 当前,电子商务系统迅猛发展,随之而来地出现了电子商务系统中的信息“超载”现象。海量的物品信息无疑增加了用户购买所需物品的难度,使得用户很难迅速准确地找到自己真正中意的商品。为此,许多电子商务网站引入了推荐系统
2、,以提高用户的点击率,变网站的浏览者为购买者,提高用户购买成功率和交叉销售能力,进而提升网站的美誉度和用户对网站的忠诚度。所谓电子商务推荐系统是在了解和学习用户的需求与喜好的基础上为用户提供商品信息和建议,模拟商家向用户推荐其可能感兴趣的商品,帮助用户完成购买过程。提供个性化服务已经成为进一步提高网络内容服务质量急需解决的重要课题之一,也是未来网络内容服务的一个发展方向。目前,几乎所有著名电子商务网站,诸如亚马逊、CDNOW、eBay、淘宝网等都采用了各式各样不同个性化水平的推荐系统。推荐系统中最核心和关键的是所采用的推荐技术,它决定了推荐系统性能的好坏。因此,加强对电子商务系统个性化推荐
3、技术研究具有非常重要的实际意义。现在,主要的推荐技术有:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和组合推荐。其中,协同过滤推荐是应用最早和最为成功的技术之一,而基于用户的协同过滤推荐又是最容易理解的一种技术。 一、协同过滤推荐 协同过滤推荐技术在个性化推荐系统中应用最广,主要的可分为基于用户和基于项目的协同过滤算法。它一般采用最近邻技术,利用用户的历史喜好信息计算用户之间的距离,然后利用目标用户的“最近邻居”对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,系统从而根据这一喜好程度来对目标用户进行推荐。协同过滤最大优点是对推荐对象没有特殊的要求,
4、能处理如音乐、电影等这样非结构化的复杂对象。 协同过滤是基于这样的假设:为一用户找到他真正感兴趣的内容的好方法是首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用户。基于协同过滤的推荐系统可以说是从用户的角度来进行相应推荐的,而且是自动的,即用户获得的推荐是系统从购买模式或浏览行为等隐式获得的,不需要用户努力地找到适合自己兴趣的推荐信息,如填写一些调查表格等。 协同过滤推荐的一般步骤是: 交易数据库→测量用户间相似性→寻找相似用户→计算商品的购买可能性→根据购买可能性推荐商品。 二、基于用户的协同过滤推荐 1.算法3 基于用户的协同过滤是到目前为止实际应用中
5、最为成功的个性化推荐技术,算法的基本思想是将具有相同爱好的用户感兴趣的项目推荐给目标用户。假如目标用户对项目的评价与他的“最近邻居”相似,而目标用户对某个项目的评价可以从他的“最近邻居”的评价中综合得到。 基于用户的协同过滤推荐算法主要包括三个过程: (1)表示:建立一个用户-项目评价矩阵描述用户对项目的评价。用户的判断和偏好明确地表示为一个m*n的用户-项目评价矩阵R,这里m是用户数,n是项目数,R=(rij),元素rij表示用户i对项目j的评价。在电子商务推荐系统中,元素rij既可表示用户是否购买商品(例如0或者1),也可表示用户对商品的偏好程度(例如评分从1到10)。 (2)生
6、成“邻居”:通过计算所有用户对之间的相似度形成“邻居”。计算系统中目标用户与其他所有用户的相似度,以找出K个最相似用户集—“最近邻居”。K-“最近邻居”依相似度排序。 (3)产生推荐:通过加权目标用户“邻居”对目标项目的评价产生推荐。根据“最近邻居”集,可计算目标用户对项目的预测评价值,进而产生推荐。假定用户i的“最近邻居”集为Si,用户i对项目x的预测评价值为Pi,x,用户i和用户j的相似度为sim(i,j),用户i和用户j的平均评价值分别为,那么有: 2.相似度计算方法 计算两个用户之间相似度的方法主要有三种:余弦相似度、相关相似度以及修正的余弦相似度,分述如下: (1)余
7、弦相似度:每个用户的评分作为n维项目空间中的一个向量。如果某个用户没有对一个项目评价,则其默认评价值设为0。两个用户i和j之间的相似性通过计算两个向量和夹角的余弦得到,记为sim(i,j),计算公式如下: (2)相关相似度:在余弦相似度计算中没有考虑不同用户之间评价范围的差别。相关相似度通过减去用户对项目平均评价值来克服上述缺陷。两个用户i和j之间的相似性通过计算Pearson相关性得到。假定用户i和用户j共同评价
此文档下载收益归作者所有