基于用户的协同过滤算法

基于用户的协同过滤算法

ID:28010477

大小:87.34 KB

页数:4页

时间:2018-12-07

基于用户的协同过滤算法_第1页
基于用户的协同过滤算法_第2页
基于用户的协同过滤算法_第3页
基于用户的协同过滤算法_第4页
资源描述:

《基于用户的协同过滤算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于用户的协同过滤算法作者:罗沐阳(2012101020028)指导教师:张勇【摘要】:随着网络技木的应用和普及、电子商务的迅猛发展,越来越多的信息充斥在网络之上。如何在众多的资源中找到适合自己需求的信息,成为众多学者、专家和网络用户火心的核心问题之一。个性化推荐技术在这样的背景下应运而生。协同过滤技术是个性化推荐技术最为核心的技术之一,也是目前应用最为广泛和成功的技术。本文主要研究的是基于用户的协同过滤推荐算法的实现。【关键词】:协同过滤,相似度,个性化推荐1.电子商务个性化推荐技术1.1个性化推荐技术电子商务对传统的商务交易产生了革命性的变化,从而要求“以

2、产品为中心”向“面向客户”、“以客户为中心”的新的商业模式的转变,要求电子商务网站按客户群划分产品,围绕客户进行服务,为客户提供所耑要的东西,所以对每个顾客提供个性化的服务成为必要。在这种背景下,推荐系统(RecommenderSystem)应运而生,它是根据用户个人的喜好、〉』惯來向其推荐信息、商品的程序。电子商务网站可以使川推荐系统分析客户的消费偏好,向每个客户具有针对性地推荐产品,帮助川户从庞大的商品目录中挑选真正适合自己耑要的商品,尽可能为每个顾客提供个性化的服务。个性化推荐(personalizedrecommendation)技术通过研究不同用户的

3、兴趣,主动力用户推荐最耑要的资源,从而更好地解决互联网信息口益庞大与川户耑求之间的矛盾。目前,推荐技术被广泛应川到电子商务、数字图书馆、新闻网站等系统巾。因此,各种适用于推荐系统的技术应运而生,如协同过滤技(CF)、bayesian网技术、聚类分析技术、关联规则技术、神经网络技术和图模型技术等,其屮,协同过滤是应川最为广泛的个性化推荐技术。协同过滤推荐又分为基于模型(Model-based)的协同过滤和基于用户的协同过滤。后來,sarwr教授在2001年提出基于项目的协同过滤算法1.2协同过滤协同过滤推荐技术是川“相似统计”的方法发现具有相似偏好或是兴趣特征的

4、“相邻用户”。“协同过滤”的思想最早由美国明尼苏达州大学的学者PaulResnick在1994年,发表的〈〈GroupLens:AnOpenArchitectureforCollaborativeFilteringofNetnews))一文中提出的。迄今为止,协同过滤是在个性化推荐系统中应用最广泛和最被人们所认可的一种推荐技术。协同过滤的基本原理是:根据用户对信息产品的评分情况,对其他川户进行检索,找出与该川户“品味”相似的一小群人,也就是“邻居”,然后再基于这些相似性进行信息产品评分预测,产生Top-N的推荐结果。协同过滤具有以下儿个主要优点:第一,可以处理

5、非结构化的信息产品,对非结构化如电影、音视频等杂对象进行推荐;第二,奇异兴趣发现。协同过滤推荐技术可以根裾如信息产品的质量,用户的品味等一些复杂的、不易表达的概念进行信息过滤,并发现用广的潜在兴趣;第三,推荐的个性化、自动化程度较高。本文主要研究的是基于用户的协同过滤推荐算法的实现。1.基于用户的协同过滤推荐算法2.1算法简介基于用户的协同过滤是个性化推荐屮应用最为广泛的方法,它是基于邻居用户的兴趣爱好预测目标用户的兴趣偏好。算法先使用统计技术寻找与目标用户有相同喜好的邻居,然后根据目标用户的邻居的偏好产生向目标用户的推荐。它的基本原理是利用用户访同行为的相似

6、性来互相推荐用户可能感兴趣的资源对当前用户,系统通过其历史访问记录及特定相似度函数,计算出与其访问行为(购买的产品集合、访问的网页集等)最相近的N个用户作为用户的最近邻居集,统计的近邻用户访问过而目标用未访问的资源生成候选推荐集,然后计算候选推荐集屮每个资源对用户的推荐度,取其屮K个排在最前而的资源作为用户的推荐集。2.2算法步骤2.2.1发现兴趣相似的用户通常用Jaccard公式或者余弦相似度计算两个用户之间的相似度。设N(u)为用户u喜欢的物品集合。N(v)为用户v喜欢的物品集合,那么11和v的相似度是多少呢:Jaccard公戎:

7、jV(w)r>jV(v)

8、

9、余弦相似度:

10、jV(w)r>jV(v)

11、、_#⑷

12、x

13、‘V(v)

14、假设目前共有4个用户:A、B、C、D;共有5个物品:a、b、c、d、e。用户与物品的关系(用户喜欢物品)如下所示:AabdBac如何一下子计算所有川户之间的相似度呢?为计算方便,通常首先耑要建立“物品一用户”的倒排表,如下所示:abcdeAABAcBCDDD然后对于每个物品,喜欢他的用户,两两之间相同物品加1。例如喜欢物品a的用户有A和B,那么在矩阵中他们两两加1。jto下所示:ABCDA0111B1001C1001D1110计算用户两两之间的相似度,上面的矩阵仅仅代表的是公式的分子部分。以余

15、弦相似度为例,对上进行进一步计算:AB

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。