基于用户的协同过滤推荐技术论文

基于用户的协同过滤推荐技术论文

ID:11034410

大小:49.00 KB

页数:2页

时间:2018-07-09

基于用户的协同过滤推荐技术论文_第1页
基于用户的协同过滤推荐技术论文_第2页
资源描述:

《基于用户的协同过滤推荐技术论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于用户的协同过滤推荐技术论文.freel*n的用户-项目评价矩阵R,这里m是用户数,n是项目数,R=(rij),元素rij表示用户i对项目j的评价。在电子商务推荐系统中,元素rij既可表示用户是否购买商品(例如0或者1),也可表示用户对商品的偏好程度(例如评分从1到10)。(2)生成“邻居”:通过计算所有用户对之间的相似度形成“邻居”。计算系统中目标用户与其他所有用户的相似度,以找出K个最相似用户集—“最近邻居”。K-“最近邻居”依相似度排序。(3)产生推荐:通过加权目标用户“邻居”对目标项目的评价产生推荐。根据“最近邻居”集,可计算目

2、标用户对项目的预测评价值,进而产生推荐。假定用户i的“最近邻居”集为Si,用户i对项目x的预测评价值为Pi,x,用户i和用户j的相似度为sim(i,j),用户i和用户j的平均评价值分别为,那么有:2.相似度计算方法计算两个用户之间相似度的方法主要有三种:余弦相似度、相关相似度以及修正的余弦相似度,分述如下:(1)余弦相似度:每个用户的评分作为n维项目空间中的一个向量。如果某个用户没有对一个项目评价,则其默认评价值设为0。两个用户i和j之间的相似性通过计算两个向量和夹角的余弦得到,记为sim(i,j),计算公式如下:(2)相关相似度:在余弦

3、相似度计算中没有考虑不同用户之间评价范围的差别。相关相似度通过减去用户对项目平均评价值来克服上述缺陷。两个用户i和j之间的相似性通过计算Pearson相关性得到。假定用户i和用户j共同评价的项目集合为,那么相关相似度计算公式如下:其中:Ri,x为用户i对项目j的评价值,和分别为用户i和用户j的平均评价值。(3)修正的余弦相似度:在相关相似度计算公式中,如果同时考虑用户i和用户j的评价项目集合,那么得到修正的余弦相似度计算公式如下:其中:Ii和Ij分别为用户i和用户j的评价项目集合。3.算法优点和缺点基于用户的协同过滤算法很容易理解,与其他

4、众多实际应用中的推荐算法相比显示出较高的推荐精度,它具有如下一些优点:(1)能够过滤难以进行机器自动内容分析的信息,如艺术品,音乐等。(2)共享其他人的经验,避免了内容分析的不完全和不精确,并且能够基于一些复杂的,难以表述的概念(如信息质量、个人品味)进行过滤。(3)有推荐新信息的能力。可以发现内容上完全不相似的信息,用户对推荐信息的内容事先是预料不到的,可以发现用户潜在的但自己尚未发现的兴趣偏好。(4)能够有效的使用其他相似用户的反馈信息,较少用户的反馈量,加快个性化学习的速度。虽然基于用户的协同过滤作为一种典型的推荐技术有其相当的应用

5、,但随着电子商务系统规模的不断扩大,用户空间和项目空间急剧增长,该算法也存在以下缺点:①稀疏性:在一个大型电子商务系统中,用户涉及的信息量相当有限,用户评价项目数少于总项目数的10%,造成评价矩阵数据相当稀疏,难以找到相似用户集,导致推荐效果大大降低。②冷开始:这个问题可看作是极端严重的稀疏性问题。一方面,它很难向新用户提供个性化推荐服务;另一方面,在这种情况下,仅有少量评价数据不可能产生精确推荐。③扩展性:基于用户的协同过滤算法的计算量随着用户和项目的增加而急剧增加,其最坏情况下的计算复杂度为O(mn)。对于一个典型的具有成百上千万用户

6、和项目的电子商务系统,算法将遭遇到严重的扩展性问题。三、结论基于用户的协同过滤虽是一种较为成功的推荐技术,但也存在着稀疏性、冷开始、扩展性和精确性问题。为了解决这些问题,目前常用聚类分析的方法,它或者将“最近邻居”搜索对象限制在最相近的聚类中,或者用聚类的质心提取推荐结果,但并不能从根本上解决以上问题,这些都有待进一步研究。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。