基于用户的协同过滤推荐技术的论文

基于用户的协同过滤推荐技术的论文

ID:10766888

大小:51.00 KB

页数:3页

时间:2018-07-08

基于用户的协同过滤推荐技术的论文_第1页
基于用户的协同过滤推荐技术的论文_第2页
基于用户的协同过滤推荐技术的论文_第3页
资源描述:

《基于用户的协同过滤推荐技术的论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于用户的协同过滤推荐技术的论文[摘要]随着因特网普遍使用和电子商务迅猛发展,推荐系统已成为重要研究领域,人们对推荐技术作了广泛的研究。个性化的推荐系统以个性化方式向用户推荐商品,帮助用户找到他们所需要的商品,并便捷地完成购买过程。介绍了电子商务系统中的协同过滤推荐技术,详细分析了基于用户的协同过滤推荐算法,同时指出了它的优点和缺点。  [关键词]电子商务协同过滤推荐系统推荐技术    当前,电子商务系统迅猛发展,随之而来地出现了电子商务系统中的信息“超载”现象。海量的物品信息无疑增加了用户购买所需物品的难度,使得用户很难

2、迅速准确地找到自己真正中意的商品。为此,许多电子商务网站引入了推荐系统,以提高用户的点击率,变网站的浏览者为购买者,提高用户购买成功率和交叉销售能力,进而提升网站的美誉度和用户对网站的忠诚度。所谓电子商务推荐系统是在了解和学习用户的需求与喜好的基础上为用户提供商品信息和建议,模拟商家向用户推荐其可能感兴趣的商品,帮助用户完成购买过程。提供个性化服务已经成为进一步提高网络内容服务质量急需解决的重要课题之一,也是未来网络内容服务的一个发展方向。目前,几乎所有著名电子商务网站,诸如亚马逊、cdno*n的用户-项目评价矩阵r,这里

3、m是用户数,n是项目数,r=(rij),元素rij表示用户i对项目j的评价。在电子商务推荐系统中,元素rij既可表示用户是否购买商品(例如0或者1),也可表示用户对商品的偏好程度(例如评分从1到10)。  (2)生成“邻居”:通过计算所有用户对之间的相似度形成“邻居”。计算系统中目标用户与其他所有用户的相似度,以找出k个最相似用户集—“最近邻居”。k-“最近邻居”依相似度排序。  (3)产生推荐:通过加权目标用户“邻居”对目标项目的评价产生推荐。根据“最近邻居”集,可计算目标用户对项目的预测评价值,进而产生推荐。假定用户i

4、的“最近邻居”集为si,用户i对项目x的预测评价值为pi,x,用户i和用户j的相似度为sim(i,j),用户i和用户j的平均评价值分别为,那么有:    2.相似度计算方法  计算两个用户之间相似度的方法主要有三种:余弦相似度、相关相似度以及修正的余弦相似度,分述如下:  (1)余弦相似度:每个用户的评分作为n维项目空间中的一个向量。如果某个用户没有对一个项目评价,则其默认评价值设为0。两个用户i和j之间的相似性通过计算两个向量和夹角的余弦得到,记为sim(i,j),计算公式如下:    (2)相关相似度:在余弦相似度计算

5、中没有考虑不同用户之间评价范围的差别。相关相似度通过减去用户对项目平均评价值来克服上述缺陷。两个用户i和j之间的相似性通过计算pearson相关性得到。假定用户i和用户j共同评价的项目集合为,那么相关相似度计算公式如下:    其中:ri,x为用户i对项目j的评价值,和分别为用户i和用户j的平均评价值。  (3)修正的余弦相似度:在相关相似度计算公式中,如果同时考虑用户i和用户j的评价项目集合,那么得到修正的余弦相似度计算公式如下:    其中:ii和ij分别为用户i和用户j的评价项目集合。  3.算法优点和缺点  基于用

6、户的协同过滤算法很容易理解,与其他众多实际应用中的推荐算法相比显示出较高的推荐精度,它具有如下一些优点:  (1)能够过滤难以进行机器自动内容分析的信息,如艺术品,音乐等。  (2)共享其他人的经验,避免了内容分析的不完全和不精确,并且能够基于一些复杂的,难以表述的概念(如信息质量、个人品味)进行过滤。  (3)有推荐新信息的能力。可以发现内容上完全不相似的信息,用户对推荐信息的内容事先是预料不到的,可以发现用户潜在的但自己尚未发现的兴趣偏好。  (4)能够有效的使用其他相似用户的反馈信息,较少用户的反馈量,加快个性化学习

7、的速度。  虽然基于用户的协同过滤作为一种典型的推荐技术有其相当的应用,但随着电子商务系统规模的不断扩大,用户空间和项目空间急剧增长,该算法也存在以下缺点:  ①稀疏性:在一个大型电子商务系统中,用户涉及的信息量相当有限,用户评价项目数少于总项目数的10%,造成评价矩阵数据相当稀疏,难以找到相似用户集,导致推荐效果大大降低。  ②冷开始:这个问题可看作是极端严重的稀疏性问题。一方面,它很难向新用户提供个性化推荐服务;另一方面,在这种情况下,仅有少量评价数据不可能产生精确推荐。  ③扩展性:基于用户的协同过滤算法的计算量随着

8、用户和项目的增加而急剧增加,其最坏情况下的计算复杂度为o(mn)。对于一个典型的具有成百上千万用户和项目的电子商务系统,算法将遭遇到严重的扩展性问题。  三、结论  基于用户的协同过滤虽是一种较为成功的推荐技术,但也存在着稀疏性、冷开始、扩展性和精确性问题。为了解决这些问题,目前常用聚类分析的方法,它或

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。