基于协同过滤推荐算法图书推荐探究

基于协同过滤推荐算法图书推荐探究

ID:46667652

大小:62.00 KB

页数:5页

时间:2019-11-26

基于协同过滤推荐算法图书推荐探究_第1页
基于协同过滤推荐算法图书推荐探究_第2页
基于协同过滤推荐算法图书推荐探究_第3页
基于协同过滤推荐算法图书推荐探究_第4页
基于协同过滤推荐算法图书推荐探究_第5页
资源描述:

《基于协同过滤推荐算法图书推荐探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于协同过滤推荐算法图书推荐探究摘要:随着信息技术以及互联网技术的飞速发展,在面对这个信息量过载的时代,我们基本无法从海量的信息当中快速有效的找到自己所需的信息。传统的推荐算法也已经无法满足的人们的需求。协同过滤是推荐系统中最为广泛使用和最成功的技术之一,以其出色的速度和健壮性,在理论和实践中都取得了快速的发展,并且已经在全球互联网领域炙手可热。针对当前高校传统数字图书馆已无法为用户提供准确的图书推荐服务,本文以图书推荐为例,提出了在协同过滤技术上的图书个性化推荐系统研究以及实现过程,并❷结其优缺点。关键词:

2、推荐系统;协同过滤;图书推荐中图分类号:TP301文献标识码:A文章编号:1007-9416(2017)04-0147-011协同过滤算法介绍在1992年Goldberg等学者首先提出来协同过滤一词,他们将协同过滤技术使用到Tapestay的一个系统中,该系统主要是想解决Xerox公司在PaloAlto的研究中心信息过载问题。而协同过滤又常被用于分辨其为特定用户可能感兴趣的物品,因此这些结论也常用来对其他相似顾客对有些物品感兴趣的分析。到目前为止,基于协同过滤推荐的技术和方法在实际的应用系统中能取得重大成就的

3、同时,国内外学者也在理论上对协同过滤的推荐技术进行研究和改进,着力于提高个性化推荐的效果。协同过滤算法以其出色的计算速度和健壮性,在全球范围内特别是在互联网领域中,炙手可热,同时相较其他算法,协同过滤具有以下两个优势:第一,对推荐对象无特殊要求、对于复杂切抽象的资源也同样能够实现推荐;其次,只需要显式或者隐试的用户使用过的历史数据,而并不需要有关用户本身的属性、知识,并且不会对用户的推荐体验,带来一些负面影响[1]。目前主要由两类协同过滤算法:其一是基于用户的协同过滤算法(user-basedcollabor

4、ativefiltering)^还有基于物品的协同过滤算法(item-basedcollaborativefiltering)和SlopeOne算法。由于基于用户的协同过滤算法存在数据稀疏性和算法扩展性两个重大问题。因此本文介绍的系统,所采用的是基于物品的协同过滤算法。2对协同过滤算法过程的分析(1)收集用户偏好。本项目中就是收集用户的借阅历史。(2)计算物品(即已借图书)之间的相似度,这是协同过滤推荐算法中最关键的一步。在协同过滤中,两个物品是否能产生相似度,往往是因为它们共同被很多用户所认同,也就是说,每

5、个用户都可以通过用户本身对物品的历史兴趣列表,从而给物品贡献相似度。在这里面蕴含一个假设条件,那就是每个用户对物品的兴趣,基本都局限在某些方面,因此,如果两个物品,能够属于许多用户的兴趣列表,那么这两个物品,就有可能就属于有限的几个领域,反过来说,如果两个物品能够属于很多用户的兴趣列表,那么也就有可能属于同一领域,从而来判断他们有很大的相似度[2]。传统的计算相似度的方法有三种:基于余弦(Cosine-based)的相似度计算、基于关联(Correlation-based)的相似度计算和调整的余弦(Adjus

6、tedCosine)相似度计算。经研究,在我们的图书推荐系统中,采用以下公式:其中In(i)

7、和

8、N(j)丨分别表示喜欢物品i和物品j的用户数量(变量),而In(I)an(j)丨是即喜欢物品i同时也喜欢物品j的用户数量。此公式限制了物品j的权重,可以避免了对热门物品所进行的推荐,从而也能够提高为用户所推荐自己喜欢物品的准确性。详细计算物品相似度的代码如图1所示,其中C[i][j]记录了同时喜欢物品i和物品j的用户数。通过上述图、公式等得到物品相似度后,ItemCF也通过以下公式来计算用户u对一个物品j的兴趣度

9、:其中,N(u)是作为用户喜欢的物品的一个集合,而S(j,K)是同物品j最相似的,K个物品的集合,Wji表示物品j同i的相似度,而rui是用户u对物品i的兴趣情况。这个公式的所表示含义是:和该用户历史上感兴趣的物品,越相似的物品,越有可能在用户的推荐列表中所获得比较高的排名[3]。其实现代码如:由此可见,协同过滤推荐算法具备强大的功能和较高的效率。我们一共选取了8700个学生的借阅信息进行研究,并对其推荐结果进行有效分析,我们得出结论:(1)借书越多的用户,其推送准确率越高。(2)能够获取图书数据越完整的信息

10、和字段越多,推送越准确。在研究中我们发现对于借书较少产生的推荐不是十分准确,通过研究发现,系统根据少量的数据,该算法的使用不容易准确掌握用的兴趣爱好;对于从未借书的同学不会产生数据。这便是协同过滤算法的稀疏性问题。3结语本文介绍了协同过滤算法的主要思想,并以图书推荐系统为例,详细介绍其主要思想以及算法,采取相关方法来降低热门商品的推荐率,以更好匹配用户偏好相似度。基于协同过滤技术的图书推荐系统,对提

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。