协同过滤算法

协同过滤算法

ID:28084060

大小:171.50 KB

页数:25页

时间:2018-12-08

协同过滤算法_第1页
协同过滤算法_第2页
协同过滤算法_第3页
协同过滤算法_第4页
协同过滤算法_第5页
资源描述:

《协同过滤算法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、-探索推荐引擎内部的秘密,第2部分:深入推荐引擎相关算法-协同过滤本系列的第一篇为读者概要介绍了推荐引擎,下面几篇文章将深入介绍推荐引擎的相关算法,并帮助读者高效的实现这些算法。在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。它以其方法模型简单,数据依赖性低,数据方便采集,推荐效果较优等多个优点成为大众眼里的推荐算法“No.1”。本文将带你深入了解协同过滤的秘密,并给出基于ApacheMahout的协同过滤算法的高效实现。ApacheMahout是ASF的一个较新的开源项目,它源于Lucene,构建在Hadoop之上,关注海量数据上的机器学习经典算法

2、的高效实现。内容o集体智慧和协同过滤o基于ApacheMahout实现高效的协同过滤推荐o总结o参考资料IBM技术文档:http://www.ibm.com/developerworks/cn/views/web/libraryview.jsp?view_by=search&sort_by=Date&sort_order=desc&view_by=Search&search_by=%E6%8E%A2%E7%B4%A2%E6%8E%A8%E8%8D%90%E5%BC%95%E6%93%8E%E5%86%85%E9%83%A8%E7%9A%84%E7%A7%98%E5%AF%86&d

3、wsearch.x=12&dwsearch.y=11&dwsearch=Go集体智慧和协同过滤什么是集体智慧集体智慧(CollectiveIntelligence)并不是Web2.0时代特有的,只是在Web2.0时代,大家在Web应用中利用集体智慧构建更加有趣的应用或者得到更好的用户体验。集体智慧是指在大量的人群的行为和数据中收集答案,帮助你对整个人群得到统计意义上的结论,这些结论是我们在单个个体上无法得到的,它往往是某种趋势或者人群中共性的部分。Wikipedia和Google是两个典型的利用集体智慧的Web2.0应用:·Wikipedia是一个知识管理的百科全书,相对于传统的

4、由领域专家编辑的百科全书,Wikipedia.---允许最终用户贡献知识,随着参与人数的增多,Wikipedia变成了涵盖各个领域的一本无比全面的知识库。也许有人会质疑它的权威性,但如果你从另一个侧面想这个问题,也许就可以迎刃而解。在发行一本书时,作者虽然是权威,但难免还有一些错误,然后通过一版一版的改版,书的内容越来越完善。而在Wikipedia上,这种改版和修正被变为每个人都可以做的事情,任何人发现错误或者不完善都可以贡献他们的想法,即便某些信息是错误的,但它一定也会尽快的被其他人纠正过来。从一个宏观的角度看,整个系统在按照一个良性循环的轨迹不断完善,这也正是集体智慧的魅力。

5、·Google:目前最流行的搜索引擎,与Wikipedia不同,它没有要求用户显式的贡献,但仔细想想Google最核心的PageRank的思想,它利用了Web页面之间的关系,将多少其他页面链接到当前页面的数目作为衡量当前页面重要与否的标准;如果这不好理解,那么你可以把它想象成一个选举的过程,每个Web页面都是一个投票者同时也是一个被投票者,PageRank通过一定数目的迭代得到一个相对稳定的评分。Google其实利用了现在Internet上所有Web页面上链接的集体智慧,找到哪些页面是重要的。什么是协同过滤协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤(Collabo

6、rativeFiltering,简称CF),首先想一个简单的问题,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看最近有什么好看的电影推荐,而我们一般更倾向于从口味比较类似的朋友那里得到推荐。这就是协同过滤的核心思想。.---协同过滤一般是在海量的用户中发掘出一小部分和你品位比较类似的,在协同过滤中,这些用户成为邻居,然后根据他们喜欢的其他东西组织成一个排序的目录作为推荐给你。当然其中有一个核心的问题:·如何确定一个用户是不是和你有相似的品位?·如何将邻居们的喜好组织成一个排序的目录?协同过滤相对于集体智慧而言,它从一定程度上保留了个体的特

7、征,就是你的品位偏好,所以它更多可以作为个性化推荐的算法思想。可以想象,这种推荐策略在Web2.0的长尾中是很重要的,将大众流行的东西推荐给长尾中的人怎么可能得到好的效果,这也回到推荐系统的一个核心问题:了解你的用户,然后才能给出更好的推荐。深入协同过滤的核心前面作为背景知识,介绍了集体智慧和协同过滤的基本思想,这一节我们将深入分析协同过滤的原理,介绍基于协同过滤思想的多种推荐机制,优缺点和实用场景。首先,要实现协同过滤,需要一下几个步骤·收集用户偏好·找到相似的用户或物品·计算

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。