基于item―based协同过滤农业高校图书个性化推荐算法研究

ID：10573656

大小：49.50 KB

页数：2页

时间：2018-07-07

资源描述：

《基于item―based协同过滤农业高校图书个性化推荐算法研究》由会员上传分享，免费在线阅读，更多相关内容在工程资料-天天文库。

1、基于Item―Based协同过滤农业高校图书个性化推荐算法研究摘要：针对高校用户对图书的个性化需求，运用用户对图书的评分，构建了基于Hadoop和Mahout的图书推荐系统。通过Hadoop中分布式文件系统（HDFS）和Map/Reduce计算模型的应用，发现当Hadoop中节点数不断增加时，计算时间不断减少，实时响应效率得到了提高；通过对Mahout中传统的Item-Based聚类协同过滤推荐算法进行改进，利用MAE值对传统和改进后的协同过滤算法进行比较，发现图书推荐的精度进一步提高。总体来说，推荐系统改善了传统单机运行

2、内存严重不足和推荐结果不精确的问题。中国8/vie　　关键词：高校图书馆；个性化推荐算法；协同过滤算法；大数据　　中图分类号：G258.6+62文献标识码：A：0439-8114（2017）06-1150-05　　DOI：10.14088/j.ki.issn0439-8114.2017.06.040　　Abstract：Forpersonalizedbookneedsofusersatcollegesanduniversities，endationsystembasedonHadoopandMahoutusingthesc

3、oresgivenbyusers.ThroughtheapplicationofHadoopdistributedfilesystem（HDFS）andMap/Reducecalculationmodel，eisreducederesponseefficiencyisimprovedberofnotesintheHadoop.ThroughtheimprovementoftraditionalItem-Basedcollaborativefilteringremendationalgorithm，clusteringint

4、heMahout，sprovedcollaborativefilteringalgorithmsbyusingMAE，andfindthattheprecisionoftheremendationisfurtherimproved.Ingeneral，thisexperimentimprovestheproblemofout-of-memoryfortherunningoftraditionalsinglemachineandtheinaccurateresultsofremendation.　　Keyendational

5、gorithm；collaborativefilteringalgorithm；bigdata　　�S着图书馆事业的发展，用户对图书馆资源的使用提出了越来越高的要求；为读者提供有针对性的服务，成为图书馆发展中所面临的具体任务之一。在建设智慧图书馆中，国外个性化图书推荐服务已经比较成熟，但国内个性化推荐系统尚不完善[1]。目前国内大部分高校图书馆都是通过输入关键词进行模糊搜索，然后列出只和关键词相关的书籍，没有达到智能以及个性化推荐的效果。在借阅图书的过程中，用户过去产生的行为分为显式用户反馈与隐式用户反馈两种，主要包括浏览

6、页面、搜索图书、收藏图书、借阅图书、评论图书、图书评分等用户行为[2]。本试验通过显式用户反馈中的图书评分，推荐出在校学生和老师感兴趣的书，达到一个图书个性化推荐的效果。河北农业大学图书馆每天产生大量的数据信息，单机运行无法满足实时响应的效率。在处理大规模海量数据时，许多研究者将其设计的协同过滤算法部署于Hadoop并行化平台，以期在保证结果准确的前提下，通过Hadoop提高协同过滤算法执行的效率。Mahout提供了Hadoop并行化算法的接口，本试验将Mahout中提供的基于项目聚类协同过滤算法与Hadoop中Map/R

7、educe计算模型和分布式文件系统（HadoopDistributedFileSystem，HDFS）进行结合，改进原来的推荐算法，设计出河北农业大学高校图书推荐系统。该推荐系统由Application业务系统、Mahout计算框架、Hadoop集群组成，解决了海量数据环境下算法实施的效率及推荐的精准性问题。　　1图书推荐系统环境　　1.1Hadoop与Mahout　　Hadoop包括HDFS和Map/Reduce2个子项目。HDFS由1个名称节点（NameNode）和多个数据节点（DataNode）组成[3]。NameN

8、ode管理和维护着系统中所有文件的索引目录，记录每个数据块节点的位置。DataNode存储着用户数据，实时被Namenode调用，并且定时向NameNode发送更新的数据列表信息。Map/Reduce并行编程框架[4]用于处理大规模计算机集群上的海量数据，该模型具有良好的扩展性及高容错性；集群中的Map

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 / 2



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于item―based协同过滤农业高校图书个性化推荐算法研究

基于item―based协同过滤农业高校图书个性化推荐算法研究

相关文章

相关标签