欢迎来到天天文库
浏览记录
ID:10573656
大小:49.50 KB
页数:2页
时间:2018-07-07
《基于item―based协同过滤农业高校图书个性化推荐算法研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于Item―Based协同过滤农业高校图书个性化推荐算法研究摘要:针对高校用户对图书的个性化需求,运用用户对图书的评分,构建了基于Hadoop和Mahout的图书推荐系统。通过Hadoop中分布式文件系统(HDFS)和Map/Reduce计算模型的应用,发现当Hadoop中节点数不断增加时,计算时间不断减少,实时响应效率得到了提高;通过对Mahout中传统的Item-Based聚类协同过滤推荐算法进行改进,利用MAE值对传统和改进后的协同过滤算法进行比较,发现图书推荐的精度进一步提高。总体来说,推荐系统改善了传统单机运行
2、内存严重不足和推荐结果不精确的问题。中国8/vie 关键词:高校图书馆;个性化推荐算法;协同过滤算法;大数据 中图分类号:G258.6+62文献标识码:A:0439-8114(2017)06-1150-05 DOI:10.14088/j.ki.issn0439-8114.2017.06.040 Abstract:Forpersonalizedbookneedsofusersatcollegesanduniversities,endationsystembasedonHadoopandMahoutusingthesc
3、oresgivenbyusers.ThroughtheapplicationofHadoopdistributedfilesystem(HDFS)andMap/Reducecalculationmodel,eisreducederesponseefficiencyisimprovedberofnotesintheHadoop.ThroughtheimprovementoftraditionalItem-Basedcollaborativefilteringremendationalgorithm,clusteringint
4、heMahout,sprovedcollaborativefilteringalgorithmsbyusingMAE,andfindthattheprecisionoftheremendationisfurtherimproved.Ingeneral,thisexperimentimprovestheproblemofout-of-memoryfortherunningoftraditionalsinglemachineandtheinaccurateresultsofremendation. Keyendational
5、gorithm;collaborativefilteringalgorithm;bigdata �S着图书馆事业的发展,用户对图书馆资源的使用提出了越来越高的要求;为读者提供有针对性的服务,成为图书馆发展中所面临的具体任务之一。在建设智慧图书馆中,国外个性化图书推荐服务已经比较成熟,但国内个性化推荐系统尚不完善[1]。目前国内大部分高校图书馆都是通过输入关键词进行模糊搜索,然后列出只和关键词相关的书籍,没有达到智能以及个性化推荐的效果。在借阅图书的过程中,用户过去产生的行为分为显式用户反馈与隐式用户反馈两种,主要包括浏览
6、页面、搜索图书、收藏图书、借阅图书、评论图书、图书评分等用户行为[2]。本试验通过显式用户反馈中的图书评分,推荐出在校学生和老师感兴趣的书,达到一个图书个性化推荐的效果。河北农业大学图书馆每天产生大量的数据信息,单机运行无法满足实时响应的效率。在处理大规模海量数据时,许多研究者将其设计的协同过滤算法部署于Hadoop并行化平台,以期在保证结果准确的前提下,通过Hadoop提高协同过滤算法执行的效率。Mahout提供了Hadoop并行化算法的接口,本试验将Mahout中提供的基于项目聚类协同过滤算法与Hadoop中Map/R
7、educe计算模型和分布式文件系统(HadoopDistributedFileSystem,HDFS)进行结合,改进原来的推荐算法,设计出河北农业大学高校图书推荐系统。该推荐系统由Application业务系统、Mahout计算框架、Hadoop集群组成,解决了海量数据环境下算法实施的效率及推荐的精准性问题。 1图书推荐系统环境 1.1Hadoop与Mahout Hadoop包括HDFS和Map/Reduce2个子项目。HDFS由1个名称节点(NameNode)和多个数据节点(DataNode)组成[3]。NameN
8、ode管理和维护着系统中所有文件的索引目录,记录每个数据块节点的位置。DataNode存储着用户数据,实时被Namenode调用,并且定时向NameNode发送更新的数据列表信息。Map/Reduce并行编程框架[4]用于处理大规模计算机集群上的海量数据,该模型具有良好的扩展性及高容错性;集群中的Map
此文档下载收益归作者所有