欢迎来到天天文库
浏览记录
ID:23973993
大小:719.09 KB
页数:15页
时间:2018-11-12
《基于协同过滤的智能书籍推荐系统.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、评委一评分,签名及备注队号:评委三评分,签名及备注20038评委二评分,签名及备注选题:评委四评分,签名及备注B题目:基于协同过滤的智能书籍推荐系统摘要随着信息技术和互联网的迅速发展,人们逐渐从信息匮乏的时代走入了信息过载的时代,对于信息消费者来说,从大量信息中找到自己感兴趣的信息是非常困难的事情;而对于信息生产者来说,让自己生产的信息脱颖而出,受到广大用户的关注,也是非常困难的事情。为了解决这一矛盾,建立了基于主成分分析的去相关模型、预测书籍评分模型、协同过滤推荐模型,解决了用户从众多书籍中找出优质图书的难题。针对问题一
2、:依据相关性理论,建立了基于主成分分析的去相关模型,得到了影响用户对书籍评价的主要因素。首先对给出的数据进行分析和筛选,找出可能会对书籍评分产生影响的因素。其次,建立主成分分析的去相关模型,研究所选因素是否能够科学、准确地影响对书籍的评价。最后,通过分析得出影响用户对书籍评价的因素为书籍标签数和间接关注度(关注好友)。针对问题二:依据线性回归理论,建立了预测书籍评分模型,可预测出用户对书籍的评分。首先建立预测用户和已评用户的评分矩阵,对每本书引入阅读特征x(i)(x,x),对每一个用户引入一个参数,对评分矩阵逐列进行线
3、性回归,12''得到的矩阵再由梯度下降法优化,求得模型参数。其次,参数和两个特征进行内积,建立最终的预测书籍评分模型,并用该模型预测附件中指定的六个人对各自六种不同书籍的评分。最后,通过比较预测评分与所给评分,进行误差分析,得到模型预测值较精确。针对问题三:依据协同过滤技术,建立了协同过滤推荐模型,可给用户推荐感兴趣的书籍。首先根据问题二得到用户对书籍的评分,创建所有已有评分的系数矩阵。其次,通过比较改进的余弦相似矩阵和皮尔逊相似矩阵的MAE值,得到被推荐用户相似性最大的若干用户。最后根据相似性最大用户所看过的书籍,给
4、出被推荐用户感兴趣的书籍。最后,分析了模型的优缺点。本文运用协同过滤技术为对评分和书籍推荐系统进行了研究,对用户成功推荐了书籍。另外,本文建立的数学模型具有较强的“可移植性”,可推广到网络、媒体、影视等领域。关键字:主成分分析,回归预测,协同过滤,相似矩阵基于协同过滤的智能书籍推荐系统1.问题重述与分析随着信息技术和互联网的不断发展,大量的信息涌现在我们面前。用户面对这些信息很难找到自己真正感兴趣的内容,而信息提供商也很难把优质的信息准确传达给感兴趣的用户。因此,研究书籍评分的问题对信息提供商为用户推荐优质的图书有着非常重
5、要的应用价值。问题一要求找出影响用户对书籍评分的因素。需要挖掘题目所给文字信息和数据库信息,对给出的数据进行合理的分析、筛选,找出可能会对书籍评分产生影响的因素,通过建立模型,研究所选因素是否能影响用户对书籍的评价。问题二要求预测predict.txt附件中的用户对未看过书籍的评分。依据第一问找出的影响用户对书籍评分的因素,作为参数,建立基于项目的评分预测模型,并求出评分。问题三要求给每个用户推荐三本没看过的书籍。从用户的角度考虑,应该关注与他兴趣爱好相似的人所看过的书籍,从中间找出评分比较高的书籍作为用户最终推荐的书籍。
6、因此,要解决如何更好地找出与该用户相似度高的其他用户。2.模型假设(1)通过数据挖掘,本文仅考虑标签数、关注度、书被翻阅次数三个可能的因素,不考虑其他的因素;(2)好友关系是单向的;(3)用户没有评分的项目均将评分假设为其所在行的平均值;(4)不考虑原始数据的缺失问题。3.符号说明R:相关系数ijx:i1表示书签1,i2表示书签2iMAE:平均绝对偏差sim:用户i和项目i之间的相似度xyxyP:目标用户对为未评分目标的预测分数a,yNBS:用户u的最近邻居集合uR:用户u和用户n对项目的平均评分n4.模型的建立与求解
7、4.1基于主成分分析的去相关模型4.1.1相关性理论【1】主成分分析法是一种通过降维技术把多个变量化为少数几个主成分(即综合变量)的统计分析方法。其中每个主成分都是原始变量的线性组合,各主成分之间互不相关,从而这些主成分能够反映原始变量的绝大部分信息,且所含的信息互不重叠。采用这种方法可以克服单一的理化指标不能真实反映用户对书籍评-1-分的全面特征的缺点,引进多方面的理化指标,但又将复杂因素归结为几个主成分,使得复杂问题得以简化,同时找出更为科学、准确的影响书籍评价的因素。首先,根据题目所给数据,找出可能影响用户对书籍评分
8、的因素即:1、某本书被用户翻阅过的次数;2、间接关注度(用户社交所体现的某本书的关系数据);3、书籍的标签数。其次,对找出的三个因素进行整体检验,即对整个评价体系中的每一个元素(即单项评价指标)进行可行性、正确性、真实性三个方面进行分析。(所谓可行性,是指该指标的数值能否正确获得,那些无法或很难取得准确
此文档下载收益归作者所有