基于非对称属性的svd推荐算法的研究.doc

基于非对称属性的svd推荐算法的研究.doc

ID:20605806

大小:52.50 KB

页数:6页

时间:2018-10-14

基于非对称属性的svd推荐算法的研究.doc_第1页
基于非对称属性的svd推荐算法的研究.doc_第2页
基于非对称属性的svd推荐算法的研究.doc_第3页
基于非对称属性的svd推荐算法的研究.doc_第4页
基于非对称属性的svd推荐算法的研究.doc_第5页
资源描述:

《基于非对称属性的svd推荐算法的研究.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于非对称属性的SVD推荐算法的研究摘要:该文在传统的基于奇异值矩阵分解模型(SVD)的基础上提出一种非对称的协同过滤算法,对电影的评分进行预测。并在Movielens数据集上实验验证,该算法在平均误差方根(RMSE)上比SVD、SVD++的算法更优。关键词:电影评分预测;SVD;RMSE;矩阵分解中图分类号:TP311文献标识码:A文章编号:1009-3044(2017)03-0079-021研宄背景推荐系统现已广泛应用于很多领域,其中最典型并具有良好的发展和应用前景的领域就是电子商务领域,比如亚马逊(Amazon)、谷歌新

2、闻(GoogleNews)以及国内的淘宝网等知名互联网巨尖。一般來说,个性化推荐是根据用户的特点或购买行为,向用户推荐其感兴趣的信息。但冋时,随着电子商务规模的不断扩大,商品个数和种类快速增长,用户需要花费大量的时间才能找到自己想买的商品。这种浏览人量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决所谓的“信息过载”问题,针对特定每一个用户的个性化推荐系统应景而生。特别是近几年来,随着学术界对推荐系统的研究热度不断攀升,已经形成了一门相对独立的学科。1.1基于电影评分预测的推荐算法当今社会,人们把欣赏

3、电影当成日常娱乐中一种不可或缺的方式。有很多电影的评分网站允许用户根据其喜好程度对电影进行评分,比如IMDB,豆瓣以及一些提供在?观看的网站。然而,对于某个用户而言,并不是所有的电影都观看并且评分了。对这些缺失的评分有很多算法对其进行预测,其屮典型的有基子内容的评分预测和协同过滤算法。2实验数据集和评价指标2.1Movielens数据集实验使用Grouplens网站开放给用户的电影评分数据集,其中Movielens100K数据集包含943个用户对1682部电影的10万条评分记录(评分范围1-5分,每个用户至少对20部电影进行了

4、评分),此数据集的稀疏度为93.7%。本文采用其中ua.base和ua.test作为训练集和测试集,即80%的数据作为训练集,余下的20%的数据作为测试集,并以此对木文提出的推荐算法进行实验。2.2评价指标实际上,针对推荐算法性能优劣的衡量方法有很多,如平均绝对误差(MAE),平均方根偏差(RMSE)、覆盖率(COV)等。本文主要采用RMSE值作为算法优劣的评价标准,即通过计算预测值与真实值的平均绝对误差来判断推荐算法的好坏,推荐精度的高低与RMSE值的大小成反比。其公式如下:[RMSE=lStest(u,i)^Stest(r

5、ui-rui)2]其中,Stest为测试集中有评分记录的集合内元素的计数,[rui]为用户U对电影i的预测评分,[mi]为测试集中用户u对电影i的真实评分。3算法3.1基线预测算法多数情况下,人们早已发现用户对电影的评分往往具有很多与电影无关的因素,用户有一些属性和电影无关,电影也有一些属性和用户无关。因此,一种将偏置项加入到推荐算法当中,并将其称为基线预测算法。定义对一部电影评分的预测值为[rui],那么其公式为:[rui=u+bi+bu]其中,[P]表示所有评分的平均值:[bi]表示电影的偏移量,代表电影在接受评分时与用户

6、无关的因素;[bu]表示用户的偏移量,代表用户在评分中与电影无关的因素。2.2SVD算法但基线预测无法针对川户的潜在偏好进行评分预测,因人们对电影进行评分的时候极可能冇一些偏好,如A用户对科幻片比较感兴趣,那么该用户在对其他具有科幻特征的电影评分很可能偏高,而对非科幻片的潜在评分就很可能偏低。因此我们引入2个特征向量:[pii]和[qi]。其中[pu]表示用户对不同风格的电影的偏好,[qi]表示不同风格的用户对电影的偏好。那么,在基线预测的基础上加入上述向量,对电影评分的预测值公式为:'rui=u+bi+bu+qTipu]为了

7、得到更为准确的特征向量值,通常采用随机梯度下降法来训练上述各参量,以防止过拟合。其更新公式分别为:[bu^—bu+a1?(cui-3l?bu)[bi—bi+al?(eui-Pl?bi)][qi—qi+a2?(euipu-P2?qi)][pu<-pu+a2?(euiqi-32?pu)]其屮,定义[eui]为每次迭代训练屮用户u对电影i的预测评分与真实评分之差。3.3SVD++算法在SVD算法的基础上,Keron等人提出把隐式反馈信息融入到SVD算法中,形成了SVD++算法。算法使用R(u)表示被用户评分的电影的集合,[yj]为隐

8、主题的维度向量,其向量值与[Pti]、[qi]的向量值一致,表示隐式反馈信息的聚类。那么,对用户偏好建模的同时加入了用户已评分电影的反馈来修正用户在隐主题上的偏好。当然,此处的隐性反馈并没有直观地反映出来川户对该电影的喜欢或厌恶程度,而是仅仅表明该用户隐性地对该电影进行了评分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。