基于baseline svd主动学习算法的推荐系统

基于baseline svd主动学习算法的推荐系统

ID:23777847

大小:60.00 KB

页数:9页

时间:2018-11-10

基于baseline svd主动学习算法的推荐系统_第1页
基于baseline svd主动学习算法的推荐系统_第2页
基于baseline svd主动学习算法的推荐系统_第3页
基于baseline svd主动学习算法的推荐系统_第4页
基于baseline svd主动学习算法的推荐系统_第5页
资源描述:

《基于baseline svd主动学习算法的推荐系统》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于BaselineSVD主动学习算法的推荐系统季芸1,胡雪蕾1,2(1.南京理工大学,江苏南京210094;2.江苏省社会安全图像与视频理解重点实验室,江苏南京210094)摘要:推荐系统是一种解决信息过载的新型技术,为了解决推荐系统中新用户带来的冷启动问题,提出一种基于主动学习的推荐系统。主动学习方法能有效减少需要标记的样本数量,快速建立模型,在此选择将主动学习方法和BaselineSVD推荐算法结合起来,通过记录模型训练得到的预估评价的改变程度,认为改变最大的样例即是最具有信息量的样例,供新用户标记,并重新训练模型

2、。通过与其他选择策略进行实验比较,证实了该方法确实有效解决了新用户带来的冷启动问题。.jyqkory-based),包括ItemCF算法和UserCF算法,通过计算用户或物品之间的相似度来做推荐;另一种是基于模型的协同过滤(Model-based),基于模型的推荐算法往往结合了数据挖掘、人工智能、机器学习等诸多技术,常见的有基于聚类的推荐、基于矩阵分解的算法、SlopeOne[3]等,其中基于矩阵分解的算法有:SVD,BaselineSVD[4],SVD++[5]等。在NetflixPrize推荐大赛之后,基于矩阵的推荐

3、算法迅速崛起。推荐系统的发展受到了诸多因素的影响,其中一种便是新用户问题。推荐系统算法非常依赖历史数据,在用户新注册互联网应用之后,系统由于没有该用户的相关数据,而无法为新用户做出准确的推荐,这会大大影响互联用应用对用户的黏着性。为了解决新用户问题,常见的方案有:(1)非个性化推荐,随机推荐或者推荐热门,这种方法不够个性化,系统必须累积一定数量的数据才能启动推荐系统;(2)根据用户注册信息做出推荐,用户的注册信息往往是有限的,这样的推荐偏向粗粒度;(3)主动询问,该方法通过与用户交流,主动获取建立模型需要的相关知识,快速

4、建立准确模型。推荐系统中,在将推荐产品呈现给用户时,一方面期望得到用户的满意度,另一方面期望能从用户的操作中学习到用户的偏好,这正是主动学习所致力的,因此将主动学习结合推荐系统是不谋而合的[6]。国外研究人员目前常用的算法是将贝叶斯理论作为样本选择策略,AM(AspectModel)算法为基准学习器[7]。Jin等针对模型本身不确定性的问题,提出了改进,使得用户参数向着准确的方向增长[8]。RasoulKarimi提出一种基于矩阵分解的主动学习算法,选出预估评分最低的样本供用户选择[9]。1相关算法介绍1.1SVD算法S

5、VD(SingularValueDeposition)[4]是一种基于潜语义的分析模型,它将用户和物品映射到低维的隐类别上,根据用户对物品已有的评分情况,分析用户和各个潜在类别,以及物品和各个潜在类别的关联程度,最后再反过来求解评分矩阵。设用户集U={u1,u2,…,uN},电影集I={i1,i2,…,iM},用R矩阵表示用户U对物品I的评分矩阵,如表1所示,矩阵存在很多空洞,这种空洞的百分比很大,往往可以达到99%。式中:矩阵P表示用户对于潜在类别的相关程度;矩阵Q表示物品对于潜在类别的相关程度;K的取值需要根据不同的

6、数据进行选择。1.2BaselineSVD算法考虑到不同用户可能有不同的打分偏向,某些用户习惯打高分,某些用户习惯打低分,并且不同的电影也有不同的评分趋势,为了解决这个问题,将这种偏差列入公式:r-u,i=μ+bi+bu+pTuqi(3)式中:μ表示所有电影的平均分;bi表示物品偏差;bu表示用户偏差。为求解公式中所需要的P,Q等未知变量,可以通过最小损失函数来得到答案,并且为防止过拟合问题,添加了正则化式,式(4)采用平方误差和作为损失函数,其中的S表示训练集:可以通过随机梯度下降法最优化解,具体参数更新公式如式(5)

7、所示:BaselineSVD算法在精确度上有很好的表现,这也是本文使用该算法作为基准学习器的原因。但是当新用户注册时,由于其历史数据过少,BaselineSVD算法对新用户的推荐仍是很不精确的,需要一个慢慢启动的过程。2基于主动学习的BaselineSVD算法为解决新用户问题,本文选择将主动学习策略和推荐算法结合起来的方法,以加快冷启动速度。主动学习根据样本选择策略,从提问池中选择一个样本供新用户标记,并不断修正模型,直到模型稳定为止,训练模型的过程如图1所示,这是一个不断迭代的过程。主动学习的核心是样本选择策略,目前常

8、用的样本选择策略有:基于不确定性缩减的算法,基于误差缩减的算法和基于版本空间缩减的算法。将主动学习策略与其他应用做结合的研究很多,例如基于主动学习的字符识别[10]、文本分类等。由于不同的学习算法需要不同的主动学习策略,基于AM算法的主动选择策略并不适用于BaselineSVD算法,并且他们的模型太过复杂,本文选择B

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。