一种基于支持向量机回归的推荐算法_王宏宇

一种基于支持向量机回归的推荐算法_王宏宇

ID:37828614

大小:248.04 KB

页数:7页

时间:2019-06-01

一种基于支持向量机回归的推荐算法_王宏宇_第1页
一种基于支持向量机回归的推荐算法_王宏宇_第2页
一种基于支持向量机回归的推荐算法_王宏宇_第3页
一种基于支持向量机回归的推荐算法_王宏宇_第4页
一种基于支持向量机回归的推荐算法_王宏宇_第5页
资源描述:

《一种基于支持向量机回归的推荐算法_王宏宇》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第24卷第6期中国科学院研究生院学报Vol.24No.62007年11月JournaloftheGraduateSchooloftheChineseAcademyofSciencesNovember2007文章编号:1002-1175(2007)06-0742-07一种基于支持向量机回归的推荐算法王宏宇糜仲春梁晓艳叶跃祥(中国科学技术大学管理学院,合肥230026)(2007年1月18日收稿;2007年4月24日收修改稿)WangHY,MiZC,LiangXY,etal.Arecommendationalgorithmbasedonsupportvectorregression

2、.JournaloftheGraduateSchooloftheChineseAcademyofSciences,2007,24(6):742~748摘要随着电子商务的迅速发展,推荐系统与算法已经成为理论研究的热点.支持向量机是一种强大的分类工具,由其衍生出的支持向量机回归方法能很好地解决非线性回归问题.以电影推荐为例,引入支持向量机回归方法来分析项目的内容,构建用户模型,进而给出推荐.实验结果和理论分析表明,这种推荐算法与传统协同过滤算法相比,能够明显提高推荐精度,并显著缩短了推荐所需时间;在大样本量情况下也能同样高效.关键词推荐系统,支持向量机回归,基于内容的推荐中图分类号

3、P1811引言推荐系统是一个方兴未艾的研究领域.日常生活中,我们常常要在自己不了解,或是没有亲身体验的情况下,通过亲朋之间的口口相传、推荐信、报纸上的影评书评或杂志上餐厅指南等的帮助,来选择自[1]己要消费的商品.推荐系统就是利用计算机辅助将一种项目推荐给用户、帮助用户做出决策而实现上述过程的专家系统.被推荐项目包括电影、书籍、网页、音乐、餐厅等.1992年,Goldberg等人提出了一个[2]新型的邮件过滤系统———Tapestry,首次使用了协同过滤算法来进行推荐,被学术界普遍认定为第一个真正意义上的推荐系统.其后10年来,随着信息技术的发展和电子商务的成长,推荐系统得到了

4、广泛应用.从Amazon、淘宝网等大型电子商务网站,到IMDb等影音资料库,甚至一个小小的BBS社区,都在[1,3]不同程度上引入了推荐系统.对推荐算法的研究也逐渐成为理论研究的热点,主要分为3个基本流[4]派:(1)协同过滤;(2)基于内容的;(3)混合算法(利用算法融合、结果融合或其他方法将协同过滤与基于内容算法结合起来,以求达到较好的推荐效果).协同过滤算法(CollaborativeFiltering,一般简写为CF)是当前推荐算法的主流,其基本思想是从用户评分矩阵中计算活跃用户cA与其他用户ci之间的相似度w(a,i),得到cA的最近邻居集Cneighbor.经典的[

5、5]协同过滤相似度有余弦相似度、Pearson相关系数等.例如Pearson相关系数的相似度如下:m∑(ra,i-ra)(ru,i-ru)i=1w(a,i)=,(1)mm22∑(ra,i-ra)∑(ru,i-ru)i=1i=1其中,ra,i表示用户a(这里代表活跃用户cA)对项目i的评分值.然后利用Cneighbor对项目iunrated评分的加E-mail:chwhy@mail.ustc.edu.cn第6期王宏宇,等:一种基于支持向量机回归的推荐算法743权平均值来预测cA对iunrated的评分,预测值为:n∑wa,u·(ru,i-ru)u=1pa,i=ra+n.(2)∑w

6、a,uu=1可以看出,该算法不考虑项目的内容,可以灵活的进行不同类型的项目推荐.但不考虑内容的特性也导致其很难精确反映用户的独特个性;而且用户评分矩阵的稀疏性问题也会严重影响该算法的时间效率.不少研究者尝试采用经典信息检索理论的思想,提出基于内容的推荐算法,或是混合算法,来解决这些问题.这类算法的基本思想是首先构建用户模型UP(userprofiles),然后根据待评分项目iunrated的内容特征与用户cA的用户模型UPA之间的匹配程度来做出评分预测.现在主要的基于内容推荐系统集中在推荐包含文本内容的项目上,如文档、网页(URLs)、新闻组等,使用的方法主要是传统的TF-ID

7、F方法,也有些人探讨了朴素贝叶斯网络、神经网络等技术的使用.[6]Vapnik等人在20世纪60年代提出了支持向量算法(SupportVectoralgorithm).基于此算法,贝尔实[7]验室在90年代大力发展了支持向量机(SVM,SupportVectorMachine)理论;该算法迅速成为文本分类、模式识别等分类问题中最好的算法之一.稍后,支持向量机回归(SupportVectorRegression,SVR)被引入[8,9]非线性回归领域,也显示了其巨大威力.尽管支持向量算法取得了

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。