电子商务推荐系统个性化协同过滤论文:协同过滤推荐研究综述.doc

电子商务推荐系统个性化协同过滤论文:协同过滤推荐研究综述.doc

ID:57580064

大小:34.50 KB

页数:12页

时间:2020-08-27

电子商务推荐系统个性化协同过滤论文:协同过滤推荐研究综述.doc_第1页
电子商务推荐系统个性化协同过滤论文:协同过滤推荐研究综述.doc_第2页
电子商务推荐系统个性化协同过滤论文:协同过滤推荐研究综述.doc_第3页
电子商务推荐系统个性化协同过滤论文:协同过滤推荐研究综述.doc_第4页
电子商务推荐系统个性化协同过滤论文:协同过滤推荐研究综述.doc_第5页
资源描述:

《电子商务推荐系统个性化协同过滤论文:协同过滤推荐研究综述.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、电子商务推荐系统个性化协同过滤论文:协同过滤推荐研究综述[摘要]针对传统协同过滤算法的局限性,探讨目前的各种改进思路,主要结合聚类、关联规则、贝叶斯、神经网络、云模型、维数简化、对等网等技术进行改进,重点评述改进现状和存在的问题,并归纳推荐系统的评估方法,最后对协同过滤推荐的未来进行展望。[关键词]电子商务推荐系统个性化协同过滤1 引言推荐系统是为满足电子商务发展和解决网络信息超载而产生的,其关键和核心是采用的推荐技术和推荐算法。目前主要推荐技术有:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和组合推荐。其中,协同过

2、滤推荐技术在个性化推荐系统中应用最广,该推荐算法主要有两类:基于用户的协同过滤推荐算法…和基于项目的协同过滤推荐算法。前者基于这样一个假设,即如果用户对一些项目的评分比较相似,则他们对其他项目的评分也比较相似,算法通常采用最近邻技术寻找邻居用户,然后加权求目标用户对该项目的评分;后者从项目角度出发,寻找与该项目相似的若干项目,然后加权求目标用户对该项目的评分。但随着电子商务系统规模的不断扩大,它有三方面的限制,即准确性、稀疏性和可扩展性。本文针对传统协同过滤技术存在的局限性,总结协同过滤推荐的各种改进思路,并归纳了推荐系统的评估方法,预测未来发

3、展方向。2 协同过滤推荐技术及改进算法各种改进的协同过滤技术都是建立在传统协同过滤技术基础之上的,下面先探讨传统协同过滤技术及优缺点,再深入分析各种改进算法。2.1传统协同过滤算法2.1.1协同过滤推荐算法原理 协同过滤推荐算法的原理是利用用户的历史喜好信息来计算用户之间的距离,然后利用目标用户的“最近邻居”对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,系统根据此喜好程度来对目标用户进行推荐。2.1.2算法优点协同过滤最大的优点是对推荐对象没有特殊的要求,能处理非结构化的复杂对象,它具有如下一些优点:·能够过滤难以通过机器自动进行基

4、于内容分析的信息。·共享其他人的经验,能够过滤一些复杂的、难以表达的概念。·有推荐新信息的能力。这也是协同过滤和基于内容过滤的一个较大的差别,能够跨类别推荐,重在发现而不是搜索。·能够有效地使用其他相似用户的反馈信息,加快个性化学习的速度。2.1.3算法缺点 基于用户的协同过滤推荐系统有众多优点,但随着电子商务用户、商品规模的剧增,该算法也存在以下缺点:·稀疏性。在一个大型电子商务系统中,用户购买商品的总量占网站总商品量的1%左右,而参与评价的用户评价项目数少于总项目数的10%,造成了评分矩阵非常稀疏。这样一方面导致难以寻找最近邻,另一方面计算

5、相似性非常耗时。·冷开始。又称第一评价问题,或新项目问题,从一定角度可以看成是稀疏问题的极端情况。一方面,它很难向新用户提供个性化推荐服务;另一方面,在这种情况下,仅有少量评价数据不可能产生精确推荐。·扩展性。面对日益增多的用户和项目,扩展性将会成为制约推荐系统发展的一个瓶颈问题。2.2协同过滤推荐改进算法尽管协同过滤技术在电子商务推荐系统中的应用获得了很大的成功,但随着商品数量和用户人数的不断增加,基于协同过滤的推荐系统的发展面临着算法的可扩展性和推荐质量两个主要挑战。在这种情况下,众多的研究人员提出了基于协同过滤的改进算法,改进算法主要体现

6、在与聚类、关联规则、贝叶斯、云模型、神经网络或免疫网络、维数简化以及对等网等技术的结合。2.2.1结合聚类技术·基于项目的聚类。o’connor等对项目进行聚类,在对应的聚类中搜索目标用户的最近邻,算法虽然提高了可扩展性但是推荐质量并没有提高,原因是每个聚类中的用户数并不是随着聚类中项目数的减少而减少,所以这种方法在用户对多个聚类中的商品均有评分的情况下并不理想。邓爱林等根据用户对项目评分的相似性进行聚类,从而只需要在与目标项目最相似的若干个聚类中就能寻找到目标项目的大部分最近邻,结果表明该算法能够保证在尽量小的项目空间上查询到目标项目尽量多的

7、最近邻,从而有效提高推荐系统的实时响应速度。但实验是在计算目标项目与聚类中心相似性的时间代价相对于最近邻查询可以忽略的条件下成立的,当聚类数目很大的时候是不能忽略的。翁小兰等基于项目特征聚类的协同过滤推荐算法,选取k个具有代表性项目属性形成项目特征矩阵,并利用特征矩阵进行未评分项的预评分,其关键是要选择合适的特征属性,该算法可解决数据稀疏性和新产品的冷启动问题。·基于用户的聚类。adomavicius等利用用户评分的相似性对用户进行聚类,当用户离线时预处理用户数据,在线时利用已有的用户聚类寻找目标用户的最近邻并产生推荐。算法在一定程度上提高了推

8、荐质量,但当用户评价数据极端稀疏时该方法依靠用户评价聚类的可靠性不高。ranshid等用bisectingk-means聚类生成每个聚类的代理用户,基

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。