欢迎来到天天文库
浏览记录
ID:32212099
大小:2.40 MB
页数:43页
时间:2019-02-01
《协同过滤系统的冷启动问题分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、协同过滤系统的冷启动问题研究1.2推荐系统越来越多的电子零售商和内容供应商向消费者提供了各类眼花缭乱的商品,而帮助用户从海量的信息中寻找其感兴趣的内容将会提高消费者满意度和忠诚度。个性化推荐系统就是解决此类问题而产生的,它是电子商务个性化服务的重要组成部分。个性化推荐系统属于信息过滤系统,是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。它是建立在海量数据挖掘基础上的一种高级智能平台,以帮助电子商务网站为其消费者提供完全个性化的决策支持和信息服务。个性化推荐系统采用的算法主要有三种:基于人口统计学的推荐,基于内容
2、的推荐和协同过滤推荐。1.2.1推荐技术基于人口统计学的推荐是最为简单的一种推荐算法。它只是简单地根据系统用户的基本信息发现用户的相关程度,然后将相似用户喜好的其他物品推荐给当前用户。换言之,它根据用户属性建模,比如用户的年龄、性别和兴趣等信息。并根据这些特征计算用户间的相似性,如果系统通过计算发现用户“和用户v比较相似,则把“喜欢的物品推荐给v,如下图1.1所示。由于该算法不需要历史数据,所以没有冷启动问题。另外,该算法不依赖于物品的属性,因此其他领域的问题都可以无缝接入。但是该算法比较粗糙,最终的效果很难令人满意,只适合简单
3、的推荐。/,蒜尹枞旧≯{\>躲‰用户矿图1.1基于人口统计学的推荐Fig.1.1Recommenderindemography-basedalgorithm大连理工大学硕士学位论文基于内容的推荐算法是根据物品的属性建模,根据得到的特征模型计算不同物品间的相似性,与基于人口统计学的推荐算法类似。如下图1.2所示,在实际应用中,只根据类型显然过于粗糙,还需要考虑演员,导演等更多信息。通过相似度计算,发现电影i和,相似度较高,因为他们都属于爱情类。系统还会发现用户“喜欢电影i,由此得出结论,用户“很可能对电影,也感兴趣。于是将电影i推
4、荐给“。该算法能为用户的兴趣很好的建模,并随着物品属性维度的增加,推荐的精度也将增加。由于物品的属性有限,因此很难有效地得到跟多数据。物品相似度的衡量标准只考虑了物品本身,有一定的片面性。用户“\\推荐、用户矿电影j类型:爱情、浪漫、\1囊耋名怖、惊悚相似类型:恐怖、惊悚硼似f/羹耋‰、浪漫乏类型:爱情、浪漫、图1.2基于内容的推荐Fig.1.2Recommenderincontent-basedalgorithm协同过滤是一项信息过滤技术。与传统的基于内容的过滤算法不同,协同过滤通过分析某个用户的评分信息(或者用户兴趣)等简单
5、信息,在用户集合中找到与该用户有相似评分特点(或兴趣)的其他用户对某信息的评分,聚合这些相似用户的评分后,预测该用户对此信息的喜欢程度(或者判断是否会浏览此信息),如下图1.3所示。与传统的文本过滤相比,协同过滤能够过滤掉那些机器无法基于内容自动分析的信息,如电影和音乐。并且能够基于一些复杂的,难以表述的概念(如信息质量、品味)进行过滤。另外,协同过滤具有推荐的新颖性,比如它可以推荐动作片电影给喜欢看爱情片电影的消费者。但是由于消费者对物品的评价非常稀疏,基于用户的评价所得到的用户间的相似性可能不准确(即稀疏性问题)。如果从来没
6、有用户对某一物品加以评价,则这个物协同过滤系统的冷启动问题研究品就不能被推荐(即冷启动物品问题)。因此,现在的电子商务推荐系统都采用几种技术想结合的推荐算法,即混合推荐算法。用户z图1.3传统的基于用户的协同过滤推荐Fig.1.3Recommenderintypicaluser-basedcollaborativefiltering1。2。2主要研究热点近年来,随着机器学习、社交网络、大规模网络应用需求、高性能计算、移动终端的发展和移动终端的普及推动了推荐系统领域的新发展,主要的研究热点[2J如下:(1)引用更恰当的用户和项目概
7、貌描述大部分的推荐技术都是基于有限的用户和项目信息产生用户和项目概貌,没有充分应用用户的历史交易信息和其他的可以信息。比如基于邻居的协同过滤算法几乎没有使用用户和项目的概貌信息,仅仅依据历史评分信息作出预测和推荐。尽管有些推荐技术运用了用户和项目概貌,但是这些概貌描述往往是简单的(如项目描述的关键词和用户的人口统计学特征等),并没有充分利用概貌构建技术。然而许多数据挖掘技术已用于构建用户概貌,例如关联规则、时序挖掘等方法。这类概貌构建方法已经成熟的用于网页挖掘方面,但是在推荐技术的研究中未被广泛采用。4大连理工大学硕士学位论文(
8、2)推荐的多维度研究当前关于推荐系统的大部分研究都建立在用户一项目的二维空间上。换言之,大部分的研究仅仅依据用户和项目信息,没有考虑额外的相关背景信息,这些背景信息在某些应用中可能相当重要。但是,在实际应用中,很多用户对项目的评价或购买常常基于多方面的考量,比如
此文档下载收益归作者所有