推荐系统中的用户兴趣模式检测1

推荐系统中的用户兴趣模式检测1

ID:34478613

大小:385.44 KB

页数:7页

时间:2019-03-06

推荐系统中的用户兴趣模式检测1_第1页
推荐系统中的用户兴趣模式检测1_第2页
推荐系统中的用户兴趣模式检测1_第3页
推荐系统中的用户兴趣模式检测1_第4页
推荐系统中的用户兴趣模式检测1_第5页
资源描述:

《推荐系统中的用户兴趣模式检测1》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、http://www.paper.edu.cn1推荐系统中的用户兴趣模式检测杨杰,陈恩红中国科学技术大学计算机系,合肥(230027)E-mail:jayyouth@ustc.edu,cheneh@ustc.edu.cn摘要:近年来推荐系统已经被证明是一种非常有效的方法用以处理网络上的信息过载问题,这些推荐系统根据用户以往的访问记录为用户兴趣建模,并根据用户兴趣给用户提供推荐项。然而,当前在推荐系统方面的研究几乎都忽略了用户访问记录的时间因素,这些系统在为用户做推荐的时候并不知道用户的兴趣是否发生了改变,或者说并不知道在推荐那一刻并不知道用户真正需要什么。本文

2、对用户访问记录进行深入分析,提出了四种典型的用户兴趣模式,并提出了一种及于子图稠密度和连续度的方法来检测这四种模式。实验结果显示该方法可以有效检测用户兴趣模式。关键词:推荐系统;兴趣模式;偏移检测;序列分割中图分类号:TP31计算机软件1.引言推荐系统常常在用户先前访问数据、访问项的内容以及用户自身信息等基础上为用户提供他们可能感兴趣的推荐项。目前在推荐系统方面有很多有意义的研究[1],包括基于内容的推荐(content-based)、基于协同过滤的推荐(collaborativefiltering)和混合推荐(hybridmethod)等。然而,大多数当前的

3、研究很少关注用户兴趣上的转变,尽管现实中用户的兴趣总是在发生变化。这些系统大都把用户的访问数据全部同等地进行处理,而不关心用户的兴趣是否发生了变化,也不在乎系统提供推荐那一刻用户真正的兴趣是什么。到目前为止,只有少数的研究考虑了时间因素和检测用户兴趣的变化[2]。文章[3]使用关联规则挖掘算法在基于内容的推荐系统中建立兴趣变化规则;文章[4]使用一种SOM(self-roganizingmap)聚类方法来检测用户兴趣在协同过滤系统中的变化。然而为了达到更好的推荐效果,实际的推荐系统大多采用混合的推荐模式来建立推荐系统,因此迫切需要一种更一般的方法来检测用户兴趣

4、在复杂的推荐系统中的变化。为了提高推荐系统的性能,本文分析了时间相关的用户评分数据,并提取出四种用户兴趣模式。它们分别为:单一兴趣模式(singleinterestmode),多兴趣模式(multipleinterestsmode),兴趣偏移模式(interestshiftingmode),随机噪声模式(casualnoisemode)。其中,兴趣偏移模式和随机噪声模式存在于系统数据中的话将会对推荐系统的推荐性能造成很大的影响。于是我们把所有的项构建成一个相似网络图,并且定义了用户访问项子图,以及子图的稠密度和连续度。根据子图的稠密度和连续度我们识别出了单一兴

5、趣用户和随机噪声用户。而且我们采用基于稠密度的启发式分段算法识别多兴趣用户和兴趣偏移用户,达到很高的准确度和召回率。本文主要贡献有以下几点:(1)本文提出了四种用户兴趣模式,它们可以揭示出用户兴趣的变化。根据有的用户具有单一兴趣,有的用户同时具有多个用户,有的用户兴趣发生改变,而有些用户的访问数据类似随机噪声,我们提出四种模式,缩写为:SIM,MIM,ISM,CNM。(2)我们提出了一种方法根据用户的访问记录来检测用户的兴趣模式。首先我们在稠密度和连续度的基础上设置了阈值来识别单一兴趣用户和随机噪声用户。随后采用一种基于稠密度的分割算法识别多兴趣用户和兴趣偏移

6、用户。实验结果显示我们的方法在精确度、召回率和F-值方面都有超过90%的得分。1本课题得到国家教育部基于“中国科技论文在线”模式的科技论文网络发表平台的个性化服务研究,教育部博士点基金项目(2007105)的资助。-1-http://www.paper.edu.cn本文的剩余部分组织如下:第二节我们首先介绍了推荐系统中项具有的相似度特性,接着在此特性基础上根据用户的访问行为概括出了四种用户的访问模式,包括单兴趣、多兴趣、兴趣偏移和随机噪声模式。然后我们给出了用户访问项子图及其稠密度和连续度的定义,并在两者基础上给出了稠密度和连续度的阈值来识别单兴趣模式和随机噪

7、声模式,更进一步本文提出了基于稠密度的启发式分割算法来检测兴趣偏移,从而识别兴趣偏移模式和多兴趣模式。第三节我们在模拟数据上做了一些实验来识别四种模式,结果显示我们的方法对识别用户访问模式具有相当好的性能。第四节中本文详细介绍了一些与用户兴趣偏移检测相关的研究工作。最后一节对本文进行总结并给出了我们的结论。2.兴趣模式2.1项的相似性网络先前的研究[5,6]显示项之间存在相似性。我们从MovieLens数据集(详细描述在3.1小节)中选取了一些电影作为例子。表1给出了这些电影以及它们具有类型的描述。对于电影Mi和Mj,它们的类型用Gi和Gj表示,则电影Mi与M

8、j的相似度可以定义为:

9、GIG

10、ijs

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。