基于用户语义相似性的协同过滤推荐算法.pdf

基于用户语义相似性的协同过滤推荐算法.pdf

ID:52973319

大小:231.63 KB

页数:3页

时间:2020-04-05

基于用户语义相似性的协同过滤推荐算法.pdf_第1页
基于用户语义相似性的协同过滤推荐算法.pdf_第2页
基于用户语义相似性的协同过滤推荐算法.pdf_第3页
资源描述:

《基于用户语义相似性的协同过滤推荐算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2013年1月机械设计与制造工程Jan.2013第42卷第1期MachineDesignandManufacturingEngineeringVo1.42No.1DOt:10.3969/j.issn.2095—509X.2013.01.019基于用户语义相似性的协同过滤推荐算法李想,周良(南京航空航天大学计算机科学与技术学院,江苏南京210016)摘要:为了解决协同过滤推荐中的稀疏性问题,提出一种基于用户语义相似性的协同过滤推荐算法。算法考虑到项目之间内在的语义关系,通过构建领域本体来计算项目之间的语义相似度,并

2、综合项目语义相似度和用户评分数据来度量用户语义相似性。实验结果表明,该算法在用户评分数据极端稀疏的情况下,依然可以获得较高的推荐质量。关键词:推荐系统;协同过滤;稀疏性;领域本体;语义相似性中图分类号:TP31l文献标识码:A文章编号:2095—509X(2013)0l一0070—03协同过滤推荐是当前应用最广泛、最成功的个的推荐质量下降的问题,提高推荐的准确性。性化推荐技术。协同过滤推荐主要根据用户对项1基于用户语义相似性的协同过滤推荐流程目的评分数据,发现用户之间或者项目之间的相关协同过滤推荐根据目标用户最近

3、邻居集的偏性,预测目标用户对未评分项目的喜好程度,从而好来预测目标用户的偏好,推荐流程主要分为2个产生推荐。目前常用的协同过滤推荐算法主要分为2类:基于用户的协同过滤推荐和基于项目的协部分:发现用户最近邻和产生推荐。基于用户语义相似性的协同过滤推荐通过引入语义知识,同时综同过滤推荐⋯。合用户评分数据来计算用户语义相似度,推荐流程传统的基于用户的协同过滤推荐算法是以用户一项目评分矩阵为基础来计算用户之间的相似陛,如图1所示。用户评分数据的缺失使系统难以准确定位目标用户融合机制卜计算用广t语义.}l=l似度的最近邻,

4、从而导致推荐质量下降。近些年,一些研领域本体用户趣模型II

5、t算用户最近邻究者开始尝试将语义知识应用到协同过滤推荐中,在解决评分数据稀疏性问题上取得了显著的效果。文献[2]提出了一种基于项目语义相似度的协同过滤推图1基于用尸语义相似性的协同过滤推荐流程图荐算法,通过计算项目之间的语义相似性来预测用户根据图1中描述的推荐流程,首先利用项目的评分,并填充用户评分矩阵,再计算用户的相似性进行推荐。文献[3]提出了一种基于本体用户模型的个分类信息构建领域本体,收集用户兴趣信息并构建性化推荐算法,利用本体构建用户兴趣模型,

6、并通过用户兴趣模型,用户兴趣模型由分类本体树中的叶改进的相似度计算方法来计算用户相似度。文献[4]子节点和相应的评分组成;然后,根据领域本体内提出了一种领域知识驱动的协同过滤推荐算法,通过部的语义关系计算项目之间的语义相似度,综合项项目语义相似度计算用户之间的语义相似度,同时结目语义相似度和用户评分数据来对余弦相似性方合用户评分相似性和用户语义相似性计算用户最近法进行语义扩展,以此来计算用户语义相似度,并邻,有效地改善了推荐质量。为目标用户产生最近邻居集;最后,根据用户最近本文提出了一种基于用户语义相似性的协同邻

7、居集的评分产生TopN推荐。过滤推荐算法。其核心在于利用领域本体中概念之间的关系来描述项目之间的语义关系,同时利用2基于用户语义相似性的协同过滤推荐算法语义扩展的余弦相似性方法来改进传统的用户相2.1计算项目语义相似度似性度量方法,并以此来计算用户语义相似性。该领域本体通常用来描述某个领域内的概念以算法能够很好地克服协同过滤中数据稀疏性导致及概念之间的关系,领域本体中的上层概念是下层收稿日期:2012一lO一08作者简介:李想(1989一),男,河南信阳人,南京航空航天大学硕士研究生,主要研究方向为信息系统集成。

8、·70·第1期李想,等:基于用户语义相似性的协同过滤推荐算法概念的泛化,下层概念是上层概念的具体化。项目,(s()一s(g))(3)』之间语义关系的表达可以借助领域本体来实现,图式中:s(p)和s(q)分别表示用户a和用户b对项目2描述了电影领域的一个分类本体,领域本体树中的平均评分;和Q分别表示项目P和qj的单位的叶子节点表示具体的电影项目,非叶子节点表示向量。根据传统的余弦相似性度量方法,当P≠g泛化的电影分类概念。时,单位向量Pl和Q之间是相互正交的,即·Q=0,但领域本体中的项目之间本身存在着某种程度上的

9、语义关联,而不是真正意义上的正交关系。因此,本文根据公式(1)中定义的项目之间的语义相似度为单位向量的点积赋予一个合理的值,即·Q,=itemsim(pi,qj)。由此可以进一步推导图2电影领域的分类本体得到用户兴趣评分向量点积的计算方法:根据Ganesan在文献[5]中提出的思想来计算·Ib=乏.乏(s(p)一s(p))·(4)项目之间的语义相似度。设分类本体树中叶子(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。