欢迎来到天天文库
浏览记录
ID:58298197
大小:1.67 MB
页数:2页
时间:2020-05-03
《一种基于领域本体的混合推荐算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、两化融合一种基于领域本体的混合推荐算法郑元平/浙江师范大学数理与信息工程学院.r.容过滤主要取决于表征项目的内容(或特content(d1)=(wli,w2l,W3i,⋯)(3)I'’I征)之间的相似度,其优点是它不需要额外而用户的兴趣则通过算法从Content中学习得到。令的其他用户的数据,它只需要用户的使用历profile(u)表示用户的兴趣模型,一种简单的表征用户兴史记录以及相关项目的信息。然而,这种推荐算法的缺点趣模型的方式为:却是:随着系统当中项目数量的增多,计算项目(或特lprq/~/e()。Ⅳ“1l,czmtent(∥)(4)征)间的相似度将变成棘手的问题。协同
2、过滤算法是基于用户之间相似性的,它不需要项目的其他信息。然而,协任意给定一个用户u,11一个待推荐的项目d,则用户U同过滤却面临冷启动问题⋯,此外矩阵稀疏性问题也是传对d的喜好程度可以表示为:统协同过滤推荐算法的另一个严重的问题。同时,传统CBPref(u,d)=Score(profile(u),content(d))(5)的这两种推荐算法不能很好的挖掘和预测用户的兴趣,并2领域本体且它们对于用户兴趣的变化做出的反应非常慢。本体(Ontology)是关于一个领域的明确的规范的形1主要的推荐算法式化说明。图1展示的是电影推荐领域中相关的抽象概1.1协同过滤(简称CF)。是目前使
3、用和研究最多的念。推荐算法”,协同过滤通过邻居用户的信息来计算得到目标用户的推荐。其认为:一个用户会与和他有相同兴趣的用户喜欢相同的项目。任意给定两个用户U和v,用N(u)表示用户U的特征集合,N(v)表示用户v的特征集合,则u和v的相似度可以使用如下公式进行描述:N()nnr)Ⅲ“)。;Ui一.)~JN÷、(1)于是,用户u对项日i的喜好程度可由预测评分表示为:(、-,:,te~u,,)=IZ~'erSim(u,).wte(v,)(2)、协同过滤以用户对项目的评分来代表用户的喜好程度,协同过滤算法使用用户.项目评分矩阵的行列向量来表示用户和项目,因而用户和项目都是用评分向量
4、表示的。图1领域本体MovieLens、Ringo和Tapestry等是使用协同过滤著名的系其中与用户相关的信息有两方面:使用历史是用来记统录用户在观看电影时的动作的。’兴趣节点记录的是用户的1.2内容过滤(简称CB)从搜索引擎发展而来】,是兴趣,其中对象属性“兴趣点”指向的是用户感兴趣的对协同过滤技术的延续,是一种非常重要的推荐技术,也是象,它的实例即为用户的Profile。其中的用户兴趣部分是一种匹配技术。CB认为用户会喜欢与他之前喜欢的项目相最主要的,在本文用户的兴趣模型被描述为向量Profile=似的项目。内容过滤要求为项目和用户建模,一般的方法(Il,I2,⋯⋯,I
5、N)。是设立配置文件(profile)用于储存用户兴趣和项目的内3基于本体的推荐算法容【9】。令k,是项目d的第i个关键词,W。为ki对应的权重,那3.1本体中概念的语义相似度计算公式么项目di可以用向量模型表示为:在本文中,我们引进语义相似度计算公式,则本体中●卜—————————一中图分类号:TP391.3CDSoftwareandApplicationsl134本期关注两化融合任意两个概念A和B的语义相似度定义为:基于本体的混合推荐。以上算法的步骤只进行到评分预测,并未得出最终的推荐结果。在混合推荐算法中,本⋯l/。j'L—detain'(.4一,B)j(6)文将上面多
6、种算法的预测评分进行线性组合,得到组合评其中:distance()表示树形结构中两个节点的距分,其步骤为:离,depth()、density()分别表示节点深度和密度。公1C:使用(10)组合评分公式进行评分:式中的三个因式分别代表语义距离、节点深度和密度对语HYbPref(u,d)=Q·CBPref(u,d)+义相似度的影响。(1.Q)·CFPref(u,d)(10)3.2基于本体的推荐算法接下来的步骤是以上算法都可以继续的步骤,它是以基于本体的协同过滤。其算法步骤为:上算法的推荐步骤。1A:使用公式计算出与目标用户最相似的K个邻居;对刚刚评分的项目按评分排序,将评分最高的
7、前N个UserSim(u,v)=Osim(u,V)=Osim(profile项目推荐给用户。(u),profile(v))(7)因此,在实际系统当中我们的算法即可以各自单独的2A:使用公式(8)进行评分预测,并用预测评分填运行,也可以两种组合起来运行。充和修正评分矩阵;4结束语cF1,:⋯ff_卜w(CpdataTim~J.L(seJ'Sim(tt·l)rate(v,d)(8)在基于本体的协同过滤和内容过滤算法中,本文将基于本体的内容过滤。其算法步骤为:传统的基于向量模型的相似度计算公式改为了基于本体1
此文档下载收益归作者所有