基于混合信任模型的协同过滤推荐算法探究

基于混合信任模型的协同过滤推荐算法探究

ID:24196724

大小:50.00 KB

页数:4页

时间:2018-11-13

基于混合信任模型的协同过滤推荐算法探究_第1页
基于混合信任模型的协同过滤推荐算法探究_第2页
基于混合信任模型的协同过滤推荐算法探究_第3页
基于混合信任模型的协同过滤推荐算法探究_第4页
资源描述:

《基于混合信任模型的协同过滤推荐算法探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于混合信任模型的协同过滤推荐算法探究 1引言  一个社交X站,比如脸谱X、微博,已经成为互联X用户不可或缺的一部分。信息技术和互联X技术的普及和迅猛的发展,加剧了信息过载问题,增加了用户获得有用信息的成本。推荐系统作为一种过滤技术,可以有效缓解信息过载问题,为用户提供优质的个性化服务。在传统的个性化推荐算法中,协同过滤算法无疑是最成功的一种算法。协同过滤推荐算法是基于某些特定项目的用户之间的相似性偏好来预测推荐结果的。更一般而言,如果他们在某些项目上有类似的利益,他们最有可能对一些其他项目感兴趣。基于协同过滤的方法首先基于项目或基于用户的相似性度量计算发

2、现邻居项目或邻居用户,然后通过相似性的邻居的历史偏好来预测目标用户的偏好。虽然协同过滤是有效的,但当评分数据稀疏,用户没有足够的历史评级数据来支撑相似性计算时,推荐效果表现不佳。此外,基于协同过滤的推荐系统忽略了用户之间的社会关系或信任关系,很多研究者也考虑利用社会X络关系信息来提高协同过滤推荐系统性能。  基于信任的推荐系统试图通过引入信任度量解决数据稀疏性问题,采用用户项目评分信息和用户社会信任X络信息来共同计算相似度。如果两个用户有非常少的共同评分项目,只从他们的共同额定项目的评级信息计算的信任值可能会产生误导性的信任。虽然传统的基于信任的比照系统已

3、经提出了基于评级的信任模型,或明确指定的信任指标,以获得用户的可信性,由于用户间共同评分数据的极度稀疏性,造成信任值度量的误差很大,对推荐系统精度的改良意义不大。所以本文提出一个新的混合信任度量模型,利用用户的历史评分数据和用户在社会X络中的互动交互频率来共同计算直接信任值,再通过一定的信任传递规则来计算没有直接联系和没有共同评分项目的用户之间的间接信任值,合并得到用户信任矩阵。最后基于信任矩阵和用户评分矩阵来共同预测评分,得到推荐结果。  2传统协同过滤方法  2.1传统相似性计算方法  协同过滤推荐的关键点是不同用户之间的相似性度量。广泛采用的方法是基

4、于用户的共同历史评分数据项量来进行相似度的计算。在相似性计算方法中,虽然各有其优缺点,但最常用的相似性度量方法是余弦相似性、修正的余弦相似性和皮尔森相似性。余弦相似性:将用户的评分数据转换为多维向量,然后利用这些向量的余弦值来度量用户之间的相似性。  2.2基于信任的协同过滤算法  信任被定义为一个用户对另一个用户可靠性的主观信念。信任可以分为直接信任和间接信任,直接信任是用户间直接交互作用而建立的信任,而间接信任是一个用户通过信任传播的方式和别的没有直接联系的用户间的信任关系。假设信任度量的目的是量化用户之间的信任程度,如果信任关系没有明确表示,可以从评

5、级数据或其他间接信息中推断出来。此外,许多研究人员将信任引入到基于用户的协同过滤的推荐中,并提出了许多信任模型。例如,从逻辑的角度研究用户之间的信任关系,Pitsilis提出了一种基于不确定概率理论的信任模型。然而,由于不确定性是由用户的平均评分计算得到,而评分矩阵的稀疏性导致信任模型的准确性是有限的。KovieLens站点的相关数据集来完成相应实验。MovieLens数据集是最常用来测试推荐算法性能的标准数据集。此数据集包含100000个等级从1到5的评价数值,由943名用户对1682部电影的评价。在这个数据集中,用户被要求至少对20部电影进行评分,数据

6、稀疏率是95%左右。在实验中数据集被分为训练和测试部分(80%用于训练测和20%用于测试集)。  4.2结果分析  1)实验1:通过调节评分相似度和信任度组合的权重因子ϕ来对比推荐精度MAE的值在本实验中我们将测试参数ϕ取不同值对推荐精度MAE值的影响。ϕ∈[0,1],ϕ的值从0开始,每次增加0.1,纵坐标为推荐精度MAE的值,观察纵坐标MAE值的变化,并将本文提出算法和基于用户的CF以及基于信任的CF作对比,发现当参数ϕ取值为0.6时推荐效果最佳。  2)实验2:本文算法与其他协同过滤推荐算法的比较本实验的目的是将本文提出算法与传统的协同过滤算

7、法以及近期业界比较领先的研究方法EMDP(EffectiveMissingDa⁃taPrediction)进行比较。我们使用相同的实验数据,比较了该算法与传统的协同过滤算法,如基于项目的CF,基于用户的CF,基于信任的CF以及文献中提出的EMDP算法在推荐精度方面的差异。在这个实验中,ϕ取值为0.6,和最近邻数数目取值范围为[10,60],每次增加5个邻居。实验结果如图2所示。实验结果表明,本文提出的方法可以得到较低的MAE值,因此推荐效果更好,随着产品最近邻居数目的增加,预测的质量也在不断提升。  5结论  协同过滤是目前推荐系统所使用的主流技术,但用户

8、项评分矩阵的稀疏性问题是协同过滤技术的主要限制之一。为了解决稀疏性

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。