基于多特征融合的混合协同过滤算法研究

基于多特征融合的混合协同过滤算法研究

ID:23531508

大小:2.86 MB

页数:37页

时间:2018-11-08

基于多特征融合的混合协同过滤算法研究_第1页
基于多特征融合的混合协同过滤算法研究_第2页
基于多特征融合的混合协同过滤算法研究_第3页
基于多特征融合的混合协同过滤算法研究_第4页
基于多特征融合的混合协同过滤算法研究_第5页
资源描述:

《基于多特征融合的混合协同过滤算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西南大学硕士学位论文大量的学者对协同过滤技术展开了研究,关于协同过滤的文献更是如雨后春笋的出现在各大学术网站上。关于协同过滤的研究主要可以分为两个方面:基于记忆的协同过滤算法和基于模型的协同过滤算法[12]。旱期的协同过滤就是从基于记记的方法开始的,基于记忆的方法根据用户对项目的评分得到用户间和项目问的相似关系,利用相似的用户或项目的评价产生预测。基于记忆的方法又可以分为基于用户的协同过滤和基于项目的协同过滤,主要可以概括为以下三个步骤:相似性的计算、邻居的选择以及预测。常用的相似性计算方法包括余弦相似性的方法[4,5]和皮尔森关联相似的方法[6,7,8]。为了克服基于少量共同评分造成相似

2、性度量的不准确,Herlocker[9]提出了增加一种关联权重因子的万法来平衡相似性的值。由于用户的兴随是不断变化的,仅仅利用过去的评分来度量用户现在的相似性并不是恨准确,基于此种考虑,Jeong[lO]使用迭代的信息传送流程对相似进行更新。在邻居选择部分,最经典的邻居选择算法有阳制方法[11]和基于

3、淘值[12]的方法。标准的邻居边择方法基于项目或用户的相似性大小,Al司andro[13]根据用户喜好重叠的多少来边择邻居,该方法在存储和时间花费方面有小小的改进,然而,推荐的精度有待衡量。在预测方面,Ma在[14]中提出了一'种用户和项目预测结合的方法,该方法通过判断用户和项目的相似邻居来

4、决定采用何种方法进行预测。在文献[4]中,Marlin利用迷失数据的理论对评分进行预测。基于模型的方法利用统计技术或机器学习等方法对己知的评分数据离线构建用户的模型,利用构建好的模型对迷失数据进行实时预测,己知的基于模型的方法包括聚类的方法町,概率语义的方法IlEl,矩阵分解的方法币,id],贝叶斯网络的方法[17],线性回归的方法[1町等。Koren在[19]中利用时间序列模式的方法对数据的有效范围影响进行追踪构建了暂时性动态模型。基于模型的方法比较稳定,实时性较好。然而,建模需要大量的用户和历史评分,通常需要调整大量的参数、费时并且难以更新:另外,基于模型的方法只把原始数据分成若干小类

5、,来表征所有用户的评分模式,这大大降低了数据的多样性,一般来说基于模型的方法比基于记忆的方法推荐效果稍差[20]。为了克服基于内存和基于模型的缺点以改进推荐的性能,目前,混合的方法被研究。庄永龙在文献[21J中根据项目特征属性构建了项目特征模型,丰富了项目间的相似性度量使得预测精度有所提高。Lee在文献[22]中通过构建泪合的智能神经网络模型来处理样本之间的相似度量。Gong在[12]中通过对用户项目进行聚类,在聚类后的簇中寻找相似的邻居,该方法有效缩小了邻居边择的时间。Xue在向中先对用户进行聚类,采用聚类平滑的方法对迷失数据填充,再用项目聚类的方法进行预测。Jahrer[7J结合了不同

6、的模型(SVD,KNN,RestrictedBoltzrnannmachine等),2万方数据第1章引言利用混合的推荐来改善预测的精度。1.3论文主要研究内容和结构安排1.3.1主要研究内容目前,协同过滤技术被广泛应用在各大推荐系统中,然而,由于历史数据的稀疏性使协同过滤的推荐质量受到一定的影响,此外,随着用户和项目数量的增长,实时性、可扩展性等问题也使协同过滤的发展受到限制。针对协同过滤技术面临的上述问题,本文的研究内容主要包括三个部分:1)针对数据稀疏导致传统相似性度量不准确的问题,提出了一种增强的相似性度量算法(EPCC),该算法综合考虑了用户或项目间共同评分和所有ì-'f分的差异,

7、使得相似性度量更加准确。此外,为了缓解传统协同过滤仅利用评分而面临更大的稀疏性的影响,本文融合用户项目的特征矩阵,提出了基于评分和特征融合的混合相似性度量算法,该算法首先利用SVD技术对用户·项目评分矩阵进行分解,然后把得到的用户特征矩阵和项目特征矩阵与用户.项目评分矩阵进行融合,利用融合后的评分-特征向量对用户和项目进行相似性度量。不同于其他论文的后融合方式,本文采用中融合的混合相似度量方法可以动态的平衡评分和特征的重要程度。实验表明,该方法比传统相似算法度量更为准确,有效的提高了预测精度,在数据稀疏情况下,效果更明显;2)针对传统邻居选择方法存在的问题,本文对邻居相似大小和邻居数量的关

8、系进行研究分析,提出了一种改进的近邻选择算法一一基于信任区间的k近邻优化算法。实验表明,该算法可以在时间复杂度几乎不增加的情况下,选择更优的近邻进行推荐,提高了推荐精度;3)为了充分利用用户和项目的预测来提高推荐准确度,提出了基于用户和项目二维邻居选择的混合协同过滤算法。传统的用户和项目混合协同过滤算法多是三者的预测结果的加权结合,或是根据二者稀疏情况选取不同的预测方法。本文算法在邻居选择时对用户和项目进行融合,根据用户

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。