余弦相似度度量.doc

余弦相似度度量.doc

ID:57721505

大小:71.50 KB

页数:2页

时间:2020-09-02

余弦相似度度量.doc_第1页
余弦相似度度量.doc_第2页
资源描述:

《余弦相似度度量.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、2.2.1 余弦相似度度量为了找到相似物品,需要定义一种相似度度量标准。在基于物品的推荐方法中,余弦相似度由于效果精确,已经被证实是一种标准的度量体系。这种度量标准用两个n维向量之间的夹角来测算相似度。这种方法也被广泛用于信息检索和文本挖掘,用来比较两份文本文档,其中文档可以表示为词语的向量。将两个物品a和b用对应的评分向量和来表示,其相似度可以定义如下:符号·表示向量间的点积,表示向量的欧式长度,即向量自身点积的平方根。物品5和物品1的余弦相似度因此可以计算为:相似度值介于0和1之间,越接近1则表示越相似。基本的余弦方法不会考虑用户评分平均值之间的差异。改进版的余弦方法能够解

2、决这个问题,做法是在评分值中减去平均值。相应地,改进余弦方法的取值在1到+1之间,就像Pearson方法一样。设U为所有同时给物品a和b评分的用户集,改进的余弦相似度计算如下:我们因此可以对原始的评分数据集进行变换,用评分值相对于平均评分值的偏差取代原始值,如表2-2所示。表2-2 均值调整评分数据库 物品1物品2物品3物品4物品5Alice1.00-1.000.000.00?用户10.60-1.40-0.400.600.60(续) 物品1物品2物品3物品4物品5用户20.20-0.800.20-0.801.20用户3-0.20-0.20-2.202.800.80用户4-1.8

3、02.202.20-0.80-1.80物品5和物品1的改进余弦相似度值为:确定物品间的相似度之后,我们可以通过计算Alice对所有与物品5相似物品的加权评分总和来预测Alice对物品5的评分。形式上,我们预测用户u对物品p的评分为:就像在基于用户的方法中,近邻集合的规模也会受限于一个固定值。也就是说,不是所有的近邻都会拿来做预测。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。