基于粗集和模糊聚类的协同过滤算法

基于粗集和模糊聚类的协同过滤算法

ID:34145132

大小:201.93 KB

页数:5页

时间:2019-03-03

基于粗集和模糊聚类的协同过滤算法_第1页
基于粗集和模糊聚类的协同过滤算法_第2页
基于粗集和模糊聚类的协同过滤算法_第3页
基于粗集和模糊聚类的协同过滤算法_第4页
基于粗集和模糊聚类的协同过滤算法_第5页
资源描述:

《基于粗集和模糊聚类的协同过滤算法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第2期第56页浙江纺织服装职业技术学院学报2010年6月doi:10.3969/j.issn.1674-2346.2010.02.014基于粗集和模糊聚类的协同过滤算法徐兵兵摘要:提出了一种基于粗集和模糊聚类相结合的协同过滤推荐算法,通过粗集理论自动填补空缺评分降低数据稀疏性;然后根据用户对项目评分的相似性对用户进行模糊聚类,并在此基础上搜索目标用户的最近邻居,从而缩小最近邻居的查找范围并产生推荐结果。实验结果表明,该方法能有效的解决数据稀疏性问题,提高了推荐系统的精确性和实时响应速度。关键词:个性化推荐;协同过滤;数据稀疏

2、;粗集;模糊聚类中图分类号:TP301.6文献标识码:C文章编号:1674-2346(2010)02-0056-050引言[1]个性化推荐作为一种崭新的智能信息服务方式,可以根据用户提出的明确要求,或通过用户个性、习惯、偏好的分析,准确地向用户提供感新区的信息和服务,从而有效解决信息过载和信息迷失带来的种种问题。协同过滤(CollaborativeFiltering,CF)是通过比较用户之间的相似性,把和目标用户具有相[2]似兴趣的其他用户的意见提供给目标用户完成推荐,是目前最成功的推荐技术。Amazon和CD-Now等国外

3、著名的电子商务网站都应用协同过滤技术向顾客推荐产品,提高服务的效率和质量。但协同过滤需要在整个用户空间上搜索目标用户的最近邻居,随着系统规模的不断扩大,用户和项[3]目数量急剧增加,最近邻协同过滤技术面临着评分数据稀疏性这一巨大挑战。在用户评分数据稀疏的情况下,传统的最近邻协同过滤算法难以准确地计算用户间的相似性,无法形成可靠的最近邻居集,同时,在整个用户空间上搜索目标用户的最近邻居比较耗时,难以满足推荐系统的实时性要求,导致推荐[4,5]系统的效率和推荐质量严重下降。针对上述问题,本文提出了一种基于粗集和模糊聚类相结合的协

4、同过滤算法,其基本思路是根据用户对项目的评价产生对目标用户的推荐。首先将稀疏用户-项目评分矩阵映射为不完备信息系统,利用改进的ROUSTIDA算法自动填补空缺评分数据,降低稀疏性;然后,通过用户对项目的相似性对用户进行模糊聚类并生成相应的聚类中心,在聚类中心的基础上计算目标用户与聚类中心的相似性,选择与目标用户相似性最高的若干个聚类作为查询空间,在这些聚类中搜索目标用户的最近邻居,从而能够在尽量少的用户空间上搜索到目标用户尽可能多的最近邻居。实验结果表明,与传统的协同过滤算法相比,该算法有效地解决了数据稀疏性问题,显著地提高

5、了推荐的质量,具有较好的可行性。1利用粗集理论降低稀疏性粗糙集(Roughsets,RS)理论是由波兰数学家Z.Pawlak教授在1982年提出的,是一种处理含糊————————————收稿日期:2010-01-07作者简介:徐兵兵,男,浙江纺织服装职业技术学院机电与信息工程分院(浙江宁波315211)PDF文件使用"pdfFactoryPro"试用版本创建www.fineprint.cn2010年6月浙江纺织服装职业技术学院学报第2期第57页(Vagueness)和不确定(Uncertainty)信息的新型数学工具,它用等

6、价类的思想来研究问题,用集合的上[6]近似和下近似来刻画集合。2.1基本定义定义1四元组=()称为信息系统,其中为非空的对象集合,称为论域;=为非空的属性集合,表示条件属性,表示结论属性;为属性值的集合;→为信息函数,指定了中每一对象的属性值,ak(xi)表示对象xi在属性ak的取值。对于信息系统,若至少存在一个对象其属性值缺省,则称为不完备信息系统。对于对象xi在属性ak的缺省值,表示为ak(xi)=*。定义2给定不完备信息系统=(),()表示经过扩充的可辨识矩阵中的第行第列元素,则经过扩充的可辨识矩阵定义为:()={ak

7、

8、ak∈A∧ak(xi)≠ak(xj)∧ak(xi)≠*∧ak(xj)≠*}其中,=1,2,…,;“*”表示遗失值。定义3信息系统=(),={ai

9、=1,2,…,}是属性集,xi∈U,定义:i={ak

10、ak(xi)=*,=1,2,…,}为对象xi的遗失属性集;i={

11、()=,≠,=1,2,…,}为对象xi的无差别对象集;={

12、i≠,=1,2,…,}信息系统的遗失对象集;i={xj

13、()=(k∈i{()}),xj∈i,≠,=1,2,…,}为对象的最大相似对象集(即与对象等值属性数最大的对象的集合),其中称为对象对于对象的等值属

14、性集。2.2映射用户评分矩阵根据粗集理论,本文将协同过滤推荐视作分类问题。用户的项目评分是基于用户兴趣的对项目分类的知识,该知识表示用户对项目集合的一种划分。兴趣相似的用户,他们的项目评分也相似,因此依据项目评分知识所产生的项目划分也具有一定的相似性。将给定的用户-项目矩阵映射为一个不完备

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。