推荐系统中协同过滤算法若干问题地研究

推荐系统中协同过滤算法若干问题地研究

ID:32272943

大小:5.03 MB

页数:130页

时间:2019-02-02

推荐系统中协同过滤算法若干问题地研究_第1页
推荐系统中协同过滤算法若干问题地研究_第2页
推荐系统中协同过滤算法若干问题地研究_第3页
推荐系统中协同过滤算法若干问题地研究_第4页
推荐系统中协同过滤算法若干问题地研究_第5页
资源描述:

《推荐系统中协同过滤算法若干问题地研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、—]。.;:::■.●.●■^▲毒,JI之ESEARCHONKEYPROBLEMSFORCOLLABORATIVEFILTERINGINRECOMMENDATIONSYSTEMByLIANGZHANGSupervisor:Prof.JunGUOADISSERTATl0NPRESENTEDTOTHEFACULT’YOFTHEUNIVERSITYoFPOSTS&TELECOMA仉rNICATIONSINCANDIDACYFORTHEDEGREEOFDoCTOROFPHILoSOPHYRECOMMENDEDFoRACCEPTANCEBYTHESCHOOLOFINFOR

2、MATIONENGINEERINGMay2008吣2川—●⋯5叭0㈣6m7Ⅲ1㈣Y]lIJll√▲川一一也▲^囊.毒羹,J独创性(或创新性)声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。I■本人签名:趁i堑么同期:∥9。歹、之。关于论文

3、使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。(保密的学位论文在解密后遵守此规定)保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论文注释:本学位论文不属于保密范围,适用本授权书。本人签名:导师签名:日期:沙,夕./.;夕日期:∥罗.,.?汐●▲j—Aj推荐系统中协Ird过滤算法

4、若十问题的研究推荐系统中协同过滤算法若干问题的研究摘要随着互联网的飞速发展,互联网的应用也在快速普及,并受到了公众的认可和赞同。同时,互联网也渗透到我们每个人的生活中,网上交易购物,也变得越来越流行。但是,对于互联网的使用者来说,在网上购物还要面临一个巨大的问题。由于互联网信息的种类繁多,商品数量庞大,如何在众多商品中正确的选择商品和购买到自己需要的商品成为用户要面临的一个问题。为了帮助用户在互联网上更好地选择商品,推荐系统应运而生。推荐系统是用来帮助用户选择商品和产生商品智能推荐的系统。其中最重要的推荐技术是协同过滤技术,协同过滤技术利用用户品味间的相似来产生

5、推荐。目前,协同过滤技术在研究和应用领域上均取得了很大成功,但依然有很多问题需要解决和研究。目前,国内外学者研究的热点问题主要有三个。第一是算法的准确性问题。为了使推荐的结果更加准确,研究者们一直在推荐准确性方面做着不懈的努力,但是由于用户和产品的数据的稀疏性,其推荐的准确性受到严重的影响。由于用户并不能购买所有商品,而是只能购买其中很少的一部分,从而导致数据矩阵十分稀疏,数据稀疏性也成为影响协同过滤技术最主要的原因。第二是算法的可伸缩性问题。由于用户和产品数量庞大,并且用户和产品的数量都在高速增长,因此如何使算法更加适合不断增长的大规模数据,以提高算法的可伸缩

6、性成为一个重要的研究课题。第三是协同过滤算法的评估问题。推荐系统的评估是一个非常重要的课题,它不但可以帮助我们评估推荐系统的推荐质量,还可以针对不同的数据及数据属性选择合适的推荐算法。针对上述问题,本文开展了以下创新性的研究工作:第一,提出了一种新的基于模型的协同过滤算法。传统的基于用户的协同过滤算法基于一个如下假设:如果用户对一些项目的评分比较相似,则他们对其它项目的评分也比较相似;如果大部分用户对一些项的评分比较相似,则当前用户对这些项的评分也比较相似。但是两个用户北京邮IU人学博Ij学位论义推荐系统中协F净过滤算法若十问题的研究存在品位的相似往往只是针对部

7、分项目而言。传统的协同过滤算法往往忽略了这一点,而是把所有的项目都考虑进来。针对这个问题,本文提出了一个新的基于聚类的模型算法。这种算法在聚类的同时试图在类别中发现簇中用户所共有的部分偏好相似项目,并依据偏好相似程度赋予不同的权值,然后再在每个簇中使用本文定义的新的相似度计算方法来计算最近邻并产生预测。实验结果表明,该方法有比较高的准确度,同时由于使用了聚类的方法,可以有效的减少计算复杂度,提高算法的可伸缩性。第二,针对目前协同过滤算法存在的预测准确度受数据稀疏性影响比较大的问题,提出了一种新的基于用户和基于项目结合的协同过滤算法。数据稀疏或者是由于某些用户选择

8、项目太少或者某些项目被用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。