基于时序行为挖掘和隐私保护的协同过滤推荐算法研究

基于时序行为挖掘和隐私保护的协同过滤推荐算法研究

ID:35151855

大小:10.46 MB

页数:70页

时间:2019-03-20

基于时序行为挖掘和隐私保护的协同过滤推荐算法研究_第1页
基于时序行为挖掘和隐私保护的协同过滤推荐算法研究_第2页
基于时序行为挖掘和隐私保护的协同过滤推荐算法研究_第3页
基于时序行为挖掘和隐私保护的协同过滤推荐算法研究_第4页
基于时序行为挖掘和隐私保护的协同过滤推荐算法研究_第5页
资源描述:

《基于时序行为挖掘和隐私保护的协同过滤推荐算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术大学硕士学位论文基于时序行为挖掘和隐私保护的协同过滤推荐算法研究作者姓名:学科专业:导师姓名:孙光福计算机应用技术陈恩红教授完成时间:二O一四年四月二十二日IYIl2IIl6Iili㈣111111111158帆9帆Y2601UniversityofScienceandTechnologyofChinaAdissertationformaster’SdegreeAStudyofCollaborativeFilteringBasedonSequentialBehaviorsMiningandPrivacy

2、ProtectionAuthor’SName:Speciality:Supervisor:‘⋯1●’tmlshedttme:GuangfuSunun—ComputerApplicationProf.EnhongChenApril22加,2014中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。作者签名:硷丝主堡签字日期

3、:中国科学技术大学学位论文授权使用声明作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。囱么开口保密(——年)作者签名:j啤盖爱L签字日期:翌!衄目兰≥日导师签名:签字Et期:丝!!:

4、!:丝摘要随着Web2.0时代的兴起,互联网上的用户和商品呈现了爆炸式的增长态势,互联网的快速渗透带来了海量的数据信息,而海量数据的产生使得用户无法在短时间内准确及时地获取所需的信息,信息过载现象愈发严重。在此背景下,推荐系统应运而生。推荐系统通过研究用户的兴趣偏好,进行个性化的计算,由系统发现用户的兴趣点,进而有选择地进行信息推送,引导用户的信息需求。由于推荐系统能够有效地解决信息过载问题,因而其得到了广泛的研究和应用。然而,近几年来,互联网的快速发展也给推荐系统带来了一些新的挑战。以此为背景,本文首先介绍了信

5、息过载现象,以此引出推荐系统的产生和发展过程,接着介绍了目前主流的推荐算法,此后,本文以协同过滤推荐系统中的时序行为信息挖掘和用户隐私保护为研究点,提出了相应的解决方案,本文的主要研究工作如下:(1)提出了一种利用用户的时序行为挖掘用户和商品近邻关系的方法。该方法通过构建用户和商品的消费网络图,计算最近邻集合,得出相应的关系信息。由于时序信息相对于社交关系、标签信息更加容易获取,因而其适用范围更广泛。(2)将挖掘的关系信息应用到矩阵分解模型中,提出了基于时序行为的协同过滤推荐模型SequentialMF。该推荐模

6、型将利用时序信息挖掘的最近邻集合融入到概率矩阵分解算法中,从而提高推荐算法的准确度。在此基础上,进一步提出了基于该模型的推荐框架,该框架能够在线下更新模型,从而快速在线上完成推荐,使得推荐系统的实时性得到提高。(3)提出了一种能够实现隐私保护的推荐机制G-roupMF。该机制收集用户对群组的宏观评价信息,基于此粗粒度的数据,预测用户对具体商品的偏好,进而为用户推荐个性化的商品。由于并不需要用户对具体商品的评价,因而其在一定程度上降低了隐私泄露的风险。(4)通过实验验证了模型的有效性。实验表明,基于时序行为的推荐算

7、法在准确度上比传统推荐算法有了进一步的提升;基于隐私保护的推荐算法虽然在一定程度上造成了准确度的损失,但是其仍然具有一定的推荐效果。除此之外,该方法所需要的数据更容易收集,数据噪音也较少。关键词:信息过载推荐系统时序行为矩阵分解隐私保护摘要IIABSTRACTWiththeincreasingprosperityofWeb2.0,moreandmoreusersandapplicationsareemergingontheIntemet,andtheirinteractionsgeneratealargenumb

8、erofdata.Therapidexpansionofdataleadstotheseriousproblemofinformationoverload.Asaresult,peoplecannotobtaininformationtosatisfymeirpersonalneedsinashorttime.Underthisbackground,variousreco

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。