欢迎来到天天文库
浏览记录
ID:37032360
大小:1.41 MB
页数:61页
时间:2019-05-17
《基于迁移学习的跨领域推荐研究及并行化实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代码:10564学号:2016307815分类号:TP391密级:硕士学位论文基于迁移学习的跨领域推荐研究及并行化实现张朝武第一指导教师:刘财兴教授第二指导教师:学院名称:数学与信息学院专业学位类别:工程专业学位硕士领域:计算机技术答辩委员会主席:中国广州2018年6月华南农业大学学位论文原创性声明本人郑重声明:所呈交的学位论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者签名:____
2、_______________日期:___________________学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属华南农业大学。学校有权保存并向国家有关部门或机构送交论文的复印件和电子版,允许学位论文被查阅或在校园网上发布并供校内师生和与学校有共享协议的单位浏览(除在保密期内的涉密论文外);学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。本人电子文档的内容和纸质论文的内容相一致。作者签名:___________________日期:______________
3、_____导师签名:___________________日期:___________________学位论文提交同意书本学位论文符合国家和华南农业大学关于研究生学位论文的相关规定,达到学位授予要求,同意提交。导师签名:_____________________日期:___________________学科带头人签名:_______________日期:___________________摘要信息技术与经济社会的交汇融合使得信息数据量呈指数式增长。信息爆炸性增长使得个人用户每天接触的数据量超出了人们所能处理的能力范围,带来信息过载的问题。在这个背景下,推荐系统应运而生,可以让用户从海量信
4、息中获取自己真正感兴趣的东西,为“信息过载”的问题提供了解决的方案。当前,对推荐系统的研究大多针对单领域的环境,数据源独立存在,数据稀疏性问题和“冷启动”问题制约着推荐系统,导致推荐性能严重下降。利用辅助领域与目标领域在数据上的关联性,将辅助领域中的有效信息迁移到目标领域,进行跨领域推荐,可以极大提高推荐系统的准确性和运行效率。CBT是一种经典的密码本迁移模型,其假设所有领域共享一个评分模式,从辅助数据中迁移聚类层次的评分模式到目标数据。TRBT基于此模型,在考虑领域特有模式的基础上,通过用户端和项目端的共享模式、潜在因子和图正则化组成的三元桥迁移学习联合预测缺失评分。但是该模型存在计算复杂
5、度高、效率低精度却提升不大的问题,在融合用户端和项目端模式评分时人为确定系数,有着适应性差的缺陷。本文在分析了以TRBT为主的多种迁移学习模型的优劣后,改进已有的模型,得到基于聚类隐因子迁移模型的跨领域推荐算法。首先对数据集进行分析,在各个领域间用户、项目重叠的情况下,在相应的辅助领域分别对用户和项目运用Canopy聚类算法,将得到的聚类信息用于提取用户特征矩阵、项目特征矩阵、用户共享评分模式、项目共享被评分模式,再分别进行用户端和项目端的数据迁移学习,最后用线性回归模型融合用户端和项目端的评分得到最终的评分预测矩阵。该算法创造性地对用户和项目进行聚类,准确地得到用户和项目簇的数量,提高了算
6、法跨领域推荐的精确性。此外,运用线性回归模型动态融合评分克服了适应性差的缺陷。通过在三个公开数据集MovieLens10M、Amazon-meta、Book-crossing上进行验证得到:基于聚类隐因子迁移模型的跨领域推荐算法的平均绝对误差和均方根误差更低,该算法的推荐精度优于一些目前最先进的推荐算法。本文最后给出了基于聚类隐因子迁移模型的跨领域推荐算法在Spark平台上实现并行化的应用,表明并行化可以提升算法运行的效率,为实际中推荐系统开发工作提供了有价值的参考。关键词:跨领域迁移学习推荐算法机器学习ICross-domainRecommendationResearchandParall
7、elizationImplementationBasedonMigrationLearningZhangChaowu(CollegeofMathematicsandInformatics,SouthChinaAgriculturalUniversity,Guangzhou,510642,China)Abstract:Theconvergenceofinformationtechnologyandeconomi
此文档下载收益归作者所有