欢迎来到天天文库
浏览记录
ID:34954848
大小:5.74 MB
页数:139页
时间:2019-03-15
《基于用户行为关系挖掘的个性化推荐模型及算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、博博博士士士学学学位位位论论论文文文基于用户行为关系挖掘的个性化推荐模型及算法PERSONALIZEDRECOMMENDATIONTHROUGHUSERBEHAVIORRELATIONSHIPMINING郭郭郭慧慧慧丰丰丰2018年年年6月月月国内图书分类号:TP391.4学校代码:10213国际图书分类号:681.39密级:公开工工工学学学博博博士士士学学学位位位论论论文文文基于用户行为关系挖掘的个性化推荐模型及算法博士研究生:郭慧丰导师:叶允明教授申请学位:工学博士学科:计算机软件与理论所在单位:
2、计算机科学与技术学院答辩日期:2018年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.4U.D.C.:681.39DissertationfortheDoctoralDegreeinEngineeringPERSONALIZEDRECOMMENDATIONTHROUGHUSERBEHAVIORRELATIONSHIPMININGCandidate:GuoHuifengSupervisor:Prof.YeYunmingAcademicDegreeAppliedfor:Doct
3、orofEngineeringSpecialty:ComputerSoftwareandTheoryAliation:SchoolofComputerScienceandTechnologyDateofDefence:June2018Degree-Conferring-Institution:HarbinInstituteofTechnology摘要摘要推荐系统是数据挖掘领域的研究热点之一。如何从大规模的高维稀疏用户行为数据中挖掘有效的行为关系,并为用户快速产生准确的个性化推荐,已成为推荐系统领域所
4、面临的、迫切需要解决的问题。推荐系统的性能依赖于用户行为关系的挖掘,具有个性化信息的行为关系可以更好的揭示隐藏在用户历史行为中的根本性的有用信息,进而能够明显提升推荐系统的性能表现。本文以深度神经网络和链路关系预测为基础,旨在挖掘对推荐有意义的行为关系信息以架起低阶用户行为数据和高阶用户兴趣爱好之间的联系,提升推荐模型和方法的个性化推荐效果。值得注意的是,根据用户进入系统的状态和频率,推荐系统中的用户可分为活跃用户、不活跃用户和未登录用户。由于交互方式的差异,推荐系统对不同类型用户采取不同的推荐策略。
5、如何针对不同的推荐策略从不同类型的用户行为数据中挖掘有用的行为关系十分重要。针对这一问题,本论文提出一些新的个性化推荐模型和方法,这些方法在多个推荐任务上取得了推荐效果的提升。具体来讲,本文的主要研究内容介绍如下。(1)针对活跃用户的商品点击率预测问题,提出一种基于因子分解机的深度神经网络框架DeepFM。该框架结合了因子分解机和深度神经网络,可同时学习数据中的低阶和高阶特征组合关系权重,且不需要预训练和特征工程。因子分解机部分将二阶特征关系矩阵分解,提升了模型在稀疏数据中学习二阶特征组合关系的能力。
6、深度网络部分通过神经元之间的连接和非线性变换学习特征之间的高阶组合关系。将分解二阶特征关系矩阵的向量同神经网络共享,降低了神经网络参数的训练难度。基于该共享结构,模型更容易学习到准确的特征表示。本文分别研究了基于该框架的DeepFM-D和DeepFM-P点击率预测模型,并在大规模竞赛数据集和商业数据集进行实验。实验结果显示,基于该框架的点击率预测模型在AUC和Logloss指标取得更好的结果。此外,提出多卡数据并行和异步数据读取提高训练效率。本文提出的DeepFM框架已部署于华为应用市场推荐系统,在该
7、系统进行线上A/B测试,所提出模型取得更高的点击率和转化率。(2)针对活跃用户的排序学习问题,提出基于贝叶斯个性化排名框架的神经网络模型Deep-BLM,该模型基于贝叶斯个性化排名框架,利用神经网络拟合数据中的偏序关系。首先,采用贝叶斯个性化排名方法构建偏序关系集合,然后利用神经网络拟合偏序关系的概率,通过最小化预测偏序关系概率分布和真实偏序关系分布之间的交叉检验熵训练模型参数。基于偏序关系的排–I–哈尔滨工业大学工学博士学位论文序学习模型不仅可以通过用户显式反馈建立模型,而且可以学习到用户隐式反馈中
8、的偏序信息。同基于线性函数的贝叶斯排序学习模型BLM-Rank相比,Deep-BLM可以拟合数据中更为复杂的偏序关系。此外,为提高排序学习的训练/预测效率,本文还研究了基于图形计算卡的并行算法。在多个标准数据集进行实验,Deep-BLM模型都得到更高的归一化累积增益值。(3)针对不活跃用户的消息推送推荐问题,提出局部吸收随机游走近似算法,即A-PARW,基于用户-商品关系图挖掘潜在目标用户。设定该算法的正则参数为单位矩阵,得到A-PARW-I算法,该算法
此文档下载收益归作者所有