欢迎来到天天文库
浏览记录
ID:35066059
大小:4.23 MB
页数:61页
时间:2019-03-17
《基于时序行为和标签关系的个性化新闻推荐系统研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、f一—9-中图分类号TP31论文编号10060160298学科分类号520.4050SS‘?*考诚乂净TIANJINUNIVERSITYOFTECHNOLOGY4?硕±学位论支SMffiiistagaMmfer基于时序巧为和标签关系的个性化新闻推荐系统研究民esearchofPersonalizedNews一民ecommendationSstem&edoniyb昇‘质乃S^andid已為Hr巧Jl!immiw:;;心dUbUHHIIkT
2、敝^…呈涵麵HHIOI’’‘r,!,;ms计算机科学与技术p^fjp计算机科学与技术ligEkljifeW交鹏强"'--?■-T:lir.LSi4.aajgfjg^zr,姊肖迎元教授Jill-T?Ift‘二O—六年天津理工大学研究生院?H月分类号:TP391520.4050密级:天津理工大学研究生学位论文基于时序行为和标签关系的个性化新闻推荐系统研究(申请硕士学位)学科专业:计算机科学与技术研究方向:个性化推荐算法作者姓名:艾鹏强指导教师:肖迎元2016年3月Th
3、esisSubmittedtoTianjinUniversityofTechnologyfortheMaster’sDegreeResearchofPersonalizedNewsRecommendationSystembasedonTime-OrderedBehaviorsandTagRelationByPengqiangAiSupervisorYingyuanXiaoMarch,2016推准I牲若巧本人声明所呈交的学位论文是本人在导师指导下进行的研巧工作和取得的研究成果,除了文中特别加标注和致谢之处外,论文中不包含其他
4、人己经发表或撰写过的研究成果,也不包含为获得夭津理工大学或其他教育机构的学位或证书而使用过的材料一。与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学化去丈作者签名:艾曰期:础《3月6曰_鳴蘇签李年学隹备文胶枚使巧援权书本学位论文作者完全了解义津搜工大学有关保留、使用学位论文的规定。特授权义津理工大学可W将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编,供查阅和借阅。同意学校向国家有关部口或机构送交论文的复本和电子文件
5、。(保密的学位论文在解密后适用本授权说明)学化冷文作者签名:又哦蘇导种签名;签李日期;年3月5可签季g期:必I《年3月摘要互联网上海量、实时更新的新闻,满足了不同用户的新闻阅读需求。据中国互联网络信息中心的最新统计,83%的互联网用户习惯于在互联网上阅读新闻。随着越来越多的用户通过移动设备和无线网络接入互联网,如何帮助互联网用户在海量新闻中寻找到其感兴趣的新闻变得愈发必要和迫切。个性化新闻推荐技术作为解决互联网新闻过载问题的重要的手段,得到工业界和学术界高度重视,许多相关的算法与系统被不断提出和开发,个性化新闻
6、推荐算法已成为数据挖掘与机器学习领域的一个研究热点。个性化新闻推荐算法根据用户浏览行为和新闻的内容,采用各种数据挖掘技术,分析并挖掘用户的兴趣,主动地向用户推荐其感兴趣的新闻。个性化新闻推荐算法不仅能够帮助用户发现其感兴趣的新闻,而且可以提升用户对网站的满意度,增加用户粘性。针对现有个性化新闻推荐算法很少考虑用户浏览行为的时序特性以及忽略了蕴含丰富信息的新闻标签的作用与价值的问题,本文对个性化新闻推荐算法展开了研究,主要创新工作如下:(1)在用户浏览新闻的过程中,用户浏览新闻而产生的行为数据是一种时间序列数据。但是,现有的新闻推荐算
7、法很少考虑用户浏览行为的时序特性,从而造成在预测用户将要阅读的下一则新闻时表现出较差的性能。为了解决上述问题,本文考虑用户行为的时序特性和用户所处的上下文,提出了时序性协同过滤新闻推荐方法。与该方法相匹配,在相似度计算方法上,本文提出了一种名为时间依赖性相似系数的方法,弥补了传统相似度计算方法在计算长期用户和短期用户的相似度方面的不足。(2)尽管新闻的标签向用户展示了与新闻的内容密切相关的核心内容,但现有的个性化新闻推荐算法通常使用关键词向量或者主题分布对新闻的主要内容进行特征化表示,忽略了标签的作用和价值。基于标签的信息量和标签概
8、率关系图中标签的度,本文提出计算标签权重的方法,用于区分不同标签的重要性;基于标签间共同出现的模式,采用条件概率的方法,计算两个标签在不同方向上的相关度;在此基础上,通过标签向量对新闻的内容和用户阅读偏好进行特征化表示,提出了基于标签
此文档下载收益归作者所有