欢迎来到天天文库
浏览记录
ID:35056998
大小:4.93 MB
页数:88页
时间:2019-03-17
《基于hadoop的新闻推荐系统研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、工程硕士学位论文基于Hadoop的新闻推荐系统研究与实现作者姓名郄智超工程领域软件工程校内指导教师张星明教授校外指导教师张宇高级工程师所在学院软件学院论文提交日期2016年5月TheResearchandImplementationofNewsRecommenderSystemBasedonHadoopADissertationSubmittedfortheDegreeofMasterCandidate:QieZhichaoSupervisor:Prof.ZhangXingmingSouthChinaUniversityofTech
2、nologyGuangzhou,China分类号:TP3学校代号:10561学号:201321033764华南理工大学硕士学位论文(基于Hadoop的新闻推荐系统研究与实现)作者姓名:郄智超指导教师姓名、职称:张星明教授、张宇高级工程师申请学位级别:工程硕士工程领域名称:软件工程论文形式:ꇶ产品研发工程设计ꇶ应用研究ꇶ工程/项目管理ꇶ调研报告研究方向:软件工程技术论文提交日期:2016年5月31日论文答辩日期:2016年6月5日学位授予单位:华南理工大学学位授予日期:年月日答辩委员会成员:主席:王振宇委员:彭新一、李挥、朱映波、吴
3、一民华南理工大学学位论文原创性声明I本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加W标注引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写的成果作品。对本文的研究做出重要贡献。的个人和集体,均已在文中W明确方式标明本人完全意识到本声明的法律后果由本人承担。作者签名:日期//窄接;y始知2日种学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,目日:研^生在校攻读学位期间论文工作的知识产权单位属华南理工大学。学
4、校有权保存并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被查阅(除在保密期内的保密论文外);学校可W公布学位论文的全部或部分内容,可1^允许采用影印、缩印或其它复制手段保存、汇编学位论文。一本人电子文档的内容和纸质论文的内容相致。本学位论文属于:在年解密后适用本授权书。口^保密,同意在校园网上发布,供校内师生和与学校有共享协议的单位浏览;同意将本人学位论文提交中国学术期刊(光盘版)电子杂志社全文出版和编入CNKI《中国知识资源总库》,传播学位论文的全部或部分内容。""(请在
5、上相应方框内打V)又心作者签名:杂舊餐曰期:心.V指导教师签名4羣日期V0/会作者联系电话:电子邮箱;联‘系地址(含邮编);爭摘要当今互联网时代,人们面临着一个严重的问题就是信息过载,如何在海量数据中找到人们需要的有用信息成为一个热门的研究课题。信息分类和搜索引擎已经在解决信息过载问题上取得了一定的成功。推荐系统是另一种更加优秀的解决方法,相比前两者,推荐系统更加智能和主动,它的优势是通过研究用户的兴趣偏好,进行个性化分析计算,由系统主动挖掘用户的兴趣点,从而引导用户发现自己的信息需求。新闻推荐系统就是推荐
6、领域的应用之一,其目的是智能的为用户推荐他们感兴趣的新闻信息。推荐领域所面临的问题在新闻推荐中同样存在,并且存在着领域特殊性,因此本文的重点是设计并实现一个新闻推荐系统,并解决新闻推荐领域所面临问题。本文主要完成了以下工作:对推荐系统的理论背景进行了介绍,分析了推荐系统的研究现状和所面临的问题,对推荐系统的相关技术进行了说明。在深入研究推荐系统的工作流程和主要推荐算法的基础上,针对新闻推荐领域的特点,基于Hadoop平台,使用MapReduce并行框架以及Storm流式框架完整的设计实现一个新闻推荐系统,并且着重介绍了个性化新闻推荐
7、算法的设计并将其运用到系统当中,包括协同过滤算法和基于BP神经网络算法的推荐方法,其中协同过滤算法通过加入时间因子和采用混合相似度解决了数据稀疏、兴趣漂移问题,基于BP神经网络算法的推荐方法通过综合考虑用户和新闻的各种特征来解决项目“冷启动”问题。本文的最后实验证明了本文所使用的个性化新闻推荐算法能较好的解决新闻推荐所面临的数据稀疏、兴趣漂移以及“冷启动”问题,提高了推荐的准确率以及召回率,并且对新闻推荐系统的测试表明基于Hadoop平台的新闻推荐系统有较高的扩展性和实时性。关键词:新闻推荐系统;协同过滤;BP神经网络;Hadoop
8、平台IAbstractIntheInternetera,peoplearefacingaseriousproblemofinformationoverload.Howtofindusefulinformationinthevastam
此文档下载收益归作者所有