欢迎来到天天文库
浏览记录
ID:34096664
大小:7.34 MB
页数:73页
时间:2019-03-03
《基于协同过滤算法的推荐系统框架设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于协同过滤算法的推荐系统框架设计与实现申请上海交通大学工程硕士学位论文基于协同过滤算法的推荐系统框架设计与实现学校代码:10248作者姓名:迟轩学号:1090379189第一导师:陈昊鹏第二导师:学科专业:软件工程答辩日期:年月日上海交通大学软件学院年月万方数据基于协同过滤算法的推荐系统框架设计与实现ADissertationSubmittedtoShanghaiJiaoTongUniversityforMasterDegreeofEngineeringDESIGNANDIMPLEMENTATIONOFARECOMMENDER
2、SYSTEMFRAMEWORKBASEDONCOLLABORATIVEFILTERINGALGORITHMUniversityCode:10248Author:ChiXuanStudentID:1090379189Mentor1:ChenHaoPengMentor2:Field:SoftwareEngineeringDateofOralDefense:SchoolofSoftwareShanghaiJiaotongUniversity2013万方数据基于协同过滤算法的推荐系统框架设计与实现上海交通大学学位论文原创性声明本人郑重声
3、明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日万方数据基于协同过滤算法的推荐系统框架设计与实现上海交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权上海交通大
4、学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密保密□,在保密年解密后适用本授权书。本学位论文属于不保密不保密不保密□。不保密(请在以上方框内打“√√√√”)学位论文作者签名:指导教师签名:日期:年月日日期:年月日万方数据万方数据万方数据万方数据基于协同过滤算法的推荐系统框架设计与实现基于协同过滤算法的推荐系统框架设计与实现摘要现如今网络世界中一个用户可以通过电子商务系统获得很多便利,很多电子商务系统引入推荐引擎以求得类似实际生活中推销员的作用。推荐引擎的使用
5、加快了协同过滤算法的研究,一个合适的算法将会为电子商务系统带来更多的收益。然而面对林林总总有关协同过滤的研究,大多只注重算法层,且研究过于理论,忽略了其在实际应用中的局限。相对于一般的基于项目的协同过滤算法SlopeOne算法有着很好的效果。然而单单使用SlopeOne算法依旧不能摆脱稀疏数据,冷启动等问题。本研究对算法进行改进的同时不只局限于研究单一算法,还对一个推荐引擎的搭建从架构层进行阐述。本研究的主要工作有如下几个方面:(1)对电子商务系统进行深入分析并通过实际案例阐述一个电子商务系统引入推荐引擎的现实意义,分析推荐算法
6、适用范围、区别以及推荐系统的研究现状,并且描述相关研究存在的问题。(2)研究分析SlopeOne算法以及Lucene,NoSQL等关键技术的优缺点,为实现系统框架提供技术途径。并最终提出一种新的既可以满足用户喜好又可以拓展系统业务的推荐方式并对实际应用中可能出现的若干问题进行了阐述和改进,使得应用的推荐结果可以更好的展现给用户,将推荐引擎的作用发挥到最大。(3)对某一具体电子商务系统引入推荐系统进行分析,并进行需求分析,提出系统框架的总体设计目标,对整个系统的逻辑结构以及总体框架进行设计,将总体框架设计成多模块层次结构。其中着重
7、设计算法层,通过对具体算法的选择以及对选定算法存在问题的分析,详细描述算法改进思路以及具体实现,并对实际应用中可能出现的问题进行分析。并且不只局限于算法,还对系统各个子模块如推荐结果的展现层等关键部分进行详细设计。在设计与实现中充分应用设计模式,并且对具体技术的选择进行技术选型,使得框架拥有更好的扩展性以及移植性。总体上框架的设计尽量体现用简单的算法起到优秀效果的特点。(4)运用大量实验数据。在具体技术选型的过程中,根据实际环境中可能出现的数据类型和数据量,对具体选取的技术进行测试。例如对于用户行为数据收集层会根据设计的日志格式
8、,分别对不同数据量进行测试,最终选取一种日志框架进行数据收集并分析系统在何种条件下会影响日志输出的效率。I万方数据基于协同过滤算法的推荐系统框架设计与实现(5)设计实验选取MovieLens数据集,在被划分的数据集基础上,通过计算确定具体相似度算法,并在选定算法
此文档下载收益归作者所有