欢迎来到天天文库
浏览记录
ID:37062520
大小:2.26 MB
页数:66页
时间:2019-05-16
《基于冷启动混合聚类的协同过滤推荐算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、工程硕士学位论文基于冷启动混合聚类的协同过滤推荐算法研究作者姓名林茂杰工程领域控制工程校内指导教师彭云建副教授校外指导教师唐勇高级工程师所在学院自动化科学与工程学院论文提交日期2018年3月ResearchonCollaborativeFilteringRecommendationSystemBasedonClusteringAlgorithmforColdStartProblemADissertationSubmittedfortheDegreeofMasterCandidate:MaojieLinSupervisor:YunjianPengSouthChinaUniversi
2、tyofTechnologyGuangzhou,China分类号:TP301学校代号:10561学号:201521013375华南理工大学硕士学位论文基于冷启动混合聚类的协同过滤推荐算法研究作者姓名:林茂杰指导教师姓名、职称:彭云建副教授申请学位级别:工程硕士工程领域名称:控制工程论文形式:□产品研发□工程设计□√应用研究□工程/项目管理□调研报告研究方向:信息系统论文提交日期:2018年3月12日论文答辩日期:2018年3月20日学位授予单位:华南理工大学学位授予日期:年月日答辩委员会成员:主席:邓飞其委员:田森平、康文雄、赵学艳、旷世芳摘要随着信息技术和互联网的快速发展,人类
3、社会已经进入了高度信息化的时代。网络世界的不断丰富给人们带来了诸多便利的同时,也带来了信息过载的问题。目前网络信息量已经远远超过了人们所能接受和处理的数量,人们需要花费大量的时间和精力去寻找自己需要的内容。在这样的背景之下,个性化推荐系统应运而生。协同过滤推荐算法自20世纪90年代问世便成为了一个重要的研究领域,尽管这种技术已经取得了许多成功的应用,但在实际应用也存在如冷启动、数据稀疏性、实时性和用户隐私等问题。为了解决这些问题,学者提出了基于聚类的协同过滤推荐算法。基于聚类的推荐算法通过先对用户或者项目进行聚类划分,使相似度较高的对象聚集到同一个类群中,从而简化查找最近邻居的过
4、程,大大减小了整体计算复杂度和时间消耗。另外由于聚类算法可以在离线完成,所以大大提升了推荐系统的实时响应性。本文对推荐系统和聚类技术做了一定的理论研究,提出了一种基于聚类的协同过滤推荐算法,并通过实验验证了改进的有效性。本文的主要内容为:(1)比较了传统相似度计算方法,分析出其中的缺点和不足,并针对性地提出了一种改进的相似度计算方法。该方法考虑了用户属性、个人评分倾向和置信度,提高了相似度计算的合理性和准确度,同时对于冷启动问题也有一定的缓解作用。(2)将改进的相似度计算方法与K-means聚类算法相结合,并使用果蝇优化算法对聚类算法进行优化,提出了改进的基于聚类的推荐算法FKC
5、R算法。借助于聚类算法和果蝇优化算法,FKCR算法在查找用户相似邻居集时有更高的效率和准确度。最后,本文通过实验验证了所提算法在推荐准确性和时效性上的改进效果,以及在冷启动环境下的推荐质量。关键词:推荐系统,协同过滤,冷启动,聚类,果蝇优化IAbstractWiththerapiddevelopmentofinformationtechnologyandtheInternet,humansocietyhasenteredanewinformationera.Althoughthecontinuousenrichmentofthenetworkworldhasbroughtmany
6、conveniencestous,italsoleadstotheproblemofinformationoverload.Atpresent,theamountofInternetinformationhasfarexceededtheamountthatwecandealwithsothatwehavetospendalotoftimeandenergytofindtheinformationweneed.Undersuchabackground,personalizedrecommendationsystemcameintobeing.Collaborativefilter
7、ingrecommendationalgorithmhasbecomeanimportantresearchfieldsince1990s.Althoughthistechnologyhasachievedalotofsuccessfulapplications,therearealsomanyproblemsneedtobeconsiderd.Suchasthecoldstartproblem,thedatasparsityproblem,thereal-timerespons
此文档下载收益归作者所有