欢迎来到天天文库
浏览记录
ID:37089566
大小:2.58 MB
页数:75页
时间:2019-05-17
《基于用户偏好和用户聚类的协同过滤算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:TP391学校代码:10697201520991:密级:公开学号_I?士字位论文MA5STERSDISSERTATION泉子用户偏好和用户聚类的协同过滤算法研究学科名称:软件工程作者:史维峰教授:张艺指导老师西北大学学位评定委员会二〇_八年六月CollaborativeFilteringAlgorithmBasedonUserPreferenceandUserClusteringAthesissubmittedtoNorthwestUniver
2、sityinpartialfulfillmentoftherequirementsforthedegreeofMasterinSoftwareEngineeringByZhangYiSupervisor:ShiWeifengProfessorJune2018摘要摘要目前解决互联网上“信息过载”问题的策略主要是推荐系统,其中应用最广泛的核心技术之一就是协同过滤算法。协同过滤算法在实际应用中给用户带来了许多方便,但同时也面临着挑战:如何在稀疏的数据中挖掘用户准确真实的兴趣偏好,如何实时反映用户的兴趣迁移等。这
3、些问题对推荐结果的质量以及可信度都有较大影响。因此,本文在传统协同过滤算法的基础上对以上问题进行研究和改进,具体内容如下:对于数据稀疏性的问题,本文提出一种基于用户真实偏好的算法。该算法在挖掘用户真实兴趣时更加关注的项目是用户对其给出的高评分,不仅考虑用户的访问次数而且把用户的评分信息对应到项目类的特征矩阵中。根据此特征评分矩阵的每个特征中评分大于用户的平均评分数目来分析,从用户主观评分上准确得出用户的真实偏好。基于Logistic时间函数的改进算法,是对用户兴趣迁移问题的解决。该算法主要应对用户的兴趣随
4、着时间而迁移的问题,主要依据时间因子实时监控用户兴趣的变化,在分析用户的真实偏好时运用Logistic函数引入时间加权计算,对用户不同时间段的兴趣加以区分,增加最近用户兴趣的信息权重,对过去的兴趣喜好因子进行消弱,这样以用户最近交互项目为主结合之前兴趣进行用户兴趣建模。基于用户聚类的改进算法,是为了更准确的得到目标用户的邻居集合,提高系统的性能。推荐系统对用户的项目评分预测主要以用户最近邻居集合为出发点,所以最近邻居集合的准确性对于推荐质量也很重要。本文用K-means算法对用户进行聚类,从目标用户所属的
5、聚类中根据用户相似度大小得出用户的邻居集合。这样得出的邻居集合更加贴近目标用户,对预测目标用户的兴趣趋势更加精确。关键词:协同过滤,稀疏性,兴趣迁移,时间函数,用户聚类IABSTRACTABSTRACTAtpresent,thestrategytosolvetheproblemof"informationoverloading"ontheInternetismainlyapersonalizedrecommendationsystem,inwhichthecollaborativefilteringalg
6、orithmisoneofthemostwidelyusedtechnologiesforrecommendingsystems.Collaborativefilteringalgorithmprovidesuserswithmanyconveniencesinpracticalapplication,butalsofacesthechallengeofhowtominetheuser'saccurateandrealinterestpreferencesinsparsedataandhowtorefle
7、cttheuser'sinterestmigrationinrealtime.Thesequestionshaveagreaterimpactonthequalityandcredibilityoftherecommendations.Therefore,thisthesisstudiesandpracticestheaboveproblemsindetail.Thespecificresearchworksareasfollows:Fortheproblemofdatasparsity,thispape
8、rproposesanalgorithmbasedontheuser'srealpreference.Thealgorithmfocusesmoreontheitemsgivenbyuserswithhighscoreswhentheyareinterestedintherealusers.Basedonthenumberofuser'svisit,thealgorithmintroducesthefeaturematrixo
此文档下载收益归作者所有