基于用户偏好和用户聚类的协同过滤算法研究

基于用户偏好和用户聚类的协同过滤算法研究

ID:37089566

大小:2.58 MB

页数:75页

时间:2019-05-17

基于用户偏好和用户聚类的协同过滤算法研究_第1页
基于用户偏好和用户聚类的协同过滤算法研究_第2页
基于用户偏好和用户聚类的协同过滤算法研究_第3页
基于用户偏好和用户聚类的协同过滤算法研究_第4页
基于用户偏好和用户聚类的协同过滤算法研究_第5页
资源描述:

《基于用户偏好和用户聚类的协同过滤算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP391学校代码:10697201520991:密级:公开学号_I?士字位论文MA5STERSDISSERTATION泉子用户偏好和用户聚类的协同过滤算法研究学科名称:软件工程作者:史维峰教授:张艺指导老师西北大学学位评定委员会二〇_八年六月CollaborativeFilteringAlgorithmBasedonUserPreferenceandUserClusteringAthesissubmittedtoNorthwestUniver

2、sityinpartialfulfillmentoftherequirementsforthedegreeofMasterinSoftwareEngineeringByZhangYiSupervisor:ShiWeifengProfessorJune2018摘要摘要目前解决互联网上“信息过载”问题的策略主要是推荐系统,其中应用最广泛的核心技术之一就是协同过滤算法。协同过滤算法在实际应用中给用户带来了许多方便,但同时也面临着挑战:如何在稀疏的数据中挖掘用户准确真实的兴趣偏好,如何实时反映用户的兴趣迁移等。这

3、些问题对推荐结果的质量以及可信度都有较大影响。因此,本文在传统协同过滤算法的基础上对以上问题进行研究和改进,具体内容如下:对于数据稀疏性的问题,本文提出一种基于用户真实偏好的算法。该算法在挖掘用户真实兴趣时更加关注的项目是用户对其给出的高评分,不仅考虑用户的访问次数而且把用户的评分信息对应到项目类的特征矩阵中。根据此特征评分矩阵的每个特征中评分大于用户的平均评分数目来分析,从用户主观评分上准确得出用户的真实偏好。基于Logistic时间函数的改进算法,是对用户兴趣迁移问题的解决。该算法主要应对用户的兴趣随

4、着时间而迁移的问题,主要依据时间因子实时监控用户兴趣的变化,在分析用户的真实偏好时运用Logistic函数引入时间加权计算,对用户不同时间段的兴趣加以区分,增加最近用户兴趣的信息权重,对过去的兴趣喜好因子进行消弱,这样以用户最近交互项目为主结合之前兴趣进行用户兴趣建模。基于用户聚类的改进算法,是为了更准确的得到目标用户的邻居集合,提高系统的性能。推荐系统对用户的项目评分预测主要以用户最近邻居集合为出发点,所以最近邻居集合的准确性对于推荐质量也很重要。本文用K-means算法对用户进行聚类,从目标用户所属的

5、聚类中根据用户相似度大小得出用户的邻居集合。这样得出的邻居集合更加贴近目标用户,对预测目标用户的兴趣趋势更加精确。关键词:协同过滤,稀疏性,兴趣迁移,时间函数,用户聚类IABSTRACTABSTRACTAtpresent,thestrategytosolvetheproblemof"informationoverloading"ontheInternetismainlyapersonalizedrecommendationsystem,inwhichthecollaborativefilteringalg

6、orithmisoneofthemostwidelyusedtechnologiesforrecommendingsystems.Collaborativefilteringalgorithmprovidesuserswithmanyconveniencesinpracticalapplication,butalsofacesthechallengeofhowtominetheuser'saccurateandrealinterestpreferencesinsparsedataandhowtorefle

7、cttheuser'sinterestmigrationinrealtime.Thesequestionshaveagreaterimpactonthequalityandcredibilityoftherecommendations.Therefore,thisthesisstudiesandpracticestheaboveproblemsindetail.Thespecificresearchworksareasfollows:Fortheproblemofdatasparsity,thispape

8、rproposesanalgorithmbasedontheuser'srealpreference.Thealgorithmfocusesmoreontheitemsgivenbyuserswithhighscoreswhentheyareinterestedintherealusers.Basedonthenumberofuser'svisit,thealgorithmintroducesthefeaturematrixo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。