基于项目云的个性化推荐算法研究

基于项目云的个性化推荐算法研究

ID:35071333

大小:2.71 MB

页数:73页

时间:2019-03-17

基于项目云的个性化推荐算法研究_第1页
基于项目云的个性化推荐算法研究_第2页
基于项目云的个性化推荐算法研究_第3页
基于项目云的个性化推荐算法研究_第4页
基于项目云的个性化推荐算法研究_第5页
资源描述:

《基于项目云的个性化推荐算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号密级太原理工大学硕士学位论文题目基于项目云的个性化推荐算法研究TheResearchofPersonalizedRecommenderAlgorithm英文并列题目BasedonItemCloud研究生姓名:杜宗宴学号:2013510676专业:统计学研究方向:数理统计导师姓名:景英川职称:副教授学位授予单位:太原理工大学论文提交日期2016/6地址:山西·太原太原理工大学太原理工大学硕士研究生学位论文I太原理工大学硕士研究生学位论文摘要近年来,随着互联网科学技术的迅速崛起,网络数据与日俱增,随之而来的信息

2、过载问题也日趋严重。因此,对于用户而言,从大量繁复的网络讯息中快速、准确获取目标信息是一项十分重要的任务。推荐系统作为信息过滤的重要手段,已经广泛应用于各大电子商务网站。然而,随着网络经济平台的扩大,网购人数急剧增多,网上商品种类不断增加,使得推荐系统的冷启动、稀疏性等缺陷逐渐显露。针对传统算法的不足,本文从定性分析和模糊聚类角度出发,构建出一套完整的基于项目云的个性化推荐系统。该系统巧妙融合云模型与有序秩聚类的优势,在传统算法的基础上提出一种基于项目云的有序秩聚类协同过滤推荐算法。本文设计的个性化推荐系统大致可

3、以分成三大模块:数据预处理、有序秩聚类、预测和推荐。在数据预处理模块,本文通过云模型来拟合不同项目的分布情况及其统计分布特征,并用云发生器生成的缺失值来还原原始评分矩阵;其次,该算法将有序秩聚类算法与推荐系统相结合,用新定义的排序准则对项目云进行初步分类,生成有序云向量,为之后的相似度计算奠定基础;此外,本文选择“聚类-推荐”模式,在聚类簇内探索分析项目云之间的关系,进而生成推荐结果。同传统推荐算法相比,该算法主要做出了如下改进:第一,本文探索分析原始数据分布特征与数据缺失原理,给出合理的数据缺失机制假设;并通过

4、云模型来拟合数据分布特征。第二,为从根本上缓解数据极端稀疏性,本文提出两种数据填充算法。一种是依据项目分布进行普通填充;另一种则是通过新定义的用户评分可I太原理工大学硕士研究生学位论文靠度进行加权填充。对比两种不同的填充机制,判断用户评分可靠度对推荐结果的影响。第三,填充缺失值时,本文利用经验分布函数,对连续性随机数进行离散化转变成符合本研究数据打分机制的评分数。这一做法充分考虑到了项目本身的性质特征,依据其统计分布信息生成缺失值来还原原始评分矩阵,更能科学反映项目的评分特征。第四:本文首次将有序秩聚类算法与推荐

5、系统相结合,根据新定义的排序准则对项目云进行有序秩聚类,不仅能提高推荐精度,且大大缩短了计算时间。传统推荐算法需要计算相似度n(n)12次,本文仅需n1次。最后,为检验基于项目云的有序秩聚类协同过滤推荐算法的有效性,本文用R语言软件分别对MovieLensData和JesterJokeData进行试验。实证分析结果表明:新提出的数据填充机制能有效改善系统的极端稀疏性;基于项目云的有序秩聚类算法融入了云模型的不确定性,不仅可以缓解推荐系统的冷启动问题,而且能够更准确的定位同质项目,提高推荐精度;此外,有序秩聚类

6、算法确实能够降低计算复杂度,提高推荐系统的可扩展性。因此,该算法的提出对于目前个性化推荐系统的研究与发展具有十分重要的意义。关键词:推荐系统,协同过滤,项目云,有序秩聚类,评分可靠度II太原理工大学硕士研究生学位论文ABSTRACTInrecentyears,networkdatahassurgedexponentiallywiththerapiddevelopmentofthesciencetechnology,whichleadstoveryseriousinformationoverloadissue.Th

7、us,fortheusers,itisanimportanttasktoacquiretheirnecessaryinformationaccuratelyandquicklyfromthemassofinformationinashorttime.RecommendersystemasanimportanttoolforinformationfilteringhasbeenwidelyusedinmanyE-commercesites.However,withtherapiddevelopmentofscien

8、cetechnology,thenumberofonlineshoppingusershasincreasedsharply,andnewproductscontinuecomingout,whichleadtotheproblemsofcoldstart,extremesparsity,scalabilityandotherissuesbecomeincreasingl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。