欢迎来到天天文库
浏览记录
ID:1746986
大小:28.50 KB
页数:5页
时间:2017-11-13
《工商管理电子商务毕业论文 电子商务中协同过滤推荐技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、湖南师范大学本科毕业论文考籍号:XXXXXXXXX姓名:XXX专业:工商管理电子商务论文题目:电子商务中协同过滤推荐技术研究指导老师:XXX二〇一一年十二月十日 [摘要]协同过滤推荐是电子商务推荐系统中应用最成功的技术,很大程度上决定了推荐系统的推荐质量。文章主要介绍了目前应用较广的几种协同过滤推荐技术,并对这几种推荐技术的存在的问题进行了分析。 [关键词]电子商务推荐系统协同过滤 一、引言 随着互联网的广泛普及,电子商务对传统的商务交易产生了革命性的变化,产生从以商品为中心到以用户为中心的商业模式的转变。
2、新的商业环境在为企业提供新的商机的同时,也对企业提出了新的挑战。围绕用户进行服务,为用户提供所需要的商品,所以对每个用户提供个性化的服务成为必要。电子商务推荐系统成为解决问题的重要途径。而协同过滤推荐是目前研究最多、应用最广的电子商务推荐技术。 二、电子商务推荐系统 电子商务推荐系统定义为:利用电子商务网站向用户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。它是一个基于用户网上购物的以商品为推荐对象的个性化推荐系统,为用户推荐符合兴趣爱好的商品。分析用户的消费偏向,向每个用户
3、具有针对性地推荐的产品,帮助用户从庞大的商品目录中挑选真正适合自己需要的商品。电子商务推荐系统在帮助了用户的同时也提高了用户对商务活动的满意度,换来对电子商务站点的进一步支持。 三、协同过滤推荐技术 1.基于用户的协同过滤,基于用户的协同过滤推荐技术是推荐系统中应用最为广泛的方法之一,它是基于邻居用户的兴趣爱好预测目标用户的兴趣偏好。算法先使用统计技术寻找与目标用户有相同喜好的邻居,然后根据目标用户的邻居的偏好产生向目标用户的推荐。它能够通过用户间的相互协助、根据用户对项目的评价的相似性对用户进行分类,其次,在基
4、于用户的系统过滤系统中,所有用户都能从邻居用户的反馈评价中得益,当然,基于用户的协同过滤系统容易挖掘出目标用户潜在的新兴趣。 2.基于项目的协同过滤,基于项目的协同过滤通过先计算已评价项目和待预测项目的相似度,以相似度作为权重,加权各已评价项目的评价分,得到预测项目的预测值,基于项目的协同过滤推荐根据用户对相似项目的评分预测该用户对目标项目的评分,它基于这样一个假设:如果大部分用户对一些项目的评分比较相似,则当前用户对这些项目的评分也比较相似。 3.基于混合推荐的协同过滤,综合考虑了用户和项目这两个属性。一种是先
5、根据项目来预测,然后用基于用户的协同过虑产生推荐;另外一种是先根据用户来预测,然后用基于项目的协同过虑产生推荐;还是一种就是分别根据基于用户和基于项目的协同过虑来加权平均产生推荐。 4.基于聚类的协同过滤,聚类技术是根据用户的兴趣类似性来进行聚类,聚类产生之后,根据聚类中其他用户对项目的评价预测目标用户对该项目的评价。有学者提出通过对服务器日志进行事务聚类和关联规则超图分割聚类获取用户的共同浏览特征,然后扫描所有的数据集合产生个性化的推荐。也有学者提出对项目进行聚类,然后在对应的聚类中搜索目标用户的最近邻居,由于每
6、个聚类中的用户数量并不是随着项目数量的减少而线性减少,所以这种方法在用户对多个聚类中的商品均有评分的情况下效果并不理想。 5.基于关联规则的协同过滤,关联规则技术在零售业得到了很大的发展。关联规则挖掘可以发现不同商品在销售过程中的相关性。系统根据生成的关联规则模型和用户当前的购买行为向用户产生推荐。关联规则模型的生成可以离线进行,因此可以保证系统的实时性要求。 四、待解决的问题 1矩阵稀疏性。电子商务网站通常拥有大量商品,而每个用户购买或作评价的只是其中很小的一部分通常不到1%,例如亚马逊网站系统,数据的稀疏会
7、导致算法准确率降低。在一般的协同过滤系统中,如果两个用户没有对相同的商品进行打分,即使这两个用户的兴趣爱好都相同,系统也无法得出他们之间的相似度,算法甚至找不到任何商品可作推荐。 2.冷启动问题。冷启动问题有新商品问题和新用户问题两类。新商品问题是指一个新商品刚加入的时候,没有人或很少人评价,则这个商品很难被推荐出去,这就需要推荐系统引入一些新机制来激励用户多作评价。新用户问题是指推荐系统中对用户的分类是依据目标用户与其他用户的比较,这种比较主要基于不断累积的用户评价。如果一个新用户从未对系统中的项目进行评价,则系
8、统无法获知他的兴趣点,也就无法对他进行推荐。 3.可扩展性。随着用户和项目数量急剧增加,在整个用户空间上搜索目标用户的最近邻居比较耗时,难以满足推荐系统的实时性要求。主要由于基于用户或项目的协同过滤算法需要扫描整个数据库来计算相似度,因此随着数据库中记录的增加,其计算复杂度呈指数级别增长,导致推荐系统性能急剧下降。一种可能的方法就是用聚类分两
此文档下载收益归作者所有