基于随机森林的购物推荐系统

基于随机森林的购物推荐系统

ID:28162509

大小:76.41 KB

页数:5页

时间:2018-12-08

基于随机森林的购物推荐系统_第1页
基于随机森林的购物推荐系统_第2页
基于随机森林的购物推荐系统_第3页
基于随机森林的购物推荐系统_第4页
基于随机森林的购物推荐系统_第5页
资源描述:

《基于随机森林的购物推荐系统》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于随机森林的购物推荐系统南宁第二中学摘要:随着科学技术的发展,人们的衣、食、住、行无一不与互联M产生或多或少的联系,这其中的典型案例就是网络购物。而推荐系统便是如今一种热门的运用于网络购物的技术,是现代互联网领域的重要技术。机器学习屮的随机森林算法是常用于推荐系统的算法,它的运行也需要有海量的数据作为基础。FI前应用于电子商务领域的推荐系统大多数都是单纯根据用户的浏览记录和购买记录进行商品推荐,这样会使得推荐范围较小,对数据的利用不够充分。如果推荐系统将更多其他的因素考虑进来,比如好友、同学、邻居的浏览和购买记录,便能在上提高推荐的质量,扩大推荐的范围,吸引用户购买更多的商品,提

2、高商家营业额,推动网络购物的发展。本文将就FI前电子商务领域的推荐系统存在的问题,分析推荐系统中所运用的机器学习和随机森林算法,提出优化推荐系统的方法。关键词:推荐系统;机器学习;决策树;随机森林;作者简介:苏昶玥,南宁第二屮学。近些年来,伴随着互联网的发展,我们所接收的信息量快速增长,信息爆炸带来了各种各样的问题。而购物推荐系统就是一种解决信息过载问题的有效的热门的工具,它是通过向用户推荐该用户了解不多的新产品来解决信息过载问题的[1]。而这些新产品都是与用户的浏览记录相关的,推荐系统从数据库中找到用户的记录从而推断出用户的需求和兴趣,进行推荐。这使得这些推荐的产品能更符合用户的

3、个性化需求,增加用户的购买的可能性,达到提高销售量的目的。用户在电子商务平台上的任何行为都会被记录并载入数据库,有庞大的数据库作为基础,推荐系统能高效地过滤掉无用信息,获取有价值的信息,不断地产生新推荐。数据库中冇着海量的数据,推荐系统这些数据的利用率冇待提高。向用户推荐商品时,不应只是考虑用户个人的历史记录,还可以把用户好友的浏览和购买记录、用户所在地区的人的购买记录、用户对曾经购买的商品的反馈等其他信息当作有价值的信息,加入推荐系统的考虑范围,进一步提高推荐的质量,减少无用的推荐,这样不仅仅能推动销售发展,还能改善用户的体验。随着信息量的不断增加,人们要处理海量数据,就需要机器

4、学的帮助。推荐系统的运行也离不开机器学习。机器学习的过程是一个从未知到已知的过程[2]。机器学习通过获取前人的大量经验,接受大量信息,总结其中的规律,实现应用。现阶段的推荐系统中,常使用机器学习算法,基于随机森林的推荐系统也是其中一个重要种类。随机森林算法的运算量很大,运行速度也很快,预测的精准度也相对更高,是当前运用于推荐系统和机器学习的热门算法。总之,在目前阶段,基于随机森林的推荐系统都是在互联网领域屮,改善用户体验,实现商业成功的重要手段,在实践中也获得了一定的程度。一、机器学习(一)为什么需要机器学习随着科学技术的发展,信息的获取越来越简单,每天都会产生大量的数据有待处理。

5、据统计,淘宝每天产生的千万笔交易会产生将近20TB的数据[3]。在大数据时代的数据分析人们要处理的数据量,远远超过了传统数据分析人们所能承受的数据量。机器学习是使机器像人脑一样能够分析经验总结规律,从而拥有预测的能力。这也代表着机器学习是建立在海量数据之上的,有分析大量数据的能力。想要高效地处理海量数据,获得有价值的信息,就必然要使用机器学>J。在目前的情况下,使用人工工作的成本已经变得非常高。在一些反复性强、规律性较为突出的行业和领域,可以由机器来代替人工作。这样可以在一定范围内降低劳动力成本,提高投入产出比。同时,机器的工作效率也会高于人工处理,能降低劳动生存吋间,进一步降低成

6、本。对于某些领域的数据处理,由人工操作会较为困难,比如垃圾邮件识别、互联网诈骗、信用风险预测等领域。在这些领域,机器学习便起到了重要作用。同时,机器学习与多门学科和多个领域交织在一起,应用非常广泛,能带来高效益。(二)什么是机器学习机器学习是人工智能的一个核心研究领域[4]。1997年MitchellTM在“MachineLearning"一书中详细解释了信息论中的一些概念,给出了机器学习的经典定义“计算机利用经验改善系统自身性能的行为”[5]。人能够通过获取和总结经验来学习知识,获得能力。机器学习就是让机器拥有和人一样的学习能力,通过输入大量的历史数据,总结规律,建造模型。经过大

7、量数据的训练之后,机器便能从数据中获取知识,也是掌握了像人一般的学习能力。(三)学习形式分类(1)有监督学习;(2)无监督学习;(3)半监督学习;(4)增强学习。我们目前所采取的随机森林算法就是有监督学习中的分类算法。(四)机器学习的过程机器学习首先是数据的获取,大量的数据是机器学习的前提。数据的获取也是最简单的一步。面对杂乱无章的数据,机器学习的第一步是清洗数据,也就是完善我们所获取的数据。接下来的第二步是特征提取。在获取的数据中,冇很多没冇利用价值的数据会影响到分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。