欢迎来到天天文库
浏览记录
ID:34712455
大小:2.62 MB
页数:79页
时间:2019-03-09
《基于spark机器学习的服饰电商推荐系统研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文论文题目:基于Spark机器学习的服饰电商推荐系统研究与实现作者姓名袁龙龙指导教师潘建学科专业计算机技术培养类别全日制专业学位硕士所在学院计算机科学与技术学院提交日期2017年05月万方数据浙江工业大学硕士学位论文基于Spark机器学习的服饰电商推荐系统研究与实现作者姓名:袁龙龙指导教师:潘建副教授浙江工业大学计算机科学与技术学院2017年05月万方数据DissertationSubmittedtoZhejiangUniversityofTechnologyfortheDegreeofMas
2、terResearchandimplementationofapparelsystembasedonsparkmachinelearningCandidate:YuanlonglongAdvisor:AssociateProf.PanJianCollegeofComputerScienceandTechnologyZhejiangUniversityofTechnologyMay2017万方数据浙江工业大学学位论文原创性声明本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作所取得的研究
3、成果。除文中已经加以标注引用的内容外,本论文不包含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江工业大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权浙江工业大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以
4、采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密□,在一年解密后适用本授权书。2、保密□,在二年解密后适用本授权书。3、保密□,在三年解密后适用本授权书。4、不保密□。(请在以上相应方框内打“√”)作者签名:日期:年月日导师签名:日期:年月日万方数据浙江工业大学硕士学位论文基于Spark机器学习的服饰电商推荐系统研究与实现摘要随着互联网技术、电子商务网站和移动互联网的蓬勃发展,电子商务网站中的商品数量、用户出现了快速增长的趋势。当电子商务网站面对不断增长的用户和商品时,如何从海
5、量数据中挖掘出有用的信息,如何提高用户忠诚度和商品销售量是电子商务网站面临的一个严峻问题。机器学习和推荐系统能够有效的解决这一问题。在推荐系统中,协同过滤推荐技术作为最典型的推荐技术被广泛应用。它能够根据用户的偏好、兴趣对用户进行个性化推荐,但是,协同过滤推荐算法也存在一些问题,例如可扩展性、冷启动、数据稀疏性问题等。可扩展性问题是由于随着数据量的增多,推荐系统的开销逐渐增大,系统的时间和空间复杂度会越来越大。数据稀疏性问题的主要原因是用户的行为数据存在较大的稀疏性导致协同过滤算法的准确度较低。为了解决
6、上述问题,本文提出来一种基于Spark下机器学习的混合推荐算法,该混合推荐算法可以有效的提高推荐效果的准确性,最后将该混合推荐算法应用在了服饰电商网站中。在传统的推荐算法中,单机在处理海量的用户行为和商品数据时需要耗费大量的时间,单机算法的并行化可以解决这一问题。本文将设计的混合推荐算法应用到基于Spark平台的集群中,并实现了混合推荐算法在集群中的并行化和优化,不仅解决了计算效率问题,也解决了扩展性问题。接着,本文设计了一个服饰电商系统,该系统包括了用户、商家、系统管理员四种角色,用户具有购买服饰、管
7、理订单、查看购物车、对购买服饰评分等功能;商家可以添加服饰商品、管理图库等功能。然后将本文设计的混合推荐算法应用到该服饰电商系统中,根据用户的历史行为数据将用户可能喜欢的服饰推荐给用户。实验表明,本文提出的基于机器学习的混合推荐算法能够有效的提升推荐结果的准确性。特别地,该算法基于Spark平台,更适合大量的迭代计算过程和处理海量数据,算法在运行速度上更有优势,而且有更好的扩展性。i万方数据浙江工业大学硕士学位论文关键字:Spark,机器学习,并行计算,混合推荐,服饰推荐ii万方数据浙江工业大学硕士学位
8、论文RESEARCHANDIMPLEMENTATIONOFAPPARELSYSTEMBASEDONSPARKMACHINELEARNINGABSTRACTWiththerapiddevelopmentofInternettechnology,e-commercesitesandmobileInternet,thenumberofgoodsandusersine-commercesitesappearedarapidgrowthtrend.W
此文档下载收益归作者所有