欢迎来到天天文库
浏览记录
ID:35180068
大小:7.04 MB
页数:58页
时间:2019-03-20
《基于sap hana数据库的推荐方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、^'STR分类号a^)電敏UDCVthesisgyii导恆巧交基于SAPHANA数据库的推荐方法研究(中文题名)Recommenda杜onresearchbasedontheSAPHANAdatabase(英文题名)黄佳琪(作者姓名)指导教师肖江教授闻磊副教授专业学位类型工程硕±申请学位级别硕±了智能研究方向人论文提交2016年4月日期论文答辩日期2016年6月学位授予日期2016年6月答辩委员会主席:评巧人!化京抹大学独
2、创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中铃别加W标注和致谢的地方外,论文中不包括含其他人己经发表或撰写过的研究成果,也不包括为获得北京林业大学或其它教育机构的学位或证书而使用过的材料一。与我同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。(f如批.%签名:觀破期:_日关于论文使用授权的说明本人完全了解北京林业大学有关保留、使用学位论文的规定:,即学校有权保留,论文的全部或部分内容,送交论文的复印件允许
3、论文被査阅和借阅;学校可W公布可W采用影印、缩印或其它复制手段保存论文。(備的论文在#密后離守此規定)心签名:导师嫁名:曰巧:仁言摘要随着电子商务在互联网时代长达二十年的发展一直在进,电子商务的学术研究也步,针对消费者巧为的研巧也越来越多。快速处理大量数据和进行实时分析的能力,。将决定公司能否快速响应市场变化,从而获得优势在这样的背景下,提升分析速度-At显得更为急迫,SAPHANA(SAPHighPerformancenalyicAppliance)由此而生,它具有实时分析、存
4、储和处理大数据的能为,并充分发挥其商业数据的价值,帮助企业抓住机遇,进行实时决策。本研究HANA数据库W及其上安装的相应组件为基础,巧用大数据竞赛平台Pon一kaggle网站中,日本领导扭购网站pare巧该网站提供的年交易信息,进行预测分析研巧。本论文进行的研究工作主要如下;1HANA中实现整体功能的顺利运行。.完成本文中系统整体架构的设计,保证在。主要包括数据抽取层,数据仓库层,数据处理巧分析层本文中数据最开始储存在Oracle数据库中作为数据源,EIM(企业信息管理)作为抽数工具将数据抽取到HANA
5、中,PAL和基于HANA的R语言作为算法实现工具完成数据的预处理和分析。数据在几个纸件中可实现无障碍的流通。,满足系统的连贯性、2.利用HANA(缺失值PAL预测分析库)与AFM结合的工具来实现数据融合一レ填补W及数值旧化的操作,,从而得到可ッ用于研究的数据。在数据挖掘之前针对客户的浏览购物信息和个人信息,LA及优惠券的原始信息进行介绍分析,对网站提供,提高数据挖掘效率的初始数据进行数据预处理,降化挖掘所需要的时间。3.在HANA数据库的环境中,采用基于HANA的R语言环境,完成推荐系统算一法的
6、实现。首先,利用cbind,密数把向量和矩阵拼成个新矩阵;其次对属性赋予不同的权重;最后,计算用户属性与优惠券间的cosine相似度并进行排序,得到客户最有可能购买的ID。通过对比用户实际贿买产品与推荐产品的类型及所10个优惠券在区域,得到推荐结果的正确率。本文将最近流行的数据挖掘与SAP近几年新推出的数据库HANA相结合。通过最新纽件封M、数据预处理及数据预测分析。、PAL完成数据的迁移,关键词:SAPHANA,推荐系统,预测分析余弦相似度IABSTRACTCustomershoppi
7、ngrecommenda村onresearchbasedontheSAPHANAda化baseMas化rCandidate:HuangJiaqi(SpecialtyofMechanicalEnineerin)ggDirectedbrofessorXiaoJianYanLeiyPg,ABSTRACTWi化化edevelopmentof化eInternet,e乂ommercehasdevelopedfor20yearsSOfar.The-m
8、manacademicstudyofecommerceiseerininendlesslydtherearealsoareatstudofgg,angyyecommercesi化sofconsum巧beh
此文档下载收益归作者所有