大众点评网数据分析

大众点评网数据分析

ID:12074975

大小:285.00 KB

页数:10页

时间:2018-07-15

大众点评网数据分析_第1页
大众点评网数据分析_第2页
大众点评网数据分析_第3页
大众点评网数据分析_第4页
大众点评网数据分析_第5页
资源描述:

《大众点评网数据分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、广西大学数学与信息科学学院商务智能课程论文题目:商务智能在大众点评中的应用小组成员:1111200139蓝承妙1111200202刘金香摘要:大众点评是中国领先的本地生活信息及交易平台,也是全球最早建立的独立第三方消费点评网站,它不仅为网友提供商户信息、消费点评及消费优惠等信息服务,同时亦提供团购及餐厅预订等O2O(OnlineToOffline)交易服务。本文通过分类回归树和关联规则挖掘出大众点评数据中关于全国各地美食商家的可用信息。关键字:大众点评分类回归树关联规则SPSS一、背景随着互联网的出现与飞速发展,人们的生活方式一直在发生着巨大的变化。特别是交通、购物、饮食、

2、住宿、教育等各方面均受到来自互联网的极大的影响。大众点评便是一个影响人们日常生活,方便人们娱乐、饮食的点评网站。大众点评是中国领先的本地生活信息及交易平台,也是全球最早建立的独立第三方消费点评网站。大众点评不仅为网友提供商户信息、消费点评及消费优惠等信息服务,同时亦提供团购、电子会员卡及餐厅预订等O2O(OnlineToOffline)交易服务。大众点评是国内最早开发本地生活移动应用的企业,已经成长为一家移动互联网公司,大众点评移动客户端已成为本地生活必备工具。本文使用的数据为大众点评网在2014年4月份更新后的商家数据,其中包含全国各地区1000家美食店相关数据,包括商户

3、ID(shop_id)、商户名称(name)、所处省份(province)、城市(city)、区(area)、具体地址(address)、联系电话(phone)、营业时间(hours)、平均物价(avg_price)、会员卡服务、大众对其产品的各类评价等级、环境、服务等级等数据项。为了有效的使用该数据,本文运用分类回归树、关联规则两种数据挖掘方法对该数据进行分析。二、分类回归树(C&RT)2.1C&R tree分类回归树(C&R tree,全称为the classification and regression tree)是一种基于树的分类和预测方法,模型使用简单,易于理解

4、(规则解释起来更简明易),该方法通过在每个步骤最大限度降低不纯洁度,使用递归分区来将训练记录分割为组。2.2目的通过分析数据中存在的预测因子变量,如店铺的环境等级、产品等级和服务等级等预测并分类,为新用户在选择是否光顾某家店铺提供决策依据。2.3数据整理原始数据中包含的内容多而繁杂,为了方便研究,我们从中筛选了涉及店家评价的数据项avg_price、product_rating、environment_rating、service_rating、very_good_remarks、good_remarks、common_remarks、bad_remarks、very_ba

5、d_remarks进行整理,将very_good_remarks、good_remarks、common_remarks这三个字段处理为积极评价,字段jiji的值为这三个字段的总和,视为对该店家的积极评价,将bad_remarks、very_bad_remarks这二个字段处理为消极评价,字段xiaoji的值为这二个字段的总和,为该店家的消极评价。新增字段hh取值为0和1,判定该店铺是否值得新客户选择,如果该店铺消极评价(xiaoji)的值小于总评价(jiji+xiaoji)的10%,则认为该店铺值得选择,hh的值为1;反之,则为0,该店铺不值得选择。整理后的数据:avg_

6、price、product_rating、environment_rating、service_rating、hh。2.4创建决策树将整理后的数据添加到SPSS工作区域,再添加一个类型节点。在类型节点中,选择ReadValue来为指定的字段读取数据。选择hh字段,将其type设为Flag,Direction设为Out,如图1所示。其余所有字段都作为预测因子变量,将Direction设为In。图1在类型节点中设置相关参数在类型节点上连接一个C&RT节点,设置其参数,选择简单模式(SimpleMode),如图2所示。图2Simple标签运行C&RT节点,出现交互式窗口,完全展开

7、的决策树如图3所示。图3C&RT决策树2.4分析决策树从图3可以看到第一层的划分是根据product_rating,第二层的划分根据environment_rating,第三层service_rating。从节点1中,可以看出若大众对某店家product的综合评分在8.25分以上,那么该店家值得光顾;product的综合评分在8.25分以下,则可以参考其环境评分,若environment_rating大于6.75分,说明其环境优美,值得光顾;同理,若其环境评分低于6.75,则可参考其员工服务质量。从店铺角度也能通过

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。