欢迎来到天天文库
浏览记录
ID:13462328
大小:9.49 MB
页数:14页
时间:2018-07-22
《数据处理与智能决策论文—数据挖掘与智能决策—大数据中商铺选址问题》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、广州商学院数据处理与智能决策课程论文题目:数据挖掘与智能决策——大数据中商铺选址问题姓名:曾柏树学号:201306114414院名:信息技术与工程学院专业班级:商业软件2班指导教师:孔宇彦2016年5月9日目录1、绪论11.1研究背景11.2研究的意义21.3研究工具32、数据分析选址研究与应用32.1BigDataLab数据分析:32.2慧选址数据分析(以餐饮快餐行业选址为例)73、总结和展望11参考文献:12II1、绪论“大数据”的定义是可以归纳为4个V:海量的数据规模(volume)、快速的数据流转和动态的数据体系(velocity)、多样的数据类型(v
2、ariety)和巨大的数据价值(value)。利用大数据时代的对目标地段的位置,是否是热门商圈,离居民区、学校、商业区的距离,还有调查人流量、交通方式等等数据分析挖掘,期间还要面临种种情况导致信息不对称情况,数据挖掘技术在大数据时代中为商铺选址带来了他们的答案。关于商铺选址,派人深入该地实地调查应该是最笨的土办法。而当将范围扩展至全国百余城市的重点商业圈时,个人和小团队仅凭商业直觉和有限的知识是远远不够的。这从而推动了利用商业地理数据进行商业选址及消费者地理细分的普及。但目前市面上已有基于数据驱动的选址方案同样也存在一定问题,一般是通过人群密度或者人群画像,来
3、观察可能的消费者的分布。但是人群密度大的地方,并不代表潜在的消费者分布也多;同样,人群画像的属性也难以准确表达用户对具体位置服务的需求。1.1研究背景大数据首先要考虑的应该是“大”——海量的数据规模。谷歌执行董事长艾瑞克.施密特曾说,现在全球每两天所创造的数据量等同于从人类文明至2003年间产生的数据量的总和。而具体到企业应用领域,漫无边际、浩如烟海的数据对企业并无意义,日立数据系统公司(HDS)副总裁兼CTOHubertYoshida表示,数据量的“大”是相对而言的概念,对于像SAP的HANA那样的“内存数据库”来说,能把2TB的数据用好就是胜利;而对于像谷
4、歌这样的搜索引擎,EB(1024×1024TB)的数据量才能称得上是大数据。12海量数据的危机并不单纯是数据量的爆炸性增长,它还牵涉到数据类型的改变。原来的数据都可以用二维表结构存储在数据库中,如常用的Excel软件所处理的数据,称之为结构化数据。但是现在更多互联网多媒体应用的出现,使诸如图片、声音和视频等非结构化数据占到了很大比重。有统计显示,全世界结构化数据年增长率大概是32%,而非结构化数据则是63%。2012年,非结构化数据占有比例已经达到互联网整个数据量的75%以上。而产生智慧的大数据,往往是这些非结构化数据。大数据是指无法使用传统和常用的软件技术和
5、工具在一定时间内完成获取、管理和处理的数据集。进一步,当今“大数据”一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术发展进入了一个新的时代,代表着爆炸性的数据信息给传统的计算技术和信息技术带来的技术挑战和困难,代表着大数据处理所需的新的技术和方法,也代表着大数据分析和应用所带来的新发明、新服务和新的发展机遇。在商业社会中,“从数据中得到价值”一直都不是什么新鲜的东西,但是当大数据时代到来,经济的新增量逐渐显露出来。尽管数据挖掘从“啤酒与尿布”开始做了几十年,但是“大数据”与我们通常所说的“数据”还是有显著的不同。由于大数据处理需求的迫切性和重要性,
6、近年来大数据技术已经在全球学术界、工业界和各国政府得到高度关注和重视,全球掀起了一个可与20世纪90年代的信息高速公路相提并论的研究热潮。美国和欧洲一些发达国家政府都从国家科技战略层面提出了一系列的大数据技术研发计划,以推动政府机构、重大行业、学术界和工业界对大数据技术的探索研究和应用。1.2研究的意义对于快餐连锁店,能够对比各种各样的数据,了解车流量、消费群体分布、安全信息、商业构成以及其它相关信息,可以帮助他们在决定门店选址中节省大量的开支。12从全球范围来看,采用商业地理数据进行商业选址及消费者地理细分在发达经济体已经非常普及。为更精准地服务不断升级的中
7、国消费者,宜家家居、麦当劳、星巴克等专门成立了商业地理分析团队,来指导其在中国的店铺选址。麦肯锡的“解读中国”商业地理分析团队亦感受到来自客户方越来越强烈的需求。1.3研究工具BigDataLab(百度大数据实验室)通过分析时间、空间、网点、交通便利程度、竞争对手情况等等因素,结合用户需求,告诉用户开店地点。慧选址在网站上提供了一个以上海为试点,可供展示的beta体验版系统。可以快速直观地看到店铺的信息、商品购买分布热度。而在这背后,是多到难以想象的数据在做支撑。实地考察的兴趣点、网民行为、消费能力、消费习惯、人口、经济数据、小区、房屋、商圈面数据……在这种种
8、海量数据作支撑的基础上,慧选址构建了一
此文档下载收益归作者所有