【5A版】大数据概念与应用.pptx

【5A版】大数据概念与应用.pptx

ID:32229663

大小:7.44 MB

页数:41页

时间:2019-02-01

【5A版】大数据概念与应用.pptx_第1页
【5A版】大数据概念与应用.pptx_第2页
【5A版】大数据概念与应用.pptx_第3页
【5A版】大数据概念与应用.pptx_第4页
【5A版】大数据概念与应用.pptx_第5页
资源描述:

《【5A版】大数据概念与应用.pptx》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、全国高校标准教材《云计算》姊妹篇,剖析大数据核心技术和实战应用大数据刘鹏  主编    张燕 张重生 张志立 副主编BIGDATA刘鹏教授,清华大学博士。现任南京大数据研究院院长、中国信息协会大数据分会副会长、中国大数据技术与应用联盟副理事长。主持完成科研项目25项,发表论文80余篇,出版专业书籍15本。获部级科技进步二等奖4项、三等奖4项。主编的《云计算》被全国高校普遍采用,被引用量在国内计算机图书类排名居前。创办了知名的中国云计算(chinacloud.cn)和中国大数据(thebigdata.cn)网站。曾率队夺得2002PennySort国际

2、计算机排序比赛冠军,两次夺得全国高校科技比赛最高奖,并三次夺得清华大学科技比赛最高奖。荣获“全军十大学习成才标兵”(排名第一)、南京“十大杰出青年”、江苏省中青年科学技术带头人、清华大学“学术新秀”等称号。第一章 大数据概念与应用1.1大数据的概念与意义1.2大数据的来源1.3大数据应用场景1.4大数据处理方法全国高校标准教材《云计算》姊妹篇,剖析大数据核心技术和实战应用of403习题1.1大数据的概念与意义第一章大数据概念与应用of40412008年9月,美国《自然》(Nature)杂志专刊——Thenextgoogle,第一次正式提出“大数据”概

3、念。22011年2月1日,《科学》(Science)杂志专刊——Dealingwithdata,通过社会调查的方式,第一次综合分析了大数据对人们生活造成的影响,详细描述了人类面临的“数据困境”。32011年5月,麦肯锡研究院发布报告——Bigdata:Thenextfrontierforinnovation,competition,andproductivity,第一次给大数据做出相对清晰的定义:“大数据是指其大小超出了常规数据库工具获取、储存、管理和分析能力的数据集。”时至今日,“数据”变身“大数据”,“开启了一次重大的时代转型”。“大数据”这一概

4、念的形成,有三个标志性事件:1.从“数据”到“大数据”4V特征种类多(Variety)速度快(Velocity)价值高(Value)体量大(Volume)大数据与传统数据相比,数据来源广、维度多、类型杂,各种机器仪表在自动产生数据的同时,人自身的生活行为也在不断创造数据;不仅有企业组织内部的业务数据,还有海量相关的外部数据。随着现代感测、互联网、计算机技术的发展,数据生成、储存、分析、处理的速度远远超出人们的想象力,这是大数据区别于传统数据或小数据的显著特征。大数据有巨大的潜在价值,但同其呈几何指数爆发式增长相比,某一对象或模块数据的价值密度较低,这

5、无疑给我们开发海量数据增加了难度和成本。第一章大数据概念与应用of405从2013年至2020年,人类的数据规模将扩大50倍,每年产生的数据量将增长到44万亿GB,相当于美国国家图书馆数据量的数百万倍,且每18个月翻一番。1.1大数据的概念与意义第一章大数据概念与应用大数据数据源整合进行存储、清洗、挖掘、分析后得出结果直到优化企业管理提高效率云计算、硬件性价比的提高以及软件技术的进步智能设备、传感器的普及,推动物联网、人工智能的发展计算运行、计算速度越来越快存储存储成本下降智能实现信息对等解放脑力,机器拥有人的智慧of4061.1大数据的概念与意义2

6、.大数据的技术支撑第一章大数据概念与应用of4071.1大数据的概念与意义1)存储:存储成本的下降云计算出现之前云计算出现之后在云计算出现之前,数据存储的成本是非常高的。例如,公司要建设网站,需要购置和部署服务器,安排技术人员维护服务器,保证数据存储的安全性和数据传输的畅通性,还会定期清理数据,腾出空间以便存储新的数据,机房整体的人力和管理成本都很高。云计算出现后,数据存储服务衍生出了新的商业模式,数据中心的出现降低了公司的计算和存储成本。例如,公司现在要建设网站,不需要去购买服务器,不需要去雇用技术人员维护服务器,可以通过租用硬件设备的方式解决问题

7、。存储成本的下降,也改变了大家对数据的看法,更加愿意把1年、2年甚至更久远的历史数据保存下来,有了历史数据的沉淀,才可以通过对比,发现数据之间的关联和价值。正是由于存储成本的下降,才能为大数据搭建最好的基础设施。第一章大数据概念与应用of4081.1大数据的概念与意义2)计算:运算速度越来越快分布式系统基础架构Hadoop的出现,为大数据带来了新的曙光;HDFS为海量的数据提供了存储;MapReduce则为海量的数据提供了并行计算,从而大大提高了计算效率;Spark、Storm、Impala等各种各样的技术进入人们的视野。海量数据从原始数据源到产生价

8、值,期间会经过存储、清洗、挖掘、分析等多个环节,如果计算速度不够快,很多事情是无法实现的。所以,在大数据的发

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。