大数据读书分享

大数据读书分享

ID:33925373

大小:1.52 MB

页数:19页

时间:2019-03-01

大数据读书分享_第1页
大数据读书分享_第2页
大数据读书分享_第3页
大数据读书分享_第4页
大数据读书分享_第5页
资源描述:

《大数据读书分享》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、《大数据时代》《爆发:大数据时代预见未来新思维》读书分享什么是大数据?百度百科:大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。!大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、veracity(真实性)什么是大数据时代最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率

2、增长和消费者盈余浪潮的到来。”“大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。大数据作为云计算、物联网之后IT行业又一大颠覆性的技术革命。云计算主要为数据资产提供了保管、访问的场所和渠道,而数据才是真正有价值的资产。企业内部的经营交易信息、互联网世界中的商品物流信息,互联网世界中的人与人交互信息、位置信息等,其数量将远远超越现有企业IT架构和基础设施的承载能力,实时性要求也将大大超越现有的计算能力。如何盘活这些数据资产,使其为国家治理、企业决策乃至个人生活服务,是大数据的核心议

3、题互联网公司要被数据淹没谷歌公司每天要处理超过24拍字节(1千万亿字节)的数据,这意味着其每天的数据处理量是美国国家图书馆所有纸质出版物所含数据量的上千倍。!Facebook这个创立时间不足十年的公司,每天更新的照片量超过1000万张,每天人们在网站上点击“喜欢”(Like)按钮或者写评论大约有三十亿次,这就为Facebook公司挖掘用户喜好提供了大量的数据线索。!与此同时,谷歌子公司YouTube每月接待多达8亿的访客,平均每一秒钟就会有一段长度在一小时以上的视频上传。!Twitter上的信息量几乎每年翻一番,截止到2012年,每天都会发布超过4亿条微博。大数

4、据:数字化—数据化—量化一切1KB(Kibibyte,千字节)=1024B,1MB(Mebibyte,兆字节,简称“兆”)=1024KB,1GB(Gigabyte,吉字节,又称“千兆”)=1024MB,1TB(Terabyte,万亿字节,太字节)=1024GB,1PB(Petabyte,千万亿字节,拍字节)=1024TB,1EB(Exabyte,百亿亿字节,艾字节)=1024PB,1ZB(Zettabyte,十万亿亿字节,泽字节)=1024EB,1YB(Yottabyte,一亿亿亿字节,尧字节)=1024ZB,1BB(Brontobyte,一千亿亿亿字节)=10

5、24YB大数据在身边Facebook2012年拥有大约10亿用户,他们通过上千亿的朋友关系网相互连接。这个巨大的社交网络覆盖了大约10%的全球总人口。想想这所有的关系和活动在数据化之后都为一家公司所掌控,这些指责和质疑就不能算作空穴来风。2013年Android手机用户突破10亿;有数十亿用户每天使用Google搜索各类信息;全球数亿用户每天使用苹果设备从事工作、生活、社交。。。引言故事2009年出现了一种新的流感病毒。这种甲型H1N1流感结合了导致禽流感和猪流感的病毒的特点,在短短几周之内迅速传播开来。全球的公共卫生机构都担心一场致命的流行病即将来袭。有的评论

6、家甚至警告说,可能会爆发大规模流感,类似于1918年在西班牙爆发的、影响了5亿人口并夺走了数千万人性命的大规模流感。更糟糕的是,我们还没有研发出对抗这种新型流感病毒的疫苗。公共卫生专家能做的只是减慢它传播的速度。但要做到这一点,他们必须先知道这种流感出现在哪里。关键字Google30亿条的搜索指令4.5亿个不同的数字模型45条检索词条的组合相关性高达97%基于这样的技术理念和数据储备预测流感传播引言故事2003年,奥伦·埃齐奥尼(OrenEtzioni)准备乘坐从西雅图到洛杉矶的飞机去参加弟弟的婚礼。他知道飞机票越早预订越便宜,于是他在这个大喜日子来临之前的几个

7、月,就在网上预订了一张去洛杉矶的机票。在飞机上,埃齐奥尼好奇地问邻座的乘客花了多少钱购买机票。当得知虽然那个人的机票比他买得更晚,但是票价却比他便宜得多时,他感到非常气愤。于是,他又询问了另外几个乘客,结果发现大家买的票居然都比他的便宜。。。关键字Farecast2000亿条飞行数据记录十万亿条价格记录75%可节省50美元大数据时代才刚刚开始大数据时代2003年,人类第一次破译人体基因密码的时候,辛苦工作了十年才完成了三十亿对碱基对的排序。大约十年之后,世界范围内的基因仪每15分钟就可以完成同样的工作。美国股市每天的成交量高达70亿股。而其中三分之二的交易都是由

8、建立在算法公式上的计算机

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。