大数据时代的真实世界研究

大数据时代的真实世界研究

ID:42710834

大小:12.38 MB

页数:59页

时间:2019-09-20

大数据时代的真实世界研究_第1页
大数据时代的真实世界研究_第2页
大数据时代的真实世界研究_第3页
大数据时代的真实世界研究_第4页
大数据时代的真实世界研究_第5页
资源描述:

《大数据时代的真实世界研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、大数据时代的真实世界研究程良斌湖北省中医院肝病科二、大数据时代的思维改变一、大数据时代三、真实世界研究目录二、大数据时代的思维改变一、大数据时代三、真实世界研究目录前言作者:[英]维克托·迈尔-舍恩伯格(ViktorMayer-Schönberger)著盛扬燕周涛译2013年4月14日CCTV《对话》栏目陈伟鸿Vs维克托大数据时代来临2008年9月,《Nature》出版了一个专刊,讨论大数据存储、管理和分析等问题,昭示着大数据时代的到来。之后麦肯锡公司、《Science》先后出版大数据报告和专刊大

2、数据的讨论在中国也风起云涌,中国计算机学会于2012年10月在大连成立了以中国工程院院士李国杰为首的“大数据专家委员会”,国家自然科学基金委于2013年3月在上海举办了第89期双清论坛“大数据技术与应用中的挑战性科学问题”大数据时代来临进入2012年,大数据(bigdata)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都

3、将开始这种进程。”数据到底有多大?一组名为“互联网上一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。大数据是什么?什么是大数据,其概念定义至

4、今莫衷一是2012年8月份国际数据挖掘会议SIGKDD的大数据论坛,从数据存储角度认为大数据应该是10台服务器也无法存储的数据,这样的数据必须进行在线分析,否则计算机存储无法支持;有专家从数据分析角度认为,数据结构很复杂,现有方法无法处理,必须采用类似谷歌的Hadoop平台进行处理的就是大数据。到2013年,世界存储的数据预计达到1.2泽字节(ZB=270),其中98%为数字数据今天我们所说的“大数据”和过去传统意义上的“数据”的区别又在哪里?大数据的来源又有哪些?云计算“大数据”与“数据”的区别

5、过去我们说的“数据”很大程度上是指“数字”,都是一个个数字或者是可以进行编码的简单文本,这些数据分析起来相对简单,过去传统的数据解决方案(如数据库或商业智能技术)就能轻松应对而今天我们所说的“大数据”则不单纯指“数字”,可能还包括“文本,图片,音频,视频……”等多种格式,其涵括的内容十分丰富,如我们的博客,微博,轻博客,我们的音频视频分享,我们的通话录音,我们位置信息,我们的点评信息,互动信息等等,包罗万象用正规的语句来概括就是,“数据”是结构化的,而“大数据”则包括了“结构化数据”、“半结构化数

6、据”和“非结构化数据”“结构化”、“半结构化”、“非结构化关于“结构化”“半结构化”“非结构化”可能从字面上比较难理解由于数据是结构化的,数据分析可以遵循一定现有规律的,如通过简单的线性相关,数据分析可以大致预测下个月的营业收入额。目前,只有5%的数据是结构化而大数据是半结构化和非结构化的,其在分析过程中遵循的规律则是未知的,它通过综合方方面面的信息进行模拟,它以分析形式评估证据,假设应答结果,并计算每种可能性的可信度,通过大数据分析我们可以准确找到下一个热点大数据潜质的信息资源笔者体会“大数据”

7、不仅是数据量大,数据结构复杂,而且应该是动态变化、蕴含着丰富使用价值的数据如今,在我们身边具有大数据潜质的信息资源随处可见,目前大多以纸张或模拟信息媒介的形式存放,但随着数字信息技术、网络技术以及物联网技术的出现和应用,他们大都可以被数据化后而激活,成为拥有巨大创新价值的宝库而中医药领域浩瀚的古代医籍、大量病历资料与现代科学研究文献,以及随着物联网的广泛应用,人们衣食住行过程以及健康信息监测所产生的数字信息,也都将成为可以有力促进中医药和人类健康事业发展的大数据本质上,世界由信息构成物联网,试图在

8、一切生活的事物中都植入芯片、传感器和通信模块,这个词很像互联网的姐妹,其实不过是一种典型的数据化手段罢了2009年,苹果公司申请了一项专利,通过音频耳塞收集关于血液氧合度、心率和体温的数据今天,我们生活在一个计算型社会,因为我们相信世界可以通过数字和数学而获得解释——量化一切——把各种各样的显示转化为数据耳挂、头戴式16通道健康监护设备物联网“棱镜门”计划泄密者,美国前中央情报局特工 爱德华·斯诺登量化一切是数据化的核心数据化:将现象转变为可制表分析的量化形式的过程数字化:把模拟数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。