简述大数据时代网络信息有哪些新特点

简述大数据时代网络信息有哪些新特点

ID:44236041

大小:28.50 KB

页数:5页

时间:2019-10-19

简述大数据时代网络信息有哪些新特点_第1页
简述大数据时代网络信息有哪些新特点_第2页
简述大数据时代网络信息有哪些新特点_第3页
简述大数据时代网络信息有哪些新特点_第4页
简述大数据时代网络信息有哪些新特点_第5页
资源描述:

《简述大数据时代网络信息有哪些新特点》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、简述大数据时代网络信息有哪些新特点学号:201406180319临沂人学英语翻译三班彭侏最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的牛产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”“大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时口,却因为近年来互联网和信息行业的发展而引起人们关注.随着云时代的来临,大数据(Bigdata)也吸引了越来越多的关注。著云台的分析师团队认为,大数据(Bigdata)通常用来形容一

2、个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。“大数据”在互联网行业指的是这样…种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用G或T来衡量,大数据的起始计量单位至少是卩(1000个T)、E(100万个T)或Z(10亿个T)。除了“物联网”和“云计算”,IT业又出现了一个新名词——大数据。如今,大数据甚至引起了工商界和金融界

3、的高度关注,人们认为大数据将为数据应用和决策支持提供有效帮助,成为物联网和云计算内在的灵魂和必然的发展趋势。大数据目前尚没有统…的定义,通常被认为是八种数据量很大、数据形式多样化的非结构化数据。这里我们先弄清楚儿个概念,结构化数据、半结构化数据和非结构化数据。结构化数据可以在关系数据库中找到,多年来一直主导着IT应用;半结构化数据包括电子邮件、文字处理文件以及大量发布在网络上的新闻等,以内容为基础,这也是谷歌和百度存在的理由;而非结构化数据广泛存在于社交网络、物联网、电子商务之中。伴随着社交网络、移动计算和传感器等新技术不断产牛,有报告称,超过85%的数

4、据属于非结构化数据。很多人相信这些庞大的异构数据中蕴含着巨大财富——企业如果能在这些非结构化数据中挖掘知识并与业务融合,决策的依据将会更加全面和准确;在科学、体育、广告和公共卫生等其他领域中,也有着向数据驱动型的发现和决策方式转变的趋势。大数据的推动因素主要来自于一些大型IT公司,如谷歌、亚马逊、中国移动、阿里巴巴等,他们需要以更加优化的方式存储和分析数据。此外,还有一些来自健康医疗、地理空间遥感和数字媒体等行业的大数据需求。据市场研究公司统计,未来10年里预计数字信息总量将在2009年到2020年增长44倍,全球数据使用量将达到大约35.2ZB(1ZB

5、=1O亿TB)。大数据到底有多大?一组名为“互联网上一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1・68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200力个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……截止到2012年,数据量已经从TB(1O24GB=1TB)级别跃升到PB(1O24TB=1PB)、EB(1O24PB=1EB)乃至ZB(1024EB=1ZB)级别。国际数据公司(IDC)的研究结果表明,2008年全球产生的数据量为0.

6、49ZB,2009年的数据量为0.8ZB,2010年增长为1.2ZB,2011年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的数据。而到2012年为止,人类生产的所有印刷材料的数据量是200PB,全人类历史上说过的所有话的数据量大约是5EBoIBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。大数据呈现出“4V+1C”的特点:(1)Variety,大数据种类繁多,在编码方式、数据格式、应用特征等多个方面存在差异性,多信息源并发形成大量的异构数据;(2)Vo

7、lume,通过各种设备产牛的海量数据,其数据规模极为庞大,远大于目前互联网上的信息流量,PB级别将是常态;(3)Velocity,涉及到感知、传输、决策、控制开放式循环的大数据,对数据实时处理有着极高的要求,通过传统数据库查询方式得到的“当前结果”很可能已经没有价值;(4)Vitality,数据持续到达,并且只有在特定时间和空间中才有意义;(5)Complexity,通过数据库处理持久存储的数据不再适用于大数据处理,需要有新的方法来满足异构数据统一接入和实时数据处理的需求。数据量大第一个特征是数据量大。大数据的起始计量单位至少是P(1000个T)、E(1

8、00万个T)或Z(10亿个T)。类型繁多第二个特征是数据类型繁多。包括网络日志、

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。