云计算环境下大数据及其智能处理技术1

云计算环境下大数据及其智能处理技术1

ID:8819660

大小:17.48 KB

页数:2页

时间:2018-04-08

云计算环境下大数据及其智能处理技术1_第1页
云计算环境下大数据及其智能处理技术1_第2页
资源描述:

《云计算环境下大数据及其智能处理技术1》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、云计算环境下大数据及其智能处理技术1、什么是大数据“大数据”“是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。“大数据”首先是指数据体量(volumes)大,指代大型数据集,一般在10TB规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量;其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。IBM将大数据归纳未三个标准,即3V:类型(

2、variety)、数量(volume)和速度(velocity)。其中类型(variety)指数据中有结构化、半结构化和非结构化等多种数据形式;数量(volume)指收集和分析的数据量非常大;速度(velocity)指数据处理速度要足够快。大数据对于悲观者而言,意味着数据存储世界的末日,对乐观者而言,这里孕育了巨大的市场机会,庞大的数据就是一个信息金矿,随着技术的进步,其财富价值将很快被我们发现,而且越来越容易。大数据本身是一个现象而不是一种技术,伴随着大数据的采集、传输、处理和应用的相关技术就是大数据处理技术,是系列使

3、用非传统的工具来对大量的结构化、半结构化和非结构化数据进行处理,从而获得分析和预测结果的一系列数据处理技术。2、“大数据”的缘由根据IDC作出的估测,数据一直都在以每年50%的速度增长,也就是说每两年就增长一倍(大数据摩尔定律),这意味着人类在最近两年产生的数据量相当于之前产生的全部数据量,预计到2020年,全球将总共拥有35亿GB的数据量,相较于2010年,数据量将增长近30倍。这不是简单的数据增多的问题,而是全新的问题。举例来说,在当今全球范围内的工业设备、汽车、电子仪表和装运箱中,都有着无数的数字传感器,这些传感器

4、能测量和交流位置、运动、震动、温度和湿度等数据,甚至还能测量空气中的化学变化。将这些交流传感器与计算智能连接起来,就是目前“物联网”(InternetofThings)或“工业互联网”(IndustrialInternet)。在信息获取的问题上取得进步是促进“大数据”趋势发展的重要原因。3、“大数据”的辨正随着物联网和云计算的研究和应用不断深入,对大数据的研究越来越引起广泛的重视,对大大数据及其处理技术产生了很多错误的认识,业界有大量关于何谓大数据及它可以做什么的说法,其中有很多是相互矛盾的,都存在一定的片面性,根据ID

5、C2011年市场研究报告,主要有三个典型的错误说法:1)关系型数据库不能扩展到非常大的数据卷,因此不被认为是大数据的技术;2)无论工作负载有多大,也无论使用场景如何,Hadoop或推而广之,任何Mapreduce的环境)都是大数据的最佳选择;3)基于数据模型的数据库管理系统的时代已经结束了,数据模型必须大数据的方式来建立。结论是新型关系型数据库既可解决结构化和非结构化数据,也可满足大数据的数量和速度要求,相比较而言的Hadoop型解决方案是片面的,不能解决很多的关系型应用环境问题,不一定是最佳选择,大数据管理和处理有更优

6、的解决方案和技术路线。4、“大数据”处理技术大数据时代的超大数据体量和占相当比例的半结构化和非结构化数据的存在,已经超越了传统数据库的管理能力,大数据技术将是IT领域新一代的技术与架构,它将帮助人们存储管理好大数据并从大体量、高复杂的数据中提取价值,相关的技术、产品将不断涌现,将有可能给IT行业开拓一个新的黄金时代。大数据本质也是数据,其关键的技术依然逃不脱:1)大数据存储和管理;2)大数据检索使用(包括数据挖掘和智能分析)。围绕大数据,一批新兴的数据挖掘、数据存储、数据处理与分析技术将不断涌现,让我们处理海量数据更加容

7、易、更加便宜和迅速,成为企业业务经营的好助手,甚至可以改变许多行业的经营方式。1)大数据的商业模式与架构----云计算及其分布式结构是重要途径大数据处理技术正在改变目前计算机的运行模式,正在改变着这个世界:它能处理几乎各种类型的海量数据,无论是微博、文章、电子邮件、文档、音频、视频,还是其它形态的数据;它工作的速度非常快速:实际上几乎实时;它具有普及性:因为它所用的都是最普通低成本的硬件,而云计算它将计算任务分布在大量计算机构成的资源池上,使用户能够按需获取计算力、存储空间和信息服务。云计算及其技术给了人们廉价获取巨量计

8、算和存储的能力,云计算分布式架构能够很好地支持大数据存储和处理需求。这样的低成本硬件+低成本软件+低成本运维,更加经济和实用,使得大数据处理和利用成为可能。2)大数据的存储和管理----云数据库的必然很多人把NoSQL叫做云数据库,因为其处理数据的模式完全是分布于各种低成本服务器和存储磁盘,因此它可以帮助网页和各种交

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。