power处理器推动大数据发展

power处理器推动大数据发展

ID:32021543

大小:690.67 KB

页数:14页

时间:2019-01-30

power处理器推动大数据发展_第1页
power处理器推动大数据发展_第2页
power处理器推动大数据发展_第3页
power处理器推动大数据发展_第4页
power处理器推动大数据发展_第5页
资源描述:

《power处理器推动大数据发展》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、POWER处理器推动大数据发展?在这个报告中,我们将详细介绍大数据和企业级分析市场,讨论分析使用模式之间的区别,并且边讨论边给出一些定义。我们还将具体介绍IBM认为在成本和性能方面均可击败x86的新平台。IBM能否在x86主战场使用基于POWER的系统来击败它们呢?企业级分析–常称“大数据”–正在掀起一场经济革命,迅速演变成为帮助企业击败竞争对手的最重要的工具。企业级分析使企业能够知道自己哪方面做得很好、哪方面有待改进、如何提高客户服务效率以及如何在未来实现繁荣昌盛等问题。企业若不能利用大数据,最终将在

2、下一波的经济增长与竞争中被淘汰出局。总之,大数据无比重要。但是,大数据到底是什么呢?简言之,“大数据”现已成为通过收集和分析大量数据而发现隐蔽的内在关系以及新机会和新威胁的代名词。华尔街使用大数据来开发贸易算法与模型。连锁零售商使用大数据来确保适当时间及适当位置的合理库存。企业一直都在收集客户及竞争对手的信息。我们一直都在通过一些系统来汇聚信息、通过一定的容量来分析信息并且从中提取某些有用的洞察力–仅仅这些还不足够。我们还需要足够充分的信息、足够强大的分析能力、以及足够准确的洞察力。对大数据而言,突然能

3、够接入激增信息的能力才是真正的“新事务”。传感器、信用卡、电话、计算机、社交媒体及联网设备等源源不断地生成大量信息;据统计,全世界有90%的数据都是在最近两年生成的。大数据的主要考虑因素在这个数据洪流中,有些数据是有意义的、有用的,有些则是“噪音数据”。接下来,我将对“大数据的四个V”进行补充:©2002-2014GabrielConsultingGroup,Inc.版权所有,保留所有权利数量(Volume)–有多少?速度(Velocity)–有多快?准确性(Veracity)–有多可靠?多样性(Var

4、iety)–有哪些格式?这里漏掉了价值(Value)因素。虽然并非所有的数据都具有价值,但在噪音数据中也可能存在您所需要的关键信息:一旦被发现便可以改变洞察力、战略和目标的数据点。您一般专注于哪些数据?许多数据科学家都认为只要能够掌控极小部分的变量,可能只有5%,企业便可获得超过90%的销售收益。换句话说,只要有一小部分产品/服务属性达到这个“甜点”需求,您便能获得巨大收益,就像完全满足了所有“甜点”需求一样。例如,我们假设一家汽车制造商可以为了满足客户需求而对特殊车型进行100处不同的调整或修改。经过

5、对大量客户及市场数据开展具体调查,制造商可能会发现某些“魔力数据”,令他们只需对车辆进行5-10处的改动可以获得与全部100处改动完全相同的竞争优势。发现并且量化这个“魔力数据”的影响是企业重要的全新分析目标。哪些主要数据对客户而言最重要?这个问题的答案因行业和产品而异。魔力数据的关系也会随市场的成熟而逐渐发生变化。能够发现魔力数据的企业寥寥无几,有些企业甚至从来没有讨论过这个话题。实际上,大多数企业都不知道客户为何购买他们的而不是竞争对手的产品。分析活动能够避免预感与猜测,使企业真正洞悉最重要的资产:

6、他们与客户之间的关系。大数据的类型:结构化vs.非结构化您需要收集、处理和分析的大数据大致分两类。第一类是我们都熟悉的“结构化数据”。当客户在您的网站上输入他们的姓名、寄付账单地址及收货地址时,便给您提供了大量的结构化数据。当您在组织此类信息时,街道地址和邮编均可通过适当格式熟练添加到现有关系数据库的适当字段中,以便随后使用它们来开展任何运营或分析工作。POWER处理器推动大数据发展?2何为“非结构化数据”呢?从本质上说,除结构化数据外的其他所有数据都属于非结构化数据:也就是说,无法轻松添加到关系数据库

7、表中的所有其他的数字化数据。非结构化数据属于完全不同的类型,分析起来难度极大。电子邮件便是典型的非结构化数据。电子邮件是不支持任何标准结构的大量文本,但却包含极为重要的信息。Web流量、脸书发帖、微博跟帖及博客等也都是可能提供宝贵数据的非结构化数据。非结构化数据之所以难以分析是因为它的非结构性质。提取有用信息的步骤通常都是通过分析文本来了解模式,然后再去试图了解上下文及其背后的含义。现在有许多工具都能帮助您完成这些工作,我们将在下文进行简单介绍。结构化和非结构化数据都呈现出指数性增长之势。虽然各机构的估

8、计存在很大不同,但数字化数据的年增长率保守估计也应在40-50%之间,这意味着全球数据总量大约每隔2年便会翻一番。据IDC预计,到2020年底,全球一年生成、复制和消耗的数据总量将问鼎40ZB大关–相当于40万亿千兆字节。大数据分析那么,我们一直讨论的这些关键转型数据到底在哪里呢?它们无处不在。您的公司内部便会生成大量数据–可能存在于遍布整个公司的多个孤立数据仓库中。其他的有用数据则来自公司外部的传感器、网络爬虫、现金出纳机、第三方数据经纪

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。