大数据读后感吕文德

大数据读后感吕文德

ID:21727814

大小:19.94 KB

页数:5页

时间:2018-10-24

大数据读后感吕文德_第1页
大数据读后感吕文德_第2页
大数据读后感吕文德_第3页
大数据读后感吕文德_第4页
大数据读后感吕文德_第5页
资源描述:

《大数据读后感吕文德》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、《大数据时代》读后感松崮完小吕文德首先,本书大体上都是在讲美国政府在各社会团体不断“争取”权利、三权分立制度的制衡下,一步步将信息公开的历程。以及数据对美国政治所产生的影响,美国政府如何保护公民隐私等等。其实真正涉及到企业如何变得更加“智能”,唯有第四章讲得非常详细。先来看一下完整的商务智能流程:1、通过各种来源的关系型数据库,使用ELT(提取、转换、加载)工具,对来自不同系统的数据以统一格式进行清洗、转换、集成进入到数据仓库。2、锁定目标数据后进行联机分析。通过不同的分析角度进行多维分析,这样用户可以随时创建自己需要的报表,开发人员只要在后台为用户创建构建多维的数据立方体模型,用户就可以直

2、接在前端的各个维度之间进行切换,从不同的维度对数据进行分析。从而获得更加全面的、动态的的分析结果。3、进行数据挖掘。就是从海量数据中,挖掘出具有价值的数据。通过对数据的挖掘其一、可以发现数据的历史规律,对过去进行总结。其二、可以根据数据对未来进行预测。企业可以根据预测对未来行情趋势做出预判,并作出相关决策。4、数据可视化,我想任何人看到一推数据,就会感到很头疼。当然也很不直观,到底企业的各项指标相比往年是好是坏去做对比也会很麻烦。使用各种图表、三维地图、动态模拟以及相关的动画技术是原本枯燥乏味的数据,变得生动起来。数据可视化把数据以更加直观的形态展现出来,使人们对相关数据做到一目了然。5、通

3、过上面几步我们就把原先毫无价值的数据,变成了信息,最后演变为知识。本书观点掷地有声,作者观念高屋建瓴,从很多实例和经验中萃取普适性观念。例子详实丰富,囊括了进百个学术和商业实例。引言提出了大数据将给生活、工作于思维带来重大的变革。一个例子是2009年H1N1流行病毒背景下谷歌通过检测检索词条,处理了4.5亿个不同的数据模型,通过预测并与2007年、2008年美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,预测的结果与官方数据的相关系数高达97%。按照传统的信息返回流程,通告新流感病毒病例将有一到两周的延迟。对于飞速传播的疾病,信息滞后两周是

4、致命的。而谷歌运用大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为世界预测流感提供了一种更快捷的预测工具。此外,我联想到原淘宝董事长马云通过大量数据分析得出2008年经济疲弱,为其商家提前做好迎接经济危机提供了时间缓冲。(补充并清晰描述详细)关于大数据在商业领域的应用,Farecast公司是一个成功的典型范例。该公司由奥伦·埃齐奥尼创办,利用机票的销售数据来预测未来的机票价格,旨在帮助用户在购买机票方面做出预测,并对机票价格走势预测的可信度标示出来供消费者查考。Farecast系统利用近十万亿条价格记录预测的准确度达75%,使得使用Farecast票价预测工具购买机票的

5、旅客,平均每张机票节约50美元。而处理如此多的数据离开了大数据技术将无法进行。也正是由于我们进入了一个前所未有的信息化时代,人们拥有了如此多的数据,才提供给我们利用大数据的分析处理手段,创造新的价值。也许有人以为我们大数据时代的还未来临。其实大数据技术早已渗透到我们中间,它被应用在垃圾邮件的过滤,新浪微博技术平台,谷歌翻译以及输入文字的自动纠错等。文中提出的一个观点是,预测是大数据的核心。其实从过去的时代人们就利用掌握的数据进行各种分析,从而对经济等各方面进行预测、矫正。只是进入了大数据时代人们掌握的数据爆炸性的速度在增长,从而数据的存储和分析数据分方法成了释放大数据能量的关键。关于不是随机

6、样本而是整体数据中。作者指出了随机取样是小数据时代用最少的数据获取最大价值的做法。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义。乔布斯成为世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。乔布斯曾开玩笑说“我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个因为这种方式死于癌症的人”。虽然最后难免死于癌症但这种获得所有数据而不是仅样本的方法将他的生命延长了几年。同样,从事跨境汇款业务的Xoom公司侦破一起犯罪集团的诈骗也是由于使用了整体数据。初此之外,他还列举了日本“相扑”等来证明使用全体数据的重要性。其次,我们微动天下应该考虑的:1、是否有必要建立数据仓库?当

7、然我这个问题我也在线上向IBM数据仓库的人员询问过。要考虑的有两个因素:其一、数据量的级别,其二、对数据挖掘的程度。一、数据量。采集器实时都对新闻、论坛、博客、微博在进行采集,当然如果说一年的数据量不算大的话,亦或者宁波本地的数据量也没那么大的话。公司假设几年后、几十年后业务量增大了,做到了浙江省乃至全国的时候。那个时候的数据量我想应该是非常的庞大了。二、对数据挖掘的程度,当然有关公司涉及的更多。不过有时候那

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。