欢迎来到天天文库
浏览记录
ID:34598255
大小:44.46 KB
页数:6页
时间:2019-03-08
《硅谷观察之大数据篇【下】:硅谷巨头们的大数据玩法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、硅谷观察之大数据篇【下】:硅谷巨头们的大数据玩法 在硅谷观察之大数据篇的【上】篇中,我把硅谷地区大数据生长状况基本梳理了一个相对完整的形状出来。有朋友看了【下】的预告后在微博上给我留言说,听说下篇要介绍一些公司的大数据部门情况,问能不能点名加个Google尤其是GoogleMaps,因为特别想知道这个世界上最大的搜索引擎以及每天必不可少的出行神器是怎么当一个挖掘机的。 于是,上周我又去了Google采访。本篇将一共呈现硅谷四大不同类型的公司如何玩转大数据,其中包括了著名FLAG中的三家(Apple在大数据这块来说表现并不突出)。
2、 本篇内容来自对EvernoteAI负责人ZeeshaCurrimbhoy、LinkedIn大数据部门资深总监SimonZhang、前Facebook基础架构工程师AshishThusoo和Google大数据部门一线工程师及GoogleMaps相关负责人的专访。Enjoy~~ Evernote:今年新建AI部门剑指深度学习 Evernote的全球大会上,CEOPhilLibin提到,Evernote的一个重要方向就是“让Evernote变成一个强大的大脑”。要实现这个目标,就不得不提他们刚刚整合改组的AugmentedInte
3、lligence团队(以下简称AIteam)。我在斯坦福约到AIteam的managerZeeshaCurrimbhoy,在此分析一下从她那里得到的一手资料。 ●是什么 今年早些时候,这个2岁的数据处理团队改组为由Zeesha带领的AugmentedIntelligenceteam,总共十人不到,很低调,平日几乎听不到声响。他们究竟在做什么? 与我们常说的AI(artificialIntelligence)不同,Evernote的团队名叫做AugmentedIntelligence,通常情况下简称为IA。 Zeesha显然是
4、这个团队里元老级的人物:“我是在2012年加入Evernote的,直接加入到了当时刚刚建立的数据处理团队,这也就是现在AIteam的雏形。我们最开始的项目都是简单易行的小项目,比如按照你的个人打字方式来优化用户的输入体验。” 传统意义上的AI指的是通过大量数据和算法让机器学会分析并作出决定。而这里讲到IA则是让电脑进行一定量的运算,而终极目的是以之武装人脑,让人来更好的做决定。这两个概念在具体实施中自然有不少相通之处,但是其出发点却是完全不同的。 这个区别也是EvernoteAIteam的亮点所在。作为一个笔记记录工具,Ever
5、note与Google之类的搜索引擎相比,最大的区别就是它非常的个人化。用户所储存的笔记、网站链接、照片、视频等都是他思维方式和关注点的体现。 ●从哪来 Zeesha小组的初衷便是,通过分析用户储存的笔记来学习其思维方式,然后以相同的模式从第三方数据库(也就是互联网上的各种开源信息)抽取信息推送给用户,从而达到帮助用户思考的过程。从这个意义上讲,Zeesha版的未来Evernote更像是一个大脑的超级外挂,为人脑提供各种强大的可理解的数据支持。 目前整个团队的切入点是很小而专注的。 “我们不仅仅是帮助用户做搜索,更重要的是在
6、正确的时间给用户推送正确的信息。” 实现这个目标的第一步就是给用户自己的笔记分类,找到关联点。今年早些时候,Evernote已经在Mac的英文版上实行了一项叫做“DescriptiveSearch”的功能。用户可以直接描述想要搜索的条目,Evernote就会自动返回所有相关信息。 例如,用户可以直接搜索“2012后在布拉格的所有图片”,或者“所有素食菜单”。不管用户的笔记是怎样分类的,DecriptiveSearch都可以搜索到相关的信息并且避免返回过大范围的数据。而这还仅仅是AIteam长期目标的开始,这个团队将在此基础上开发
7、一系列智能化的产品。 ●到哪去 不用说,这样一个新创团队自然也面临这诸多方面的挑战。当下一个比较重要的技术难点就是Evernote用户的数据量。虽然Evernote的用户量已经达到了一亿,但是由于整个团队的关注点在个人化分析,外加隐私保护等诸多原因,AIteam并没有做跨用户的数据分析。 这样做的结果就是团队需要分析一亿组各不相同的小数据组。比如,假设我只在Evernote上面存了10个笔记,那Evernote也应该能够通过这些少量的数据来分析出有效结果。当然,这些技术的直接结果是用户用Evernote越多,得到的个性化用户体
8、验就越好。长期来讲,也是一个可以增加用户黏性的特点。 不过Zeesha也坦言:“的确,我们都知道没有大数据就没有所谓的智能分析。但是我们现在所做的正是在这样的前提下来找到新的合适的算法。”她并没有深入去讲目前团队所用的是什么思路,但
此文档下载收益归作者所有