谷歌TPU3.0的四大亮点.doc

谷歌TPU3.0的四大亮点.doc

ID:28144176

大小:653.00 KB

页数:7页

时间:2018-12-08

谷歌TPU3.0的四大亮点.doc_第1页
谷歌TPU3.0的四大亮点.doc_第2页
谷歌TPU3.0的四大亮点.doc_第3页
谷歌TPU3.0的四大亮点.doc_第4页
谷歌TPU3.0的四大亮点.doc_第5页
资源描述:

《谷歌TPU3.0的四大亮点.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、谷歌TPU3.0的四大亮点  8倍性能  今天的新闻中我们都可以看到如下描述“GoogleCEOSundarPichaisaidthenewTPUiseighttimesmorepowerfulthanlastyearperpod,withupto100petaflopsinperformance.”也就是说一个TPU3pod的总处理能力100PFLOPS是TPU2pod的8倍。  从下图我们可以看一下TPU3pod和TPU2pod的对比。    TPU2的一个pod包括4个rack,两个CPUrack(左右两边),两个TPUrack(中间两个)。每个rack有32个compu

2、tingunit(板卡),每个TPU板卡有4颗TPU芯片。因此一个pod总共有64x4颗TPU2芯片。每颗TPU2芯片的处理能力是45TFLOPS,因此一个pod总的处理能力是45x4x64=11.5PFLOPS.      对比来看,TPU3的板卡仍然包括4颗芯片。但目测TPU3pod的rack数量和板卡的密度(这个看的不是很清楚)和TPU2相比都增加了一倍。因此,一个pod中的TPU3芯片的数量应该是之前4倍。如果pod的总处理能力是TPU2的8倍,那么TPU3单芯片的处理能力则为TPU2的2倍。  根据Google的说法,这次他们第一次在Datacenter采用水冷的散热

3、方式,这可能和芯片功耗以及板卡密度增加有关系。  Googlealsosaidthisisthefirsttimethecompanyhashadtoincludeliquidcoolinginitsdatacenters,CEOSundarPichaisaid.    总得来说,如上图所描述(来自GoogleI/O大会的talk:EffectiveMachineLearningwithGoogleTPU,可以在YouTube上搜索Googleio18stage8观看),TPU3实现的超过100PFLOPS的处理能力是来自“新的芯片架构和大规模系统”。  快速迭代  从去年I/

4、O大会发布TPU2到今天不过一年时间,Google的芯片迭代速度还是非常惊人的。“为什么Google能够实现这样的快速迭代?”这也是一个非常值得探讨的话题。  我先简单谈几点个人看法:  第一,TPU是一个Domain-specificArchitecture(参考当我们设计一个专用处理器的时候我们在干什么?(上)),定位准确,架构简单,容易扩展。相比之下,传统的通用处理器必须考虑灵活性和兼容性,有太重的包袱。当然,TPU这种特点也决定它只能用于有限的应用场景,可能只有Google的体量以及云服务能够所提供的应用需求才能充分利用TPU这种专用芯片,这一点是得天独厚的。这也是目前

5、几乎所有科技巨头都开始自研芯片的一个基本考量。而传统的芯片厂商在这一点上就有些尴尬了。  第二,Google的软件和系统能力超强,TPU以Cloudservice出现,提高给客户的是整体服务。芯片硬件可做的tradeoff空间比较大,芯片本身的弱点可以在系统层面弥补。从目前得到的信息分析的,TPU3的处理能力是TPU2的8倍,其中芯片换代的贡献只有2倍,大部分改进在系统层面。另一方面,目前芯片开发离不开相关软件工具,Google的软件能力和生态也是其能够实现芯片快速迭代的一个重要因素。  第三,钱很重要。Google不差钱,在芯片实现上可以通过花钱换取时间。  总得来说,Goo

6、gleTPU的意义可能远远超过芯片本身。它背后的芯片设计逻辑,实现方法,应用模式和生态环境,相较传统芯片开发有很大区别,也许会成为趋势。  云服务和Benchmark  Google在发布TPU3的时候同时提到了新的云服务,在之前的CloudTPU基础上,今年晚些时候还会发布CloudTPUpod(不知道谁能用的起?),可以看出TPU对于Goolge的云端战略的重要意义。    有意思的是,在Google的talk中强调了cost的问题,每个例子都给出了相应的trainingcost,画风是这样的。    这里颇有广告的感觉,不禁让人想起黄教主的”ThemoreGPUsyoub

7、uy,Themoremoneyyousave“。结合最近Microsoft对Brainwave项目的宣传,感觉云端机器学习的价格战马上就要开始了。  另外,Google也强调了Benchmark的重要性,还专门展示了他们最近力推的MLPerf。    最近不同平台之间的对比很多,有比性能的,也有拼成本的。相信随着越来越多的厂商加入,刷榜应该会非常热闹。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。