NVIDIA这暴脾气!全新显卡架构Volta解析 性能暴增50%.doc

NVIDIA这暴脾气!全新显卡架构Volta解析 性能暴增50%.doc

ID:27521585

大小:564.00 KB

页数:15页

时间:2018-12-04

NVIDIA这暴脾气!全新显卡架构Volta解析 性能暴增50%.doc_第1页
NVIDIA这暴脾气!全新显卡架构Volta解析 性能暴增50%.doc_第2页
NVIDIA这暴脾气!全新显卡架构Volta解析 性能暴增50%.doc_第3页
NVIDIA这暴脾气!全新显卡架构Volta解析 性能暴增50%.doc_第4页
NVIDIA这暴脾气!全新显卡架构Volta解析 性能暴增50%.doc_第5页
资源描述:

《NVIDIA这暴脾气!全新显卡架构Volta解析 性能暴增50%.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、NVIDIA这暴脾气!全新显卡架构Volta解析性能暴增50%  NVIDIA这几年垄断了高端显卡市场,从他们的Q1季度财报中虽然也能看到Tegra、数据中心等业务有了明显增长,不过营收的主力还是游戏PC市场,Q1季度游戏PC市场营收就增长了50%,高端玩家现在买游戏显卡往往是从GTX1080TI/1080/1070中选一款了。如今Pascal还未显出颓势,今天凌晨的GTC2017主题演讲上,NVIDIACEO黄仁勋发布了Volta架构显卡,新一轮升级又要来了。    NVIDIA能够获得现在的表现很大程度是因为他们的产品路线图比较连贯,从Kepler到Maxw

2、ell,再到现在的Pascal架构,NVIDIA每一代GPU升级都很稳定,短时间内就能完成高端到低端的布局。以Pascal这一代为例,首发的是GTX1080、GTX1070,接着是TItanX,陆陆续续又有GTX10606GB及GTX10603GB,还有GTX1050TI、GTX1050,今年3月份又有GTX1080TI、TitanXp,马上还会有GT1030主打入门级市场——不算不知道,NVIDIA在Pascal这一代的GPU产品组合还真是挺多的。  Pascal显卡发布一年整了,产品线布局还在完善,不过大家的兴趣点现在已经开始向新一代GPU转移了,特别是今天

3、发布了Volta架构显卡——TelsaV100,这跟去年Pascal架构首发GP100核心的TelsaP100一样,也在去年这个时候,我们撰文详细介绍了GP100核心的改进情况,今天我们也会针对GV100核心及TeslaV100显卡做更深入的探讨。  早上已经有TeslaP100的新闻发布了,大家也了解过基本情况了,我们先来看看TeslaV100加速卡的真身,这次同时展示的是两个版本的。  TeslaV100显卡真身:NVLink与PCI-E版大不同    NVLink2接口的TeslaV100显卡  老黄手里曝光最多的就是这个短小强悍的TeslaV100,它实

4、际上NVLink版的,跟去年的TeslaP100看着很像,毕竟这二者都使用了HBM2显存,功耗也没有明显增加,应该是直接沿用相同的PCB电路。    PCI-E接口的TeslaV100显卡  PCI-E版的TeslaV100显卡不太引人注意,找到了上面这张照片,如果跟去年PCI-E版的TeslaP100显卡对比,可以看出PCI-E版TeslaV100显卡跟PCI-E版P100有很多不同,散热器明显小多了,体积跟NVLink版差不多。    这是去年的PCI-E版TeslaP100加速卡  TelsaV100加速卡规格:Volta架构终于来了  TeslaV100

5、是针对HPC市场设计的,跟普通消费者没啥关系(属于吃瓜群众买不到买不起系列),之所以引人关注是因为它使用的是新一代Volta架构,首发的依然是GV100这种大核心。早上的新闻中大家也看到了它各方面规格都很惊人——815mm2核心面积、211亿晶体管、5120个CUDA核心、15TFLOPS浮点性能等等,放在当前的显卡中简直是鹤立鸡群,拿来跑游戏不知道多爽,可惜老黄不卖给消费级玩家。    NVIDIAVolta/Pascal与AMDVega显卡的规格对比  为此我做了一个详细的规格表,对比的产品除了目前的TeslaP100和TitanXp之外,还加入了AMD的V

6、ega10核心的RadeonInstinctMI25显卡,尽管还没上市,但AMD早前公布过这款显卡的一些信息,比如带宽、浮点性能,不过Vega核心的晶体管、核心面积等关键参数还是个谜。  对比GP100核心与GV100核心,可以看出后者规模进一步扩大,SM单元数量从之前的56组提升到了80组,CUDA核心数从3584个提升到5120个,计算单元数量增幅为43%。显存位宽及容量都没变化,还是16GBHBM2显存,不过频率有所提升,带宽从前代的720GB/s提升到了900GB/s,非常接近HBM2显存理论上1024GB/s的带宽了(搭配4颗HBM显存的情况下)。  

7、计算单元的增加也使GV100核心的规模进一步扩大——晶体管数量从目前的153亿增加到了211亿,核心面积从610mm2提升到815mm2,一举创造了NVIDIAGPU同时也是现代GPU的核心面积新纪录。NVIDIA这几代大核心虽然核心面积有涨有降,不过之前最多是在600mm2级别徘徊,这一次直接做了815mm2的大核心。  与Pascal架构GP100核心相比,Volta的GV100核心在架构上更多地是量变而非质变,不过它在架构也不是说没升级,这次GV100核心主要的变化就是针对AI人工智能、DL深度学习等新兴领域专门做了运算单元,我们下面再说这个。  Volt

8、a架构改进:Pascal

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。