NVIDIA在美国发布了 Quadro 系列和 DGX 系列的两款新品.doc

NVIDIA在美国发布了 Quadro 系列和 DGX 系列的两款新品.doc

ID:27508287

大小:225.50 KB

页数:9页

时间:2018-12-04

NVIDIA在美国发布了 Quadro 系列和 DGX 系列的两款新品.doc_第1页
NVIDIA在美国发布了 Quadro 系列和 DGX 系列的两款新品.doc_第2页
NVIDIA在美国发布了 Quadro 系列和 DGX 系列的两款新品.doc_第3页
NVIDIA在美国发布了 Quadro 系列和 DGX 系列的两款新品.doc_第4页
NVIDIA在美国发布了 Quadro 系列和 DGX 系列的两款新品.doc_第5页
资源描述:

《NVIDIA在美国发布了 Quadro 系列和 DGX 系列的两款新品.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、NVIDIA在美国发布了Quadro系列和DGX系列的两款新品  3月28日(北京时间),NVIDIA在美国圣何塞召开了GTC2018(GPUTechnologyConference2018)大会,并发布了Quadro系列和DGX系列的两款新品。    QuadroGV100是NVIDIA「专业图形显卡」系列的最新成员,公司CEO黄仁勋称其为「世界上体积最大的GPU」。    QuadroGV100拥有5120颗CUDA流处理器,640颗Tensor处理器,最高可提供14.8TFLOPS的单精度浮点性能,7.4TFLOPS

2、双精度浮点性能;采用32GBHBM2显存,显存带宽为870GB/s;能够提供118T的深度学习性能。    接口方面,QuadroGV100配备4个Display1.4接口,可以对接最多4个4096x2160分辨率,120Hz刷新率的显示器;或4个5120x2880分辨率,60Hz刷新率的显示器;或2个7680x4320分辨率,60Hz刷新率的显示器。    DGX-2是一台专门用于人工智能训练和/或推理任务的桌面计算机,是NVIDIA的第二代DGX「小型超级计算机」,采用新的NVSwitch技术并联16块32GB显存的T

3、eslaV100计算卡,以及两枚英特尔XeonPlatinum处理器,拥有1.5TB系统内存,与30TB的NVMeSSD作为存储空间,显存容量则为512GBHBM2,可以提供最高2petaFLOPS的浮点性能。    这是它的内部结构:    你可以看到,在图中1和2的位置看起来是很多块芯片。其实他们是英伟达的TeslaV100Volta架构GPGPU,单枚算力达到双精度7.8TFLOPS(万亿次浮点计算)、单精度15.7TFLOPS、深度学习125TFLOPS。  而DGX-2单机箱安装了16枚V100,总体性能达到了惊

4、人的2PFLOPS——业界第一台超过千万亿次浮点计算能力的单机箱计算机——称它为超算或许并不浮夸。  但DGX-2的算力并非靠堆叠出来,如果它们之间不能实现高带宽的数据互通则无意义。  时间倒回两年前,英伟达有意在深度学习的设备市场上对英特尔发起直接挑战,推出了Pascal架构的P100GPGPU。在当时,主流服务器PCIe总线接口的带宽和时延,已经无法满足英伟达的需求。于是它们开发出了一个新的设备内互联标准,叫做NVLink,使得带宽达到了300GB/s。一个8枚GPGPU的系统里,NVLink大概长这样:    然而N

5、VLink的标准拓扑结构在理论上最多支持8枚显卡,仍不足以满足英伟达对于新系统内置更多显卡的需要。于是在NVLink的基础上,英伟达开发出了一个名专门在显卡之间管理NVLink任务的协处理器,命名为NVSwitch。这个元件在DGX-2上,让16枚GPGPU中两两之间实现NVLink互通,总带宽超过了14.4TB。  这一数字创造了桌面级电脑内总线接口带宽的新高,但实现它的目的并非跑分,而在于DGX-2可以1)更快速地训练一个高复杂度的神经网络,或2)同时训练大量不同结构的神经网络。  N卡之所以被称为核弹有一种另类的解释

6、方式:它的多核心架构在这个依核心数量论高下的时代显得超凡脱俗——动辄几百、上千个CUDA核心,令人不明觉厉。而在DGX-2上,16枚V100的CUDA核数达到了疯狂的81,920核心。这一事实,结合NVSwitch技术、512GB现存、30TBNVMe固态硬盘、两枚至强PlatimumCPU和高达1.5TB的主机内存——  黄仁勋用GPU深度学习里程碑式的杰作AlexNet来举例。研究者AlexKrizhevsk用了6天,在英伟达GPU上训练AlexNet,这个研究首次利用梯度下降法和卷积神经网络进行计算机图像识别,显著优

7、于此前的手调参数法,拿下了ImageNet图像识别竞赛冠军。AlexNet让Alex世界闻名,这6天可以说值了。  然而,“同样的8层卷积神经网络,我用DGX-2跑了一下,只用18分钟就达到了同样的结果,”黄仁勋说,”五年,500倍的进步。”  这说明了很多东西。其中有一条:在这五年里,英伟达的技术进步节奏已经无法用摩尔定律来描述了。  NvidiaDGX-2可提供10倍于上一代NvidiaDGX-1的深度学习性能,整体功耗为为10KW,重350磅,售价仅为39.9万美元(约合250万人民币)。  除了上述两款重磅产品外,

8、在今天的GTC2018上,黄仁勋还宣布了英伟达的以下进展:  1、推出光线追踪RTX技术(ray-tracing),能够提供电影级画质的实时渲染,渲染出逼真的反射、折射和阴影画面。这一技术由英伟达在前不久的GDC全球游戏开发者大会上展示过;  2、推出了第一款专用于医疗图像处理的超级电脑Clara;  

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。