欢迎来到天天文库
浏览记录
ID:27508287
大小:225.50 KB
页数:9页
时间:2018-12-04
《NVIDIA在美国发布了 Quadro 系列和 DGX 系列的两款新品.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、NVIDIA在美国发布了Quadro系列和DGX系列的两款新品 3月28日(北京时间),NVIDIA在美国圣何塞召开了GTC2018(GPUTechnologyConference2018)大会,并发布了Quadro系列和DGX系列的两款新品。 QuadroGV100是NVIDIA「专业图形显卡」系列的最新成员,公司CEO黄仁勋称其为「世界上体积最大的GPU」。 QuadroGV100拥有5120颗CUDA流处理器,640颗Tensor处理器,最高可提供14.8TFLOPS的单精度浮点性能,7.4TFLOPS
2、双精度浮点性能;采用32GBHBM2显存,显存带宽为870GB/s;能够提供118T的深度学习性能。 接口方面,QuadroGV100配备4个Display1.4接口,可以对接最多4个4096x2160分辨率,120Hz刷新率的显示器;或4个5120x2880分辨率,60Hz刷新率的显示器;或2个7680x4320分辨率,60Hz刷新率的显示器。 DGX-2是一台专门用于人工智能训练和/或推理任务的桌面计算机,是NVIDIA的第二代DGX「小型超级计算机」,采用新的NVSwitch技术并联16块32GB显存的T
3、eslaV100计算卡,以及两枚英特尔XeonPlatinum处理器,拥有1.5TB系统内存,与30TB的NVMeSSD作为存储空间,显存容量则为512GBHBM2,可以提供最高2petaFLOPS的浮点性能。 这是它的内部结构: 你可以看到,在图中1和2的位置看起来是很多块芯片。其实他们是英伟达的TeslaV100Volta架构GPGPU,单枚算力达到双精度7.8TFLOPS(万亿次浮点计算)、单精度15.7TFLOPS、深度学习125TFLOPS。 而DGX-2单机箱安装了16枚V100,总体性能达到了惊
4、人的2PFLOPS——业界第一台超过千万亿次浮点计算能力的单机箱计算机——称它为超算或许并不浮夸。 但DGX-2的算力并非靠堆叠出来,如果它们之间不能实现高带宽的数据互通则无意义。 时间倒回两年前,英伟达有意在深度学习的设备市场上对英特尔发起直接挑战,推出了Pascal架构的P100GPGPU。在当时,主流服务器PCIe总线接口的带宽和时延,已经无法满足英伟达的需求。于是它们开发出了一个新的设备内互联标准,叫做NVLink,使得带宽达到了300GB/s。一个8枚GPGPU的系统里,NVLink大概长这样: 然而N
5、VLink的标准拓扑结构在理论上最多支持8枚显卡,仍不足以满足英伟达对于新系统内置更多显卡的需要。于是在NVLink的基础上,英伟达开发出了一个名专门在显卡之间管理NVLink任务的协处理器,命名为NVSwitch。这个元件在DGX-2上,让16枚GPGPU中两两之间实现NVLink互通,总带宽超过了14.4TB。 这一数字创造了桌面级电脑内总线接口带宽的新高,但实现它的目的并非跑分,而在于DGX-2可以1)更快速地训练一个高复杂度的神经网络,或2)同时训练大量不同结构的神经网络。 N卡之所以被称为核弹有一种另类的解释
6、方式:它的多核心架构在这个依核心数量论高下的时代显得超凡脱俗——动辄几百、上千个CUDA核心,令人不明觉厉。而在DGX-2上,16枚V100的CUDA核数达到了疯狂的81,920核心。这一事实,结合NVSwitch技术、512GB现存、30TBNVMe固态硬盘、两枚至强PlatimumCPU和高达1.5TB的主机内存—— 黄仁勋用GPU深度学习里程碑式的杰作AlexNet来举例。研究者AlexKrizhevsk用了6天,在英伟达GPU上训练AlexNet,这个研究首次利用梯度下降法和卷积神经网络进行计算机图像识别,显著优
7、于此前的手调参数法,拿下了ImageNet图像识别竞赛冠军。AlexNet让Alex世界闻名,这6天可以说值了。 然而,“同样的8层卷积神经网络,我用DGX-2跑了一下,只用18分钟就达到了同样的结果,”黄仁勋说,”五年,500倍的进步。” 这说明了很多东西。其中有一条:在这五年里,英伟达的技术进步节奏已经无法用摩尔定律来描述了。 NvidiaDGX-2可提供10倍于上一代NvidiaDGX-1的深度学习性能,整体功耗为为10KW,重350磅,售价仅为39.9万美元(约合250万人民币)。 除了上述两款重磅产品外,
8、在今天的GTC2018上,黄仁勋还宣布了英伟达的以下进展: 1、推出光线追踪RTX技术(ray-tracing),能够提供电影级画质的实时渲染,渲染出逼真的反射、折射和阴影画面。这一技术由英伟达在前不久的GDC全球游戏开发者大会上展示过; 2、推出了第一款专用于医疗图像处理的超级电脑Clara;
此文档下载收益归作者所有