英伟达的新杀器-全球最大GPU性能提升10倍,售价39.9万美元.doc

英伟达的新杀器-全球最大GPU性能提升10倍,售价39.9万美元.doc

ID:28134057

大小:1.53 MB

页数:10页

时间:2018-12-08

英伟达的新杀器-全球最大GPU性能提升10倍,售价39.9万美元.doc_第1页
英伟达的新杀器-全球最大GPU性能提升10倍,售价39.9万美元.doc_第2页
英伟达的新杀器-全球最大GPU性能提升10倍,售价39.9万美元.doc_第3页
英伟达的新杀器-全球最大GPU性能提升10倍,售价39.9万美元.doc_第4页
英伟达的新杀器-全球最大GPU性能提升10倍,售价39.9万美元.doc_第5页
资源描述:

《英伟达的新杀器-全球最大GPU性能提升10倍,售价39.9万美元.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、英伟达的新杀器:全球最大GPU性能提升10倍,售价39.9万美元  英伟达的新杀器又来了。  刚刚,在GTC2018大会上,黄仁勋发布全球最大GPU。  他说的是DGX-2。  DGX-2能够实现每秒2千万亿次浮点运算(2PFLOPS),性能比去年9月推出的DGX-1性能提高了10倍,售价39.9万美元(人民币250万元)。    这次的GTC2018大会在美国加州圣何塞举行,黄仁勋照例身着皮衣登台演讲。(官方还特别提示:这次是一件全新的皮衣)  而老黄这次的演讲主题,是四个Amazing:amazinggraphi

2、cs、amazingscience、amazingAI、amazingrobots。  首先,从不可思议的图像开始。  在这个环节里,黄仁勋介绍了英伟达在图像实时光线追踪处理方面的最新进展,展示了细腻的反射效果。    这项技术,称为RTX。它面向图形领域,借助深度学习技术,实现了实时光线追踪。    然后黄仁勋发布了首款基于Volta架构的工作站GPU:QuadroGV100。  它支持英伟达RTX技术,支持NVLink2,32GB容量HBM2显存。两个GV100相连,可以提供10000多个CUDA核心,236te

3、raflops的TensorFlow核心。  说着说着,老黄又开始讲这句:买得越多,省得越多。(ThemoreGPUstobuy,themoremoneyyousave.)  “来GTC,学习如何节省百万美元。”老黄发出诚恳的建议。  然后进入不可思议的科学环节。  我们正处在GPU计算的关键点,黄仁勋表示。这部分他还介绍TESLAV100等产品的多快好省,也谈到一些GPU在计算和医疗影像方面的贡献。  比如医疗影像超级计算机CLARA。    深度学习给医疗影响的识别带来了诸多变革,但投入到实际使用中却很难。医院用

4、着十几年前生产的超声仪,黑白渣画质成了医疗进步的阻碍。  要等所有医院升级设备,可能要花上30年。  CLARA是一款医疗影像的超级计算机,让医院可以升级那些已有的系统。医生可以仍然用原有的超声、CT等设备,然后将图像输入超级计算机,推理出更清晰的图像。  在这个项目上,英伟达联合了一大群医疗行业的合作伙伴:    以及在这个环节,黄仁勋又引导全场跟他念:买得越多,省得越多。  来到不可思议的AI环节。  这个环节的主题是“全球最大的GPU”。  首先,英伟达把VoltaV100m每张卡的内存扩大到32GB。适用于内

5、存密集型的深度学习和高性能计算,还能将内存受限的HPC应用性能提升高达50%。  其次,是全新发布的互联结构NVSwitch,带宽比最好的PCIe交换机高出5倍,最高支持16个TeslaV100同时以2.4TB/秒的速度进行通信。    最后,一个全新的DGX服务器发布了。  黄仁勋说这个现在是全球最大的GPU了:新的DGX-2,包括20亿个晶体管,12个交换机。每个GPU都可以通过光纤交换机互相通信,比PCIe接口快20倍。    DGX-2的算力可达2千万亿次浮点运算,功耗10千瓦。这台机器内部是NVLink连接

6、的两组TeslaV100阵列。  与6个月前发布的DGX-1相比,DGX-2提速10倍。  五年前,在两块GTX580上进行Alexnet训练耗时六天,现在使用DGX-2,可以在18分钟以内完成。  这款产品将于今年三季度发售,每台价格39.9万美元(人民币250万元)。  DGX-2具有300台服务器的深度学习处理能力,占用15个数据中心机架空间,而体积则缩小60倍,能效提升18倍。  此外,英伟达还更新了CUDA、TensorRT、NCCL、cuDNN等深度学习和HPC软件堆栈。  新版的TensorRT能快速优

7、化、验证和部署在超大规模的数据中心,针对更广泛的应用加速深度学习推理。它最高可以将深度学习推理的速度加快190倍,降低70%的数据中心成本。  TensorRT4还集成到了谷歌TensorFlow1.7版本中,更易于使用。  另外,NVIDIA还宣布和ARM合作,将英伟达深度学习加速器架构集成到Arm的ProjectTrillium上,在手机、智能家居等设备上实现深度学习推理。  以及英伟达GPU现在支持Kubernetes了。这是一个基于容器技术的分布式架构方案。这个技术让英伟达的GPU进一步加速。  还有一事,英

8、伟达骄傲的宣布,TITANV仍然断货中。  最后是不可思议的机器人环节。  发布了机器人开发工具包IssacSDK之后,话题转向了自动驾驶。  “我们正试图从头到尾了解这个系统,这其中包含四个最重要的方面:数据收集、模型训练、模拟和驾驶。”老黄说,这个了解过程,大约花了5到7年。  老黄在现场,又展示了一把云代驾。    他把VR和自动驾驶结合

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。