Intel-人工智能与高性能计算关联越来越紧密.doc

Intel-人工智能与高性能计算关联越来越紧密.doc

ID:27496376

大小:61.50 KB

页数:8页

时间:2018-12-04

Intel-人工智能与高性能计算关联越来越紧密.doc_第1页
Intel-人工智能与高性能计算关联越来越紧密.doc_第2页
Intel-人工智能与高性能计算关联越来越紧密.doc_第3页
Intel-人工智能与高性能计算关联越来越紧密.doc_第4页
Intel-人工智能与高性能计算关联越来越紧密.doc_第5页
资源描述:

《Intel-人工智能与高性能计算关联越来越紧密.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、Intel:人工智能与高性能计算关联越来越紧密  作为Intel公司的Fellow,AlanGara表示随着神经形态计算、量子计算等新型计算、存储、通信技术快速推动百亿亿次计算成为现实,人工智能与高性能计算将走向融合。  英特尔数据中心事业部的Fellow艾伦·加拉(AlGara)表示,随着我们使用新的计算、存储和通信技术以及神经形态芯片和量子计算芯片向百亿亿级未来过渡,高性能计算和人工智能之间的关联将会越来越紧密。加拉认为,“人工智能(AI)、数据分析和传统仿真的融合将带来具有更广泛功能和可配置性以及交叉授粉(crosspollination)特质的系统。”  加拉为这一高性能计算

2、(HPC)和人工智能交织的未来设定了十分具有挑战性的硬件目标。在这一未来中,硬件会提供百亿亿次以上的双精度使用性能,且会在减少精度运算的情况下提供更高的性能。他相信,如果用户将重点放在单位内存容量的计算性能上,那么用户将跨各种架构获得丰厚回报,并为系统软件和用户应用程序提供通过百亿亿级及更高级别计算保持指数级性能增长的机会。  1.“三大支柱”的统一  加拉提出的愿景基于高性能计算“三大支柱”的统一:人工智能(AI)和机器学习(ML);数据分析和大数据;以及高性能计算(HPC)。这意味着未来的用户会使用互相利用并通过内存交互的模型进行编程。    具体而言,英特尔正在努力研究高度可配

3、置的百亿亿级系统,该系统可支持到全新技术的升级,其中包括可扩展处理器、加速器、神经网络处理器、神经形态芯片、FPGA、英特尔持久内存、3DNAND和自定义硬件。  加拉的愿景有一个共同特征,那就是同一架构会通过配置涵盖高性能计算、人工智能和数据分析,这意味着这些不同的硬件后端需要拥有一致的软件环境来处理高性能计算和人工智能工作负载。  目前,加拉的愿景有一个非常实际的实例,即在TensorFlow等热门机器学习软件包中使用IntelnGraphT库。从本质上来说,IntelnGraph库被用作中间语言(类似于LLVM),可在从CPU到FPGA、专用神经网络处理器等各种硬件平台上提供优

4、化的性能。  英特尔人工智能产品事业部首席技术官办公室的杰森·奈特(JasonKnight)如是写道,“我们将IntelnGraph库视为由流行深度学习框架的优化通道(optimizationpass)、硬件后端和前端连接器构成的生态系统的开端。”  整体而言,加拉指出“高性能计算实际上是许多架构的发源地…和测试环境”,因为高性能计算编程人员、研究人员和领域科学家通过探索架构空间描绘出了如下性能格局:  数据级别并行(从细粒度到粗粒度)  节能加速器(计算密度和能源效率通常是相关的)  在所有级别利用可预测的执行(缓存到粗粒度)  集成的固定功能数据流加速器  通用数据流加速器  2

5、.技术机遇  高性能计算和人工智能科学家将有机会获得并能够利用许多新网络、存储和计算架构的性能功能。  其中,高性能计算是光学技术的重大驱动因素,这是因为光纤是超级计算机最具挑战性且成本最高昂的要素之一。出于此原因,加拉认为,随着我们过渡到线性设备和环形设备以及使用不同波长的光进行通信的光学设备,硅基光子学将产生颠覆性影响,集成硅基设备或光学设备的能力将带来巨大的经济和性能优势,包括增长空间(从技术角度而言)。  新的非易失性存储技术(例如英特尔持久内存)正在模糊内存和存储之间的界线。加拉描述了一种用于百亿亿级超级计算机的新存储堆栈,当然,此类堆栈也可在通用计算集群中实施。  加拉评

6、论道,关键在于此类堆栈是为了使用NVM存储而重新设计的。这会带来与任意对齐和事务大小相关的高吞吐IO操作,因为应用程序可通过新的用户空间NVMe/pmem软件堆栈执行超细粒度IO。在系统级别,这意味着用户将能够在软件托管的自我修复型冗余环境中使用可扩展的通信和IO操作跨同源、无共享服务器管理大规模分布式NVM存储。换而言之,高性能、大容量的可扩展存储能够支持大数据和核心内算法以及针对稀疏及非结构化数据集的数据分析。  科研人员正在利用内存性能和容量方面的进步来改变我们处理人工智能和高性能计算问题的方法。美国犹他大学(UniversityofUta)和沙特阿拉伯阿卜杜拉国王科技大学(K

7、ingAbdullahUniversityofScienceandTechnology,KAUST)都在做这方面的工作。  例如,犹他大学的科研人员强调了对数运行时算法在Ospray可视化软件包中的重要性。对数运行时算法对于大型可视化和百亿亿级计算而言十分重要。运行时基本上随数据规模的增长而缓慢增长。但即使数据规模呈数量级增长,运行时的增长仍然会十分缓慢,因而对数增长十分重要。否则,运行时增长会阻止计算在合理的时间内完成,从而让大内存容量计算机的优势消失殆

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。