一文详解AWS FPGA优势-特性-工作方式-用途.doc

一文详解AWS FPGA优势-特性-工作方式-用途.doc

ID:27820681

大小:712.00 KB

页数:12页

时间:2018-12-06

一文详解AWS FPGA优势-特性-工作方式-用途.doc_第1页
一文详解AWS FPGA优势-特性-工作方式-用途.doc_第2页
一文详解AWS FPGA优势-特性-工作方式-用途.doc_第3页
一文详解AWS FPGA优势-特性-工作方式-用途.doc_第4页
一文详解AWS FPGA优势-特性-工作方式-用途.doc_第5页
资源描述:

《一文详解AWS FPGA优势-特性-工作方式-用途.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、一文详解AWSFPGA优势/特性/工作方式/用途  一、FPGA背景介绍  FPGA是Field-ProgrammableGateArray的英文缩写,英文直译叫做“现场可编程门阵列”,一般都叫做“可编程硅芯片”。计算机的处理器是在预定义的电路中运行软件应用程序,与此相反,对FPGA进行编程会使芯片内部的线路重新连接,从而直接在硬件中执行所需的功能。  每一块FPGA芯片都是由有限多个带有可编程连接的预定义源组成,可实现可重配置数字电路和I/O模块并允许电路接触外部环境。    FPGA资源说明书中通常介绍了可编程逻辑模块的数量、固定功能逻辑模块(如乘法器)的数目

2、及存储器资源(如嵌入式块RAM)的大小。FPGA芯片中还有很多其它的部分,但是以上指标通常是在为特定应用选择和比较FPGA时的最重要参考指标。  可重配置逻辑模块(configurablelogicblock,CLB)是FPGA的基础逻辑单元。CLB有时又称为片(slice)或逻辑单元,由两个基本元器件构成:触发器和查找表(LUT)。不同FPGA产品系列的区别在于触发器和LUT的组合方式,因此理解触发器和LUT是至关重要的。  二、FPGA作用  在计算加速领域,传统CPU处理能力的需要突破已经成为共识,目前的途径主要有以下几类:  途径一,ASIC:经历了几十年

3、的发展演变,为专门目的而设计的ASIC,由于面向特定用户的需求,在加速效率上可圈可点。但是,设计周期长、成本贵、应用范围窄的通病,使ASIC仅适合于批量很大或者对产品成本不计较的场合。  途径二,GPU:随着近年来机器学习等领域的突飞猛进,GPU也早已经不再局限于3D图形处理,其在浮点运算、并行计算等部分计算方面的特性已经引起业界越来越多的关注,尤其是目前最大的独立芯片生产销售商NVIDIA有些如日中天的感觉,但其在应用广度上的通用性仍然有待时间的检验。  途径三,FPGA:它作为半定制的ASIC而出现,既解决了定制电路的不足,又在性能与应用广度上显示出优势,英特

4、尔已经积极布局,推出CPU+FPGA架构,也有厂商推出了单独的FPGA架构,这些都使FPGA进入数据中心加速的主角地位。  下面是一个厂商提供的测试数据:  可以看出,这个厂商FPGA与服务器CPU的性能对比,单位功耗性能在机器学习推断方面提高了11倍;数据分析SQL查询方面提升了33倍;视频处理转码提高40倍;存储压缩提高40倍;网络vSwitch可提高23倍。  三、AWS的FPGA  亚马逊AWS提供了新的EC2实例F1,这种新的EC2实例是具有现场可编程门阵列(FPGA)的计算实例。可以进行编程,为应用程序创建自定义硬件加速。F1实例易于编程,并且配备了开

5、发、模拟、调试和编译硬件加速代码所需的各种资源,包括FPGADeveloperAMI和硬件开发工具包(HDK)。FPGA设计完成后,您可以将其注册为AmazonFPGAImage(AFI),然后将其部署到您的F1实例,只需单击几下即可完成部署。您可以多次重复使用您的AFI,并可以根据需要跨多个F1实例使用。  AmazonEC2F1现已推出预览版,具有两种不同的实例大小,且每个实例包含多达八个FPGA。F1实例配有最新的16nmXilinxUltraScalePlusFPGA。每个FPGA都具有64GiB本地DDR4ECC受保护内存,并配有专用PCIex16连接。

6、每个FPGA大约包含250万个逻辑元件以及大约6800个数字信号处理(DSP)引擎。与其他AmazonEC2按需实例一样,您将按小时为F1计算容量付费,无需签订长期合约,也无须支付预付款。FPGADeveloperAMI或HDK都是免费的,您可以在您的F1实例上根据需要对FPGA多次进行编程,无需额外付费。  四、AWSFPGA的优势  快速部署自定义硬件加速。借助F1实例,您只需在AWS管理控制台中单击几下,即可在AWS上部署自定义FPGA。F1实例可以拥有一个或多个与其关联的FPGA设计,使您能够快速且灵活地在同一个实例上运行多个AFI。此外,F1实例还为您提

7、供了编程、模拟、调试和编译硬件加速代码所需的易于访问的工具。  可预测的性能。FPGA通过一种专用的PCIExpress(PCIe)结构连接到您的F1实例,从而使各个FPGA能够共用同一内存空间,并能够以高达12GBps的速度相互通信。PCIExpress结构与其他网络相隔离,且FPGA不会跨实例、用户或账户进行共享。此设计可确保您在使用FPGA时只有您的逻辑在其上运行,有助于提供一致的性能。  改变FPGA的经济性。借助F1实例,您无需自行购买FPGA或购买专门的硬件来运行FPGA,即可为您的工作负载部署硬件加速,从而大幅降低为应用程序部署硬件加速所需的成本。如

8、此一来,您

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。