利用FPGA加速实现高性能计算.pdf

利用FPGA加速实现高性能计算.pdf

ID:50648624

大小:290.09 KB

页数:8页

时间:2020-03-07

利用FPGA加速实现高性能计算.pdf_第1页
利用FPGA加速实现高性能计算.pdf_第2页
利用FPGA加速实现高性能计算.pdf_第3页
利用FPGA加速实现高性能计算.pdf_第4页
利用FPGA加速实现高性能计算.pdf_第5页
资源描述:

《利用FPGA加速实现高性能计算.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、白皮书___________________________________________________________________利用FPGA加速实现高性能计算引言目前应用软件的需求已经远远超出了传统处理器的能力所及。一种解决方法是通过硬件加速,采用专用协处理器来提升处理性能。FPGA作为协处理器设计的基础,在价格、性能、易用性以及功耗方面有明显的优势。微处理器有近40年的历史,在这期间,其性能得到了大幅提高,每18个月翻倍,这就是众所周知的“摩尔定律”。处理器从最初不实用的“玩具”发展到现在,性能上已经超越了曾轰动一时

2、的Cray-1超级计算机。处理器在每一轮性能增长过程中,都能支持更复杂和要求更高的应用软件,使得用户对未来处理器的性能有更高的期望。在微处理器发展历史中,随着处理器性能的提高,应用软件的需求也随之增长,而处理器总是能满足应用软件的需求。但是,在过去几年中,情况发生了变化。处理器本身无法满足高性能计算(HPC)应用软件的性能需求,导致需求和性能之间出现了缺口(参见图1)。图1.工业发展形势:技术缺口很多应用需求都要求改变这一形势。一个例子是金融分析,金融期权交易所通过加速应用软件来获得市场竞争优势。对金融应用软件加速,金融交易所能够

3、比竞争对手更快更好地完成交易,更少出错,大幅度提高收益。要提升性能首先得提高处理能力,全面提升性能要求处理能力至少提高一个数量级。很多传统应用软件采用了越来越复杂的算法,对处理器的要求也随之提高。例如,为了提高通信应用软件的功能,编解码(CODEC)、数据压缩和存储、加密等运算越来越复杂。有的在复杂度上甚至出现了自激式的螺旋上升。例如,骇客总是试图绕过现有的防护措施,因此,安全防护的加密方法越来越复杂。应用软件的需求促进了性能的提高新的应用软件在性能达到要求后,会很快得到广泛应用。在处理性能达到一定水平后,超声、计算机辅助断层扫描

4、(CAT)、磁共振成像(MRI)等医疗成像应用需要更高的图像分辨率。科学计算和建模也同样出现类似的情况,模型越来越复杂。甚至金融服务也需要HPC,采用模型和仿真实时提供金融辅助决断。除了这些需求以外,用户还希望加快应用软件的运行速度,尽快出结果,他们不能忍受较慢的响应,这对应用软件提出了新的性能标准。而另一方面,计算速度带来的竞争优势也促使提高目前的处理能力。在基因医疗研究领域,能否迅速获得仿真结果往往会影响产品的推出——率先面市或者落在别人后面。在金融市场的计算机控制金融衍生品交易中,几个毫秒就意味着数百万的收益或者损失。高性能

5、就是高收益,市场不会等到处理器在性能上应付自如的时候。虽然对性能需求的增长已经超越了摩尔定律,处理器的发展却徘徊不前。过去40年中,处理器性能的提高主要受益于半导体技术,吞吐量和系统性能不断提高。但是这种技术改进达到了极限。电路越来越复杂,每一个设计的开发成本高达数百万美元,数十亿美元才能形成新产品投产能力。时钟速率的提高导致器件功耗增大,现在已经到了不能迅速散热的地步。好在提高处理器性能并不是解决应用需求的唯一方法。采用专用处理器来扩展处理器一直是解决性能瓶颈可靠的途径。这类协处理器可以结合使用调制解调器和以太网控制器等专用I/

6、O处理功能,使用图层着色引擎提高显示能力,采用加密引擎来保证安全性。还出现了更通用的协处理器,例如处理乘法和除法的数学加速器。数字信号处理器作为一种协处理器,采用了内置数学硬件以及具有流水线和并行结构的新体系结构,能够处理复杂的数学运算。然而,这些专用结构还不足以填补目前的技术缺口,只是解决了一小部分问题。这在以前是可行的,因为处理器的性能可以满足大部分应用需求,只在特殊应用时采用辅助器件,在这些应用场合,协处理器有更强的成本优势,效果更好。器件功能比传统协处理器更丰富才能填补目前的技术缺口。而且,在设计中还要避免采用软件实现某些

7、功能,例如数字信号处理器等,因为这和主处理器一样,在灵活性上受到限制。专用协处理器当今理想的协处理器应该是基于硬件的设计,具备三种基本能力。第一是设计能够提供专门的硬件加速实现各种应用中需要的关键处理功能。其次是协处理器设计在性能上非常灵活,使用流水线和并行结构,跟上性能的需求变化。最后,协处理器能够为主处理器和系统存储器提供宽带、低延迟接口。除了硬件要求以外,理想的协处理器还应该满足HPC市场的“4P”要求:性能(performance)、效能(productivity)、功耗(power)和价格(price)。HPC市场对性能

8、的最低要求是全面加速实现算法,而不仅仅是某一步骤,并能够加速实现整个应用软件。效能需求来自最终用户。在现有的计算机系统中,协处理器必须安装起来很方便,提供简单的方法来配置系统,加速实现现有的应用软件。HPC市场的功耗需求来自计算系统安装和使用上的功

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。