使用vivado hls为软件提速

使用vivado hls为软件提速

ID:33579295

大小:4.16 MB

页数:4页

时间:2019-02-27

使用vivado hls为软件提速_第1页
使用vivado hls为软件提速_第2页
使用vivado hls为软件提速_第3页
使用vivado hls为软件提速_第4页
资源描述:

《使用vivado hls为软件提速》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、手把手课堂:FPGA101用VivadoHLS为软件提速任何为代码瓶颈而苦恼的人都应探索高层次综合工具与ZynqSoC的组合出击。50赛灵思中国通讯2014年第二季度手把手课堂:FPGA101规环境下运行多数软件。事实上赛灵作者:DavidC.Black思还提供了一款软件开发工具(SDK)Doulos高级技术人员以及PetaLinux来帮您实现这一目的。用VivadoHLSdavid.black@doulos.com架构问题从软件角度思考这一转变,我开始更为软件提速加担心软件接口问题。毕竟,HLS创建的硬件专注于处理硬件接口。我需要一些易于访问的工具(如协处理器或硬件加速

2、器)来加快软件运行速H度。而且,我不想编写新的编译器。为了方便与软件的其它部分交换数据,这个接口应该类似于简单的存储在编写软件时,您有没有遇到过无论单元,我们可以在其中输入信息并稍怎么努力编码,软件都不能按您期望后读取结果。的速度运行?我遇到过。您有没有想然后我有了新的发现。Vivado过,“有没有什么简单而且成本不高HLS支持以相对较小的努力轻松创建的方法可将一些代码输入多个定制处AXI从接口。这让我开始思考,创建理器或定制硬件?”毕竟,您的应用加速器也许没有那么难。于是,我编只是众多应用中的一个,而且创建定码了一个简单的实例来探索这种可能制硬件需要花费时间和成本。是不

3、是性。探索的结果让我惊喜不已。这样?下面看看我用了什么方法,并思最近听说了赛灵思的高层次综考这种方法所得出的结果。®合工具VivadoHLS后,我开始重在我的实例中,我选择了对一系新思考这一问题。高层次综合工具列简单的矩阵运算(如加法和乘法)®与Zynq-7000AllProgrammableSoC进行建模。我不想将它限制在固定的的结合为设计开辟了新的可能性,大小,因此,我必须同时提供输入阵®其中Zynq-7000AllProgrammable列及各阵列的尺寸大小。理想的接口SoC结合了带有FPGA架构的双会将所有数值作为函数的自变量,例®核ARMCortexTM-A9处

4、理器。这如图1中的代码。类工具可以用C语言,C++语言硬件接口需要用一种简单的方法或SystemC源代码创建高度优化的将函数自变量映射到存储单元。图2RTL。近年来,出现很多这项技术的是支持这一映射的存储器配置。寄存提供商,且其采用率也不断提高。器中保存了有关矩阵的排列方式以及如果我只用VivadoHLS便能完所需运算的信息。指令寄存器将指示成要求更高的计算,那么将那些慢速执行何种运算。这样我便可以将一些代码迁移到硬件中会有多难?毕竟我简单的运算融合到一个硬件中。可以经常用C++语言编写代码,而Vivado用状态寄存器来查看是否正在进行运HLS将C/C++语言作为输入语言

5、。算或是已经成功完成运算。此外,器ARM处理器内核意味着我可以在常件最好还能提供中断支持。2014年第二季度赛灵思中国通讯51手把手课堂:FPGA101回到硬件设计,我了解到Vivado假设能够综合AXI从接口,怎做用户I/O器件的机制。UIO可以用HLS为阵列自变量留出空间以指定小样将它用在软件上?我将正常编码简单的方法将新硬件映射到用户容量内存。这样,图3所示函数便说环境假设为Linux。还好赛灵思提供内存空间,并具备中断等待能明了这种函数性。PetaLinux,而且PetaLinux提供一种叫力。这意味着您可以省去编写器件驱Matrixoperand1(5,10),

6、operand2(10,5),product(10,10);intstatus;status=matrix_op(MUL,operand1,operand2,product);//product=operand1*operand2;if(status!=0)cout<<“ERROR:multiplicationfailed”<

7、例如,8Matrix1_ptrRW32Matrix1数据地址无法在DMA中使用UIO器件,因12Matrix1_shapeRW32Matrix1行Matrix1列此您必须在器件内存中构建矩阵,并16Matrix2-ptrRW32Matrix2数据地址在构建完成后手动复制出来。如果需20Matrix2_shapeRW32Matrix2行Matrix2列要,将来可以通过定制器件驱动程序24Matrix3_ptrRW32Matrix3数据地址解决这个问题。28Matrix3_shapeRW32Matrix3行Matrix3列32-r

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。