谈谈Zynq SoC里ARM NEON SIMD架构扩展集的使用.doc

谈谈Zynq SoC里ARM NEON SIMD架构扩展集的使用.doc

ID:28147451

大小:72.50 KB

页数:3页

时间:2018-12-08

谈谈Zynq SoC里ARM NEON SIMD架构扩展集的使用.doc_第1页
谈谈Zynq SoC里ARM NEON SIMD架构扩展集的使用.doc_第2页
谈谈Zynq SoC里ARM NEON SIMD架构扩展集的使用.doc_第3页
资源描述:

《谈谈Zynq SoC里ARM NEON SIMD架构扩展集的使用.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、谈谈ZynqSoC里ARMNEONSIMD架构扩展集的使用  在所有ZynqAllProgrammableSoC的内部,你都会发现一个双核的ARMCortex-A9MPCore处理器,而且ZynqSoC中的这两个处理器中都设有ARMNEONSIMD架构扩展集。那么为什么您需要采用ARMNEONSIMD扩展集呢?那是因为你可以因此大幅提升你的软件性能。你可能看不到您把关键任务转入ZynqSoC可编程逻辑所获得的那么大幅的加速,但是在很多应用中您都会看到某种加速现象。  诀窍就在于NEON扩展集的使用!  这一特殊决窍的秘诀在于ProjectNe10的NE10开源库。设立Ne10

2、项目的目的是提供一套通用、有效的函数,可以大大优化ARM架构,包括NEON谈谈ZynqSoC里ARMNEONSIMD架构扩展集的使用  在所有ZynqAllProgrammableSoC的内部,你都会发现一个双核的ARMCortex-A9MPCore处理器,而且ZynqSoC中的这两个处理器中都设有ARMNEONSIMD架构扩展集。那么为什么您需要采用ARMNEONSIMD扩展集呢?那是因为你可以因此大幅提升你的软件性能。你可能看不到您把关键任务转入ZynqSoC可编程逻辑所获得的那么大幅的加速,但是在很多应用中您都会看到某种加速现象。  诀窍就在于NEON扩展集的使用!  

3、这一特殊决窍的秘诀在于ProjectNe10的NE10开源库。设立Ne10项目的目的是提供一套通用、有效的函数,可以大大优化ARM架构,包括NEONSIMD扩展集,并提供统一且便于测试的操作,以便融合到应用中。这个开源库支持静态链接和动态链接,并且是模块化的,因此不需要将未曾使用的库代码添加到您编写的代码脚本中。  以下是目前NE10开源库当中可使用的函数列表:FIR滤波器FIR抽取器FIR插入复数FFT实数FFT格型IIR滤波器FIR格型稀疏矩阵FIR滤波器点积矢量加法矢量减法矢量累加矢量除法矢量集矢量长度矢量标准化矢量属性十字型矢量矩阵的加法矩阵的减法矩阵的乘法矩阵的除法

4、矩阵向量乘法矩阵转置矩阵行列式逆矩阵矩阵转置单位矩阵  下图显示了一组FFT函数,展示了使用NEON扩展集和Ne10库与使用NEON内联函数及ARMCC编译器生成矢量代码的性能对比。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。