面向opencl的mali gpu仿真器构建研究

面向opencl的mali gpu仿真器构建研究

ID:28252331

大小:17.64 KB

页数:4页

时间:2018-12-08

面向opencl的mali gpu仿真器构建研究_第1页
面向opencl的mali gpu仿真器构建研究_第2页
面向opencl的mali gpu仿真器构建研究_第3页
面向opencl的mali gpu仿真器构建研究_第4页
资源描述:

《面向opencl的mali gpu仿真器构建研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。面向OpenCL的MaliGPU仿真器构建研究  摘要:针对嵌入式GPU通用计算的仿真器构建需求,通过对通用图形处理单元仿真器的计算核心、存储结构与MaliGPU的异同进行比较分析,首先建立面向OpenCL的MaliGPU仿真器的流程与结构,并设计计算单元数、寄存器数、最小并行粒度等GPU微体系结构参数的获取方法,在对GPGPU-sim进行修改和配置后,实现了对特定GPU架构的仿真器构建。

2、使用矩阵相乘、图像处理等OpenCL程序对仿真器的准确性进行测试,以程序在仿真器和硬件平台上的执行周期数差距作为评估依据。实验结果表明:对于测试程序集中优化前的OpenCL程序,其中70%的程序在两个平台上的运行周期数差距不超过30%;对于优化后的OpenCL程序,其中90%的程序的运行周期数差距不超过30%。由此证明,构建的GPU仿真器能够满足OpenCL程序的仿真与性能评估。  关键词:图形处理器;OpenCL;微体系结构参数;仿真器  中图分类号:TP391  文献标志码:A  文章编号:0253-987X02-0020-05为了充分发挥“教学点数字教育资源

3、全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。  GPU通用计算技术将GPU与CPU组成异构计算平台,使得GPU不再局限于传统的图形计算,可以加快现有算法运行速率。嵌入式设备的GPU已经采用多核架构,使得利用嵌入式GPU进行通用计算成为新的研究方向和热点,例如ARM发布的MaliT6

4、系列GPU目前已支持OpenCL规范,对嵌入式平台的GPGPU开发环境产生了需求,因此本文构建了Mali系列GPU仿真器,以满足OpenCL程序的运行性能预测与程序优化。  1嵌入式GPU仿真器的构建设计  GPU的体系结构决定了OpenCL程序的执行方式,与嵌入式GPU的体系结构保持一致是仿真器的准确性的前提。本文以通用图形处理单元仿真器作为仿真器设计基础,对其进行修改,使其体系结构与MaliT-628一致,以完成仿真器的构建。  仿真结构  GPGPU~sim仿真器面向GPU通用计算,着色器模型采用统一渲染架构,由UBC大学Aamodt等于XX年发布,以NVI

5、DIA的GPU为模拟对象。GPGPU-sim提供了详细的配置参数,能够对着色器结构以及内存缓存结构进行详细模拟,并提供了OpenCL接口,支持对OpenCL程序的仿真。为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。  图1给出了GPGPU-sim的整体

6、结构。计算核心部分模拟了GPU的并行核心架构,每个核心都是一个单指令多线程架构。SIMT核心负责指令的执行,包括算术运算指令和数据存取指令。在SIMT核心中含有多个算术逻辑单元,所有的ALU执行相同的操作以实现并行化。GPGPU-sim的缓存体系模块包括位于核心内的一级缓存、本地内存和位于存储器的二级缓存、内存芯片4部分。计算核心与外部的存储器通过内部互联网络总线相连。  系列GPU体系结构  Mali系列GPU主要分为计算核心和存储结构两部分。  存储结构部分由寄存器、一级缓存、二级缓存和系统内存4部分组成。在系统内存中划分出4块内存空间――私有内存、常量内存、

7、本地内存和全局内存,分别与OpenCL的内存模型相对应,其中私有内存和寄存器共同存储OpenCL的私有类型变量。  仿真对象MaliT-628的计算核心内部包含一个矢量处理器和一个标量处理器,矢量处理器为128位的单指令多数据结构,标量处理器单周期内能够处理不大于32位的算术运算。图2给出了MaliGPU体系结构的抽象模型。  对比图1和图2,可以看出GPGPU-sim的体系结构和嵌入式GPU体系架构相类似,GPGPU-sim中片上互联网络模块支持3种模式,不同模式对性能影响较小,因此本文对MaliT-628中互联网络模块部分不做研究,仿真时将其设为蝶形模式。GP

8、G-PU-

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。