欢迎来到天天文库
浏览记录
ID:37918159
大小:1.73 MB
页数:9页
时间:2019-06-02
《GPU通用计算在三维距离变换中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、GPU通用计算在三维距离变换中的应用田绪红陈茂资司徒志远华南农业大学信息学院计算机科学与工程系,广州510642摘要:距离变换是图象处理的一个经典问题,在图象处理中有广泛的应用。本文结合GPU的特殊的体系结构,根据三维距离变换的特点设计了相应的数据存储结构,充分利用GPU的并行处理能力,在GPU上实现三维距离变换的算法。实验证明了基于GPU的并行算法可以得到很好的加速比,同时也提出了其中的局限性。关键词:GPU;GPU通用计算(GPGPU);距离变换1.引言近些年来图形处理器(GPU)的硬件技术飞速发展,其更新速度非常快,平均每年就有新的一代GPU推出市场。与之相随的是其可编程能力
2、在不断的提高,出现了像CforGraphics(Cg),HighLevelShadingLanguage(HLSL),OpenGLShadingLanguage(GLSL)等类似C的高级语言。GPU的应用领域不断扩大,学者们提出GPU通用计算(GPGPU)的概念,将GPU应用于非图象绘制方面的计算。这些计算相当广泛,如碰撞检测[1],数值计算[2],流体模拟[3],图象处理[4],偏微分方程计算[2,5,6]等。由于GPU的高效的并行处理能力,使之在以上的运算中有很好的性能,达到许多大型计算机的水平,并且GPU价格低廉,十分有利于推广。距离变换是图象处理的一个经典问题,在图象处理中
3、有广泛的应用。由于三维距离变换的数据量非常巨大,传统使用CPU计算的效率不高。本文尝试在GPU上实现三维距离变换算法,利用GPU的并行处理能力提高变换的效率。2.GPU通用计算(GPGPU)2.1.GPU的体系架构GPU是专门为图形图象处理而设计的硬件芯片,其设计初衷是为了减轻CPU的负担,将大部分的图形图象运算如光照处理,顶点运算,纹理映射等功能转移到一块专门的芯片上。这就是图象处理单元(GPU)的由来。从系统架构上看,GPU是针对向量计算进行了优化的高度并行的数据流处理器,其中包括两种流处理单元:顶点着色器(VertexShader),是多指令多数据流的处理单元(MIMD),像
4、素着色器(PixelShader)是单指令多数据流的处理单元(SIMD)[7,8]。这种以数据流作为处理单元的处理器,在对数据流的处理上可以获取较高的效率。由于GPU特殊的系统架构、整数运算逻辑运算支持的贫乏,以及其不同于传统CPU的数据存取方式,使得其并不能轻易的运用在非图形图象运算。GPU对于通用计算不是一服万能药[8],它只能完成一些特定的计算。一般说来GPU通用计算有如下的特点[9,10]:1)算法程序必须能被分解成为不相关的程序片段(section),这些程序片段作为GPU的计算内核,每个流处理器执行相同的程序片段来并行求解最终的计算结果;2)由于GPU的特殊架构,使之更
5、适合运算程序的循环结构而不适合运算程序的分支结构;3)每个程序片段的控制结构不能复杂,语句不能太多,实际应用中可以将复杂算法程序分解成几个规模较小的代码模块;1)由于GPU是针对图形处理进行加速的,因此其中最主要的计算元素,或者说数据结构就是纹理;1.1.GPU的编程接口现在比较流行和通用的图形接口有两个:DirectX和OpenGL。二者都是为了方便人们对GPU进行编程而产生的,是一套底层(low-level)图形API。利用其强大功能程序员可以十分方便地与驱动程序沟通,从而运用GPU强大的三维图形处理能力,大幅度地提高三维程序的开发效率。图1GPU工作示意图图1所示的图形API
6、是一套已定义好的,提供给应用程序的接口和函数。由于市面上的图形卡品种繁多,每种卡的性能和结构都有所差异,HAL(HardwareAbstractionLayer,硬件抽象层)就应运而生。它由设备厂商提供,向下指示特定设备完成具体操作,向上对API提供相同的调用接口。为了对GPU更好的控制,人们又开发了着色语言(ShadingLanguage),当今比较流行的有3种:lCg:CforGraphics,由NVIDIA公司开发的一种针对GPU的程序设计语言;lHLSL:High-LevelShadingLanguage,微软公司为Direct3D开发的着色语言,当今大部分的游戏厂商都使用
7、该种语言;lGLSL:与OPENGL绑定的一种着色语言,由于OPENGL的开放性,其应用也相当广泛。利用上面这样的高级着色语言的好处是显而易见的[10][11]:1)提高了生产力,用高级语言编写程序更简便更快捷,编译器可以自动优化代码并执行底层任务,例如注册地址分配等,编译器所生成的汇编代码往往都比手工编写的汇编代码更高效;2)增强了可读性,上面的3种语言都是高级语言,可读性很好,易于调试和维护;3)用高级语言编写的渲染程序要比用汇编代码书写的更能够适用于广泛的平台;
此文档下载收益归作者所有