欢迎来到天天文库
浏览记录
ID:15377129
大小:1.07 MB
页数:4页
时间:2018-08-03
《基于gpu的数字图像并行处理方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、esign设计天地栏目编辑韩汝水DField基于GPU的数字图像并行处理方法*ParallelImageProcessingBasedonGPU■盖素丽河北省应用数学研究所(河北石家庄050081)数字图像处理的并行化分析摘要:针对像素级图像处理算法并行化程度高的特点,利用数字图像处理算法多种多样,但从数据GPU的并行流处理特性和可编程性,提出了基于GPU处理的层面来考虑,可以分为:像素级处理、的数字图像并行化处理方法,并对其基本执行流程和其特征级处理和目标级处理三个层次[3][4]。中的关键技术问题:数据加载,结
2、果反馈、保存等进行像素级图像处理了详细论述。最后通过图像的卷积运算验证了GPU的像素级处理,即由一幅像素图像产生另并行处理能力。一幅像素图像,处理数据大部分是几何的、关键词:GPU;片元程序;Cg;并行处理规则的和局部的。根据处理过程中的数据相关性,像素级处理又可进一步分为点运算、2008年12月9日收到本GPU并行化处理局部运算和全局运算。文。可编程图形处理器(Programmable特征级图像处理*河北省自然科学基金GraphicProcessUnit,PGPU)是目前计算机特征级处理是在像素图像产生的一系列项
3、目(200710096057)上普遍采用的图形图像处理专用器件,具有特征上进行的操作。常用的特征包括:形状单指令流多数据流(SIMD)的并行处理特性,特征、纹理特征、梯度特征和三维特征等,一而且提供了完全支持向量操作指令和符合般采用统一的测度,如:均值、方差等来进IEEE32位浮点格式的顶点处理能力和像素处行描述和处理,具有在特征域内进行并行处理能力,已经成为了一个强大的并行计算单理的可能性。但是,由于其特征具有象征意元。研究人员将其应用于加速科学计算和可义和非局部特性,在局部区域并行的基础视化应用程序,取得了令人
4、鼓舞的研究成果。上,需要对总体进行处理。利用GPU实现并与CPU相比,GPU具有以下优势:强行化处理的难度比较大。大的并行处理能力和高效率的数据传输能力目标级图像处理[1][2][7]。其中,并行性主要体现了指令级、数目标级处理是对由一系列特征产生的目据级和任务级三个层次。高效率的数据传输标进行操作。由于目标信息具有象征意义和主要体现在两个方面:GPU与显存之间的复杂性,通常是利用相关知识进行推理,得带宽为:16GB/s;系统内存到显存的带宽到对图像的描述、理解、解释以及识别。由为:4GB/s。于其数据之间相关性强
5、,且算法涉及到较多总上所述,GPU比较适合处理具有下面的知识和人工干预,并行处理的难度也比较特性的应用程序:1、大数据量;2、高并行大。性;3、低数据耦合;4、高计算密度;5、与由此可见,整个图像处理的结构可以利CPU交互比较少。用一个金字塔模型来表示。在底层,虽然处www.eepw.com.cn2009.23389esign设计天地栏目编辑韩汝水DField制操作,调用片段程序进行处理;最后,保存在帧缓存中的绘制结果就是算法的输出数据,如图1所示[5][6]。虽然数字图像处理算法多种多样,具体实现过程也很不相同,
6、但是在利用GPU进行并行化处理时,有一些共性的关键技术问题需要解决,如:数据的加载,计算结果的反馈、保存等。下面对这些共性的问题进行分析,并提出相应的解决思路。数据加载在GPU的流式编程模型中,所有的数据都必须以“流”的形式进行加载处理,并通图1遥感影像GPU并理的数据量巨大,但由于局部数据之间的相过抽象的3DAPI进行访问。在利用GPU进行化处理基本流程关性小,且较少的涉及知识推理和人工干行图像处理时,最直接有效的数据加载方法预,因此大多数算法的并行化程度比较高。是把待处理的图像打包为纹理,在绘制四边当沿着这个金
7、字塔结构向高层移动时,随着形时进行加载、处理。同时为了保证GPU上抽象程度的提高,大量原始数据减少,所需片段程序能够逐像素的对纹理图像进行处的知识和算法的复杂性逐层提高,并行化处理,必须将投影变换设置为正交投影,视点理的难度也逐渐加大。变换的视区与纹理大小相同,使得光栅化后由于绝大部分的图像处理算法是在像素的每个片段(fragment)和每个纹理单元级进行的,且GPU的SIMD并行流式处理在(texel)一一对应。进行像素级的图像处理时具有明显的优势,对于图像处理算法中的其他参数,如果而特征级和目标级处理无论是从数
8、据的表达数据量很小,则可以直接通过接口函数进行还是从算法自身的实现来说,都很难实现设置;如果参数比较多,也应该将其打包为GPU并行化。因此,本文重点研究各种像素纹理的形式传输给GPU。在打包的过程中应级图像处理操作的GPU并行化实现方法。充分利用纹理图像所具有的R、G、B、A四个通道。数字图像GPU并行化处理的基本计算结果的反馈、保存流程与关键技术应用程序是
此文档下载收益归作者所有