一种基于GPU的主动声纳宽带信号处理实时系统.pdf

一种基于GPU的主动声纳宽带信号处理实时系统.pdf

ID:57744097

大小:368.38 KB

页数:5页

时间:2020-03-27

一种基于GPU的主动声纳宽带信号处理实时系统.pdf_第1页
一种基于GPU的主动声纳宽带信号处理实时系统.pdf_第2页
一种基于GPU的主动声纳宽带信号处理实时系统.pdf_第3页
一种基于GPU的主动声纳宽带信号处理实时系统.pdf_第4页
一种基于GPU的主动声纳宽带信号处理实时系统.pdf_第5页
资源描述:

《一种基于GPU的主动声纳宽带信号处理实时系统.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第24卷第9期传感技术学报V01.24No.92011年9月CHINESEJOURNALOFSENSORSANDACTUATORSSep.2011AReal·TimeSignalProcessingSystemofBroadbandActiveSonarBasedonGPUL/Xiaomin,HOUChaohuan,YANShefeng(IntelligentSensingandSignalProcessingLab,InstituteofAcoustics,ChineseAcademyofSciences,Beifing100190,China)

2、Abstract:ThissystemimplementsthesignalprocessingofbroadbandactivesonarusingGPUviaCUDA,andachievesthetimelinessofthewholeprocessingsystem.ExperimentationsshowthatitimprovesaboutonemagnitudecomparedwithCPU;Meanwhile,ithasmanyadvantagescomparedwithDSPplatformwhichhasthesameproces

3、singspeed,suchasshorterdevelopmentperiod,lowercost,higherreliabilityandSOon.Keywords:broadbandarraysignalprocessing;activesonar;real-time;GPUEEACC:7230doi:10.3969/j.issn.1004—1699.2011.09.011一种基于GPU的主动声纳宽带信号处理实时系统术李晓敏,侯朝焕,鄢社锋(中国科学院声学研究所声学智能制导实验室,北京100190)摘要:该系统采用基于CUDA(Compute

4、UnifiedDeviceArchitecture,统一计算设备架构)并行编程模型的GPU(GraphicProcessingUnit,图形处理器),实现了整个主动声纳宽带信号处理系统的实时性。实验结果表明:该系统与CPU平台相比,处理速度提高了近一个数量级;与具有同等处理速度的DSP阵列信号处理平台相比,克服了开发周期长、成本高和移植性差等缺点。关键词:宽带阵列信号处理;主动声纳;实时性;GPU中图分类号:TN911.72文献标识码:A文章编号:1004—1699(2011)09—1279-05传统意义上的GPU主要针对图形图像处理和基于以上因素

5、,本文采用基于CUDA编程架构游戏加速,其功能受到一定限制。NVIDIA公司于的GPU,实现了LFM及CW信号的几种经典波束形2007年发布了CUDA以及相应的GPU版本。这类成和匹配滤波过程,该系统具有实时性、开发周期GPU内核有很多流处理器,每个流处理器内包含相短、性价比高和使用灵活等众多优点。当多数量的并行执行单元,可以高效执行各种模型1基于CUDA的GPU通用编程的大规模科学计算,因此受到学术界和产业界的追捧,被广泛应用于金融、石油、天文学、流体力学、信CUDA是一种将GPU作为数据并行计算设备号处理、电磁仿真、模式识别、图像处理和视频压缩

6、的软硬件体系,采用了比较容易掌握的类C语言进等众多领域¨。然而,目前国内外将GPU通用计行开发。它是一个SIMD(SingleInstructionMultiple算应用到声纳信号处理的案例还很少。Data)系统,即一个程序编译一次以后,CUDA将计声纳信号处理的手段主要分为两类。一类为以算任务映射为大量的可以并行执行的线程,并由拥CPU为代表的处理平台,另一类为基于FPGA和有大量内核的硬件动态调度和执行这些线程,从而DSP等大规模集成电路芯片的阵列信号处理平台。显著提高运算速度。如图1所示,将一个可以并行前者耗时严重,实时性差;后者虽然能够完成

7、实时信化执行的任务首先分配给若干个线程网格(Grid),号处理,但也具有开发周期长、板卡众多和成本高等其次将每个Grid内的任务分配给若干个线程块众多缺点。(Block),最后再将每个Block内的任务细分给若干项目来源:国家自然科学基金项目(11074270,60802072)收稿日期:2011—03—30修改日期:2011—05—16传感技术学报1280WWW.chinatransducers.con第24卷个线程(Thread)。Grid中的所有Blocks并行执行,A(0)=a(0)=[a(0)Block中的所有Threads并行执行,这种

8、两层并行模Ull/'/'12’。llqM型是CUDA最重要的创新之一。。13,21/X22‘‘‘1~2M::●●Gridl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。