欢迎来到天天文库
浏览记录
ID:46603201
大小:404.09 KB
页数:6页
时间:2019-11-26
《基于GPU的LDPC存储优化并行译码结构设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、2013年3月第39卷第3期北京航空航天大学学报JournalofBeijingUniversityofAeronauticsandAstronauticsMarch2013VoI.39No.3基于GPU的LDPC存储优化并行译码结构设计葛帅刘荣科侯毅(北京航空航天大学电子信息J二程学院,北京100191)摘要:提出了一种基于Nvidia公司Fermi架构图形处理单元(GPU,GraphicPro—cessingUnit)的分层低密度奇偶校验LDPC(Low—DensityParity—Check)码译码算法的译码器结构优化设计.利用GPU架构的并行性特点,采用帧间与层内双
2、重并行的处理方式,充分利用流多处理器硬件资源,有效缓解了分层译码算法并行度受限的1'7题.此外,通过采取片上constantmemory存储器压缩存储校验矩阵以及利用片外globalmemory存储器对译码迭代信息进行联合访问的优化方法,有效降低了访存延迟,提高了译码吞吐率.测试结果表明,通过采用多帧并行处理和存储器访问优化可以提升基于GPU的LDPC译码器吞吐率14.9~34.8倍.关键词:准循环低密度奇偶校验码;图形处理单元;多帧处理;分层译码算法;存储优化中图分类号:TN911.2文献标识码:A文章编号:100l一5965(2013)03—0421—06Memoryo
3、ptimizedparallelLDPCdecoderarchitecturedesignonGPUGeShuaiLiuRongkeHouYi(SchoolofElectronicandInformationEngineering,BeijingUniversityofAeronauticsandAstronautics,Beijing100191,China)Abstract:Anoptimizeddecodingarchitecturewasproposedforlow—densityparity—check(LDPC)codeslayereddecodingalgor
4、ithmbasedonNvidia’SFermigraphicprocessingunit(GPU).InaccordancewiththeparallelismcharacteristicsinGPUhardwarestructure,inter—frameandintra—layerparallelizationprocessingwereadoptedtofullyutilizetheresourceofstreamingmuhiprocessors(SM)andmitigatethedecodingparal—lelismlimitationinlayereddec
5、odingalgorithm.Secondly.bycompressedstoringparity—checkmatrixinon—chipconstantmemoryandcoalescingaccesstheexchangeinformationinoff—chipglobalmemory,thememoryaccesslatencywasreduced,andhencethedecodingthroughputwasimproved.Simulationresultsshowthat14.9xto34.8xspeed—upfordecodingthroughputis
6、obtainedbyusingmulti—flameprocessingandmemoryac·cessoptimizationonGPUplatform.Keywords:quasi-cycliclow—densityparity—check(Qc—LDPC)codes;graphicprocessingunit(GPU);multi—flameprocessing;layereddecodingalgorithm;memoryaccessoptimizationLDPC(Low—DensityParity—Check)码由Gallag·er于1962最早提出。1。,但限
7、于当时的计算机仿真水平,它的出现并没有得到足够的重视.直到20世纪末,Mackay,Neal等人发现其为具有逼近香农限性能的优秀纠错编码,具有很强的纠错和检错能力.准循环低密度奇偶校验码(Qc.LCPC,Quasi.CyclicLDPC)以其码字设计的低复杂度,正逐渐取代Turbo码成为信道编码的研究热点.经典的LDPC码的译码方式是基于Tanner图的双相消息传递(TPMP,TwoPhaseMessagePassing)译码算法.TPMP译码算法具有性能优异且易于使用并行计算实现等优点.现今采用的LDPC码译收稿
此文档下载收益归作者所有