H264快速运动估计算法及其在CUDA上的实现

H264快速运动估计算法及其在CUDA上的实现

ID:36750542

大小:4.29 MB

页数:67页

时间:2019-05-14

H264快速运动估计算法及其在CUDA上的实现_第1页
H264快速运动估计算法及其在CUDA上的实现_第2页
H264快速运动估计算法及其在CUDA上的实现_第3页
H264快速运动估计算法及其在CUDA上的实现_第4页
H264快速运动估计算法及其在CUDA上的实现_第5页
资源描述:

《H264快速运动估计算法及其在CUDA上的实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2008指导教师(姓名、职称):至睦噩:麴攮ISOnEC和ITU-T联合制定的新一代视频压缩标准H.264可以获得很高的编码效率,但却大大增加了编码复杂度,对视频编码的实时性带来了很大的挑战。在高实时应用系统中,必须对该标准进行相应的改进。改进的方法可以从两个方面考虑,一方面通过对编码算法的改进,降低编码时间,提高编码速度,另一方面采用相关协处理设备与CPU协同编码,从而提高系统实时性。运动估计是H.264编码标准的核心技术之一,编码时间占很大比例。本文总结了几种经典的运动估计算法,并在此基础上了提出了一种高效的快速运动估计算法⋯.改进的UMHEX算法。该算法采用了提前终止阈值

2、,改进的搜索模板和基于混合模板的搜索技术。通过实验表明,改进的算法与全搜索算法和UMHEX算法相比,在保持信噪比和码率几乎不变的情况下,编码时间明显降低了。图形处理器GPU具有强大的浮点计算能力和并行处理能力,能够很好地协同CPU完成视频编解码。在解码器中,将去方块滤波放入GPU中进行并行计算,其余部分仍在CPU中计算,从而提出了CPU+GPU的并行解码器结构。本文充分利用了GPU的并行计算能力,使得去方块滤波的计算时间大大缩短。实验表明,这种并行架构与传统的算法相比,能够有效地进行编码加速。不管是对算法本身的改进或是通过协处理器进行并行处理,都能够有效地提高编码速度,改进系统

3、的实时性,从而使得H.264视频编码标准能够很好地应用到实际场合中。关键字:H.264;运动估计:混合模板;图形处理器GPU;并行处理SPECIALIZATION:.CommunicationandInformationSy—stem.POSTGRADUATE:.YangXiaoqinH.264isanewgeneratedstandardofvideocompressionwhichformulatedbytwoimportantinternationalstandardorganizations,ISO/IECandITU-T.InH.264,thecodingeffici

4、encyisenhancedbyawidemargin.However,thecomputationalcomplexityisincreasedefficiently.It’Sabigchallengeforreal-timevideoencoding.ThestandardCanbeimprovedfromtwoaspects.Ontheonehand,theencodingspeedcouldbeincreasedbyimprovingthecodingalgorithm,ontheotherhand,weuseco-processingequipmenttoworkwi

5、thCPUtogether.MotionestimationisoneofthecoretechniquesofH.264videocoding.Ittakesalargeproportionofcodingtime.Thispaperhasstudiedseveralclassicmotionestimationalgorithmwithdetaileddescriptionandanalysis.Then,animprovedUMHEXfastmotionestimationalgorithmisproposed.Inthealgorithm,aseriesoftechni

6、quesareadopted,suchasearlytermination,improvedsearchtemplateandmixedsearchtemplate.TheresultshowsthatcomparedwithFullSearchalgorithmandUMHEXalgorithm,theimprovedalgorithmcanenhancetheprocessingspeedwhilePSNRisslightlydegradedandtheincreasingbitrateisnegligible.Takingtheadvantageofpowerfulflo

7、ating-pointcomputationandparallelabilityofGPU,wecanuseGPUtodovideoencodingwithCPUtogether.Invideodecoding,thedeblockingfiltermoduleisshiftedtoGPUtoaccelerate.AparallelencodingarchitectureCPU+GPUisproposed.Thedeblockingfiltertimeisreducedgreatlybyfu

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。