欢迎来到天天文库
浏览记录
ID:33928914
大小:1.79 MB
页数:93页
时间:2019-03-01
《基于cuda平台h.264视频编码器的研究设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofElectronicandInformationEngineeringResearchandDesignofH.264VedioEncoderBasedonCUDAAThesisinCommunicationandInformationSystembyZhangjianAdvisedbyProf.YangfengfanSubmittedinPartialFulfillmentoftheRequirementsfortheDegre
2、eofMasterofEngineeringDecember,2012承诺书本人声明所呈交的博/硕士学位论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京航空航天大学或其他教育机构的学位或证书而使用过的材料。本人授权南京航空航天大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本承诺书)作者签名:日期:南京航空航天大学硕士学位论文摘要H.264/AVC是当前国际上最先进的视频编码
3、标准,通过采用新的编码技术获得了更高的编码效率与更好的图像质量。但是这些新技术在提高编码效率的同时也带来了更高的计算消耗以及对系统内存带宽的需求。由于运算复杂度的增加,使用目前的硬件平台已经很难实现高清视频的实时编码。另一方面,近年来图形处理器(GPU)的处理速度正在以超过摩尔定律的速度发展,而且能够加速处理一些非图形领域的应用问题。CUDA、OpenCL等编程模型的出现使得基于GPU的通用应用开发变得更加简单灵活。目前GPU已经在天文学、流体力学、电磁仿真、信号处理、视频压缩等领域获得广泛的应用,并取得了丰硕的成果。本文通过对CUDA编程模型以及H.264视频编码框架
4、的研究,提出了一种基于CUDA的H.264并行编码器实现方案。该方案中CPU负责编码参数的初始化、视频文件的读写、CPU与GPU之间的数据交互以及对GPU的调度和控制。GPU负责编码过程中帧间预测、帧内预测、变换与量化、熵编码与去块滤波等具体计算任务的执行。通过合理的任务分配,充分发挥了CPU和GPU两种处理器各自的优势。然后对编码器的各个模块重新作了并行设计。针对帧间预测分别设计了整像素运动估计与分像素运动估计的并行执行过程,提出了一种并行的参考帧插值计算方法;针对帧内预测设计了宏块之间与宏块内部两级并行的执行过程;针对变换与量化设计了快速DCT变换与Hadamard
5、变换的并行执行过程;针对熵编码设计了每个子块码流生成与各宏块码流合并的并行执行过程;针对去块滤波设计了边界强度计算与滤波计算的并行执行过程,提出了一种新的去块滤波的宏块执行顺序,增大了并行粒度。最后本文选择了多种格式的视频序列对设计的编码器进行了详细的性能测试。相比传统的串行编码器,本文设计的基于CUDA的并行编码器在处理1080P全高清视频时获得了平均16倍左右的加速比,并且图像质量只有微小的损失。本文基于CUDA平台开发的H.264视频编码器性能有了明显的提升,可应用于很多现实场景中,同时在推广GPU用于通用计算任务方面也有着很强的借鉴作用。关键词:H.264视频编
6、码器,GPU,CUDA,加速比,并行粒度,通用计算I基于CUDA平台的H.264视频编码器研究设计II南京航空航天大学硕士学位论文ABSTRACTH.264/AVCisthemostadvancedvideocompressionstandardcurrently.Byadoptingnewcodingtechniques,H.264/AVCachieveshighercodingefficiencyandimagequality.Butthesenewtechniquesproduceahighcomputationalcostandlargesystemmemory
7、bandwidthrequirementsatthesametime.Realtimeencodingisverydifficulttoperformoncurrenthardwareplatformduetoitshighcomputationalcomplexity.Ontheotherhand,duringtherecentyearstheprocessingspeedofthegraphicsprocessingunit(GPU)isimprovingmuchmorefastthantheMoore'slawanditcanspe
此文档下载收益归作者所有