基于GPU的H.265编码技术研究与实现

基于GPU的H.265编码技术研究与实现

ID:37028554

大小:4.34 MB

页数:83页

时间:2019-05-15

基于GPU的H.265编码技术研究与实现_第1页
基于GPU的H.265编码技术研究与实现_第2页
基于GPU的H.265编码技术研究与实现_第3页
基于GPU的H.265编码技术研究与实现_第4页
基于GPU的H.265编码技术研究与实现_第5页
资源描述:

《基于GPU的H.265编码技术研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、财{謂似彳_硕士学位论文P龜圓基于GPU的H.265编码技术研究与实现圓作者姓名李芙蓉学校导师姓名、职称王海.教授企业导师姓名、职称李立研究员ImjM申请学位类别工硕士I学校代码10701学号1504122089分类号TP919.8密级公开西安电子科技大学硕士学位论文基于GPU的H.265编码技术研究与实现作者姓名:李芙蓉领域:仪器仪表工程学位类别:工程硕士学校导师姓名、职称:王海教授企业导师姓名、职称:李立研究员学院:机电工程学院提交日期:2018年6月Researc

2、handimplementationofH.265encodingtechnologybasedonGPUAthesissubmittedtoXIDIANUNIVERSITYinpartialfulfillmentoftherequirementsforthedegreeofMasterinInstrumentandMeterEngineeringByLiFurongSupervisor:WangHaiTitle:ProfessorSupervisor:LiLiTitle:ResearchFellowJune

3、2018西安电子科技大学学位论文独创性(或创新性)声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研宄成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研宄成果;也不包含一为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我同工作的同事对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。一。学位论文若有不实之处,本人承担切法律责任本人签名:日期:

4、.西安电子科技大学关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研宄生在校攻读学期间论文工作的知识产权属于西安电子科技大学。学校有权保留送交论文的复印件,允许查阅,、借阅论文;学校可以公布论文的全部或部分内容允许采用影印、缩印或其它复制手段保存论文。同时本人保证,结合学位论文研究成果完成的论文、发明专利等成果,署名单位为西安电子科技大学。保密的学位论文在年解密后适用本授权书。__本人签名:愚导师签名:至邊別才彡日期:日期:

5、乃摘要摘要随着视频应用的范围越来越广,视频编码标准也在不断更新换代,视频格式的不断变化带来视频数据量的增加,因此,一个性能良好的视频压缩标准就显得尤为重要。新一代视频编码标准H.265/HEVC在保证视频编码质量的同时,相较于之前的H.264/AVC编码标准能减少50%的码率,但是,它的复杂度也大幅度增加,导致编码速度慢。H.265官方给出的开源纯软件编码器HM采用串行实现方式,编码速度很慢但是没有版权保护很方便再开发。H.265编码技术中包含大量重复计算和可并行模块,同时,GPU是一款具有高度并行架构

6、的显卡,十分适合并行计算,两者结合将会对编码速度有较大提升。本文在GPU平台上对H.265编码技术进行并行设计与实现,使用CUDA语言对HM编码器中的耗时模块进行重新编写,以达到提升编码速度的目的。首先,本文对H.265编码标准和编码关键技术进行了详细的分析,包括图像划分方式、整体编码框架、帧内预测、帧间预测以及变换与量化,并对GPU架构和CUDA体系作了详细叙述,为后续在GPU平台上进行实现奠定了理论基础。分析了HM编码器的运行框架和各个编码模块的耗时占比,选择了帧间预测、变换和量化作为本文进行并行实现的编

7、码模块。然后,针对帧内预测模式选择算法复杂度高的情况,本文提出了一种帧内预测模式快速选择的方法,通过将33种角度预测模式进行区域划分,并利用高概率预测模式在划分区域中不断匹配,快速定位最优预测模式分布,在几乎不影响编码质量的前提下,减少了最优预测模式选取次数,降低了模式选择的复杂度;在帧间预测并行时,本文选择了预测准确度最高的全搜索算法,借助GPU并行的特点克服了算法本身计算量大的弊端,并在SAD计算环节使用由4x4块逐级向上叠加的方法完成所有尺寸块的计算,设计了映射函数将显存存储地址和块尺寸相对应;在变换和

8、量化模块,本文使用行并行和列并行的方法完成了并行设计与实现,有效提升了编码速度。最后,本文在GPU(GeForceGTX1080)平台上对并行设计后的H.265编码器进行了测试,并和CPU平台下的HM编码器进行了对比分析,对帧内预测模式选择的优化进行了测试验证,对帧间预测、变换和量化分别进行了独立耗时分析与对比,验证了编码器能够对视频序列进行正确编码,并在保证编码质量的前提下将整体编码速度提升了平均

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。