基于深度学习的端到端图像视频压缩框架

基于深度学习的端到端图像视频压缩框架

ID:35164183

大小:12.41 MB

页数:62页

时间:2019-03-20

基于深度学习的端到端图像视频压缩框架_第1页
基于深度学习的端到端图像视频压缩框架_第2页
基于深度学习的端到端图像视频压缩框架_第3页
基于深度学习的端到端图像视频压缩框架_第4页
基于深度学习的端到端图像视频压缩框架_第5页
资源描述:

《基于深度学习的端到端图像视频压缩框架》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、嗨!thesis硕士学位论文基于深度学习的端到端图像视频压缩框架END-TO-ENDIMAGEANDVIDEOCOMPRESSIONFRAMEWORKBASEDONCONVOLUTIONALNEURALNETWORKS陶文哈尔滨工业大学2018年6月国内图书分类号:TP391学校代码:10213国际图书分类号:681密级:公开工程硕士学位论文基于深度学习的端到端图像视频压缩框架硕士研究生:陶文导师:姜峰教授申请学位:工程硕士学科:计算机技术所在单位:计算机科学与技术学院答辩日期:2018年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391U.D.C:681Dis

2、sertationfortheMaster’sDegreeinEngineeringEND-TO-ENDIMAGEANDVIDEOCOMPRESSIONFRAMEWORKBASEDONCONVOLUTIONALNEURALNETWORKSCandidate:TaoWenSupervisor:ProfessorFengJiangAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence

3、:June,2018Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工程硕士学位论文摘要图像和视频压缩一直是学术界和工业界研究的热点之一。近年来,随着深度学习技术的发展,尤其是卷积神经网络在图像处理和计算机视觉领域的成功应用,利用深度学习技术来对图像和视频高效压缩成为可能。目前深度学习技术在高层视觉领域,如图像分类,目标检测,目标跟踪,图像分割,人脸识别等,已经取得了突破性的研究成果,然而在低层视觉上,如图像压缩,图像复原等领域的应用还具有很大的研究潜力和价值。本文以深度学习技术为基础,主要研究工作分为以

4、下两个部分:一、提出了基于深度学习的端到端图像压缩框架,将深度学习技术与传统的图像编解码器(如JPEG,JPEG2000和BPG等)无缝的衔接起来,进一步提高编解码器的压缩性能。二、着眼于视频帧率转换中的插帧技术,提出了基于运动补偿模型的深度学习插帧网络模型。为了能提高压缩图像质量的同时提高压缩比,我们将两个卷积神经网络和传统编解码器整合到一个端到端的图像压缩框架中。第一个卷积神经网络ComCNN在编码器前端,用来学习原图像的紧凑表示,学习到的紧凑表示被送到传统编码器进行编码。第二个卷积神经网络RecCNN在解码器后端,通过解码后的紧凑表示来高质量的重建原图像。为了让这两个卷积神经网

5、络互相协作学习,我们提出了一个端到端的学习算法来同时学习ComCNN和RecCNN,学习到的RecCNN可以精确地重建原图像。本文提出的图像压缩框架可以兼容现有的编解码器。实验结果表明,本文提出的图像压缩框架远优于其他的图像压缩后处理方法,提高了传统编解码器的压缩性能。在低带宽环境下,视频帧率转换技术是视频压缩的关键技术之一。本文提出了一种基于运动补偿的视频插帧深度网络模型MCIF,其中运动补偿子网络MC-subnet可以准确估计前后帧运动信息。在MC-subnet网络模型中,利用了前后帧的多尺度特征,让网络更加精确地学习到多种运动模式。图像质量增强子网络QE-subnet采用慢融合

6、的网络结构,生成了高质量的中间帧。实验结果表明,本文提出的视频插帧方法可以更精确地捕捉运动信息,生成的中间帧质量更好。关键词:图像压缩;视频插帧;深度学习;压缩框架;紧凑表示-I-哈尔滨工业大学工程硕士学位论文AbstractImageandvideocompressionhasbeenoneoftheresearchhotspotsinacademiaandindustry.Inrecentyears,withthedevelopmentofdeeplearningtechnologies,especiallythesuccessfulapplicationofconvolutio

7、nalneuralnetworksinthefieldsofimageprocessingandcomputervision,itispossibletousedeeplearningtechnologytocompresstheimageandvideoefficiently.Atpresent,deeplearningtechnologyhasachievedbreakthroughresearchresultsinhigh-levelvisualfields

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。