欢迎来到天天文库
浏览记录
ID:35098194
大小:2.80 MB
页数:73页
时间:2019-03-17
《超低质量视频字幕识别方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、国内图书分类号:TP39学校代码:10213国际图书分类号:681.3密级:公开硕士学位论文超低质量视频字幕识别方法研究硕士研究生:王瑞导师:李海峰教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2016年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP39U.D.C.:681.3DissertationfortheMasterDegreeRESEARCHONULTRA-LOWQUALITYVIDEOCAPTIONTEXTRECOGNITIONCandidate:WangRuiS
2、upervisor:Prof.LiHaifengAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologySchoolofComputerScienceandAffiliation:TechnologyDateofDefence:June,2016Degree-Conferring-Institution:HarbinInstituteofTechnology摘要摘要当下,海量视频数据中包含着丰富的信息,对于这些视频进行分析处理
3、的需求也越来越多。有的视频其视频质量非常低,其中字符大小极小,而且受到噪声的干扰,本文中称为“超低质量视频”。传统的视频字符识别技术对于此类视频难以适用,因此亟需针对超低质量视频的字符识别方法进行研究。本文中识别的视频字符为固定位置的字幕文本,且字幕没有复杂的背景。本文的最终目标是构建一个高性能和高可靠性的视频字符识别系统。基于上述目标,本文首先提出了基于模板的字符匹配识别算法,直接使用图像的灰度值特征计算待识别字符与模板的相似度。取相似度最高的模板的类标签作为待识别字符的识别结果。使用视频多帧融合方法作为识别预处理过程,实验表明预处
4、理过程有效减少了视频中冗余帧。其次,为了提高识别自动化程度,提出了基于可信度的视频字符区域自动匹配算法。视频字符区域匹配算法对于每一帧进行处理,分别使用各个已定义的字符区域识别同一帧后,计算识别结果的平均可信度,选择可信度最高的字符区域作为最终结果。为了减少用户建立模板库时的工作量,本文提出了基于半监督学习思想的模板库自动生成算法。通过借鉴自学习方法,我们首先生成已知标签的标准字模,接着用标准字模对于视频中待识别字符进行相似度分布的统计。挑选各个字模相似度分布中的最大的??个字符加入模板库。从而达到完全自动生成识别模板库的目的。模板库
5、自动生成算法在未知字体的情况下,由于先验知识过少,模板库会有错误产生,导致识别准确率下降。针对此问题,我们提出了后处理纠错算法。包括基于自回归模型的自动纠错算法和人工反馈纠错算法。自回归模型可以对于连续平稳变化的时间序列进行预测。我们使用自回归模型检测识别数值型变量中的突变,并进行纠错。而人工反馈纠错则是用户直接对于识别错误进行纠正,将纠错的图片与标签直接加入模板库,同时纠正模板库中的错误。在纠错后使用新的模板库更新识别结果,迭代纠错多次使得识别准确率越来越高。经过实验,使用上述提出的一整套识别算法,在经过3轮迭代纠错后,对于测试视频
6、的平均识别准确率达到了98%以上。最后本文设计并实现了一套视频字符识别系统,系统集成了我们上述提出的算法,具有友好的人机交互界面和高可靠性。关键词:视频字幕识别;超低质量;模板匹配;模板库自动生成IAbstractAbstractNowadays,thereisstrongdemandforanalyzinginformationinvideodatabecauseofabundantinformationinvideo.Somevideoshaveverylowqualityduetovariousreasons.Wedefinet
7、hesevideosare“ultra-lowqualityvideos”.Traditionalvideotextrecognitionmethodsoftenfailstoprocessultra-lowqualityvideoappropriately.Soitisnecessarytoresearchthemethodofultra-lowqualityvideotextrecognition.Inthisarticle,therecognizedtextbelongstocaptiontext,withfixedpositi
8、onanduncomplicatedbackground.Theultimategoalofthisarticleistobuildavideotextrecognitionsystemwithhighperforman
此文档下载收益归作者所有