欢迎来到天天文库
浏览记录
ID:36574142
大小:2.70 MB
页数:73页
时间:2019-05-12
《文档图像几何畸变校正技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、CIassifiedIndex:TP391.1U.D.C:004.91SouthwestUnivetsity0fScienceandTechnoIogyMasterDegreeThesiSTheResearchofDocumentImageGeometriCDistortionCorectionTechnoIogyGrade:(;andidate:AcademicDegreeAppIiedfor:SpeciaIity:Supervisor:2008SongLi—‘IiMasterEducationalTechnoIogyWuYa—。dongApriI4th.2011独创性
2、声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得西南科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:寥孙日期:aoI/.么.7关于论文使用和授权的说明本人完全了解西南科技大学有关保留、使用学位论文的规定,即:学校有权保留学位论文的复印件,允许该论文被查阅和借阅;学校可以公布该论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的学位论文
3、在解密后应遵守此规定)一乔锄劲纛:环胁’/、冉㈦’6、j西南科技大学硕士研究生学位论文摘要视觉文档图像的采集通常会因为焦距变化、角度形变等多种复杂情况的出现而使图像产生几何畸变,从而影响OCR(光学字符识别)系统识别结果的正确性,甚至导致无法识别。针对上述问题,本文给出了一种文档图像倾斜扭曲校正方法,该方法采用四个步骤对产生几何畸变的文档图像进行校正处理。首先对文档图像进行去噪和二值化预处理;其次采用连通域标记方法进行单词及文本线的检测;再根据单词连通域的中位点信息进行线性拟合得到其校正基线;最后根据校正基线和垂直位移距离分别对单词进行旋转和位移而得到校正后的图像。本文的
4、主要工作如下:(1)研究了文档图像的去噪和二值化方法,针对文档图像的单词连通域大小相对固定的特点,给出了一种基于连通域标记的文档图像去噪方法,使得在去噪的同时完成单词的检测,且去噪效果明显。(2)针对传统从上至下的文本线检测方法利用中间段单词检测文本线,存在错检和适应性差的问题,本文给出了一种从左至右的文本线检测方法,该方法利用首单词的个数来确定文本行的条数,提高了检测的准确度,并能适应双向扭曲的情况。(3)针对传统校正基线及垂直位移距离计算方法会受文档具体内容影响的问题,本文引入单词中多数字母的高度值H,,取高度为日,的字母的中位点作为基线拟合的数据,排除了单词中个别字
5、母向上或向下凸起对校正基线及垂直位移距离准确计算的干扰,并将算法的时间复杂度从O(n2)降为D(行)。实验表明,本文方法能快速有效的校正产生倾斜或扭曲畸变的文档图像,并使校正后的图像在OaR识别阶段的识别率显著提高。关键词:文档图像几何畸变;连通域标记;文本线检测;校正基线;垂直位移距离西南科技大学硕士研究生学位论文AbstraotDocumentimagedistortionoftenappearswhencapturedbythecamera,whichmayinducerecognitionmistakesbyOCR.Tosolvethisproblem,anewd
6、ocumentimagedistortioncorrectionmethodisproposedinthispaper.Andfourstepsareusedtocompletethisprocess.Firstly,thetechnologyofimagesmoothingandbinaryzationisusetopreprocesstheoriginalimage.Secondly,thetechnologyofconnectedcomponentslabelingisusedtodetectwordsandtextlines.Then,basedtheinform
7、ationofthemiddledotsofthewords,linearfittingmethodisusedtogetthewords’baselines.Finally,accordingtothewords’baselinesandthedistanceforverticaldisplace,wordsrotationandverticaldisplacearemadetoobtainthecorrectedimage.Themainworkofthispaperisdescribedasfollows:(1)Base
此文档下载收益归作者所有