欢迎来到天天文库
浏览记录
ID:36638920
大小:2.38 MB
页数:91页
时间:2019-05-13
《特定领域OCR系统的精度与速度问题研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、北京邮电大学博士学位论文特定领域OCR系统的精度与速度问题研究姓名:陈光申请学位级别:博士专业:信号与信息处理指导教师:郭军20061125摘要新的信息检索领域的应用,提出相应的解决思路。本文进行的主要工作如下:1.对于汉字识别这样一个统计模式识别的问题来说,训练样本的数量和质量对于系统的识别性能是非常关键的。当训练样本的数量和质量不能满足需要时,我们无法正确估计样本的统计分布,无法得到最优的识别率。本文提出一种新的基于余弦整形变换的手写汉字训练样本生成方法,可有效提高现有手写汉字识别系统的识别性能。通过对原始训练样本进行基于余弦整形变换的样本生成和样本
2、筛选,一定程度上缓解了某些条件下训练样本不足的问题,增强了识别器的扩展能力和鲁棒性。2.手写体汉字变形问题是手写体汉字识别中的关键问题,归一化处理是直接从汉字点阵图像上矫正手写变形、减小属于同一类别的不同模式之间差异的主要途径。但是,在对图像进行规整的过程中,也引进了可能会影响识别精度的锯齿等不利因素。为了更有效的提取手写汉字的特征,提高识别精度,本文提出了一种利用非线性归一化过程产生的坐标变换信息来提取手写汉字有效特征的方法。该方法通过非线性归一化获得各有效像素点在原汉字图像及规整后汉字图像中的坐标变换关系,在原图像上抽取各点特征,在归一化图像上进行网
3、格的均匀划分和特征统计并形成用于分类的特征向量。该方法有效克服了以往先进行归一化预处理方法和动态网格方法的一些不足,兼顾了与传统结构特征提取方法的有效结合。北京邮电大学博士论文摘要3.研究了基于PCA和LDA的手写汉字特征压缩问题,通过特征压缩,使原先的高维特征能够高效地用于实际识别过程,在保证汉字识别率的情况下,特征矢量维数大大降低,使用基于LDA的方法在一定的压缩比率下,汉字识别率也得到了改善。4.金融票据中手写体金融汉字的识别这类问题,属于背景和字形情况都相对复杂的小字符集汉字识别问题,对识别器的区分能力和鲁棒性都有较强的要求。实验表明,使用马氏距
4、离进行分类,通过适当选择参数,可以达到较高的精度,但运算量非常大,难以用于实际系统。本文提出渐进的马氏距离计算方法,并将其应用到金融汉字的识别系统中,在保证识别精度的同时,大大提高了系统的处理速度。在针对实际采集的金融票据中汉字的实验表明,该方法的效果是非常显著的。5.研究面向图像信息检索与图像信息过滤的OCR技术和系统框架,探索传统OCR技术如何更加高效应用,如何与信息检索和信息过滤系统紧密结合,提出基本的解决思路。关键词模式识别文字识别训练样本生成加权动态网格特征提取渐进的马氏距离北京邮电丈学博士论文摘要AlⅧSEARCHONACCURACYANDS
5、PEEDoFTHEoCRSYSTEMSINSPECIFICFIELDSDuringthepastfiftyyears,peoplehavegottenbrilliantachievementsinOCRarea.ThedevelopmentinOCRtheoryandtechnologymakeitbecomingpossibletomeettheneedsforpracticalOCRproductsinfinance,postalautomation,newspublishing,officeautomationfields,etc.Though,t
6、heautomationofbankcheckprocessingsystemsandinformationretrievalonlyhavebeenstudiedforfewyears,thestrongmotiveforceofmarketandsociety’SneedsmakeitbecomingoneofthehotspotinOCRarea,andthenspeedthedevelopmentoftheOCRtheoryandtechnology.Theresearchofpresentthesisinvolvesrelatedtechnol
7、ogiesontheaccuracyandspeedofOCRsystems.nefollowingaretheresultsachievedinthisdissertation:1.Inpa饥emrecognition,thenumberand删i粤oflearningpaRernsisofcrucialimportance.珊1enthenumberandqualityoflearningpattemsarelimited,erroroccursinthepresumeddistributionofpatternsandtheprecisionofw
8、holerecognitionsystemdecreases.Anewpatte
此文档下载收益归作者所有