无限制手写体数字串切分和识别相关问题的研究

无限制手写体数字串切分和识别相关问题的研究

ID:34602559

大小:4.71 MB

页数:85页

时间:2019-03-08

无限制手写体数字串切分和识别相关问题的研究_第1页
无限制手写体数字串切分和识别相关问题的研究_第2页
无限制手写体数字串切分和识别相关问题的研究_第3页
无限制手写体数字串切分和识别相关问题的研究_第4页
无限制手写体数字串切分和识别相关问题的研究_第5页
资源描述:

《无限制手写体数字串切分和识别相关问题的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、博t论文尢限制丁t与体数‘}串切分‘i识别的相关问题研究摘要字符识别是模式识别的一个重要分支,手写体阿拉伯数字识别作为光学字符识别(OCR)的一个方面,在特定的环境下有着重要的实用价值,如邮政信函地址阅读、银行票据自动处理系统等等。随着研究的深入和技术的发展,手写体数字的识别对象已由规范、孤立的手写体数字向无限制、连续的手写体数字串发展。目前大多数离线识别系统是基于单字识别的,字符切分作为单字识别的前提和基础,成为不可缺少的关键步骤。由于手写体字符存在变形、粘连和断笔等原因,字符串切分技术成为OCR

2、系统中的主要难题,字符串切分效果的好坏将直接影响系统识别的正确率,成为系统整合的核心技术。因此,字符串切分的技术研究对于提高系统的整体性能具有极其重要的意义。本文以非限制手写体数字串为研究对象,提出了一种新的基于手写体数字结构特征的切分方法,切分过程依据数字串的笔划组合完成。主曲线是一种基于非线性变换的特征抽取方法,借由通过数据分布“中间”并满足“自相合”的光滑曲线来进行特征抽取,能够获得手写数字字符笔划的稳定描述。使用主曲线分析完成字符模板的笔划抽取,在此基础上以字符识别器提供的置信度为依据指导切

3、分过程,在国内现行票据集上的实验结果表明该方法的总体性能有所提高。针对手写数字串笔划集合的冗余度以及切分算法的高复杂度问题,对字符笔划抽取模糊特征,引入模糊规则处理笔划,处理过程分为三个方面:(1)不规则笔划的分裂;(2)笔划碎片的合并;(3)冗余笔划剔除。基于模糊规则的笔划处理过程有效地解决了笔划的断裂、交错等问题,同时减少了笔划集合中的笔划数量,从而降低了笔划组合的算法复杂度,从整体上提高了执行效率。目前常用的手写数字切分方法有基于投影和轮廓特征的方法、基于结构特征的方法和基于识别的方法。基于投

4、影和轮廓特征的切分方法对于具体的应用对象缺乏针对性,而基于结构特征的切分由于缺乏识别的指导,往往导致切分质量不高。因此,在切分过程中引入识别机制是提高正确率的有效手段,识别算法的好坏直接影响切分效果。为此,提出了一种基于AffinityPropagation(AP)聚类和仿生模式识别理论的识别方法。该方法通过AP聚类选择代表训练样本,依据仿生模式识别理论构建和划分样本窄问,根据待识样本到各特征予空间的相对距离判定所处空间并进行分类识别。在两类拒识情况下,即待识样本游离于子空间之外和特征子空间出现重叠

5、,计算基于类条件的后验概率对样本进行相对区别。Concordia大学的CENPARMI手写体数字库与I摘要博卜论文南京理工大学手写金额库上的实验结果表明了该方法在识别率方面优于传统的分类器。基于识别的手写数字切分方法以字符识别器提供的置信度为依据进行切分度量,选取真实反映识别结果的置信度成为切分成败的关键。为有效地解决字符串切分中的欠分割与过分割问题,提出了后验概率模型,并以此描述和评价切分过程,最优切分结果由极大似然估计(MAP)给出。关键词:主曲线分析,模糊特征,后验概率,置信变换,概率模型,笔

6、划组合,AP聚类,仿生模式识别,字符串分割,OCR,手写阿拉伯数字识别ABSTRACTCharacterrecognitionisaveryimportantbranchinpatternrecognition.AsallimportantaspectofOpticalCharacterRecogntion(OCR)。recognitionofhandwrittenhasbeenwiderlyappliedincertainfieldssuchasmailaddressreadingandautom

7、aticprocessingofbankchecks.Withthedevelopmentoftechnology,theobjectofhandwrittennumeralrecognitionhasbecomeunconstrainedandcontinuousnumeralstrings.Mostexistingoff-linerecognitionsystemsadoptsingle—character-basedrecognitionmethods.Hencesegmentationofc

8、haractersisallimportantandkeystepinthepracticalhandwrittencharacterrecognitionsystems.However,technologiesofsegmentationencountersomedifficultiesduetothecharacteristicofhandwrittencharacterssuchasthedistortionandtouchingofcharacters.Res

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。