实用化面向金融领域的OCR系统

实用化面向金融领域的OCR系统

ID:37331860

大小:2.55 MB

页数:64页

时间:2019-05-22

实用化面向金融领域的OCR系统_第1页
实用化面向金融领域的OCR系统_第2页
实用化面向金融领域的OCR系统_第3页
实用化面向金融领域的OCR系统_第4页
实用化面向金融领域的OCR系统_第5页
资源描述:

《实用化面向金融领域的OCR系统》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、哈尔滨工业大学工学硕士学位论文摘要光学字符识别(OpticalCharacterRecognition)是模式识别的一个重要分支。就字符识别技术而言,我们已经提出了一系列卓有成效的理论及方法。然而该技术的普及和应用,在很长厂段时间里都不尽如人意,究其原因,不同的行业,对OCR产品有着不同的需求。OCR产业的发展与推广,必须面向行业。本文以金融领域为例,探讨了在开发面向行业的OCR系统中,字符分类器的设计与实现。本文分析了金融领域字符图象的特点。针对该领域常见的几种图象噪声,提出了相应的去噪和归一化算法。本文分析了字符识别技术中常用的特征采集及特征提取方法。具体分析了DE

2、F(Directionalelementfeature)特征、重心特征、Chamfer距离,粗外围特征,笔划密度特征的特点及提取方式,本文详细讨论了分类器设计的两种基本方法:近邻法和神经网络法。分析了金融领域对于字符识别的要求,并针对不同要求,设计了相应的分类器。在分类器的设计过程中,综合考虑了归一化对特征采集的影响、特征间的互补性、分类器的融合等方面的问题。进一步地,在大样本集分类器的预处理过程中,提出了先预分类,再归一化的方法,较好的解决了汉字、数字、字母及标点符号的混和识别问题。最后,考虑到不同行业对OCR系统的不同要求。本文还讨论了字符分类器的识别类别可扩充牲,

3、及分类器对训练样本的鲁棒性等问题。关键词光学字符识别;特征提取,分类器设计;哈尔滨工业大学T学硕1:学位论文AbstractsOCR(OpticalCharacterRecognition)isanimportantbranchofpatternrecognition.ManytheoriesandmethodshavebeenstudiedandproposedinOCRareatothisend.However,theapplicationsandpopularizationsofOCRtechniquescannotbesatisfiedinlongtime.Th

4、ereasonofitisthattherearedifferentrequirementsforOCRsystemindifferentlines,sothedevelopmentsandspreadsofOCRindustrymustbelinesoriented.Inthispaper,acharacterrecognitionsysteminOCR,whichisfinanciallinesorientedhasbeenstudieddeeplyandimplemented.Thecharacteristicsofcharacterimageinfinancia

5、llinesareanalyzed.Removingnoisealgorithmandnormalizationalgorithmfittedfortheimage'snoiseareproposed.Commonusedmethodsoffeatureobtainingandfeatureextractionarediscussed.Specifically,thecharacteristicsandextractionmethodsofdirectionalelementfeature,gravityfeature,coarseperipheralfeaturean

6、dstrokedensityfeatureareanalyzed.Twoclassificationalgorithms,nearestneighborandneuralnetworkarediscussed.Accordingtospecificrequirementsforcharacterrecognitioninfinanciallines,acharacterclassifierisdesigned.Intheclassifierdesigning,someproblemssuchastheimpactsofnormalizationonthefeatureo

7、btaining,thecomplementsofdifferentfeatures,thecombinationsofmulti-classifiersarestudied.Inaddition,aschemeofnormalizationprecededbypre-classificationisproposedtobetterrecognizemixturesofmulti-language-ChineseCharacters,numerals,Englishlettersandpunctuations.Consideringthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。