资源描述:
《基于特征空间的旋转多字体文字识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:TP39110710-2013132014硕士学位论文基于特征空间的旋转多字体文字识别程加乐导师姓名职称茹锋教授申请学位级别工学硕士学科专业名称控制理论与控制工程论文提交日期2016年4月25日论文答辩日期2016年6月3日学位授予单位长安大学TheRecognitionofRotatedMulti-fontCharacterBasedonEigenSpaceADissertationSubmittedfortheDegreeofMasterCandidate:ChengJia-leSupervisor:RuFengChang’anUniversity,Xi’an,C
2、hina摘要随着计算机、多媒体以及通讯技术的飞速发展,以图像为主的多媒体信息迅速成为重要的信息传递媒介,而且图像中的文字包含了重要的语义信息,比如图像中道路指示牌上的指示文字和地图上的地方名,均能指示出与此相关的地理位置信息,而书籍封面图像中的标题作者、产品包装图像上的产品名称等能够说明图像中的主体内容。准确提取和识别图像中的信息可应用于图像检索系统、车辆自动导航系统、视觉障碍辅助设备、手机辅助功能系统等领域中。因此准确提取和识别图像中的文字成了信息智能化处理的前沿课题,且具有广泛的应用意义。针对现行文字识别系统中,由于不同设备获取的分辨率不同的图像,其文字识别率也大不相同,
3、图像分辨率较低或图片倾斜时识别率便大幅降低,而且有的文字识别系统还受到文本字体种类以及文字位置的限制。本文将针对存在旋转的、多字体文字的识别进行相对应的研究与论证,提出基于特征空间的文字识别方法,以改善文字识别的识别效果,提高文字识别的鲁棒性,使其能够更好地在机器视觉领域得到应用。基于特征空间法的文字识别方法与传统文字识别方法的主要区别在于特征提取及分类判别方法有所不同。基于特征空间的文字识别,首先,根据主成分分析提取文字特征,建立文字的特征空间并确定文字的运动轨迹;其次,通过改进的近邻法比较待测文字特征与轨迹的相似度,以实现字符分类,从而并识别出文字及其对应的旋转角度。最后
4、,通过借助于GCC软件进行仿真验证与代表OCR识别潮流的汉王OCR识别软件对比,通过实验得出基于特征空间的文字识别方法在识别旋转的多种字体的文字有较好的效果。关键词:图像处理,文字识别,特征提取,特征空间IAbstractWiththerapiddevelopmentofcomputer,multimediaandcommunicationtechnologies,multimediainformationbasedonimagehasbecomeanimportantmediumofinformationtransmission.Textintheimagecontains
5、importantsemanticinformation,Forexample,textinstructionsonroadsignsimageandthepalacenameonthemapallcanindicatethelocationinformationassociatedwiththem.Thetitleandauthoronthebookcover,theproductnameandotherinformationontheproductpackagingimage,theyallcanexplainthemaincontentofthem.Accurateex
6、tractionandrecognitionofimageinformationcanbeappliedinthefieldsofimageretrievalsystem,vehicleautomaticnavigationsystem,visualdisturbancesauxiliaryequipment,mobilephoneauxiliarysystems,etc.Therefore,accurateextractionandrecognitionofthetextintheimagehasbecomeakeyissueinintelligentinformation
7、processing,andhasawiderangeofapplications.Fortheproblemsinthecurrenttextrecognitionsystemsuchas,Forexample,duetotheresolutionofdifferentimagesofdifferentequipmentacquireditscharacterrecognitionrateisalsoverydifferent,whentheimageresolutionislowortiltedim