欢迎来到天天文库
浏览记录
ID:12612437
大小:1.34 MB
页数:18页
时间:2018-07-18
《名片识别系统-实验报告》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、南京航空航天大学课程设计课程名称:数字图像处理指导老师:陈春晓课程设计:名片识别系统小组成员:王立春王章立陶然张言张晨二〇一五年十一月摘要:交换名片是商务交往中的一个重要环节,而如何管理收到的大量名片却缺少高效的方法。随着电子信息技术的快速发展,利用OCR(光学字符识别)技术识别名片信息,只需要拍一张名片图片就能够快速的将名片电子化,进而保存到通讯录中,可以方便地实现名片管理。本文详细阐述了基于Tesseract_OCR的名片识别系统的设计及实现,介绍了该系统的设计目标及实现方法。第一章首先简单介绍了基于Tesseract_OCR的名片识别系统的实现流程,并附有流程框图。第二章总结了
2、名片预处理的一些理论方法,针对图像二值化过程中动态选取阈值难的问题,本文在分析了各种常用的全局和局部二值化算法的优缺点后,采用了一种基于Ostu法的全局和局部法相结合的二值化算法,在保留了图像细节的同时又较好的消除了伪影和不均匀光照的影响。进行二值化处理之后,名片带有一些明显的噪声,本文使用了中值滤波法进行去噪。最后在图像倾斜矫正的各种算法中由于Hough变化简便快速,所以本文选择了Hough变换的方法来进行倾斜矫正。第三章主要分析了版面分割的两种基本方法投影法和连通域法,探讨其优缺点,并在此基础上使用了一种的基于膨胀算法的连通域搜索法,并用此方法实现了对名片图像的版面块划分。第四章
3、阐述了Tesseract_OCR基本原理及多语言特性,然后介绍了通过设置环境变量使Matlab能够简单调用的过程,最后利用它自带的字符库对名片图片进行了识别处理,最终的字符识别获得了较好的效果。附录中添加了本次实验中所编写的主要Matlab源代码。第一章基于Tesseract_OCR的名片识别系统简介名片作为一种简明、美观的信息载体在商务活动中扮演着不可忽视的角色。随着数字移动网络时代的到来,数字移动设备成为人们管理名片,使用名片信息的最佳对象。然而伴随而来的是一个最根本也是最关键的问题,即名片信息的自动输入。大量的名片通过手工录入不仅耗时费力,而且也很难保证名片信息的完整性和准确性
4、,这就使得一种高识别度、易于操作和管理的名片识别系统成为一个急需开发的课题。1.1Tesseract-OCR简介Tesseract-OCR是一个开源的OCR引擎,最早由惠普公司在1984年到1994年间开发的。后来惠普放弃了OCR市场,Tesseract-OCR被贡献于开源社区,并重获新生。目前Tesseract-OCR作为开源项目发布在GoogleProject上。相比于其他价格昂贵的商业OCR引擎,Tesseract-OCR设有针对每种语言提供非常详尽的字符库,因此能够兼容更多语言的字符识别,对于有多种字体的语言的文本识别非常有效,能够大幅提高识别正确率。1.2名片识别的基本模型
5、理想的智能名片识别系统的结构可分为四个模块:图像预处理模块、版面分析模块、字符识别模块和信息分类模块,如图1.1所示。名片图像预处理版面分割字符识别信息分类字符纠正关键字输出图1.1名片识别系统图图像预处理模块将经过扫描仪的名片灰度或彩色图像进行二值化,平滑去除噪声,然后进行倾斜校正,校正倾斜的图像并去除扫描倾斜名片时所产生的黑边。版面分析模块对名片版面进行分析,切分出名片上的文字行。名片字符识别模块对切分出的文字行进行识别。信息分类模块利用关键字及版面位置等信息对识别出的信息进行分类,进行正确的信息分类。第二章名片图像预处理2.1预处理概述名片经过图像采集设备采集,获取数字图像信息
6、,在这个图像信息里,可能有字符、图片以及线条等。而我们实现的名片识别系统一般只对字符进行识别、处理。名片的背景色、光洁度、油墨的深浅等干扰都会连同有用信息一同被采集到一个图像中。所以,在字符识别之前,要对这些干扰进行预处理,预处理的目的是为了准确的识别出名片中有用的字符。此外,为了后续处理方便,一般都是把彩色图像转化为灰度图像进行处理。在图像的预处理过程中包括许多方面。诸如彩色图像转为灰度图像,倾斜纠正,二值化等。图2.1给出了一个图像预处理的大概框架。在本章我们将对二值化及倾斜校正做详细介绍。倾斜校正原始名片图像图像分辨率变换图像二值化图像去噪图2.1图像预处理框架图2.2名片二值
7、化现在很多关于文档分析和识别的算法都是基于二值图像的。因为相对于有256个灰度级的灰度图像或是彩色图像,二值图像的运算更加简单,所花费的时间和空间代价也更少。故此,人们常常先把灰度图像转化成二值图像。二值化的基本要求是:(l)笔画中不能出现空白;(2)二值化后的笔画基本保持原来文字的特征。假设用f(x,y)(0
此文档下载收益归作者所有