彩色图像文本提取算法研究 毕业论文

彩色图像文本提取算法研究 毕业论文

ID:281460

大小:2.10 MB

页数:36页

时间:2017-07-18

彩色图像文本提取算法研究  毕业论文_第1页
彩色图像文本提取算法研究  毕业论文_第2页
彩色图像文本提取算法研究  毕业论文_第3页
彩色图像文本提取算法研究  毕业论文_第4页
彩色图像文本提取算法研究  毕业论文_第5页
资源描述:

《彩色图像文本提取算法研究 毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、1绪论随着互联网和多媒体技术的快速发展,世界进入了一个崭新的信息化时代。以图像、动画、视频为主要元素的各种多媒体信息构成了信息传播的主力。最近几年以来随着既有拍照功能的便携式电子设备,比如智能手机,平板电脑等,随着技术的不断更新升级,人们急需一种方便的应用程序来提取处理图像中内嵌的文本信息。这都使得彩色图像下的文本的提取成为一个很有意义的研究课题。彩色图像中的文本提取即为彩色图像中文本定位,是很困难的问题。由于其广泛的应用领域越来越受到人们的重视。因此,将图像中的文本提取出来将便于不停国家,不同文化之间的交流。1.1研究意义和背景随着计算机技术、多媒体技术和通讯技术的发展,以

2、图像、声音和视频为主的多媒体信息的应用越来越广泛,图像中的文本信息对检索和浏览有十分重要的意义。在彩色图像中,文本信息包含了丰富的高层语义信息[1]。文本可以作为图像的内容标识和索引,是图像内容重要程度的判断依据,例如出现醒目文字的帧,可以抽取出来作为对应的图像的代表帧。如果这些文字信息能自动准确的被检测、分割、识别出来,则对图像高层语义的自动理解、索引和检索是非常有价值的。随着技术的不断发展,人们对彩色图像中文字提取进行了广泛的研究,并已有许多成熟的技术应用在各个领域,如交通管理中的汽车牌照识别和港口货物管理的集装箱编码识别等。但自然场景中的文本分割依然面临着许多复杂的问题

3、,主要原因是:(1)文字和其他自然景物混杂在一起,如树、窗户和房屋建筑等,背景复杂;(2)文字的颜色多种多样;(3)文字的字体和大小复杂多变;(4)光照的变化等。因此从自然场景图像中提取文本是一项极具挑战性的工作。目前已有的文本区域提取方法大致可以分为四类:(1)基于边缘的方法(2)基于纹理的方法(3)基于连通域的方法(4)基于学习的方法。第36页共36页在各种自然彩色图像中,往往可以见到各种各样的文字,这些文字一般和该图像的语义内容相关,或者提供了某种定位辅助信息。若能准确的将这些文字信息定位出来,并进行处理,使之能够被传统的OCR软件识别并被转化成为机器内码,结合自然语言

4、处理,文本检索,文本翻译,语音合成等技术可以被应用到各种领域实现。1.2课题发展现状针对图像、视频文本检测和提取的研究,主要有以下算法:RainerLienhart[2]利用文字颜色的单一性、文本区域的大小约束、同一文本会在连续几个视频帧出现等特点,对文本进行检测和定位。首先对视频帧使用分裂—合并算法,将视频帧分解成颜色一致的连通元(connectedcomponent)。然后通过匹配算法,对连通元进行多帧跟踪,去除那些没有连续多帧出现的连通元。最后通过对比度的分析,形状分析等去除非文本的连通元。该算法要对每一个视频帧进行分裂合并算法,而且视频中生成的连通元绝大部分都不会是文

5、本,因此算法复杂度太高,系统效率低。Boon-LockYeo[3]提出利用场景变化来检测视频文本的出现和消失。算法对相邻两个视频帧取差值,在差值图像中寻找高亮区域。这种算法只能提取高亮的视频字幕,而不能提取非高亮度的字幕,而且也会受到较亮的物体的干扰。Byung[4]提出用字符的拓扑结构特征来提取字符文本区域,然后对视频字幕区域进行复原。该算法是基于单个视频帧图像的字幕提取,效果并不明显。MarcoBertin{5]利用角点特征来进行的视频字幕检测。这种算法实质上类似于基于灰度边缘的算法等。王辰等[6]等通过灰度边缘检测来定位文本区域。首先提取视频帧的灰度边缘,然后合并相邻的

6、边缘,生成候选文本区域,最后用一些启发式规则来去除虚假的文本区域。该算法不能提取灰度值和背景接近的文本。王勇等[7]提出一种基于边缘点密度的视频字幕自适应检测算法。采用基于边缘检测的方法,结合文字图像区域本身的特点,在对原图像进行边缘检测和形态学膨胀后,对其在水平和垂直方向的边缘密度投影采用一种自适应的检测算法,从而检测得到字幕图像区域。该算法的优点是可以检测出各种字体大小的文本行。但是算法不能提取灰度值和背景接近的文本。第36页共36页郭丽等[8]提出一种基于颜色边缘点和游程平滑的视频文本提取算法。黄晓东等[15]综合应用小波变换和颜色聚类技术来提取视频帧中的字幕区域。首先

7、,通过小波变换计算视频中的局部能力特征,能量高的区域作为候选字幕区域。然后利用字幕颜色一致的特征,进行邻域颜色聚类算法,从背景中分离出字幕。最后利用字幕属性特征消除噪声。但是该算法容易受到颜色一致的物体的干扰。处理图像的时间较长。1.3本文主要研究方向课题的主要目标就是在彩色图像下提取文本信息,二值化分割进而识别文字这一特定语义对象。在各种彩色图像中,往往可以见到各种各样的文字,这些文字一般和该图像的语义内容相关,或者提供了某种定位辅助信息。若能准确的将这些文字信息定位出来,并进行处理,使之能够被传统的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。