彩色图像文本提取算法研究毕业论文

ID：281460

大小：2.10 MB

页数：36页

时间：2017-07-18

资源描述：

《彩色图像文本提取算法研究毕业论文》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、1绪论随着互联网和多媒体技术的快速发展，世界进入了一个崭新的信息化时代。以图像、动画、视频为主要元素的各种多媒体信息构成了信息传播的主力。最近几年以来随着既有拍照功能的便携式电子设备，比如智能手机，平板电脑等，随着技术的不断更新升级，人们急需一种方便的应用程序来提取处理图像中内嵌的文本信息。这都使得彩色图像下的文本的提取成为一个很有意义的研究课题。彩色图像中的文本提取即为彩色图像中文本定位，是很困难的问题。由于其广泛的应用领域越来越受到人们的重视。因此，将图像中的文本提取出来将便于不停国家，不同文化之间的交流。1.1研究意义和背景随着计算机技术、多媒体技术和通讯技术的发展，以

2、图像、声音和视频为主的多媒体信息的应用越来越广泛，图像中的文本信息对检索和浏览有十分重要的意义。在彩色图像中，文本信息包含了丰富的高层语义信息[1]。文本可以作为图像的内容标识和索引，是图像内容重要程度的判断依据，例如出现醒目文字的帧，可以抽取出来作为对应的图像的代表帧。如果这些文字信息能自动准确的被检测、分割、识别出来，则对图像高层语义的自动理解、索引和检索是非常有价值的。随着技术的不断发展，人们对彩色图像中文字提取进行了广泛的研究，并已有许多成熟的技术应用在各个领域，如交通管理中的汽车牌照识别和港口货物管理的集装箱编码识别等。但自然场景中的文本分割依然面临着许多复杂的问题

3、，主要原因是：(1)文字和其他自然景物混杂在一起，如树、窗户和房屋建筑等，背景复杂；(2)文字的颜色多种多样；(3)文字的字体和大小复杂多变；(4)光照的变化等。因此从自然场景图像中提取文本是一项极具挑战性的工作。目前已有的文本区域提取方法大致可以分为四类:(1)基于边缘的方法(2)基于纹理的方法(3)基于连通域的方法(4)基于学习的方法。第36页共36页在各种自然彩色图像中，往往可以见到各种各样的文字，这些文字一般和该图像的语义内容相关，或者提供了某种定位辅助信息。若能准确的将这些文字信息定位出来，并进行处理，使之能够被传统的OCR软件识别并被转化成为机器内码，结合自然语言

4、处理，文本检索，文本翻译，语音合成等技术可以被应用到各种领域实现。1.2课题发展现状针对图像、视频文本检测和提取的研究，主要有以下算法：RainerLienhart[2]利用文字颜色的单一性、文本区域的大小约束、同一文本会在连续几个视频帧出现等特点，对文本进行检测和定位。首先对视频帧使用分裂—合并算法，将视频帧分解成颜色一致的连通元（connectedcomponent）。然后通过匹配算法，对连通元进行多帧跟踪，去除那些没有连续多帧出现的连通元。最后通过对比度的分析，形状分析等去除非文本的连通元。该算法要对每一个视频帧进行分裂合并算法，而且视频中生成的连通元绝大部分都不会是文

5、本，因此算法复杂度太高，系统效率低。Boon-LockYeo[3]提出利用场景变化来检测视频文本的出现和消失。算法对相邻两个视频帧取差值，在差值图像中寻找高亮区域。这种算法只能提取高亮的视频字幕，而不能提取非高亮度的字幕，而且也会受到较亮的物体的干扰。Byung[4]提出用字符的拓扑结构特征来提取字符文本区域，然后对视频字幕区域进行复原。该算法是基于单个视频帧图像的字幕提取，效果并不明显。MarcoBertin{5]利用角点特征来进行的视频字幕检测。这种算法实质上类似于基于灰度边缘的算法等。王辰等[6]等通过灰度边缘检测来定位文本区域。首先提取视频帧的灰度边缘，然后合并相邻的

6、边缘，生成候选文本区域，最后用一些启发式规则来去除虚假的文本区域。该算法不能提取灰度值和背景接近的文本。王勇等[7]提出一种基于边缘点密度的视频字幕自适应检测算法。采用基于边缘检测的方法，结合文字图像区域本身的特点，在对原图像进行边缘检测和形态学膨胀后，对其在水平和垂直方向的边缘密度投影采用一种自适应的检测算法，从而检测得到字幕图像区域。该算法的优点是可以检测出各种字体大小的文本行。但是算法不能提取灰度值和背景接近的文本。第36页共36页郭丽等[8]提出一种基于颜色边缘点和游程平滑的视频文本提取算法。黄晓东等[15]综合应用小波变换和颜色聚类技术来提取视频帧中的字幕区域。首先

7、，通过小波变换计算视频中的局部能力特征，能量高的区域作为候选字幕区域。然后利用字幕颜色一致的特征，进行邻域颜色聚类算法，从背景中分离出字幕。最后利用字幕属性特征消除噪声。但是该算法容易受到颜色一致的物体的干扰。处理图像的时间较长。1.3本文主要研究方向课题的主要目标就是在彩色图像下提取文本信息，二值化分割进而识别文字这一特定语义对象。在各种彩色图像中，往往可以见到各种各样的文字，这些文字一般和该图像的语义内容相关，或者提供了某种定位辅助信息。若能准确的将这些文字信息定位出来，并进行处理，使之能够被传统的

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 36



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

彩色图像文本提取算法研究毕业论文

彩色图像文本提取算法研究毕业论文

相关文章

相关标签

彩色图像文本提取算法研究 毕业论文

彩色图像文本提取算法研究 毕业论文

相关文章

相关标签

彩色图像文本提取算法研究毕业论文

彩色图像文本提取算法研究毕业论文