图片文字提取系统的设计与实现文献综述

ID：479829

大小：44.50 KB

页数：6页

时间：2017-08-09

资源描述：

《图片文字提取系统的设计与实现文献综述》由会员上传分享，免费在线阅读，更多相关内容在行业资料-天天文库。

1、文献综述图片文字提取系统的设计与实现一、前言部分图片文字的检测与识别技术在计算机网络日益发展的今天有着大量的应用，特别是对于基于内容的图片或视频过滤、检索等应用来讲，有重要意义，它可以帮助我们了解图片内容或者视频内容[1]。图片中的文字可分为两大类：一类是图片中场景本身包含的文字，称为场景文字；另一类是图片后期制作中加入的文字，称为人工文字。一般人工文字的特点：文字位于前端，且不会被遮挡；文字一半是单色的；文字大小在一幅图片中固定，并且宽度和高度答题相同，从满足人眼视觉感受的角度来说，图片中文字的尺寸不会过大也不会过小；文字的分布比较集中；文字的排列一

2、般为水平方向或是垂直方向；多行文字之间，以及单行内各个字之间存在不同于文字区域的空隙等[2]。而场景文字的特点却与之正好相反：文字和其他自然景物混杂在一起，背景复杂；文字的颜色多种多样；文字的字体和大小复杂多变；光照的变化等[3]。在分析图像算法之前，我们先了解一下我们所要分析的BMP位图的基本知识。BMP是英文Bitmap（位图）的简写，它是Windows操作系统中的标准图像文件格式，能够被多种Windows应用程序所支持。位图文件可看成由4个部分组成：位图文件头(bitmap-fileheader)、位图信息头(bitmap-information

3、header)、彩色表(colortable)和定义位图的字节阵列。图像边缘的定义。图像的大部分信息都存在于图像的边缘中,主要表现为图像局部特征的不连续性,即图像中灰度变化比较剧烈的地方。因此,我们把边缘定义为图像中灰度发生急剧变化的区域边界。根据灰度变化的剧烈程度,通常将边缘划分为阶跃状和屋顶状两种类型。阶跃边缘两边的灰度值变化明显,而屋顶边缘位于灰度值增加与减少的交界处。那么,对阶跃边缘和屋顶边缘分别求取一阶、二阶导数就可以表示边缘点的变化。因此,对于一个阶跃边缘点,其灰度变化曲线的一阶导数在该点达到极大值,二阶导数在该点与零交叉;对于一个屋顶边缘

4、点,其灰度变化曲线的一阶导数在该点与零交叉;二阶导数在该点达到极大值[4]。图像二值化对于提取文本信息非常重要。二值化的结果好坏,直接影响着最终的处理结果。对于文本标签的提取,如果能够将图像文字区域合适二值化,就可以应用基于区域的灰度聚类方法实现文字区域的检测定位[1]。通过参考了2002－2009年间发表于《计算机应用研究》、《计算机应用》、《光学技术》、《计算机科学》、《计算机工程与设计》、《计算机工程与应用》等学术杂志中的研究论文，借鉴了天津理工大学学报、通信学报、延边大学学报(自然科学版)、电子与信息学报等大学学报文章，通过分析和总结这些文章，

5、对图片文字提取的算法有了深刻的理解。二、主题部分(一)图片提取技术的历史背景随着计算机科学的飞速发展，以图像为主的多媒体信息迅速成为重要的信息传递媒介。从图像中提取文字属于信息智能化处理的前沿课题，是当前人工智能与模式识别领域中的研究热点。文字具有高级语义特征，因此图像中的文本是图像内容的一个重要来源，如果这些文本能自动地被检测、分割、识别出来，则对图像语义的自动理解、索引和检索是非常有价值的。所以，研究图片文字提取就具有了重要的实际意义。静态图片中文本提取方面的文献不是很丰富,之前的研究更多关注文档图像的分析和处理.而对于复杂图像中的文本或者嵌入图像

6、的文本标签进行提取和分析研究刚刚引起人们的兴趣.目前提出的纹理特征主要包括有原始像素抽样[5]、局部方差[6]、梯度分布[7]、强边缘的密度及方向分布等空域统计特征，以及小波、FFT、Gabor变换系数的统计特征，如矩、直方图、共生矩阵等。通过梯度特征进行边缘检测,可以达到快速的定位效果,然而同时约束参数设置非常复杂,并且检测错误率也很高;利用纹理特征决定像素块是否属于文字,可以在复杂背景的条件下检测文字信息,但是计算非常耗时,而且文字精确定位的稳定性也不够理想;对于视频文字,可以利用相邻帧的相关性大体确定字幕位置,然而这种方法不能用来处理静态图像.另

7、外,基于支持向量机(SVM)分类器的多尺度定位算法也得到了广泛的研究,虽然其检测效果较好,但算法复杂,需事先有样本进行学习分类器的训练[8].(二)发展现状——图片文字提取算法的研究1、人工文字提取的算法(1)为了能够清楚地辨识出每个字的结构,文字在颜色上与其背景总是存在一定差异。因此,文字提取的实质就是描述文字图层与背景图层之间的差异,并以这种差异对像素进行聚类。对彩色图像在HSV颜色空间进行色彩聚类形成颜色图层,再通过投影算法将颜色图层进一步细分为子图层进行图层分析,最后通过子图层合并产生备选文字图层，能够良好地从各种复杂颜色背景中提取垂直或平行于

8、图像边缘的单色文字。具体方法：颜色聚类；子图层分割；图层分析；图层合并[9]。(2)视频文字大

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 6



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

图片文字提取系统的设计与实现文献综述

图片文字提取系统的设计与实现文献综述

相关文章

相关标签