图像文本定位技术研究

图像文本定位技术研究

ID:44063651

大小:39.05 KB

页数:4页

时间:2019-10-18

图像文本定位技术研究_第1页
图像文本定位技术研究_第2页
图像文本定位技术研究_第3页
图像文本定位技术研究_第4页
资源描述:

《图像文本定位技术研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、摘要:图像文本定位是图像中文本识别的关键步骤。介绍了文本图像的分类及特征,分析了图像文木定位常川算法的应川范围及优缺点,提出了文木定位算法的评价方法,阐述了文本定位的应用领域,并对今后文本定位的研究方向进行了分析。中国论文网关键词:图像文本定位;图像文本识别;图像检索中图分类号:TP391文献标识码:A文章编号:1007-9599(2013)01-0016-03图像中的文木通常描述了图像的有效信息,如路牌、字幕、商店招牌等。如杲将图片中的文木自动地识别出来,对图像高层语义的自动理解、索引和检索是非常有价值

2、的。大多数图像中的文本具有相对明显的特征,对通过计算机图像处理技术进行文本定位和分离,再通过较为成熟的文字识别技术,就能将图像中的文本提取出来。图像文本识别已成为数值图像处理领域的研究热点。图像文本的识別主要包括以下部分:(1)获取图像;(2)对获取图像进行预处理;(3)检测图像屮包含文木的矩形区域,进行文木定位;(4)将文本从图像屮分离出来,并通过光学字符识别系统(OCR)进行文木识别;(5)保存识别结果。其中第3步图像文木定位是最为关键的步骤,成为研究的重点和难点。1图像中文本的分类及特征1.1图像中

3、文本的分类图像中的文本分为人工文本(ArtificialText)和场景文本(NaturalSceneText)«AE文木是指使用图像处理工具对获取的原始图像进行后期编辑,人为加在图像上的文木,如新闻视频中的字幕。场景文本是指在图像获取时就存在于场景中的文本,随场景一同牛成到图像中,其本身是场景的一部分,如广告牌,路标,海报等。人工文本多为视频的字幕或图片的文字说明,为了方便人们阅读,人工文本与背呆的对比度较强,文字颜色一致,排列整齐,文木内容与图片内容的相关性强。场景文木的规律性较差,文字的方向、大小、

4、字体没有限制,颜色变化鮫大,文本与背景的对比度跟环境有很人的关系。由于获取图像时的投影变换关系,图像屮的文字可能会发生旋转、缩放等变形,加上拍摄角度,光照等因素的影响,其定位难度较人工文本大。1.2图像中文本的特征(1)文木的颜色特征。大多数情况下,同一区域中同一行文字,其颜色、色调、亮度等属性相同或相似,与图片背景有较人的对比度。人工文本尤其如此。但也有不一致的情况,如颜色渐变的艺术字,广告中的文字等。(2)字符的大小。同一行文字,字符大小基本-•致。但同一•图像中的文字大小,可能差别很大,大的可能占到

5、图像而积的80%以上,而小的则只有儿个像素。山于A小的字符,识别率不高,像索低于10的字符通常被删除。(3)字符的边缘。由于字符与图像背景间具有一定的对比度,因而字符与背景间都有较突出的边缘,这为通过边缘检测进行文本定位提供了依据。边缘包含边缘强度和边缘方向两个要素。不同的文字,边缘的方向不同,如英文和汉字的边缘方向集中在水平、垂直和45°方向,而拉丁文的边缘方向集中在垂直方向。(4)其他特征。同一行文字中,字符的间距相等。字符的宽和高在一定的比例范围内。文木区域具有高填充率、髙频率等纹理特征。2图像文木

6、定位的主要方法2.1基于文本边缘的方法为方便阅读,文本与图像背景存在较大的対比度,从而在文本与背呆间形成较强的边缘。文本边缘具有边缘强度和边缘密度两个特征。对于简单背景的图片,边缘密度特征明显;对于复杂背景的图片,边缘强度特征明显。基于边缘的文木定位主要步骤包括:(1)检测图像的边缘密度和强度;(2)通过平滑滤波、形态学膨胀、区域合并等方法检测到可能包含文本的矩形区域,形成候选文木区域;(3)根据文木的一些启发性规则(如字符的宽高比,边缘密度,边缘方向,填充率等)去除非文本块,获得最终的检测结果。基于边缘

7、的文本定位方法,优点是速度较快,对于文本边缘较突出,图像背景边缘较少,背景边缘与文本边缘的交叉连接不多的图片,其定位准确率高,误判率低。但对于背景边缘比较复杂、噪声较大的图片,文木定位的结果不理想,需要与其他方法结合起来,进行文木的定位。2.2基于连通区域的方法基于连通区域的方法主耍利用同一区域文本颜色相近、边缘密度高等特性。采用口底向上的方式,使用颜色聚类、阈值、区域牛长等方法把图像分成一些小的区域,然后根据一定的规则,将这些小的区域连接成大的区域,形成候选文本区域集合。再利川区域大小、宽高比、占用率、

8、边缘强度等启发性规则來滤除非文本区域,获得真止的文本区域。基于连通区域方法的优点是实现比较简单,对于文木和背景比较单一的图像,该方法的准确率高。其缺点是对于文木颜色丰富,分辨率低,噪声高的图像,定位准确性差,甚至将—•个字符分成儿个文本块。另外,在滤除非文本区域时,用到的各种阈值(如宽高比,占用率)依赖于经验或实验,还没有一个确定这些阈值的通用方法,造成文本定位的精确性与图片数据库有很大的关系,算法的通用性受到一定的限制。2.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。