图片文字提取系统的设计与实现开题报告

图片文字提取系统的设计与实现开题报告

ID:479767

大小:40.50 KB

页数:5页

时间:2017-08-09

图片文字提取系统的设计与实现开题报告_第1页
图片文字提取系统的设计与实现开题报告_第2页
图片文字提取系统的设计与实现开题报告_第3页
图片文字提取系统的设计与实现开题报告_第4页
图片文字提取系统的设计与实现开题报告_第5页
资源描述:

《图片文字提取系统的设计与实现开题报告》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、开题报告图片文字提取系统的设计与实现一、选题的背景、意义(一)图片提取技术的历史背景随着计算机科学的飞速发展,以图像为主的多媒体信息迅速成为重要的信息传递媒介。从图像中提取文字属于信息智能化处理的前沿课题,是当前人工智能与模式识别领域中的研究热点。文字具有高级语义特征,因此图像中的文本是图像内容的一个重要来源,如果这些文本能自动地被检测、分割、识别出来,则对图像语义的自动理解、索引和检索是非常有价值的。所以,研究图片文字提取就具有了重要的实际意义。静态图片中文本提取方面的文献不是很丰富,之前的研究更多关注文档图像的分析和处理.而对于复杂图像中的文本或者

2、嵌入图像的文本标签进行提取和分析研究刚刚引起人们的兴趣.目前提出的纹理特征主要包括有原始像素抽样、局部方差、梯度分布、强边缘的密度及方向分布等空域统计特征,以及小波、FFT、Gabor变换系数的统计特征,如矩、直方图、共生矩阵等。通过梯度特征进行边缘检测,可以达到快速的定位效果,然而同时约束参数设置非常复杂,并且检测错误率也很高;利用纹理特征决定像素块是否属于文字,可以在复杂背景的条件下检测文字信息,但是计算非常耗时,而且文字精确定位的稳定性也不够理想;对于视频文字,可以利用相邻帧的相关性大体确定字幕位置,然而这种方法不能用来处理静态图像.另外,基于支

3、持向量机(SVM)分类器的多尺度定位算法也得到了广泛的研究,虽然其检测效果较好,但算法复杂,需事先有样本进行学习分类器的训练[1].(二)发展现状——图片文字提取算法的研究1、人工文字提取的算法(1)为了能够清楚地辨识出每个字的结构,文字在颜色上与其背景总是存在一定差异。因此,文字提取的实质就是描述文字图层与背景图层之间的差异,并以这种差异对像素进行聚类。对彩色图像在HSV颜色空间进行色彩聚类形成颜色图层,再通过投影算法将颜色图层进一步细分为子图层进行图层分析,最后通过子图层合并产生备选文字图层,能够良好地从各种复杂颜色背景中提取垂直或平行于图像边缘的

4、单色文字。具体方法:颜色聚类;子图层分割;图层分析;图层合并[2]。(2)视频文字大小自适应提取算法基于离散傅里叶变换(discreteFouriertransform,DFT)特征、多分辨率处理及支持向量机分类技术。算法在不同分辨率下结合梯度信息、文字边界定位技术提取出文字候选区域,然后用支持向量机对于候选图像块DFT特征作进一步分类。具体方法:提取候选区域;分割候选区域块及文字边界定位;多分辨率融合处理;验证候选块[3]。(3)彩色图像下的文本提取方法,该方法对彩色图像在R、G、B三个颜色层分别进行亮度分级,以避开传统颜色聚类方法的聚类数目选择问题

5、,降低图像复杂度;考虑到文字笔画的显著方向性特征,并且通常具有稳定的颜色,利用方向梯度算法进行文本粗定位;然后进一步利用多类SVM分类器实现文本区域精确判别。具体方法:亮度分级;笔画检测算法;SVM精确判别[4]。(4)自动提取图像中的文本对图像视频检索具有重要意义。提出了一种基于颜色和笔画特征,应用无监督聚类方法进行复杂背景下的文本分割算法。首先在对文本进行图像增强的基础上,应用颜色约减和直方图确定文本颜色。然后提取颜色和笔画特征,应用k?均值聚类算法分割出文本和背景像素。最后应用后处理优化分割结果。具体方法:图像增强预处理;文本颜色估计;特征提取;

6、无监督聚类;基于连通成分的后处理[5]。(5)为解决渐变色给文字提取聚类算法带来的问题,研究与实现了基于二值化聚类的图像文字提取算法。图像通过一系列预处理后,得到了利于聚类的二值图像,根据背景图像区域特征,对图像进行聚类分块,再利用文字图像区域特征,聚类识别出文字区域。具体方法:预处理,包括灰度化、二值化、长线剔除;文本聚类,包括背景查找、文字分割[6]。(6)一种利用笔画线条的统计特征基于支持向量机进行图像中叠加文字检测的方法。该算法首先通过一种改进的线段检测算子提取出笔画线段;然后对笔画线条通过区域合并定位出候选文字块;接着对候选文字块提取一个反映

7、文字笔画线条空间分布特点的32维特征,并通过支持向量机建立的模型对候选文字块进行确认分类。具体方法:基于笔画线条的特征抽取;基于SVM的候选文字块分类确认;基于笔画线条粗定位候选文字块[7]。2、场景文字提取算法(1)基于边缘检测的文本提取方法对自然场景文本的提取进行研究。通过改进彩色图像边缘检测和二值边缘图像的形态学文本定位的算法,从而实现场景文本的提取。先将原始图片进行金字塔分解,然后进行图片预处理,对图像进行边缘提取和二值化,再形态学文本定位,最后文本区域字符提取[8]。(2)自然环境下文本图像背景复杂,常规阈值分割方法往往无法有效分割;基于谱聚

8、类的图像分割方法利用图分割理论可以有效地实现图像分割,但过高的计算复杂度和空间复杂度使其在处理

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。