基于最大梯度差的叠加文本定位.pdf

基于最大梯度差的叠加文本定位.pdf

ID:58312771

大小:1.04 MB

页数:4页

时间:2020-06-01

基于最大梯度差的叠加文本定位.pdf_第1页
基于最大梯度差的叠加文本定位.pdf_第2页
基于最大梯度差的叠加文本定位.pdf_第3页
基于最大梯度差的叠加文本定位.pdf_第4页
资源描述:

《基于最大梯度差的叠加文本定位.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第31卷第10期计算机应用研究Vol_31No.102014年10月ApplicationResearchofComputersOct.2014基于最大梯度差的叠加文本定位水高士林,吉立新,高超(国家数字交换系统工程技术研究中心,郑州450002)摘要:通过分析文本特征和背景,提出一种基于最大梯度差的叠加文本定位算法。首先获得横向和竖向两个方向的梯度图像,然后设定一个窗1:2扫描整个图像,分别计算窗口内的最大梯度差,得到两个方向的最大梯度差矩阵,然后分别通过自适应阈值算法找出疑似文本像素,再将两个方向的判决结果取交集,消除部分复杂背景造成的误判。接着利用数学形态学运算和先验知识剔

2、除伪文本区。最后利用改进的穿越线算法精确定位文本。实验表明,本算法不仅对横向文本具有较高的查全率和较低的虚警率,并且对竖向文本也有较好的定位效果。关键词:最大梯度差;叠加文本;文本定位;穿越线算法中图分类号:TP391.4文献标志码:A文章编号:1001-3695(2014)10—3173—04doi:10.3969/j.issn.1001—3695.2014.10.071‘GraphicstextdetectionwithmaxgradientdifferenceGAOShi—lin,JILi—xin,GAOChao(NationalDigitalSwitchingSyster

3、nEngineering&TechnologicalR&DCenter,Zhengzhou450002,China)Abstract:Thispaperproposedanalgorithmwithmaxgradientdifferencebyanalyzingthetextfeature.Itfirstlycalculatedthegradientoftwodirect,verticalandhorizonta1.Andthenitgotthemaxgradientdifferentmatrixbycalculatingthemaxgradientdifferenceinawi

4、ndow.Then,ittookanadaptivethresholdalgorithmtodeterminethetextpixels,andcalculatedtheintersec—tionoftworesultsinordertoeliminatetheinfluenceofpartofthecomplexbackground.Itconductedmathematicalmorphologyoperationandpriorknowledgetoeliminatethefalsetextarea.Finally,itusedtheimprovedacross—linea

5、lgorithmforpreciselocatingoftext.Experimentsshowthatthisalgorithmnotonlyhashigherrecallratiooftransversetext,andalsohasgoodeffectforverticaltext.Keywords:maxgradientdifference;graphicstext;textdetection;across—linealgorithm基于边缘分析的算法为了提取边缘,利用不同的边缘算子0引言对图像进行边缘提取,后对图像的不同特征进行分析,最后利用分类器定位真实文本J。Liu

6、等人在图像中提取Sobel算随着互联网的飞速发展,网络上提供的视频资源越来越子的不同方向的边缘特征,然后利用SVM将所有像素分为文多。视频数据的不断增长也带来一系列问题,比如如何在这些本和非文本。虽然这个方法对于复杂的背景有鲁棒性,但是不视频中建立索引和进行检索。为了解决这个问题,现行所采取能很好地提取对比较弱、字体较小的文本,而且由于特征集较的方法多是人工标注,而另一个方法是利用视频帧中出现的文大,它的算法运算量较大。边缘提取的算法虽然较快,但是对字进行视频自动标注。自动标注的方法明显比人工标注更快于复杂背景图像会有较高的误报率,并且这些算法较适用于提速,而且也能为视频索引提供

7、可靠的数据。视频中的文字可以取横向文本,对竖向文本的检测效果较差。分为两类:a)场景文本。在视频拍摄时,拍摄到的实际存在的基于纹理的算法’将文本看做是一种特殊纹理。这类文本;b)叠加文本。后期视频处理时人工加入的文本。尤其算法利用FFT、DCT、小波变换和Gabor过滤来实现特征提取。是视频中的叠加文本,叠加文本通常具有视频中情景的描述和Ye等人对多尺度图像提取小波能量特征,确定自适应阈值总结,对视频检索和标注更有意义。所以视频文本提取的需求来寻找候选文本像素,然后合并成候选文本

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。