自然场景文本信息提取关键技术研究

自然场景文本信息提取关键技术研究

ID:33856267

大小:4.62 MB

页数:126页

时间:2019-03-01

自然场景文本信息提取关键技术研究_第1页
自然场景文本信息提取关键技术研究_第2页
自然场景文本信息提取关键技术研究_第3页
自然场景文本信息提取关键技术研究_第4页
自然场景文本信息提取关键技术研究_第5页
资源描述:

《自然场景文本信息提取关键技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、代号10701学号0808310010分类号TP391密级公开题(中、英文)目自然场景文本信息提取关键技术研究ResearchonKeyTechnologiesofNaturalSceneTextExtraction作者姓名刘晓佩指导教师姓名、职务卢朝阳教授学科门类工学学科、专业通信与信息系统提交论文日期2014年4月万方数据万方数据西安电子科技大学学位论文独创性(或创新性)声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标

2、注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切的法律责任。本人签名:日期:西安电子科技大学关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可

3、以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。(保密的论文在解密后遵守此规定)本学位论文属于保密,在年解密后适用本授权书。本人签名:导师签名:日期:日期:万方数据万方数据摘要图像中的文字信息作为场景内容的一部分,往往为人们或计算机理解场景提供了直接而关键的线索。比如路牌、商店招牌、交通提示牌和各种建筑物上的文字信息,这些文字信息都具有明确的含义,是场景信息的重要表现形式。因此,自动提取场景中的文本信息可

4、广泛应用于各种需要对场景中的文本进行分析和理解的场合,如视频和图像检索系统,涉外导游自动翻译、盲人引路、机器人行走和智能监控系统等。该课题目前已成为计算机视觉和文档分析领域的研究热点之一。本文对自然场景文本信息提取的关键技术进行了深入的研究,论文取得了以下主要研究成果:1.从频域出发,提出了一种将纹理分析和模板匹配验证策略相结合的复杂文本定位方法。考虑到具有一定宽度和方向的文字笔画可视为一种带通信号,而小波变换在捕捉这种带通信号方面具有较大的优势。首先将输入图像进行小波变换,提取每个像素局部区域的纹理统计特征,采

5、用蚁群聚类算法进行聚类分析,并结合基于密度的区域生长算法得到文本候选区域;然后提取候选文本块的LBP-HF特征,利用模板匹配的方式进行文本和非文本的确认,最后得到文本区域的位置。2.针对复杂场景中文本和非文本难以有效区分的问题,将小波变换和多尺度LBP算子相结合,提出了一种能够有效表达文本模式的WTLBP特征。在此基础上,提出了一种基于WTLBP特征和支持向量机(SupportVectorMachine,SVM)的复杂场景文本定位方法。算法首先根据中文文字的结构及笔画方向特点,设计合适的边缘检测算子提取文字的笔画

6、边缘,进行形态学滤波后形成备选文本区域集合;然后提取候选文字区域的WTLBP特征,结合SVM分类器实现文本区域的确认。3.针对文本验证时仅考虑其区域特征而忽视文本区域的空间位置关系的问题,提出了一种基于多特征和图割模型的场景文本验证方法。算法首先分析了候选文本连通区域的空间关系及其在候选文本区域验证中的作用;然后根据文本区域的空间关系,建立候选文本区域的邻域连接图。在此基础上,将候选文本区域映射为一个有权无向图,以组合优化的方式将候选文字区域标记为文本或背景。实验结果验证了算法的有效性。4.针对复杂场景文本难以有

7、效分割的问题,提出了一种基于扩展马尔可夫随机场(MarkovRandomField,MRF)模型的场景文本分割方法。首先分析了经典MRF模型的优势和不足,提出了一种扩展的MRF模型。其次,在分析场景文本特点的基础上,提取文本的颜色和最大梯度差(MaximumGradientDifference,MGD)特征,将文本的上下文信息与多特征统一在同一概率框架下,利用图割算万方数据法对所建立的模型进行推断。最后在两种数据库上,对算法的性能进行了测试比较,结果表明了所提出的模型适合处理复杂情况下的文本分割问题。5.针对复杂

8、场景文本的多样性,提出了一种基于局部颜色一致性和图割模型的复杂场景文本分割方法。算法首先利用文字笔画颜色一致性特点,采用SLIC算法将输入图像分割为若干局部同质区域,将局部区域代替像素点构建图模型;其次,根据文字笔画的双边缘特点,自动提取文字和背景种子点;提出采用两种模型构建文本和背景模型,并引入模型性能描述因子自适应学习模型参数。实验结果表明了算法在复杂场景文本方面的有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。