文本图像版面分析关键技术研究

文本图像版面分析关键技术研究

ID:35184015

大小:6.70 MB

页数:67页

时间:2019-03-21

文本图像版面分析关键技术研究_第1页
文本图像版面分析关键技术研究_第2页
文本图像版面分析关键技术研究_第3页
文本图像版面分析关键技术研究_第4页
文本图像版面分析关键技术研究_第5页
资源描述:

《文本图像版面分析关键技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文题目:文本图像版面分析关键技术研究研究生魏传义专业计算机应用技术指导教师陈勤教授完成日期2016年3月杭州电子科技大学硕士学位论文文本图像版面分析关键技术研究研究生:魏传义指导教师:陈勤教授2016年3月DissertationSubmittedtoHangzhouDianziUniversityfortheDegreeofMasterTheKeyTechnologyResearchofDocumentImageLayoutAnalysisCandidate:WeiChuanyiSupervisor:Prof.ChenQinMa

2、rch,2016杭州电子科技大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中己经注明引用的内容外,本论文不含任何其他个人或集体己经发表或撰写过的作品或成果。对本文的研巧做出重要贡献的个人和集体,均已在文中^^^明确方式标明。一切相关责任申请学位论文与资料若有不实之处,本人承担。论文作者签名:cX日期:年J月f曰学位论文使用授权说明本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,目P:研究生在校攻读

3、学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为杭州电子科技大学,。学校有权保留送交论文的复印件允许查阅和借阅论文可公布论文;学校的全部或部分内容、。(保密,可允许采用影印缩印或其它复制手段保存论文论文在解密后遵守此规定)论文作者签名:姜义日期年3月庐日指导教师签名:日期:心!6年3月^日杭州电子科技大学硕士学位论文摘要随着信息科技、网络技术和通信技术的迅速发展,电子文档是如今信息传播和分享的主要载体。信息的不断膨胀对电子文档的存储产生巨大压力,因

4、此需要对这些信息进行分层压缩。分层是把文本图像分离成前景层和背景层,然后采用不同的压缩编码技术,而文本图像的版面分析是分层过程中非常重要的一个环节,版面分析包括版面分割和区域识别。在文本图像摄取和采集的过程中,容易产生图像倾斜和多余的边缘信息,需要先进行倾斜校正和边缘剪裁,然后再进行版面分析。对于倾斜的文本图像,需要先进行倾斜校正,通常采用Hough变换的检测方法,但是该方法的计算量大。本文提出一种改进的Hough检测方法。首先对图像进行缩放重采样,减少待计算像素点个数,同时对Hough变换中正余弦值进行预存储,减少计算时间。然后使用二次H

5、ough检测,缩小检测范围并减小角度增量,不仅可以减少计算量,还能保证检测精度。实验结果表明,该方法相对于标准的Hough检测方法,平均计算效率可以提高20倍左右。对纸质文档进行拍照时,容易拍到多余的边缘信息,需要去除这些信息。首先,本文给出一种基于投影的边缘剪裁方法。该方法对多个方向进行分段投影,统计边缘信息并确定边界位置,但是对于边缘信息较复杂的情况适应性弱。因此,提出一种基于轮廓的边缘剪裁方法。首先对不同区域进行轮廓提取并计算出外接矩形,去除部分边缘信息,然后设置一个判定策略确定边界位置。实验结果表明,该方法对于边缘信息混乱、无规则的

6、情况适应性较强。版面分割是版面分析中非常重要的一步,首先将文本图像划分为多个子区域,然后进行区域识别。考虑自顶向下方法的效率优势,本文提出一种分列投影的版面分割算法。首先将文本图像划分为N列,然后对每一列进行水平和垂直方向投影,通过多次投影将文本信息划分为多个子区域。实验结果表明,该方法继承了投影法本身计算速度快的特点,同时还可以避免图像弧度对版面分割的影响,并且对排版较复杂的文本图像也有很好的适应性。关键词:文本图像、倾斜检测、边缘剪裁、版面分割、分列投影I杭州电子科技大学硕士学位论文ABSTRACTWiththerapiddevelop

7、mentofinformationtechnology,networktechnologyandcommunicationtechnology,electronicdocumentisthemaincarrierofinformationdisseminationandsharing.Thecontinuousexpansionofinformationgeneratedtremendouspressureonthestorageofelectronicdocuments,hencetheneedfortheseinformationlay

8、eredcompression.Stratificationistheseparationoftextimagesintoforegroundandbackgroundlayer

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。