资源描述:
《基于改进Hough变换的文本图像倾斜校正方法_周冠玮》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第27卷第7期计算机应用Vo.l27No.72007年7月ComputerApplicationsJuly2007文章编号:1001-9081(2007)07-1813-04基于改进Hough变换的文本图像倾斜校正方法周冠玮,平西建,程娟(信息工程大学信息工程学院,郑州450002)(zgw_tex@tyahoo.com.cn)摘要:文本图像在扫描输入时产生的倾斜现象会对后续的页面分割及光学字符识别(OCR)处理产生很大的影响,而传统的标准Hough变换虽然具有对噪声不敏感,不依赖于直线连续性的优点,但由于计算量偏
2、大,速度慢,在实用时有较大的局限性。提出一种基于改进的Hough变换的文本图像倾斜校正方法,通过在变分辨率图像中采用不同的文本方向提取算法,及选择合理投票门限等改进Hough变换的措施,减小了由图像区域及文字笔画粗细所产生的对倾角判定的不利影响,并使用基于偏移值的方法实现页面倾斜的快速校正。实验结果表明,该算法实现了大范围高精度的文本图像倾角的快速检测,具有较强的实用性。关键词:文本图像;Hough变换;数学形态学;游程平滑;变分辨率图像中图分类号:TP391.41文献标志码:ASkewdetectionandco
3、rrectionmethodofdocumentimagesbasedonimprovedHoughtransformZHOUGuan-we,iPINGX-ijian,CHENGJuan(CollegeofInformationEngineering,InformationEngineeringUniversity,ZhengzhouHenan450002,China)Abstract:Theskewofdocumentimagesoriginatedfromscanningwillbringmuchtrouble
4、topagesegmentationandopticalcharacterrecognition(OCR).AlthoughtraditionalstandardHoughtransformisinsensitivetonoiseanddiscontinuous,ithaslimitationinapplicationbecauseofhugecalculation.AskewdetectionandcorrectionofdocumentimagesbasedonimprovedHoughtransformwas
5、presented.Text-linedirectionextractioninmult-iresolutionimageandreasonablevotingthresholdselectionwereintroducedtoreducetheaffectbroughtbyimageskew.Experimentalresultsshowthatthismethodiseffectiveandaccurateinskewdetectionandcorrectionofdocumentimages.Keywords
6、:documentimage;Houghtransform;morphology;run-lengthsmoothing;mult-iresolutionimage方向并统计生成直方图,直方图的峰值对应于整个页面的倾0引言角。由于在文本图像中连通成分较多,该算法较为费时。W随着数字化技术的发展,/无纸化0已经成为办公自动化[3]Pstl等人采用的Fourier变换法,以Fourier空间密度最大的的显著特点。将纸质文件扫描或拍摄转换为文本图像,不仅方向对应于倾斜方向。虽然该方法倾斜校正的精确度较高,能够保持原文件的
7、书写特征,而且可以使用JPEG、TIFF等图但由于计算的时间长,空间复杂度很高,实际中使用较少。基像编码格式表示,易于存储建档并在互联网中传输。文本图于文本区域同一行像素相关统计特性的交叉相关法,计算固像在存储后可以运用信息处理技术提取感兴趣的信息,因此定距离间竖直扫描线上像素点的分布,生成相关矩阵,实现倾在各类信息系统中得到了广泛应用。然而在将纸质文件转换斜校正。此类方法的缺点是计算量较大。M.Chen等提出的[4]为文本图像的过程中,由于机械操作和人为的原因,不可避免改进算法解决了文字行的主方向变化和文档中包含
8、图表地会造成文本图像的倾斜,这种倾斜显然将对文本图像的分的问题,准确度较高,但精度较低。析,如页面分割、版面分析和理解及光学字符识别(Optical本文根据文本图像的特点,提出了一种基于改进Hough变CharacterRecognition,OCR)处理等产生不利的影响。因此,换的倾斜校正方法,针对变分辨率图像数据量的差异性,采用了文本图像倾斜角度的检测和