资源描述:
《基于线结构分析的档案图像倾斜校正》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、计算机科学2007Vol134№11基于线结构分析的档案图像倾斜校正1,22杨有李晓虹1(北京航空航天大学计算机学院数字媒体实验室北京100083)2(重庆师范大学数学与计算机科学学院重庆400047)摘要档案数码化为政府档案资源深度利用提供了途径,数码化后的档案图像倾斜校正是数字档案质量的必然要求,也是数字图像的预处理过程。通过引入一个多尺度的高斯滤波器,可以对档案图像的全局特征进行增强,继而在增强的图像中,定义基于梯度函数的结构分析张量,提取像素点的线结构似然信息,对于大于一定阈值的线结构信息,计算
2、其倾角,最后利用倾角直方图的统计特性确定档案图像的倾斜度。实验表明,该方法对文本富裕档案具有普遍适应性。关键词档案图像,倾斜校正,线结构分析张量SlantCorrectionofDocumentImageBasedonLineStructuralAnalysis1,22YANGYouLIXiao2Hong(DigitalMediaLaboratory,ComputerCollegeofBeihangUniversity,Peking100083)1(CollegeofMathematicsandComp
3、uterScience,ChongqingNormalUniversity,Chongqing400047)2AbstractDocumentdigitalizingprovidesamethodtoutilizethearchivalresourcesofgovernmentcomprehensively.Slantcorrectionofdigitalizeddocumentisnecessaryforthequalityofdigitalimage,andit’sapreprocessingofa
4、nyoth2erprocedure.ByaGaussianfilterofmulti2scale,theglobalstructureoftheoriginaldocumentimagewasenhanced.Basedongradientsofenhancedimage,astructuralanalysistensorisalsodefinedforthedetectionoflinestructureattheeachpixel.Fortheline2likenessvalueateverypix
5、el,whichisgreaterthanagivennumber,thecorrespondingangleiscalculated.Fromthehistogramoftheseangles,documentskewcanbedetermined.Ourexperimentsshowthattheproposedmethodisadaptivetovariousdocumentswithrichtext.KeywordsDocumentimage,Slantcorrection,Linestruct
6、uralanalysistensor的不足和改进的方向。1概述2线结构分析自1960年,光电文字识别OCR(OpticalCharacterRec2ognition)开始用于档案图像的处理,就开启了计算机在档案2.1多尺度图像滤波图像数码化方面应用的先河。目前,伴随Internet技术的发高斯滤波器是忽视图像局部细微结构、增强全局结构的[4]展,诸如工商企业档案、国土房产档案等大量政府资源档案均常用方法。对于文本型的档案图像,单个文字是局部结构,以数字图像方式实现共享和检索,极大地改变了传统的政府而文字
7、串就构成全局结构。适当方差的高斯滤波后,可以使办公模式,树立了良好的政府形象。图像中由文字串构成的线结构得以显现。设原始倾斜图像为2档案数码化就是将纸质档案(含照片)资料通过扫描、f(x,y),通过方差为t=σ的高斯滤波器进行滤波(也称扩散OCR识别、排序标引转化为基于文字和图像信息的数字档或模糊),其计算公式为:案,并备份到光盘或磁盘设备中,用于长期保存。由于数码化u(x,y,tk)=f(x,y)3Gt(1)k过程中人为操作和数码化设备的差异均可能使数码化后的档其中案图像出现倾斜,图像纠偏是图像处理的
8、第一步。1(x2+y2)Gt=exp-档案图像倾斜校正主要有四种方法[1]:投影、特征点分k2πtk2tk布、Hough变换和方向敏感特征统计。方向敏感特征统计方u(x,y,tk)代表扩散后的图像,k=1,2,⋯,n对应着n个尺度法首先从图像中提取方向敏感局部特征,并计算局部特征的tk,符号“3”表示卷积运算。倾角,再对倾角进行统计表决,最后得到档案图像的倾斜度。通过对尺度tk的控制,可以得到具有理想线结构信息的[2][3]图像。如图1所示