欢迎来到天天文库
浏览记录
ID:58211887
大小:282.92 KB
页数:7页
时间:2020-04-27
《票据图像预处理方法的研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第22卷第10期计算机仿真2005年10月文章编号:1006-9348(2005)10-0208-04票据图像预处理方法的研究张丘,马利庄,高岩,陈志华(上海交通大学计算机系数字媒体与数据重建实验室,上海200030)摘要:在文档影像的自动处理中,去黑边和倾斜校正是影像预处理的首要环节。该文提出了变黑边模板的概念和基于区域填充的黑边去除算法。对于图像的倾斜校正,我们提出了基于方向投影的表格线检测方法,并由此实现图像的自动分类;对不含表格线的图像,文中将字符包围盒中心作为特征点,采用Hough变换的算法进行倾斜检测。另外,倾斜检测时还采用金字
2、塔模型降低图像分辨率,进一步提高了算法速度。实验表明,该文的方法能够有效地去除图像黑边,快速准确地检测出图像的倾斜角,并具有很强的抗干扰性和应用适应性。关键词:黑边;倾斜校正;方向投影;包围盒;霍夫变换中图分类号:TP391文献标识码:BStudyonBillImagePreprocessingMethodZHANGOiu,MALi-zhuang,GAOYan,CHENZhi-hua(LabofDigitaiMediaandDataReconstruction,ShanghaiJiaotongUniversity,Shanghai20003
3、0,China)ABSTRACT:Inautomaticdocumentimageprocessing,biackmarginremovaiandskewcorrectionaretwoprincipaisteps.Weintroducetheconceptofadaptabiemaskonjudginganoisepointandpresentamethodbasedonregionfiiiingtoremovethebiackmargineffectiveiy.Asforskewcorrection,thispaperintroduce
4、sanewform-iinedetectionmethodbasedondirectionaiprojection.Ifanimagehasnoform-iine,weuseHoughtransformtocomputeitssiant,takingcentersoftheboundingboxesofsomecharactersastheeigen-points.Additionaiiy,wegetiowresoiutionimagebypyramidprocessingtopromotetheaigorithmspeedofskewde
5、tection.Experimentsshowthatourmethodscanreducebiackmarginnoiseweiiandcandetectthesiantingangieofanimagerapidiyandaccurateiy,andaisohavehighnoiseenduranceandappiicationadaptabiiity.KEYWORDS:Biackmargin;Skewcorrection;Directionaiprojection;Boundingbox;Houghtransform文提出了变黑边模板
6、的概念和基于区域填充的方法,不仅能1引言够有效地去除延伸到图像内部的黑边、黑块,还可以较好地近年来,文档影像的自动理解以及缩微存储日益成为人避免黑边粘连字符、粗体题头、模糊印章等有用信息的误删们研究的热点。在银行、财税、证券等行业,金融票据的电子除。影像系统已经出现,这些系统通常以票据的扫描图像作为输影像材料一般包含表格线、成段文字(汉字、字母、和数入。在扫描输入的过程中,由于摆放不当、纸张折叠及其他各字符号),或两者兼而有之。对于包含表格线的图像,倾斜检种因素,图像边缘可能会出现不规则的黑边和黑块(如图测的方法主要有两种:跟踪表格线方法和
7、基于Hough变换的[1]1);同时,扫描图像或多或少也会出现某种程度的倾斜。这对方法,这两种方法都有各自的适用范围和局限性。对纯文下一步的版面分析造成很大困难,因此,去黑边和倾斜校正本图像,文[2]把连通区包围盒底边中心作为特征点,提出是影像预处理的首要环节。了基于直线连续性的倾斜检测方法,而对字符大小不一的情现有的去黑边方法通常在图像边缘设置黑边搜索区域,况,把底边中心作为特征点并非理想的选择。对超出搜索区域延伸到图像内部的黑边一般不能够去除。本由于大部分票据图像都含有表格线,我们提出了基于方向投影的表格线检测方法,并根据检测结果实现图
8、像的自动分类。若含有表格线,检测到的线条方向就是图像的倾斜方收稿日期:2004-07-27向;否则,把一定数量的字符包围盒中心作为特征点,采用—208—~ough变换的方法检测倾
此文档下载收益归作者所有