欢迎来到天天文库
浏览记录
ID:54017156
大小:730.12 KB
页数:7页
时间:2020-04-28
《彩色扫描文档图像中图文分割算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第16卷第4期计算机辅助设计与图形学学报Vol.16,No.42004年4月JOURNALOFCOMPUTER-AIDEDDESIGNSCOMPUTERGRAPICSApr.,2004!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!彩色扫描文档图像中图文分割算法朱庆生曾令秋(重庆大学计算机学院重庆400044)摘要针对彩色扫描文档图像的背景噪声以及文本区的纹理干扰,提出一种利用图像处理技术、结合彩色文档图像自身特点、对文档插图区域进行定位与分割的方法.首先生成一组减弱了文本区纹理信息的多尺度特
2、征缩图;然后采用基于连通度的标记分割法去掉文本区域信息,确定图像区域;最后融合多尺度缩图信息实施图文分割.实验结果表明:该方法对于提高扫描文档图像的压缩比是行之有效的.关键词多尺度缩图;像素连通度;图像分割中图法分类号TP391SegmentingImageandtextinColorDocumentImageZhu@ingshengZengLinggiu(CollegeofComPuterscience,ChonglingUnioersity,Chongling400044)AbstractAnalgorithmforsegmentingdocumentimage,t
3、akingintoconsiderationbothnoiseofbackgroundandinterferenceoftextureisproposedtoimprovethecompressionratioforscanneddocumentimage.Firstthemultiscalecharacteristicimagewithreducedtextureoftextisgenerated.Thenpictureareasindocumentareextractedbymeansofmarkedsegmentationbasedonconnectiondegr
4、eeofpixels.Atlastpictureandtextareasaredemarcatedbyfusionofdifferentscalecharacteristicimages.Experimentsshowthatthisalgorithmissimpleandeffective.Keywordsmultiscalereducedimage;connectiondegreeofpixels;imagesegmentation常为150KB左右,且可读性较差;如果用300DPI1引言进行扫描,虽然增强了可读性,但JPEG文件的大小也上升为500KB左右;即使采
5、用GIF格式将其压缩扫描文档图像的压缩在电子政务和数字图书馆成黑白页,文件的大小也在50!100KB.当前所采等领域已有广泛的应用,但目前大部分已有的图像用的文档图像压缩技术存在着两个瓶颈问题:存储压缩算法(如JPEG)都是基于图像的空间分辨率同空间大和传输速度慢;并且由于没有成熟的文档图构的假设,应用于文档图像压缩时效果不甚理想.像压缩技术,使得大量的珍贵资料不能够进行数字显然,提高压缩比有利于文档图像的存储和传输.化保存,从而延缓了数字图书馆的建设进程.目前,多数文档的数字化处理都是直接对文档进行图像分割以前主要应用于图像的分析和理解,扫描,并用JPEG或TIF等格
6、式进行存储.如果采而基于图像分割的压缩则是图像语义压缩的核心问用100DPI扫描一页纸质文档,得到的JPEG文件通题,文档图像分割随OCR技术的发展得到了较深入原稿收到日期:2003-02-21;修改稿收到日期:2003-12-15.本课题得到教育部优秀年轻教师基金(教人司[2000]11)和重庆市科技攻关项目(2000-2572)资助.朱庆生,男,1956年生,博士,教授,博士生导师,中国计算机学会常务理事,主要研究方向为多媒体数据压缩、网络数字文档图像处理、软件开发环境等.曾令秋,男,1975年生,硕士,助教,主要研究方向为数字图像处理、压缩及传输.4期朱庆生等:彩
7、色扫描文档图像中图文分割算法477的研究.目前,对含有丰富对象的灰度文档图像的域组成的彩色图像.分割算法研究已取得较好的效果,文献[1]提出一种结合二值化和边缘检测进行图像分割的方法,分割"多尺度特征缩图效果较好,但对含彩色图像的分割算法的研究目前仍处在探索阶段.流行的文档图像分割算法研究主文档图像分割算法的最终目标是将文档中插图要集中于图像的统计模型和多尺度理论,文献[2]提区域和文字区域分离,我们采用的策略既简单又有出贝叶斯分割算法,该算法集成了图像行为的统计效,即筛去特征图像的文字区域,保留插图区域.首模型和精确分割所需的纹理结构的
此文档下载收益归作者所有