欢迎来到天天文库
浏览记录
ID:38277338
大小:381.13 KB
页数:3页
时间:2019-05-25
《基于多尺度条件随机场的文本图像二值化》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、《现代图书情报技术》版权所有,欢迎下载引用!请注明引用地址:基于多尺度条件随机场的文本图像二值化[J],现代图书情报技术,2009(4):79-81.总第177期2009年第4期基于多尺度条件随机场的文本图像二值化刘坤吕学强王涛施水才(北京信息科技大学中文信息处理研究中心北京100101)(北京拓尔思信息技术股份有限公司北京100101)【摘要】提出一种基于多尺度条件随机场(简称mCRF)的图像二值化算法。该算法将对图像的二值化看作一个标注过程,利用mCRF模型对图像中每个像素点进行标记,从而实现对整幅图像的二值化。mCRF模型属于判别式模型,可以容纳任意的非独立特征,从而充分利用图
2、像本身信息。实验结果表明,本算法比常用的阈值法效果有很大提高。【关键词】文本图像二值化多尺度条件随机场特征函数【分类号】TP391BinarizationofDocumentImageBasedonMulti-scaleConditionalRandomFieldsLiuKunLvXueqiangWangTaoShiShuicai(ChineseInformationProcessingResearchCenter,BeijingInformationScience&TechnologyUniversity,Beijing100101,China)(BeijingTRSInformati
3、onTechnologyCo.Ltd.,Beijing100101,China)【Abstract】Thispaperproposesanewalgorithmbasedonmulti-scaleconditionalrandomfields.Thisalgorithmtreatsthebinarizationasataggingprocess,usingmCRFtolabeleverypixelintheimage,soastorealizethebinarizationofthefullimage.MCRFofdiscriminatemodelcanaccommodateanyoft
4、henon-independentfeatures,whichmakesfulluseofinformationintheimage.Fromtheresultcanseethisalgorithmisbetterthancommonthresholdmethodineffect.【Keywords】DocumentimageBinarizationmCRFFeaturefunction1引言光学字符识别(OCR)技术在众多领域得到广泛应用,例如视频字幕的识别、智能交通系统中的车牌识别、信封字符的识别等。对字符图像进行二值化是绝大多数字符识别系统所必需的过程,近年来OCR工作者对此进行了
5、大量研究。目前二值化问题主要是靠设定全局阈值和局部阈值的方法解决,如文献[1]。然而,仅仅孤立的利用像素值大小来进行二值化效果并不理想,而且文字图像本身的大量信息也没有被很好的利用。鉴于此,本文利[2]用在图像分割方面已有很好应用的多尺度条件随机场(mCRF)来解决图像二值化问题。2多尺度条件随机场(mCRF)[4]条件随机场是一种无向图模型,用于在输入观察序列时计算标注序列的条件概率。对于一幅大小为M×N收稿日期:2008-11-21收修改稿日期:2009-02-24本文系863计划重点项目“跨媒体搜索关键技术研究及服务产品开发”(项目编号:2006AA010105)、北京市属高等学
6、校人才强教计划项目“创新团队-智能搜索引擎和文本挖掘”(项目编号:PXM2007_014224_044677)和国家自然科学基金项目“基于语义分析和统计的自动主题标引研究”(项目编号:60872133)的研究成果之一。XIANDAITUSHUQINGBAOJISHU79应用实践的图像,观察序列O={o,o,…o}表示图像的像素w,…w}为模型中待定的参数。12M×N1J观察值序列,标注序列S={s,s,…s}表示像素二12M×N3参数估计值化标签序列,即对于图像中任意o(t=1,2,…M×ttttN,ot∈[0,255]),均有st∈{0,1}表示该点像素值二值设训练集为D={(S,O)
7、,t=1,2,…N},其中Ot化后的结果。和S分别为第t幅文本图像的原始图像和二值化结果2.1局部条件随机场图像,笔者利用最大似然估计法来估计模型参数,求取对于某个特定的二维观察序列O,标签序列S的能够最大化训练集中结果图像的条件概率的对数和的条件概率可以利用GIBBS分布与CRF在联合概率意θ,即:[3]θ=argmax∑logP(St|Ot,θ)(6)义上的等价性上来获得。令C(O,S)为图中最大全θt连同环的集合,在每个环
此文档下载收益归作者所有