视频检索在汉字识别中的应用研究new

视频检索在汉字识别中的应用研究new

ID:34649656

大小:344.34 KB

页数:4页

时间:2019-03-08

视频检索在汉字识别中的应用研究new_第1页
视频检索在汉字识别中的应用研究new_第2页
视频检索在汉字识别中的应用研究new_第3页
视频检索在汉字识别中的应用研究new_第4页
资源描述:

《视频检索在汉字识别中的应用研究new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第。2O卷.第lQ期计算机技术与发展V01.20N。.102010年l0月COMPUTERTECHNOLOGYANDDEVELOPMENTOct.2010视频检索在汉字识别中的应用研究桂丹萍,陈佳祥,何红生(集美大学,福建厦门361021)摘要:传统的OCR技术在汉字识别领域趋于成熟,对背景清晰的正体汉字有很高的识别正确率,然而当汉字图片在复杂背景中或经旋转、加噪处理后,OCR软件的识别正确率大大下降。当今有关视频检索的研究正在快速发展中,其中一种行之有效的方法是通过提取模板视频的关键帧及其特征向量,应用

2、聚类算法形成关键字,并通过快速的检索算法来实现匹配。创新性地将该模型应用到汉字识别研究中,通过大量实验数据的研究发现,该模型在上述情况中相对于传统的OCR技术优势明显,在未来实际应用中具有广阔的前景。关键词:汉字识别;视频检索模型;SIFT特征;K^便ANS;TFIDF中图分类号:TP391.43文献标识码:A文章编号:1673—629X(2010)10—0207—04ApplicationResearchofVideoRetrievalModelonChineseCharacterRecognition

3、GUIDan—ping,CHENJia-xiang,HEHong—sheng(JimeiUniversity,Xiamen361021,China)Abstract:TraditionalOCRhasachievedadegreeofmaturityinthefieldofChinesecharacterrecognition。whichobtainsahighrecognitionaccuracyonChinesecharacterwithacleanhacl~roundandnorotation.Ho

4、wever,whenimagesarepreprocessedinacomplexbackgroundwithlowqualitylikeaffinetransformandadditionofnoise.itsrecognitionaccuracydeclinedsignificantly.Thecurrentresearchonvideo~tfievalisgrowingrapidly.wherealeffectivemethodistoextractkeyframesfromthevideotemp

5、lateandtheirf~turevectO~,applyclusteringalgorithmtoformkeywords,andretrievethetargetvideothroughafastsearchalgorithm.InnovativelyapplythemodeltothestudyofChinesecharacterrecognition.Throughalargenumberofexperimentaldata,thismodelOrdtp~oriTtStraditionalOCR

6、undersuchvariances.Therefore.thismodelenjoysagoodprospectofapplicationinthefuture.Keywords:chinesecharacterrecognition;videoretrievalmodel:sivrfeature;KMEANS;TFIDF0引言汉字识别的成果的基础l_2J。OCR(OpticalCharacter随着计算机技术的不断进步,我国的汉字识别研Recognition)利用各种模式识别算法分析文字形态特究工作取

7、得了令人瞩目的成果,对实际的国民经济发征_3J,通过光学输入方式获取文字图像信息,并将其转挥着不可或缺的积极效用。由于汉字固有的复杂结换为计算机能够统一识别和存储的内码,从而识别判断出汉字的标准编码。构,数量巨大的字库,使之无论在理论还是在实践上都比少量的西方字符研究困难得多,同时预示着有关西现有的汉字识别OCR软件主要针对扫描的高分方字符的匹配研究并不适用于汉字识别。1966年辨率图像和不包含字幕制作特效的手写或印刷体文IBM公司的Casey和Nagy发表了第一篇关于汉字识字,识别率可以达到99%以上,

8、然而从图像中提取汉别的文章_1J,通过采用模板匹配法识别了1000个印刷字通常都需要首先定位包含汉字的图像区域,当汉字在字体、大小、对齐方式和排列上变化多端,背景复杂体汉字,为随后的国内相关研究做好了铺垫。回顾汉字识别的历程,基于视觉形象思维心理学的分析和基且图像分辨率低时,OCR软件从图像中有效地提取出汉字变得非常困难MJ。特别是当汉字经旋转处理时,于原始图像的统计模式识别方法是取得对超大字符集在实验中oCR几乎不能识别出任

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。