ocr:不可忽视的智能基础

ocr:不可忽视的智能基础

ID:30986359

大小:63.50 KB

页数:3页

时间:2019-01-05

ocr:不可忽视的智能基础_第1页
ocr:不可忽视的智能基础_第2页
ocr:不可忽视的智能基础_第3页
资源描述:

《ocr:不可忽视的智能基础》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、OCR:不可忽视的智能基础如今在纷繁复杂的金融领域,利用各种证件的ecu技术结合数据分析,对于提升金融行业尤其是互联网金融整体业务流程的效率,降低客户的人力成本,收效显著。什么是Ku?如何利用?等一系列::题随之浮出水面。如今我们不得不正视这样一个事实:人们每天都被文字包围,像办公文件、上课板书、商品介绍等都是由文字组成的,并口这些文字在某一程度上也是语音交互的基础,而这其屮关乎一个关键技术一一临亠光学字符识别。什么是0•U是指光学设备(扫描仪、数码相机等)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,其本质就是利用光学

2、设备去捕获图像并识别文字,将人眼的能力延伸到机器上。此概念是在B年由德国科学家最先提出来的,后来美国科学家也提出了利用技术对文字进行识别的想法。在2•世纪1•年代,M就开始利用Ku技术实现各类文档的数字化;到了■•年代,平板扫描仪的诞生更是让tCu进入了商用阶段。但不管是哪个阶段,那时的ecu设备对于文字背景的要求非常之高,也需要很好的成像质量。•Cu的工作原理一般来讲,Ku的工作原理包括四个部分,分别是:影像输入,通过光学设备将图片转入计算机后,系统会对图片进行一些处理,包括字符格式的分离、二值化处理、图像降噪、倾斜校止、文字特征抽取等,以提升图片的精确度;对比识别,根据

3、字符的不同特征,将Z与数据库进行对比,并利用对比后的识别文字与其可能的相似候选字,根据前后的识别文字找出最合乎逻辑的词,再作出更正,以加强比对的正确性;人工校正,目前为止还没有一款软件的文字识别是百分之百的,所以还需要用户亲自校止,确保输出的准确性;影像输出到Grl、I”、dll等格式。现实中,ecu的发展其实已经相当完善,不过随着人们需求的变更,此种临已经不能满足人们的要求,而在当前自然环境是人们最为关注的新点。自然环境临进展相比于传统的ecu,自然环境ecu最难的部分在于文本检测(将文字从图片中提取出来),因为它具有极大的多样性和明显的不确定性。例如文字中包含多种语言,

4、每种语言含有多种字母,每个字母又可以有不同的大小、字体、颜色、亮度、对比度、排列和对齐方式等;因拍摄图像的随意性,文字区域还可能会产生变形、模糊断裂等现象。另外,背景也是一大干扰因素,例如文字区域附近有非常复杂的纹理;非文字区域有着跟文字区域非常相似的纹理,比如窗户、树叶、栅栏、砖墙等。文本检测首先要从图像中切割出可能存在的文字,即候选连通区域,目前被采取最多的方法是isa(最大平稳极值区域)。当然也有团队在此基础上开发出了自己的一套算法,例如微软研究院在传统检测方法a(极值区域)和ISCU基础之上采用了对比极值区域CEu(3—/IL.叫3),0是与周围的背景有一定对比度的

5、极值区域,在低对比度的图像上比KCu效果更好,而且获得的候选连通区域数量远小于提高了算法的效率。并且,为了提高所获得连通区域的质量,微软乂增加一个算法环节去增强CCUo最后采取了一套基于浅层神经网络的文字/非文字分类算法,进一步提高了对于连通区域字符的辨认率。•Cu的应用前景不管是传统临,还是自然环境临,其参与者还是不少的。在国内,涉足临的企业主要有汉王、文通、百度等,国外的像仏、微软等。此外,市面上也有不少ecu产品,传统的临产品有尚书、汉王等,自然环境0的冇百度翻译、翻译,实用性相当不错。论起eu的应用前景,仅看其隶属于计算机视觉领域的一个分支,再联系到当前人工智能的发

6、展,其前景可想而知。除了翻译、智能购物以外,•Cu未来最大的发展潜力在于人机交互。众所周知,人机交互一直是研究者追求的东西,但是目前也仅仅做到了语音交互和肢体交互。文字代表了人类的所有智慧与思想,如果机器人能够进行文字识别,那将能够进一步获取知识、学习人类,进而与人类进行更为自然的交互,或是协助人类工作,提高效率。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。