欢迎来到天天文库
浏览记录
ID:25254540
大小:209.50 KB
页数:8页
时间:2018-11-19
《lecture paper》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、2011年暑期论文报告学号:020142009035姓名:王滕专业:光信息科学与技术第8页共8页模式识别特殊问题与解决方案摘要:模式识别已经在各个领域与各个学科交叉应用,并且蓬勃发展。然而在与任何学科的交叉过程中都会遇到重重困难。本文就模式识别在脱机手写识别、汉语语音识别、图像识别和文档分类过滤四个领域的四篇高级论文叙述的各自遇到的困难和成就予以概括和简述并提出个人的一点浅薄看法,同时也发现,有好多问题和解决方法的思路是相通的,所以本文也在很大程度上将几篇论文对比类比来看,没有展开大型实验也没有做深入的咨询,都是通
2、过阅读和讨论总结出的文章,水平有限望见谅。关键词:脱机手写识别汉语语音识别图像识别文档的分类与过滤目录:绪论+脱机手写识别…………………………………………………3汉语语音识别…………………………………………………4图像识别…………………………………………………5文档分类与过滤…………………………………………………6绪论:非常有意义地在小学期这短短四个周集中又高效的参加了科学讲座课程的学习。没有长难的公式,没有深奥的理论,只是对四个不同领域纲领式的介绍,但是让我对这四个领域有大致的了解,判断自己的兴趣所在并做一番深入
3、研究,如此,这四堂课的目的也就达到了。四位教授都就世界各大通信电子公司以及杰出人物的历史和事迹做出一番介绍,我想对这些平时耳濡目染也知道很多也就不再赘述。在此,我愿就第三堂课的老师所讲的有关模式识别方面做一个深入阅读,并提出部分自己浅薄的见解,望教授指正。国内外如今对模式识别技术与各大学科的融合十分重视,例如:测绘学、摄影测量与遥感学、地理学、数量地理学、昆虫学、昆虫生理与生化、免疫学、概论、免疫学等等。人们也逐渐清醒得认识到,模式识别确实是与这些学科融合才更有意义,相互交叉的理论方法才使得这门学科蓬勃发展,视觉模
4、型、听觉模型、神经网络模型、贝叶斯决策理论等等高深的理论也是越来越多,超越了原本的语音识别和人脸识别等基本的应用。国际间的交流合作也日益增多,继全国模式识别与机器智能学术会议举办多次后“2007年全国模式识别学术会议”于2007年12月11-12日举行。为了进一步加强国内外同行间的学术交流与合作,由中国自动化学会和中国科学院自动化研究所主办,中国自动化学会模式识别与机器智能专业委员会和模式识别国家重点实验室共同承办的“2008年全国模式识别学术会议”于2008年10月召开,也让这个课题的意义不言而喻。经历这几代人的
5、努力,这门学科正在蒸蒸日上,蓬勃发展。鉴于知识时间有限,不可能展开大的项目研究,便找到几个国内的大学的最新研究报告,以最大的努力深入研究一下,希望对以后的学习有所帮助。正文:什么是模式识别?是指借助计算机,就人类对外部世界某一特定环境中的客体、过程和现象的识别功能(包括视觉、听觉、触觉、判断等)进行自动模拟的科学技术。(摘自全国科学技术名词审定委员会)只是单纯的概念难免有些难于理解。我以一下几个国内高级项目为例,说说自己的想法。第8页共8页第一篇要讨论的叫做《脱机手写识别》(offlinehandwritingre
6、cognition)。首先要考虑两个问题:1、手写文字样本变化很大,也就是说不同人有不同的字体,有些字迹潦草的人写的字连人眼都无法分辨;2、脱机手写识别是识别已经写好了的字,不像联机识别那样有笔顺信息当线索。克服方法:1、找到三个功能函数用来抽取特征。抽取特征的意思是:从已写汉字提取那些不受手写因素影响的,代表文字不变的信息(或者说就是一个汉字不变的特征)。可是困难就在于汉字很难找到什么不变的特征,所以必须先对这个字校正再抽取特征。这三个函数的功能分别是:向左上拉伸,中心水平(垂直)扩展,向右下拉伸。(不好打所以就
7、采用截图了)校正前后可以如图对比:这样便成功解决了大多数汉字识别中的问题。而且这项研究价值极高,1992年在日本对本国汉字库(ETL9B)测试时该系统准确率在97%以上,1995年国家863计划研究测试结果也是位列国家第一。在汉字识别中,常常用到一种叫做最短距离分离器的器材,但是由于尺度不同,所选用的种类也就不同,主要的尺度有一下几种:(1)、城市街区距离:(2)几何距离:(3)马氏距离:第8页共8页(这里:是输入样本的特征向量,是参照特征向量,为X的协方差矩阵。)很显然,这三个计算量是依次增加的,特别是马氏距离,
8、相当于对每个汉字都进行一次PCA变换,计算开销和存储开销都非常大,所以尽管人们已经明白了它们的价值但是应用领域还是相对较少。(PCA变换极难解释也极为复杂,只需要知道它是一种用软件将汉字的各个部分化成数字进行处理的方法就可以了)所以下面讲述怎样解决这个问题的。由于整形变换提供了高质量的特征,城市街区距离计算量又是最小的,虽然不够精确但是却可以进行如下所述的修
此文档下载收益归作者所有