手写字符识别系统设计

手写字符识别系统设计

ID:24981618

大小:367.39 KB

页数:10页

时间:2018-11-17

手写字符识别系统设计_第1页
手写字符识别系统设计_第2页
手写字符识别系统设计_第3页
手写字符识别系统设计_第4页
手写字符识别系统设计_第5页
资源描述:

《手写字符识别系统设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、版本:V1.0手写字符识别系统设计说明书湖南大学信息科学与工程学院二0一四年六月9手写字符识别系统任务说明书目录1引言21.1目的21.2阅读对象22项目概述22.1项目简介22.2项目任务22.3实验环境介绍23任务描述33.1背景资料概述33.2系统组成33.3系统评估54机器学习算法介绍54.1支持向量机54.2BP神经网络64.3决策树方法75特征选择86参考资料和实用网站99手写字符识别系统任务说明书1引言1.1目的随着图像处理技术与机器学习技术的发展,机器视觉技术已广泛应用于工业生产、日常生活

2、及城市管理中。字符识别作为机器视觉的一种基本应用,在车牌识别、光学字符识别(OCR,OpticalCharacterRecognition)等应用中均有涉及。本说明书旨在介绍基于常用机器学习算法(如BP神经网络、支持向量机、朴素贝叶斯、K近邻分类)的手写字符识别系统的设计需求,设计方法和环境介绍,帮助学生了解字符识别的基本流程,常用机器学习算法的基本原理,掌握机器视觉应用的开发技术。1.2阅读对象本说明书的阅读对象有:l数字媒体类相关专业学生l相关客户人员,体验用户等2项目概述2.1项目简介本项目旨在基于

3、机器学习算法实现手写字符(包括数字和大小写字母)的识别。该系统通过读入一张图片或通过鼠标绘制字符的方式,实现识别对象的输入,通过BP神经网络、支持向量机、朴素贝叶斯或K近邻分类方法实现手写字符的识别,并输出识别的结果。2.2项目任务项目名称:手写字符识别系统的设计项目内容:1)手写字符的输入;2)图片预处理与特征提取;3)机器学习与字符分类;项目周期:1个月(2014年8月25日——2014年9月20日)参与人数:2~4人。2.3实验环境介绍A)VisualStudio20109手写字符识别系统任务说明书

4、VisualStudio2010是继VC6.0后微软推出的一款新的高级语言编译器,可支持C#、C++、Basic以及Asp等编程语言的开发,具有强大的代码调试功能,是一个功能强大的可视化软件集成开发工具。本项目将使用VisualStudio2010进行代码的编辑、编译与调试。B)VisualAssist为了提高代码编写的效率,可安装VisualAssistX插件。VisualAssistX插件是WholeTomato公司针对VisualStudio开发环境开发的一款代码编写辅助工具,能够实现变量名、函数名

5、的自动提示与补全,以及函数定义与声明之间的快速切换,从而达到提高开发效率的目的。C)OpenCVOpenCV(OpenComputerVision)是一个开源的跨平台计算机视觉库,可以运行于Linux、Windows和MacOS操作系统上。它轻量级而且高效,实现了图像处理和计算机视觉方面的很多通用算法。本项目可利用OpenCV实现图像的读取、显示以及一些基本的预处理算法。网址:http://opencv.org/1任务描述1.1背景资料概述机器学习:利用计算机模拟或实现人类的学习行为,以获取新的知识或技能

6、。因此,机器学习算法通常包括两个阶段:训练和分类。训练阶段,即利用一些已知的训练样本训练得到机器学习算法模型的相应参数。该阶段类似于小孩认字时的学习阶段,老师告诉小孩各种字具有什么样的特征。分类阶段,即对于训练好的算法模型,给定输入数据,计算机自动给出数据的分类。该阶段类似于小孩在进行了学习后可以自主的识字。目前常用的机器学习算法包括:支持向量机(SVM,SupportVectorModel)、BP神经网络、决策树1.2系统组成基于机器学习的手写字符识别系统通常包括四个部分:图像预处理、特征提取、字符训练

7、与字符识别四个阶段,如图1所示。9手写字符识别系统任务说明书图1字符识别系统的功能框架图像预处理:主要包括图像的去噪(中值滤波、高斯滤波),图像的二值化(将彩色图像或灰度图像转化为二值图像),形态学处理(利用闭操作,即先膨胀再腐蚀,将断裂的笔画进行修复)。特征提取:字符图像由一系列二进制的0和1组成,虽然这些数据包含了字符的全部信息,但是这些数据也包含了大量冗余的信息,并不一定适合于机器进行识别。正如我们人类在识别各种物体的时候,也是抓住了物体的某些本质特征。因此,在进行字符识别前,从字符图像中提取尽可能

8、好的特征对于提高识别的正确率具有重要的意义。常用的特征提取的方法包括:(1)直接将字符图像看成是一个一维特征向量,无需其他处理。该方法简单,在有些时候也行之有效,但由于特征维数较高,往往需要大量的训练样本学习算法才能收敛。(2)主成分分析法(PCA,PrincipalComponentAnalysis),该方法在人脸识别中应用较多。(3)基于不变矩的方法字符训练:给定训练样本,每个样本包括字符图像和对应的字符信息,利用相应的机

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。