基于opencv的手写数字识别

基于opencv的手写数字识别

ID:20098023

大小:65.51 KB

页数:5页

时间:2018-10-09

基于opencv的手写数字识别_第1页
基于opencv的手写数字识别_第2页
基于opencv的手写数字识别_第3页
基于opencv的手写数字识别_第4页
基于opencv的手写数字识别_第5页
资源描述:

《基于opencv的手写数字识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于opencv的手写数字识另U摘要:随着科技的不断发展,在财务、经济等一系列领域对于使计算机自动识别数字的应用越来越广泛,同时也不断推动着更加精确的识别算法的深入研究。本文提出了一种针对手写数字进行识别的方法,其基本思路是:将opcncv开源库函数与CodcBlocks编译环境相结合,图像预处理后再使用SVM(支持向量机)算法与较权威的MNIST数据集结合识别手写数字。实验结果表明,相比于参考文献中的典型常用算法,该方法大大降低了识别错误率,在统计量样本数比较小的情况下也能获得较为准确的统计规律,

2、该算法可行且有效。本文采集自网络,本站发布的论文均是优质论文,供学习和研宄使用,文中立场与本网站无关,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们删除已转载的信息,如果需耍分享,请保留本段说明。关键词:机器学习;图像处理;手写数字识别;SVM分类算法图像是人们日常生活和工作中随时都会碰到的一种客观的静态描述,对数字图像的深入透彻研究大大方便了我们的生活。目前的对于数字识别的算法主要有K邻近分类算法[1-3]、BP神经网络算法[4]。K近邻分类算法本身简单右效,不需要分类器进行训练,但

3、其计算量较大,可理解性差;传统的BP神经网络收敛速度慢,网络和学习记忆不稳定。本文使用SVM分类算法结合MNIST数据集进行数字的识别,SVM(supportvectormachine)即支持向量机是一种分类算法[5],其优点是在统计量样本数比较小的情况下也能获得较为准确的统计规律。本文着手于研宄机器识别手写数字,此手写数字识别实验主要分为三个部分:图像采集、图像预处理、数字识别。1图像预处理对于摄取到的图片进行数字预处理是实验中重要的步骤之一是实验得出准确结果的前提。采集信号时,周围环境以及摄取设

4、备对采集后的图片影响很大,若不进行图片预处理,往往很难得出正确结果。步骤如下:1.1中值滤波一幅图像中,噪声的出现会使噪声点处的像素值比其周围的像素值相差非常多。可把图像中某一块的数据中所有像素值按大小顺序排列,如此和其他像素值相差很大的噪声点处的像素就会被排到最前或者最末端,再将排在中问的像素值代替模块中的中问的目标像素值,便可右效去除噪声。1.2直方图均衡化直方图均衡化着重于图像灰度级的变换,目的是将图像灰度增强,它在实际工程中使用比较广泛。利用直方图均衡化可以将处理后的图像实际亮度集中的分布在

5、亮度范围的中间区域1.3图像分割对提取到的图片进行图片分割,可将想要得到的数字更清晰的呈现出来。对于最佳阈值的选取,可以采用遍历像素值[1〜254]。(1)首先人工设置初始阈值Th=ThO将原图分为两类;分别计算两类的类内方差:⑷(5)(6)(7)(2)计算两个区域各自的分布概率(8)(9)(3)像素遍历选择选择最佳阈值,根据以下公式判定(10)1.4形态学滤波最基本的形态学滤波是腐蚀和膨胀,考虑到手写数字笔画可能会很粗不易于后期识别,所以采用膨胀的算法思路。一般膨胀是对二值图像进行处理,将此放在预

6、处理最后一步。2数字识别得到摄像头采集并经过处理后的数字图片后,下一步便是识别。识别数字的方式有很多,本文我们使用支持向量机SVM分类算法来实现手写数字识别。深度学习一般的解决思路便是将大景实例用于训练学习,学习后的机器会产生自己的一套识别体系,利用训练好的系统去识别未知的数字。其中SVM分类算法就是这样一个基础的机器学习的思想,在获得大量样本进行大量学习形成学习系统之后,机器形成-套自己用来识别手写数字的规则。随着样本数量的增加,算法会学的更加精确,不断提升自身的准确性。通常对于分类问题,可以将数

7、据集分成三部分:训练集、测试集、交叉验证集。用训练集训练系统从而生成对数字的学习模型,用后者进行准确性验证(优化参数)。在iibimU上,大约运行十分钟便可以完成训练和预测测试集的结果。采用MNIST数据集下载训练数据和测试文件。要注意,摄像机采集之后,为了增强识别效果,对采集到的数字图片进行预处理以达到手写数字图片库的数字模式使识别可以更加准确。酮1ST数据库是一个手写数据库,它有60000个训练样本集,10000个测试样本集。它是NIST数据库的一个子集。下载后的文件并不是标准的图像格式,图像都

8、保存在二进制文件中,每个样本图像的宽高为28*28。在进行编写匹配程序之前要把其转换为普通jpg格式的文件。3结论本文从识别手写数字字符识别入手,通过查阅大量资料得出一套完整的手写数字识别的方法体系,并且在Windows平台下,利用计算机视觉库OpenCv和CodeBlocks环境相结合进行实验,得出结果准确度高。采用的SVM分类算法与和典型的K邻近分类算法、BP神经网络算法相比,识别精度高。但是,在摄取图片背景复杂、图片曝光过度或不足、分辨率低的情况下,各算法还需要

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。