基于dsp的字符识别系统的设计与实现

基于dsp的字符识别系统的设计与实现

ID:28085778

大小:80.04 KB

页数:7页

时间:2018-12-08

基于dsp的字符识别系统的设计与实现_第1页
基于dsp的字符识别系统的设计与实现_第2页
基于dsp的字符识别系统的设计与实现_第3页
基于dsp的字符识别系统的设计与实现_第4页
基于dsp的字符识别系统的设计与实现_第5页
资源描述:

《基于dsp的字符识别系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于DSP的字符识别系统的设计与实现【摘要】本系统(DSP)TMS320VC5509A应用图像处理和字符识别技术,拟实现对一张图片中单个字母与数字的识别、一行数字与字母的识别、多行数字与字母的识别、在同一行中字体大小不一的字母与数字的识别,以及部分汉字的识别等文字信息的处理和识别,并以可编辑的形式输出。【关键词】DSPCCS数字图像处理字符识别随着计算机网络飞速发展,信息电子化已经成为一个时代的必然趋势。文字作为信息中最重要、最集中的载体,其电子化进程显得越来越重要。很多的电子图书、期刊文献和会议论文中都包含着大量有用的信息,但这些文件大都是以PDF格式进行保存的,只能以

2、图片的形式查看,无法直接对其中的文字信息进行复制和编辑,因此如何快捷地获取这些文字信息,一直是困扰着人们的一个难题。本系统实现对字母以及部分汉字的识别和处理并以可编辑形式输出。1系统设计方案2各部分原理一)(1)灰度化彩色图像。实现将一张彩色RGB图像转换成灰度图[1]。日常生活中人们所见到的图像一般为彩色图像,其每个像素点的颜色值由三个字节组成,分别为R(红)、G(绿)、B(蓝)三个分量,每个分量占一个字节,因此每个像素点的颜色变化范围为0〜255*255*255,如果对彩色图像直接进行处理识别的话会非常麻烦,因此本系统将所采集的彩色图像先进行了灰度化处理,使一个字节代

3、表一个像素点,每个像素点的颜色值变化范围为0〜255,从而很大程度上减少了运算量P]。(2)二值化处理。灰度图像的二值化处理,就是将图像上像素点的灰度值设置为0或255,也就是使整个图像呈现出明显的只有黑和白的视觉效果,以便于后期对图像的进一步处理。二值化是图像处理中很重要的一步,二值化后的图像效果很大程度上影响到像识别的准确率[3]。(3)分隔字符。通过算法处理,实现将每一个字符单独分割出来,以便于处理和识别。由于行与行之间、字符与字符之间都是存在空白间隙,利用这一原理可扫描并识别出每一行字符的上下边界,以及每一行中每一个字符的左右边界,从而将每个字符的上下左右边界确定

4、[4],实现字符与字符之间的分割。(2)制作字符库。即制作出一套标准的参照数据库,每个字符都有自己独特的特征,可根据这些特征的不同来区分不同的字符。将分割后每个字符的数据信息与字符库进行特征对比和匹配,从而识别出该字符,最终输出并显示。3各部分算法实现3.1灰度化彩色图像读入彩色图像每一点的索引值,并将此索引值作为该点的灰度值,存入存放该图像的一位数组。3.2二值化处理首先求出图像的最佳阈值,我们采用了迭代法来计算,步骤如下:(1)求出图像灰度的最大和最小值Hmax、Hmin,取初始阈值为其均值,即(Hmax+Hmin)/2,记作T(0);(2)根据阈值T(k)将图像分为

5、前后景,分别求前后景平均灰度值,在对其求平均,作为T(k+1);(3)重复第2步,知道T(k+1)-T(k)我们设定的精度极限,得到最佳阈值。得到最佳阈值后,再对像素点遍历,大于该值的改为255,小于的记为0[5]o3.3分隔字符得到二值化的图像后,需要将一个个的字符单独提取出来。我们利用了图像投影来分割字符。当我们把一行字符沿行方向投影后,我们可以看到一系列分离的堆,每一个堆代表一个字符,这样我们便可以记录堆间空白的位置信息来分割字符[6]。同理,沿列方向投影,我们可以分割出各个行。所以我们首先对图像进行行分割,再对各个行进行字符分割。需要注意,此时分割出的字符在列方向

6、并不是完全去除了白边(由于行分割是对一行的投影,一行的字符高度并不一定相等),所以需要有一个调整的步骤,把分离出来的图像再沿行方向投影,从顶部和底部开始,分别找到第一个非零值后,即以此点位置开始裁剪。通过以上步骤即可得到一个个完全且仅包含一个字符的子图像。3.4特征提取英文字符和简单汉字的结构都不太复杂,我们选择用就一个九维向量来描述它的特征。我们求取上述步骤提取的字符子图像总的非零像素点数。然后将每个子图像等分为9区,求取每区非零像素点数占总点数的比值,作为特征向量的一个值[7]。3.5制作字符库该步骤需要获取标准字符的信息,我们利用Matlab的便捷来进行处理。对标准

7、字符进行上述步骤处理后,会得到各个标准字符的特征向量,整理后作为模板,以待后续识别使用。3.6匹配模板并输出字符的识别部分采用了余弦算法,利用余弦定理来判断其与标准字符的相似性。4测试结果4.1测试结果展示图二、图三(部分字符库字符识别)4.2可识别字符库4.2.1可识别的英文字母以及识别率(单位%)(见表1)4.2.2可识别的数字以及识别率(单位:%)(见表2)4.2.3可识别的汉字以及识别率(单位:%)(见表3)5结语本文提出了基于DSP的字符识别系统的设计,原理与基本算法。通过最后的实验结果,可以表明,系统工作稳定,识别

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。