基于投影特征的简谱数字识别方法

基于投影特征的简谱数字识别方法

ID:10136211

大小:33.50 KB

页数:9页

时间:2018-06-11

基于投影特征的简谱数字识别方法_第1页
基于投影特征的简谱数字识别方法_第2页
基于投影特征的简谱数字识别方法_第3页
基于投影特征的简谱数字识别方法_第4页
基于投影特征的简谱数字识别方法_第5页
资源描述:

《基于投影特征的简谱数字识别方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于投影特征的简谱数字识别方法摘要:简谱数字识别是光学乐谱识别中的一个重要分支,传统的识别方法是模板匹配,该方法计算量大,且对模板的依赖性很强,导致其鲁棒性较弱,对图像的噪声和位移敏感。考虑到简谱数字识别规模较小,通过分析数字对噪声较为稳定的几何特征,提出一种改进的投影特征匹配法对简谱数字进行快速识别匹配。理论分析和实验结果表明,改进的投影特征匹配法与传统的模板匹配法相比,识别精度和速度有所提高,鲁棒性也更强。关键词:投影;数字识别;模板匹配;欧氏距离DOIDOI:10.11907/rjdk.151538中图分类号:TP317.4文献标识码:A文章编号:16727800(2015)00

2、6017604作者简介作者简介:高强(1989-),男,湖北黄冈人,武汉工程大学计算机科学与工程学院硕士研究生,研究方向为图像处理与模式识别;余军(1992-),男,湖北天门人,武汉工程大学计算机科学与工程学院硕士研究生,研究方向为模式识别与智能系统;亢治虎(1988-),男,湖北襄阳人,武汉工程大学计算机科学与工程学院硕士研究生,研究方向为无线传感器网络。0引言9光学文字识别[1](OpticalCharacterRecogniton,OCR)是模式识别学科的一个传统研究领域。在音乐界,相对应于光学文字识别,有一个重要分支――光学乐谱识别[2](OpticalMusicRecogni

3、tion,OMR)。有了OMR技术,只需将纸质教材上的乐谱作一个清晰的扫描,由计算机进行演奏或者生成格式化的乐谱文件(MusicXML文件等),这无疑大大简化了录入乐谱的步骤,大幅提高了乐谱录入效率。最为经典的OMR技术莫过于模板匹配法。该方法的基本思想是通过为每个待识别字符定义一个典型的标准模板,然后采用直方图法[3]、轮廓矩[4,5]、欧氏距离[6]、曼哈顿距离[7]等度量方法比较待识别的样本与标准模板,根据度量方法得出的相似度来决定样本与模板是否属于同一类别[8]。由于标准模板的存在,常规模板匹配方法识别与数字模板数字字体一致时的识别率很高,但是它对噪声敏感,并且对数字的不同字体

4、也不具有适应性,鲁棒性不强[9]――当数字的字体字形变化、识别图片的分辨率较低或噪点较多时,该方法的识别率下降。另外,由于常规模板匹配直接涉及到两个图像矩阵级别的运算,其计算量通常较大,时间开销较多[10]。9考虑到简谱中的数字识别规模较小,只有0~7八个数字,可通过分析简谱数字对噪声较为稳定的几何特征和水平或垂直投影特征,避开常规模板匹配法在鲁棒性上的劣势,应用一种改进的投影特征匹配法对简谱数字进行快速识别匹配,并给出具体的算法流程,分析了算法的时间复杂度。理论分析和实验结果表明,改进的投影特征匹配法与传统的模板匹配法相比,识别精度和速度有所提高,鲁棒性也更强。1算法原理1.1预处理

5、相机获取的信息多为32位真彩色信息,但乐谱只有黑白两色,人眼分辨乐谱不需要其它任何颜色信息。因此,在开始数字识别之前,可先采用加权平均值法转换三通道彩色乐谱到单通道灰度图,将彩色图像转换为8位灰度图,将图像的RGB三维信息转换为一维,可大幅度减小计算量,公式如下[11]:上式中,红绿蓝三通道的权值是根据人眼对颜色的敏感度测定的,所以,运用式(1)可以得到较为理想的灰度图像。为进一步减少计算量,还需要做二值化处理。将乐谱背景置为黑色(值为0),音符置为白色(值为255),在方便人眼观察的同时,可以为后续的图像处理技术带来操作上的便利。1.2投影特征匹配9由于待识别的目标结果只有0~7八种

6、数字,采用水平投影法和垂直投影法[12]将图像从二维矩阵降维到一维向量以进行快速匹配。设图像宽度和高度分别为w和h,现对其做水平投影,得到后的向量除以255w,所得到的向量下标对应图片坐标系中的纵坐标,而指定下标的值对应某一像素水平方向所有非零(白色)像素占该图片宽度的百分比。同理再对其做垂直投影,得到后的向量除以255h,则所得到的向量下标对应图片坐标系中的横坐标,而指定下标的值对应某一像素垂直方向所有非零(白色)像素占该图片高度的百分比。其它数字依此类推,所有数字的水平、垂直投影向量如图1所示。观察8个数字及其水平、垂直投影向量的特征,这一步需要选取相对比较稳定,即能够直接从图像上

7、体现出的不怎么受噪声影响、鲁棒性较强的特征来区分它们。可利用大部分图像中都存在的接近于100%的峰值区间,它们的水平位置特征比较具有唯一性。具体区分方法如下:(1)8个数字中,只有2和4的水平投影接近于100%的峰值区间存在于向量后半段(反映到图2中2的灰色部分),但2的垂直投影不存在接近于100%的峰值区间(反映到图2中不存在竖直基本全部贯穿图像的白色连通域),而4的垂直投影存在接近于100%的峰值区间且位置同样在向量后半段(反映到图2中4的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。