毕业论文__基于matlab的语音识别算法研究

毕业论文__基于matlab的语音识别算法研究

ID:9039478

大小:2.47 MB

页数:51页

时间:2018-04-15

毕业论文__基于matlab的语音识别算法研究_第1页
毕业论文__基于matlab的语音识别算法研究_第2页
毕业论文__基于matlab的语音识别算法研究_第3页
毕业论文__基于matlab的语音识别算法研究_第4页
毕业论文__基于matlab的语音识别算法研究_第5页
资源描述:

《毕业论文__基于matlab的语音识别算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、本科生毕业设计报告学院物理与电子工程学院专业电子信息工程设计题目:基于MATLAB的语音识别算法研究学生姓名指导教师(姓名及职称)班级10电信班学号乐山师范学院毕业设计报告完成日期:2014年4月乐山师范学院毕业设计报告题目:基于MATLAB的语音识别算法研究姓名:物理与电子工程学院电子信息工程学号:摘要:本论文介绍了双门限语音端点检测理论,研究了语音特征参数地提取过程,特征参数包括:线性预测系数(LPC)、线性预测倒谱系数(LPCC)和Mel频率倒频系数(MFCC)。并研究了3种不同的语音识别算法:DTW算法、VQ算法

2、和HMM算法。并且在MATLAB环境中提取了孤立字语音(十个数字0~9的汉语发音)的LPCC、MFCC特征参数,用它们配合上述3种语音识别算法实现了对这些孤立字语音的识别。关键字:MFCC、HMM、DTW、VQ第一章概述1.1语音识别的发展简介语音识别研究开始于二十世纪50年代,Bell实验室实现了第一个可以识别10个英文数字的语音识别系统(Audry)。但是真正取得实质性进展是在60年代末,70年代初,当时提出了动态时间规划(DP)和线性预测分析技术(LP),后者很好地解决了语音的建模问题,到了70年代初,动态时间规整

3、(DTW)解决语音特征长度不一致的问题。这对特定人孤立词的语音识别特别有效。70年代还提出了矢量量化VQ和隐马尔可夫模型HMM的语音识别算法。80年代,这时研究的重点转到了对连续语音的识别,提出了多级的动态时间规划识别算法等,此时设计方法算法从模板匹配到统计模型转变。特别是隐马尔可夫模型HMM语音识别算法的成熟和推广。90年代人们开始研究自然语音的识别,逐渐发展到口语对话和人机语音交互的方面。人工神经网络技术也开始用于语音识别,成为语音识别的一条新途径。我国在80年代后期研究了人机语音对话项目,这个时候,国内的大学和研究

4、所相继研究了语音识别。国外许多公司为语音识别投入大量资金,推动语音识别的研究。1乐山师范学院毕业设计报告1.2语音识别的发展趋势经过了半个世纪地研究发展,目前语音识别技术已经发展到了接近实用的阶段。在实验环境下,识别率很高,达到90%以上,在这样的基础上,语音识别走向了商品化。虽然很多公司开发除了语音识别系统,但是它还主要受到计算的性能和价格的制约,还有很多方面需要改进。1.提高可靠性。语音识别技术的识别率特别受到语音环境的影响,在公共场合,噪音比较大,虽然人耳可以很轻松的屏蔽掉无用信息,或不想要的信息。但是计算机不能屏

5、蔽掉,它会对语音识别率造成严重的干扰,所以必须要采取滤出噪声等措施,提高可靠性。2.增加词汇量。语音识别系统应该有很大的词汇量,让语音识别系统的功能更强大,作用更广人机交互更加智能化,使人们更加方便使用机器。3.应用拓展。可以使用语音识别系统开发一些应用,使人们生活水平更高,更加智能化,享受舒适温馨的生活。4.降低成本减小体积。任何技术商品化,都必须要降低成本,使普遍人们能够使用的起,小体积的识别系统更符合人们的需要,就像计算机一样,从开始的研发的大型计算机,到民用的个人计算机,体积缩小了很多。21世纪是信息和网络的时代

6、,Internet、智能手机、计算机、物联网、移动电话网将会把全球的人与人之间、人与物之间、和物与物之间都相互连接起来。而自然口语对话、智能家居、信息索取、电子商务、语音翻译、数字图书馆等领域,语音识别技术将发挥巨大的作用。1.3论文的内容本论文描述了基本的语音识别基本原理,介绍了语音识别的一般过程。在第二章介绍语音识别的算法所需要的参数提取的过程,包括语音信号预加重、分帧、端点检测,LPCC和MFCC意义和它的提取过程。第三章介绍了动态规划DTW算法、矢量量化算法和隐马尔可夫模型HMM算法语音识别,第四章得出了语音识别

7、的实验结果。第五章做出总结。第二章语音识别的前期准备语音识别系统通常包括以下几个环节:采样量化,加窗分帧,端点检测,特征值向量提取,模板训练和语音识别等。本系统完全采用MATLAB软件在PC机上完成。图2.1为语音识别系统结构图。2乐山师范学院毕业设计报告图2.1语音识别系统框图2.1语音信号的预处理2.1.1语音信号的采样与量化人们发出的语音信号是一个时间和幅度连续模拟信号。语音识别过程是对语音信号进行数字信号处理,所以首先必须要对模拟的语音信号进行数字化,这就叫做模数转化(A/D)。模数转化的内容是采样和量化,数模转

8、化的结果是得到时间和幅度离散的数字信号。采样信号频率必须为原始信号频率的2倍以上(奈奎斯特采样定律),才不会失真而导致丢失信息。平常人发音频率主要范围是40Hz到3400Hz,为满足采样定律,本实验采样频率为8kHz。下图为A/D转换示意图。图2.2A/D转换示意图3乐山师范学院毕业设计报告用WINDOWS录音机对语

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。