基于--MATLAB的语音识别DTW算法设计

基于--MATLAB的语音识别DTW算法设计

ID:35768409

大小:526.50 KB

页数:29页

时间:2019-04-17

基于--MATLAB的语音识别DTW算法设计_第1页
基于--MATLAB的语音识别DTW算法设计_第2页
基于--MATLAB的语音识别DTW算法设计_第3页
基于--MATLAB的语音识别DTW算法设计_第4页
基于--MATLAB的语音识别DTW算法设计_第5页
资源描述:

《基于--MATLAB的语音识别DTW算法设计》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、#目录1概述21.1研究的目的和意义21.2国内外发展状况21.2.1国外研究历史及现状31.2.3国内研究历史及现状42语音识别系统的概述43MATLAB中的语音信号的采集43.1wavrecord函数43.2wavplay函数64语音信号的端点检测64.1语音信号端点检测的流程64.1.1短时能量84.1.2过零率的计算94.1.3双门限端点检测115语音识别参数提取125.1MFCC的基本原理126特定人语音识别算法-DTW算法136.1DTW算法原理146.2DTW算法流程及实验结果167GUI界面的设计177.1图形用户界面设计工具的启动177.3测

2、试与分析18总结20致谢21参考文献22附件23#基于MATLAB的特定人语音识别算法设计摘要在高度发达的社会,语言是一种人类交流最方便的,最速度的信息,在高度发达的社会中,用数字化的方式举行语音的保存、传递、判别、加强和合成等是全部数字化通信过程中最基础、最重要的组成的一部分。由于人类进入信息社会节奏加快,语音信号处理方面的知识被越来越多的地方需要。本设计主要在MATLAB平台下先语音信号的端点检测、预处理,然后提取特征参数,建立两个模块,一个为参考模块,一个为测试模块,然后通过动态时间归整技术(DTW)算法进行匹配,算出匹配结果。最后在用户开发界面(GUI

3、界面)直观地呈现出来。本次设计录制0~10的数字做为参考库(model),测试库(test)中为需要测试及识别的语音,0的序号为11,1~9的数字以相应数字做为文件名的命名。关键词:端点检测;MFCC特征提取;语音识别;DTW算法#1概述1.1研究的目的和意义随着计算机技术和科技成果的的飞速发展,人们早已不再满足于让计算机做一些简单的科学计算和运算,而是向它提出了更高的要求,即要求我们的计算机向智能化方向发展,于是人们便开始了第五代计算机(即智能计算机)的研究。计算机人工智能方面的研究内容有很多,诸如计算机知识处理、专家系统、视觉、计算机语音等。其中人机自然语

4、言的接口是一个非常重要的部分。它要求人工智能计算机能说会听,应此要求出现了语音识别和语音合成两门学科。语音识别是人机通信的关键技术之一,也是一种最为理想的人机通信方式。对于许多应用来说,一个语音识别系统只要一组词汇或命令就能为用户提供一个有效的工具,因此简单有效的特定人语音识别系统就能满足要求。同时特定人语音识别系统具有广阔的应用前景,比如工业命令控制、计算机控制、家庭电器服务、个人移动通信呼叫等,尤其当人手已被占用或无法使用的情况下必须进行声音控制时,更可以起到不可替代的作用,这项技术将给人们的日常生活带来极大的便利。1.2国内外发展状况1.2.1国外研究历

5、史及现状国外的语音识别方面的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,它是第一个可以识别十个英文数字的语音识别系统。  但是真正取得实质性进展,并将其作为一个重要的课题开展研究则是在60年代末70年代初。这首先是因为计算机技术的发展为语音识别的实现提供了硬件和软件的可能,更重要的是语音信号线性预测编码(LPC)技术和动态时间规整(DTW)技术的提出,有效的解决了语音信号的特征提取和不等长匹配问题。实验室语音识别研究的巨大突破产生于20世纪80年代末:人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍,第一次把这三个特性都集

6、成在一个系统中,比较典型的是卡耐基梅隆大学(CarnegieMellonUniversity)的Sphinx系统,它是第一个高性能的非特定人、大词汇量连续语音识别系统。  #这一时期,语音识别研究进一步走向深入,其显著特征是隐马尔可夫模型(HMM)模型和人工神经元网络(ANN)在语音识别中的成功应用。HMM模型的广泛应用应归功于AT&TBell实验室Rabiner等科学家的努力,他们把原本艰涩的HMM纯数学模型工程化,从而为更多研究者了解和认识,从而使统计方法成为了语音识别技术的主流。   20世纪90年代前期,许多著名的大公司如IBM、苹果、AT&T和NTT

7、都对语音识别系统的实用化研究投以巨资。语音识别技术有一个很好的评估机制,那就是识别的准确率,而这项指标在20世纪90年代中后期实验室研究中得到了不断的提高。比较有代表性的是:IBM公司推出的ViaVoice和DragonSystem公司的NaturallySpeaking,Nuance公司的NuanceVoicePlatform语音平台,Microsoft的Whisper,Sun的VoiceTone等。  其中IBM公司于1997年开发出汉语ViaVoice语音识别系统,次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统ViaVoice'98。

8、它带有一个32,000词的基本词汇表,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。