欢迎来到天天文库
浏览记录
ID:44869387
大小:23.50 KB
页数:7页
时间:2019-10-31
《模式识别结课论文 基于Matlab 的语音识别系统》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、模式识别论文题目基于Matlab的语音识别系统Title:thevoicerecognitionsystembasedonmatlab摘要语音是人的自然属性之一,是人类信息交流的基本手段。语音中包含有多种信息,如语义信息、语言信息、说话人信息、情感信息等。语音识别就是从语音信号中识别出这些信息。按照任务的不同,语音识别可以分为四个方面:说话人识别、语种识别、关键词识别和连续语音识别。语音识别是以声音作为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支涉及到生理学、心理学、语言学、计算
2、机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行自然语言通信。语音识别作为一门兼具理论价值与应用价值的研究课题,得到越来越多研究者的兴趣和关注,各种各样的语音识别方法层出不穷。本次课程论文通过分析MFCC系数和语音识别的基本原理,应用Matlab设计实验程序并结合VQ矢量量化模型完成语音识别的VQ实现。本次课程论文通过语音识别的相关的背景、步骤以及原理,设计了一个matlab语音识别实验,并包含了实验的流程和结果。
3、关键词:语音识别;Matlab;模式识别一、引言:近年来,语音识别作为一门兼具理论价值与应用价值的研究课题,得到越来越多研究者的兴趣和关注,各种各样的语音识别方法层出不穷。本次课程论文通过语音识别的基本原理,应用Matlab设计实验程序。语音识别是以声音作为研究对象它是语音信号处理的一个重要研究方向,是模式识别的一个分支涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行自然语言通信。
4、二、.原理分析1语音识别系统的特征提取语音识别系统中的特征提取即提出适合分类的某些信息特征(如说话人,或语言特征,或关键词特征),次特征应能有效地区分不同的模式,而且对同种方式的变化保持相对稳定。目前的语音识别系统主要依靠较低层次的声学特征进行识别。语音识别特征大致可以分为3类:(1)线性预测系数及其派生参数,如线性预测系数、线谱对系数、线性预测倒谱系数及其组合参数。(2)由语音频谱直接导出的参数,如基音及其轮廓、美尔频率倒谱系数、感知线性预测参数、口音敏感倒谱系数。(3)混合参数。混合参数由以上不同
5、的参数组成的矢量。2语音识别系统的分类模型模型建立是指在训练阶段用合适的模型来表征这些参数,使得模型能够代表该语言的语音特性。对模型的选择主要应从语音的类型、所期望的性能、训练和更新的难易程度以及计算量和存储量等方面综合考虑。可分为以下四类:(1)模板匹配模型:从每种模型的训练语句中提取相应的特征矢量,这些特征矢量称为模板。识别时,从语音信号中按同样的处理法提取测试模板,并且与其相应的参考模板相比较。模板匹配模型的不足之处在于不能全面地反映样本分布及统计特性,适应性较差。典型的模板匹配模型有最邻近模型
6、、动态时间规整模型和矢量量化模型。(2)概率统计生成模型(又称参数模型):语音信号具有短时平稳性,通过对稳态特征如基音、声门增益、低阶反射系数的统计分析,可以利用均值、方差等统计量和概率密度函数进行分类判决。概率统计生成模型采用某种概率密度函数来描述语音特性在特性空间的分布情况,并以该概率密度函数的一组参数作为语音模型。概率统计生成模型由于考虑了语音的统计特性,能较全面地反映语音的统计信息,其优点是不用对特征参量在时域上进行规整。典型的概率统计生成模型有隐马尔可夫模型和高斯混合模型。(3)神经网络模型
7、:人工神经网络在某种程度上模拟了生物的感知特性,它是一种分布式并行处理结构的网络模型,具有自组织和自学习能力、很强的复杂分类边界区分能力以及对不完全信息的稳健性,其性能近似理想的分类器。其缺点是训练时间长,动态时间规整哪里弱。目前常用的神经网络模型有多层次感知器、径向基函数网络、自组织映射网络和支持向量机网络等。(4)融合模型:把以上分类方法与不同特征进行有机组合可显著提高语音识别的性能。三、语音识别系统的结构1一个完整的语音识别系统包括预处理、特征提取、模型建立、模式匹配和判决规则等5个部分。语音识
8、别是属于人工智能领域中的一项技术,从本质上讲,语音识别技术是一个语音信号模式识别问题,它由训练(或注册)和识别(或测试)两个阶段完成。从训练语音中提取语音特征、建立参考模型并储存的过程称为训练阶段;从待识别语音中提取语音特征,依据参考模型进行比较和判决的过程称为识别阶段。.2语音信号预处理实际的语音信号是模拟信号,因此在对语音信号进行数字处理之前,首先要将模拟语音信号以采样周期采样,采样周期的选取应根据模拟语音信号的带宽来确定,以避免信号的频域混叠失真。
此文档下载收益归作者所有