欢迎来到天天文库
浏览记录
ID:23260927
大小:74.50 KB
页数:15页
时间:2018-11-06
《试议数字语音处理课程论文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、试议数字语音处理课程论文试议数字语音处理课程论文导读:2语音信号分析基础语音信号的分析主要有时域分析和频域分析两种,其他还有倒谱域分析等。语音信号是一种典型的非平稳信号。语音的形成过程与发音器官的运动密切相关,这种物理运动比起声音振动速度来讲要缓慢得多,因此语音信号可假定为短时平稳的,其频谱特性和某些物理参数在10-30ms时间段内是近似不变的,对语音信号进行语音识别技术浅析【摘要】语音识别是让机器自动识别和理解语音信号,并把语音信号转变为相应的文本或命令的技术,语音识别作为信息技术中一种人机接口的关键技术,具有重要的研究意义和广泛的应用价值。本文具体阐述了语音识别概念、语
2、音识别原理、模式匹配算法等基本知识,并简要介绍了语音识别技术在各领域的应用。【关键词】语音识别;语音识别概念;语音识别原理;模式匹配算法SimpleanalysisofspeechrecognitiontechnologyAbstract:Speechrecognitionistomakethemachineautomaticallyidentifyandunderstandthespeechsignal,andtransformthespeechsignalintoacorrespondingtextormand,speechrecognitionasakeytechno
3、logyofhuman-puterinterfaceininformationtechnology,ithasimportantresearchsignificanceandbroadapplicationvalue.Thispaperelaboratesonthebasicknoatchingalgorithm,andbrieflyintroducestheapplicationofspeechrecognitiontechnologyinallfields.Keyatchingalgorithm引言:语言是人类创造的,是人类区别于其他地球生命的本质特征之一。语音是语言最
4、本质、最自然、最直接的表现形式或载体,是人类交流中最常用的工具。让机器能够听懂人类语言,是人类梦寐以求的理想。用语音实现人机交往1主要包括3项技术,即语音识别、自然语音理解和语音合成。作为智能计算机研究的主导方向和人机语音通信的技术,语音识别技术在工业、交通、军事、医学、民用诸方面,特别是在计算机、信息处理、自动控制、通信与电子系统等领域有着广泛的应用。如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。1.语音识别概念语音识别是将人类的声音信号转化为文字或者指令的过程。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一
5、个分支。语音识别的研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言学和认知科学等许多学科领域,是一个多学科综合性研究领域。根据在不同限制条件下的研究任务,产生了不同的研究领域。这些领域包括:根据对说话人说话方式的要求,可分为孤立字(词)、连接词和连续语音识别系统;根据对说话人的依赖程度,可分为特定人和非特定人语音识别系统;根据词汇量的大小,可分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统。2.语音识别原理2.1语音信号时域模型语音是由空气流激励声道产生的。对于浊音、清音和爆破音三种不同类型的音来说,激励源是不同的。浊音激励源是位于声门处的准周期脉
6、冲序列,清音的激励源是位于声道的某个收缩区的空气湍流(类似于噪声),而爆破音的激励源是位于声道某个闭合点处建立起来的气压及其突然释放。语音生成系统分为三个部分,在声门(声带)以下,称为声门子系统,它产生激励振动,是激励系统:从声门到嘴唇的呼气通道是声道系统:语音从嘴唇辐射出去,所以嘴唇以外是辐射系统。因此,完整的语音信号的数学模型可以用三个子模型:激励模型、声道模型和辐射模型的串联表示。语音信号产生的时域模型如图1所示:图1语音信号时域模型22.2语音信号分析基础语音信号的分析主要有时域分析和频域分析两种,其他还有倒谱域分析等。语音信号是一种典型的非平稳信号。语音的形成过程
7、与发音器官的运动密切相关,这种物理运动比起声音振动速度来讲要缓慢得多,因此语音信号可假定为短时平稳的,其频谱特性和某些物理参数在10-30ms时间段内是近似不变的,对语音信号进行处理都是基于这个假设。语音信号的时域分析参数主要有短时能量、短时平均幅度、短时过零率等,这些参数主要用在语音端点检测中。频域分析参数主要有基音频率、滤波器组参数、线性预测系数(LPC)、线性预测倒谱系数(LPCC)、线谱对参数(LSP)、MEL频率倒谱系数(MFCC)等。2.3语音识别系统面对不同的任务,语音识别系统有不同的设计方案,但是其
此文档下载收益归作者所有