欢迎来到天天文库
浏览记录
ID:33615863
大小:2.14 MB
页数:58页
时间:2019-02-27
《基于粒计算的语音实时分段算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、太原理工大学硕士研究生学位论文的短时平均过零率比背景噪声的过零率高出好几倍,两种结合起来成为区别语音信号和背景噪声的一种有效方法。1987年,J.G.Wilpon提出一种基于语音信号短时谱变化来确定子词的分段点的方法。由发声器官的物理特性所决定,语音信号的特性随时间的变化是比较缓慢的,大致可以认为在每10—30ms的时间间隔内信号的特性基本不变。对语音信号进行谱分析,用其谱的峰值点作为子词的分段点;同年Frank.Soong提出一种基于复倒谱系数的分段方法。1991年JanP.vanHemen提出一种基于LPC系数的分段方法,用二帧信号LPC系数的差异作
2、为分段的依据;同年,A.Udje提出一种新的方法,首先用20ms窗取出一帧信号,计算几个复倒谱系数及其增量,能量及其增量,两帧信号间有10ms的重叠。1993年V.RalphAlgazi提出一种基于似然比例系数的分段方法。该方法首先对每帧语音信号建立一个模型,然后计算相邻两模型的似然程度,以似然程度变化的峰值点作为分段点。1994年Erdal提出一种基于语音参数的分段方法。首先通过一定的方法判断此语音段是语音还是背景噪声。对于每个语音帧,将其分为4个5ms的子帧。对于每个5ms的子帧,计算其较为重要的8个参数:归一化的短时低通能量、归一化的短时高通能量、
3、过零率、低频带的一阶、二阶反射系数、前向后向匹配相关系数及它们的乘积。这些参数描述了此语音信号的重要的信息,继而用一定的算法进行推理,从而可以判定此信号是发声段还是非发声段。1995年EuvaldoF.CabralJr提出一种基于轨迹分段的音素分段方法。该算法首先将语音分成几个相等的时间段。每一段用一个N维的矢量表示。据误差相等的原则,将原始信号归类成K个段。同年,张刚等提出一种基于自相关系数的分段方法。1996年Ta.Hsin.Li提出一种基于参数滤波的音素分段算法,该方法以参数滤波的手段测度语音信号相关结构的变化,1997年StanMcClellan
4、提出一种基于谱熵变化的分段方法,该方法的抗噪性能较好。1998年Hon舀aoHu应用小波变换的技术进行音素分段,在降低计算量的同时提高了算法的性能l圳。除了以上几种方法之外,近些年以来,还有短时分形维数的带噪声语音信号分段方法111l;应用倒谱系数作为判决特征的带噪语音分段方法f12】,基于HMM模型的检测方法【131。另外,还有采用多层感知机MLP网络实现语音信号分段的方法【14】、采用自适应线形3太原理工大学硕士研究生学位论文神经元网络(ADALINE)的分段方法f15J,采用Mel域倒谱系数的分段方法1161。随着小波分析在信号处理领域的广泛应用,
5、也有不少基于小波分析语音端点检测算法被提出,如:选择小波部分子带跟踪信号的能量变化以实现端点检测【171,将小波变换模极大值应用于信号突变点的检测11Sl等。本文主要引进一种新的粒计算思想,对包括短时能量和过零率,自相关函数,小波系数,Mel倒谱系数等经常用于进行语音分段的参数进行分析研究,最后得出一种基于粒计算的多参数结合的语音分段实时算法。1.2几种常用的分段方法本节将介绍几种常用的语音分段方法。在很长一段时间里,语音分段算法主要依据的是语音信号的时域特性。其采用的主要参数有短时能量、短时平均过零率、短时自相关等,即通常说的基于能量的分段方法。这些算
6、法在实验室环境下具有良好的性能,而且多数是用于后处理,但在噪声环境下,或者在实时处理的要求下,则无法达到其应有的效果。近年来,随着通信业的迅猛发展,在各行业对通信系统语音质量的客观评价以及语音识别方法等技术实用化的强烈需求下,又出现了很多的语音分段算法。它们主要是通过采用各种新的特征参数,例如Mel倒谱系数、小波系数等也逐渐的被应用到分段算法中。有时,还通过将信号的几种特征组合成为一个新的特征参数来进行语音分段。1.2.1基于短时能量和过零率的语音分段方法为了消除因为人类发声器官本身和因一些采集语音信号的设备等所引起的混叠、高次谐波失真现象,在对语音信号
7、进行分析和处理之前,必须对其进行预处理【19l。语音信号的预处理应尽可能地保证处理后得到的信号更均匀、平滑,且能提高语音的质量。通常的算法如下:首先对语音信号进行分帧处理,然后进行预处理。预处理包括预加重和加窗处理,预加重即信号通过仅有一个零点的滤波器t-l(z);1一Itz~,其中∥接近或等于1。加窗处理是用窗函数w0)来乘一帧的语音信号xO),从而形成加窗语音工。(一);工(刀)·w(以)。然后利用加窗后的语音数据计算各特征参数。1、短时能量n时刻某语音信号x∽)的短时平均能量定义为:4太原理工大学硕士研究生学位论文耻,.鄹P以肛删2(1.1)式中Ⅳ
8、为帧长,窗函数w0)选用矩形窗。短时能量函数可用于区分清音段和浊音段。己值大的对
此文档下载收益归作者所有