第一部分基本理论

第一部分基本理论

ID:30626675

大小:101.50 KB

页数:7页

时间:2019-01-01

第一部分基本理论_第1页
第一部分基本理论_第2页
第一部分基本理论_第3页
第一部分基本理论_第4页
第一部分基本理论_第5页
资源描述:

《第一部分基本理论》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第一部分:基本理论:语音信号处理方法细则解释备注时域处理语音数字化和预处理数字化:取样->量化预处理目的:提升语音信号的高频部分,使信号的频谱变得平坦。以便于进行频谱分析或声道参数分析。短时平均能量和短时平均幅度短时平均能量主要用途:1、可以从清音中区分出浊音2、可以用来确定声母与韵母,无声与有声,连字等的分界。3、可以作为一种超音段信息用于语音识别。短时平均幅度:因为短时平均能量对于高电平信号处理过于灵敏,所以采用短时平局幅度。短时过零分析如果信号按段分割,就称为短时,把各段信号的过零率作统计平均,就是短时平均过零率。短时自相关函数和平均幅度差函数短时自相关函数具有自

2、相关函数所有的性质,是语音信号时域分析的一个重要参量。短时平均幅度差函数与短时自相关函数类似的功效,但运算量和对硬件的要求可以降低许多,相对来说,这种技术应用广泛。高阶统计量一般指高阶矩、高阶累积量、高阶矩谱、高阶累积量谱。时频处理短时傅里叶变换1、是个一个二维函数,也称时频函数。2、物理意义:函数将窗函数的中心移至某处截取信号,再做傅里叶变换。3、矩形窗具有较窄的主瓣,因而具有较高的频率分辨率,但它具有较高的旁瓣,且会产生“破碎”的频谱;采用哈明窗得到的短时频谱却要平滑的多,因而应用的比较普遍。4、短时傅里叶变换以固定的滑动窗对信号进行分析,从而可表征信号的局域频率特

3、性。小波变换1、时域等宽的分析方法并不是对所有信号都合适,例如:在信号的低频端具有很高的频率分辨率,而在高频端的频率分辨率较低。所以出现了小波变换。2、分析的目的:既要看到森林(信号的概貌),又要看到树木(信号的细节)。倒谱同态处理复倒谱和倒谱无论对于语音通信、语音合成还是语音识别,倒谱参数所含的信息都比其他参数多,其缺点是运算量较大。尽管如此,倒谱分析仍是一种有效的语音信号分析方法。语音信号的倒谱分析与同态解卷积将语音信号中的激励信号与声道响应分离,并且只需用十几个倒谱系数就能相当好地描述语音信号的声道响应。避免相位卷绕的算法缘由:在复倒谱分析中,Z变换后得到的是复数

4、,所以取对数时进行的是复对数运算,这时存在相位的多值性问题,称为“相位卷绕”,由于相位卷绕使后面求复倒谱、以及由复倒谱恢复语音等运算均存在不确定性而产生错误。解决方法:最小相位信号法第二部分:语音识别系统项目细节解释备注语料库基本特征1、理论语言学原则指导2、构成和取样按照明确的语言学原则并采取随机抽样方法收集语料,而非简单堆积。1、作为自然语言运用的样本,具有代表性。2、以电子文本形式存储且通过计算机自动处理。3、基于语料库的研究以量化研究为基石,以概率统计为基本手段,以“数据驱动”为基本理念。4、语料文本是一连续的文本或话语片断,而不是孤立的句子和词汇。类型以不同层

5、面来考虑可以划分为不同的类型。语音语料库建立、收集和标注。语音特性描述。863汉语普通话合成语料库语音识别的预处理语音识别单元的选取1、选择原则:首先,对于不同的语言,基元选择的考虑是不同的,例如:汉语,可用“声母—韵母”,也可用音节字、词、等作为识别单元。第二,识别基元选择具有灵活性,用它可以组成其他的语音或语法单位,具有稳定性。灵活性希望基元尽可能地小,如音素;而稳定性则希望基元尽可能地大,如词甚至词组。第三,基元的选择还需要考虑搜索时间模型存储开销。基元选择愈小、存储量愈小,算法愈复杂,正识率愈低。第四,基元选择也与实际用途有关,有限词汇量的识别基元可以选的大一点

6、(如词或短语等);而无限词汇量则应选的小一点(如音素、声母—韵母等)。这是语音识别中非常重要的环节自动分段—端点检测技术作用:用数字处理技术来找出语音信号中的各种段落(如音素、音节、词素、词等)的始点和终点的位置。方式:1、基于能量的端点检测2、基于LPC-10声码器的端点检测。3、基于信息熵的语音端点检测4、基于频带方差的端点检测5、基于倒谱特征的带噪语音信号端点检测6、基于HMM的端点检测方法7、基于分形技术的端点检测8、基于自相关相似距离的端点检测9、基于迟滞编码的端点检测10、实时端点检测算法在汉语中主要目的是找出字的两个端点,进而找出其中声母段和韵母段▲语音信

7、号特征参数基音周期概念:指发浊音时声带震动所引起的周期运动时间间隔。几种有效且实用的的方法:1、自相关法及其改进:区分清音和浊音并估计出基音周期。具体方法:1、先对语音信号进行低通滤波,然后再计算短时自相关函数。2、采用中心削波技术3、用短时幅度差函数来代替短时自相关函数,这样也省去乘法运算从而节约运算时间。2、并行处理法:语音信号经过预处理后形成一系列脉冲,这一串脉冲保留了信号的周期性特征,而略去与基音周期无关的信息;然后由平行的一些简单的检测器估计基音周期。最后在后处理部分,对这几个基音周期检测器的估值作逻辑组合,输出估计的正确周期。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。