语音识别系统ppt课件.ppt

语音识别系统ppt课件.ppt

ID:59765912

大小:3.82 MB

页数:61页

时间:2020-11-23

语音识别系统ppt课件.ppt_第1页
语音识别系统ppt课件.ppt_第2页
语音识别系统ppt课件.ppt_第3页
语音识别系统ppt课件.ppt_第4页
语音识别系统ppt课件.ppt_第5页
资源描述:

《语音识别系统ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、语音识别技术1.声学特征2.声学模型3.语言模型4.语音搜索技术5.系统实现6.语音识别系统的自棒性与鲁棒性7.综合总结声学特征汇报者:线性预测倒谱系数(LPCC)美尔倒谱系数(MFCC)语音动态特征与混合特征仿真与实现线性预测倒谱系数(LPCC)式中,ai为线性预测系数,ci为所求的LPCC参数,P是参数的个数。优点:1.去掉激励信息,主要反映声道特性。2.计算量小-且只需十几个倒谱系数。缺点:1.对辅音的描述能力较差。2.抗噪声性能也较弱。美尔倒谱系数(MFCC)语音信号分帧加窗FFTMel滤波器组Log

2、

3、DCTMel

4、倒谱动态特征与混合特征参数帧->静态特征LPCCMFCCPLP语音帧短时谱共振峰频率及带宽鼻音联合特征谱相关特征KL特征音调特征每帧所包含的特征:动态特征根据静态特征的差分谱来获取单独一种参数往往难以完全反映出每个说话者的个性特征参与组合的特征应该具有区分性、稳定性和独立性混合特征仿真与实现从训练语音中提取特征矢量,得到特征矢量集,通过LBG算法生成码本1.从输入语音中提取特征参数2.由每个模板依次对特征矢量序列进行矢量量化,计算各自的平均量化误差。声学模型汇报者:两声学建模和语言建模现代化的重要组成部分statistica

5、lly-based语音识别算法。隐马尔可夫模型被广泛地使用在许多系统。还有许多其他语言建模等领域的应用智能键盘和文件自动分类技术.。HMM声学建模:马尔可夫模型的概念是一个离散时域有限状态自动机,隐马尔可夫模型HMM是指这一马尔可夫模型的内部状态外界不可见,外界只能看到各个时刻的输出值。对语音识别系统,输出值通常就是从各个帧计算而得的声学特征。用HMM刻画语音信号需作出两个假设,一是内部状态的转移只与上一状态有关,另一是输出值只与当前状态(或当前的状态转移)有关,这两个假设大大降低了模型的复杂度。HMM的打分、解码和训练相应

6、的算法是前向算法、Viterbi算法和前向后向算法。语音识别中使用HMM通常是用从左向右单向、带自环、带跨越的拓扑结构来对识别基元建模,一个音素就是一个三至五状态的HMM,一个词就是构成词的多个音素的HMM串行起来构成的HMM,而连续语音识别的整个模型就是词和静音组合起来的HMM。汉英双语混合建模方法直接合并汉英双语的基本建模单元进行汉英双语混合声学建模,一个很自然的方法就是直接合并二者的PhoneSet,然后按照单一语言的声学建模方法训练双语的声学模型。在我们的汉英双语识别系统里,使用的是从左至右的三状态隐马尔科夫模型(H

7、iddenMarkovModel,简称HMM),与两个单语系统是一致的。汉英双语直接合并的PhoneSetIPA映射—基于知识的汉英双语Phone共享IPA映射法就是根据国际音标协会的发音规则,把特定语言的Phone用国际音标来表示。这也是构建多语言的PhoneSet最简便的方法。其映射过程可简要表示为:合并聚类—数据驱动的汉英双语Phone共享自下而上的合并聚类算法在语音识别领域应用很多,是典型的数据驱动的聚类方法。其优点是不需要先验知识的引导。因此,我们考虑利用合并聚类的方法进行汉英双语的Phone共享,使得共享后双语的

8、Phone和IPA映射方法得到的Phone数目相等,以便于进行比较研究。语言模型汇报者:语言模型IBM公司ViaVoice语音识别软件应用了规则与统计相结合的语言模型。其中,统计语言模型是用概率统计的方法来揭示语言单位内在的统计规律,其中N-Gram简单有效,被广泛使用。N-Gram该模型基于这样一种假设,第n个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。这些概率可以通过直接从语料中统计N个词同时出现的次数得到。语音搜索技术汇报者:语音识别系统模型训练部分识别部分特征提取模型结

9、构的定义在既定的模型结构下,如何选择一种比较好的方法来预测模型的参数采用正确的搜索算法,找到识别基元的边界根据声学模型提供的信息输出合适的声学候选利用语言模型提供的信息得到最终希望的词序列搜索算法的主要目的减少寻找最佳假设的时间和内存的需要,而同时维持最小的搜索错误。搜索的目的获得最佳的词序列,即最大化后验概率,即Pr(x1···xT

10、w1···wN)2.Bayes判别准则这就是所谓的Bayes判别准则,它的计算需要用到两种类型的概率分布:语言模型,即Pr(w1···wN)声学模型,即Pr(x1···xT

11、w1···wN)理

12、论基础:1.搜索算法的主要目的时间同步的搜索算法1.一遍DP搜索常用词典:线性词典和树型词典具体步骤:搜索算法1:动态规划递归剪枝操作声学剪枝语言模型剪枝直方图剪枝基本剪枝策略时间同步的搜索算法(续)2.词图算法使用范围:词图搜索算法主要是在词的混淆度比较高时用来处理多个词的候选。优点:声

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。