欢迎来到天天文库
浏览记录
ID:33931991
大小:5.14 MB
页数:75页
时间:2019-02-27
《嵌入式语音识别算法研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、太原理工大学硕+研究生学位论文和存储技术突飞猛进地发展,语音技术的商业应用开始掀起浪潮。很多专家都认为语音识别技术是2000年至2010年间信息技术十大重要的科技发展技术之一。首先是声学建模的方式由基于模板的方法全面向统计建模的转变,其次是HMM(HiddenMarkovModd)和人工神经元网络(AN-N,AartificialNeuralNetwork)在语音识别中得到了成功应用。语音识别技术在90年代从实验室走向实用,许多发达国家如美国、日本、韩国以及IBM,Apple,AT&T’NTT等著名公司都为语音识别系统的实用化开
2、发研究投以巨资,并且逐步实现了商业化的发展。1.1。3语音识别的发展方向目前语音识别技术要进入成熟可靠的实际运用阶段还有一段艰难的道路要走,处必须在很多方面取得突破性进展[21:a.提高可靠性一方面,语音识别技术需要能排除各种声学环境因素的影响。在公共场合,人能够有意识地摒弃环境噪声并从中获取自己所需要的特定声音,但几乎不可能指望计算机能听懂你的话。来自四面八方的环境噪声和背景话音,让它茫然而不知所措,极大地限制了语音识别技术的应用范围,目前,要在嘈杂环境中使用语音识别技术必须有特殊的抗噪(NoiseCancellation)麦
3、克风才能进行,这对多数用户来说是不现实的。另一方面,在日常生活中人们说话有较大的随意性(Spontaneous),常常不经过特殊准备,并带有明显的言语习惯,例如,说话时带有地方口音、重复、停顿、不受语法限制等。相对于在讲话方式和讲话内容都经过特殊准备的符合语法规则的流畅的标准“朗读式语音”丽言的,这种自然口语语音的识别要困难得多。提高可靠性的目的是当使用环境的声学特性与{Jll练语音的收集环境的声学特性不一致或用户的言语方式与训练语音的言语方式不一致时,语音识别系统性能的下降不会太大。b.增加词汇量系统可以识别的词汇的数量是系统
4、能够做什么事情的一个重要度量。如果语音识别系统使用的声学模型和语音模型太过于局限,当用户所讲的词汇超出系统已知的范围,或突然从中文转为英文、法文、俄文,计算机就会常常输出混乱奇怪的结果。随着系统建模方法的改进、搜索算法效率的提高和硬件资源的发展,将来的语音识别系统可能会2太原理工大学硕士研究生学位论文一做到词汇量无限制和多种语言混合,用户在使用时可以不必在语种之间来回切换,不受或少受词汇量的限制。C.降低成本减小体积降低成本是任何技术商业化的重要前提,一般的途径是通过规模生产来摊薄成本。目前降低语音识别技术成本的主要困难在于这项
5、技术仍然处在逐步改进的过程中,对于多数要求较高的功能和性能的应用,往往都带有量身定制的特点,规模生产定型产品的条件尚不成熟。只有在功能和性能非常有限的语音识别应用方面,可以规模生产一些低成本产品,但这些产品的应用常常又受到功能和性能瓶颈的限制。微型化是语音识别技术商业应用的另一个重要途径,这取决于语音识别技术本身进步的程度,也和微电子芯片技术的进一步发展关系密切。将具有先进功能和性能的语音识别应用系统固化到更加微小的芯片或模块上,大幅度降低产品成本,是语音识别技术真正进入大规模应用的重要条件。’‘1.2嵌入式语音识别系统嵌入式语
6、音识别系统是指应用各种先进的微处理器在板卡级或者芯片级用软件或者硬件实现语音识别技术。实验室中基于PC机的大词汇量连续语音识别系统代表着当今语音识别技术的先进水平,但是由于嵌入式平台资源和速度方面的限制,因此需要从算法层面上减小模型规模和搜索空间,提高解码速度,并且在运行规模和运算精度方面寻求平衡。1.2.1嵌入式语音识别系统的研究背景目前一方面在实验室环境下的语音识别算法已经基本成熟,基于HMM(隐马尔可夫模型)和MFCC(美尔倒谱系数)的非特定人语音识别系统成为主流,在标准发音和安静环境的条件下可以取得令人满意的识别正确率。
7、另一方面,随着计算机技术和微电子技术的迅速发展,嵌入式系统应用领域越来越广泛,已经渗透到科学研究、工程设计以及人们的日常生活等方方面面中,而在把语音识别应用到小型便携式嵌入式产品的过程中发现,基于HMM的非特定人语音识别还存在识别性能与识别速度、内存消耗的尖锐矛盾,成为当前语音识别技术在嵌入式系统上进行大规模应用的技术瓶颈。3太原理_【大学硕士研究生学位论文在此背景下,本文在嵌入式系统上建立起基于隐马尔可夫模型(HMM)的语音识别实验平台,并对语音识别的性能进行了测试分析,此外还讨论了非特定人小词汇量语音识别系统在嵌入式平台上的
8、可行性。1.2.2嵌入式语音识别系统的特点嵌入式设备通常针对特定应用而设计,只需要对几十个词的命令进行识别,属于小词汇量语音识别系统,因此嵌入式语音识别技术的要求不在于大词汇量和连续性,而在于识别的准确性与稳健性。对于嵌入式系统而言,还有许多其它因素需要考虑【3
此文档下载收益归作者所有