基于matlab的语音识别系统的设计_百度文库(2)

ID：6691297

大小：27.00 KB

页数：5页

时间：2018-01-22

资源描述：

《基于matlab的语音识别系统的设计_百度文库(2)》由会员上传分享，免费在线阅读，更多相关内容在行业资料-天天文库。

1、基于Matlab的语音识别系统的设计_百度文库(2)河南理工大学毕业设计（论文）说明书2近国外最高水平。语音识别发展到一定阶段，世界各国都加快了语音识别引用系统的研究开发，通常连续语音是含有较完整语法信息的连续语句，最接近于人的自然讲话方式，从非连续语音到连续语音的研究面临着很多完全不同的技术难点，非连续语音的识别是一些孤立的声波片段，连续语音则面临着如何切分声波的问题。诸如此类的新问题使连续语音识别率的提高比非连续语音更加困难。经过几十年的发展和摸索，人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍，第一次把这三个特性一起集中于一个系统中，并以此确定了统计方法和模型在语音识别

2、和语音处理中的主流地位。在声学识别层次，以多个说话人发音的大规模语音数据为基础，以马尔可夫链为基础的语音序列建模方法HMM(隐含马尔可夫模型)比较有效的解决了语音信号短时稳定、长时时变的特性，并且能根据一些基本建模单元构造成连续语音的句子模型，达到了比较高的建模精度和建模灵活性。目前在语音识别研究领域非常活跃的课题为稳健语音识别、说话人自适应技术、大词汇量关键词识别算法、语音识别的可信度评测算法、基于类的语言模型和自适应语言模型，以及深层次的自然语音的理解。研究的方向也越来越侧重于口语对话系统。1.3语音识别系统的分类语音识别是近年来十分活跃的一个研究领域。在不远的将来，语音识别技术有可能

3、作为一种重要的人机交互手段，辅助甚至取代传统的键盘、鼠标等输入设备，在个人计算机上进行文字录入和操作控制。本文介绍了语音识别的基本流程、所用到的语音参数算法、语音识别的训练算法和识别算法做初步的探究，主要运用了特定人孤立词识别的DTW算法和非特定人识别的连续HMM算法的Matlab识别系统。语音识别按说话人的讲话方式可分为孤立词(IsolatedWord)识别、连接词(ConnectedWord)识别和连续语音(ContinuousSpeech)识别。孤立词识别是指说话人每次只说一个词或短语，每个词或短语在词汇表中都算作一个词条，一般用在语音电话拨号系统中。连接词语音识别支持一个小的语法网

4、络，其内部形成一个状态机，可以实现简单的家用电器的控制，而复杂的连接词语音识别系统可以用于电话语音查询、航空定票等系统。连续语音识别是指对说话人以日常自然的方式发音，通常特指用于语音录入的听写机。显然，连续非特定人语音识别的难度要大得多，因为不仅有说话人口音的问题，还有协同发音、断字断句、搜索等问题，除了考虑语音的声学模型外还要涉及到语言模型，如构词法、文法等。从识别对象的类型来看，语音识别可以分为特定人(SpeakerDependent)语音识别和非特定人(SpeakerIndependent)语音识别。特定人是指只针对一个用户的语音识别，非特定人则可用于不同的用户。实际上，非特定人语音

5、识别的初始识别率往往都比较低，一般都要求用户花一定的时间对系统进行训练，将系统的参数进行一定的自适应调整，才能使识别率达到满意的程度。非特定人大词表连续语音识别是近几年研究的重点，也是研究的难点。目前的连续语音识别大多是基于HMM(隐马尔可夫模型)框架，并将声学、语言学的知识统一引入来改善这个框架，其硬件平台通常是功能强大的工作站或PC机。河南理工大学毕业设计（论文）说明书31.4语音识别系统的基本构成语音识别系统的典型实现方案为：输入的模拟语音信号首先要进行预处理，包括预滤波、采样和量化、加窗、端点检测、预加重等。语音信号经预处理后，接下来很重要的一环就是特征参数提取。对特征参数的要求是

6、：1，提取的特征参数能有效地代表语音特征，具有很好的区分性。2，各阶参数之间有良好的独立性。3，特征参数要计算方便，最好有高效的计算方法，以保证语音识别的实时实现。在训练阶段，将特征参数进行一定的处理之后，为每个词条得到一个模型，保存为模版库。在识别阶段，语音喜好经过相同的通道得到语音参数，生成测试模版，与参考模版进行匹配，将匹配分数最高的参考模版作为识别结果。同时还可以在很多先验知识的帮助下，提高识别的准确率。1.5语音识别技术难点虽然语音识别已突破了最初对技术的检验阶段，而进入通过对话及系统形象的设计，建立用户喜爱的应用系统时期。然而语音技术本身仍在不断进步，为市场提供更新更好的应用模

7、式和技术。目前，技术及应用的焦点主要集中在三个方面。首先，带口音(Dialect)语音的识别。首先要明确的是，口音是指同一种语言在不同地区的发音有所不同，与同一地区(例如中国)的不同方言是有区别的。例如，中国的八大方言多属于与普通话(北方语系)不同的语系。也就是说是有别于普通话的不同的语言，应该用不同的声学模型来描述。而对于口音的适应性首先是由声学模型本身的品质决定的。对某一种口音，语言的声学模型的适应性决定了基础识别率

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 5



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于matlab的语音识别系统的设计_百度文库(2)

基于matlab的语音识别系统的设计_百度文库(2)

相关文章

相关标签