语音信号处理综述

语音信号处理综述

ID:11315053

大小:27.41 KB

页数:8页

时间:2018-07-11

语音信号处理综述_第1页
语音信号处理综述_第2页
语音信号处理综述_第3页
语音信号处理综述_第4页
语音信号处理综述_第5页
资源描述:

《语音信号处理综述》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、语音信号处理综述摘要:随着信息技术的发展,语音信号处理技术不断地融入到各个领域。作为21世纪信息技术领域最重要的科学技术之一,它成为了人机接口的关键技术,并且越来越受到人们的重视。本文介绍了国内外语音技术的相关发展及该技术在通讯,家具,导航等领域的应用。并对他们的语音技术的优缺点进行了总结。关键词:语音技术通讯ReviewofSpeechSignalProcessingAbstract:Withthedevelopmentofinformationtechnology,theAutomaticSpeechRecognition(ASR)constantlyintothefiel

2、ds.TheASRwhichisonethemostimportanttechnologyininformationfieldsanditisthekeytechnologyoftheman-machineinterface,andwhichismoreandmoreappreciatedbypeople.Thetextintroducesthedevelopmentandapplicationincommunication,householdandnavigationoftheASR.IsummertheadvantagesanddisadvantagesoftheirASR

3、.Keywords:ASRcommunication一、研究语音信号处理技术的背景及其意义随着人们进入信息时代,人们的生活、学习、工作领域也越来越智能化。作为人和这些领域沟通的关键接口,语音信号处理技术自然引起里人们的足够重视。该技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高级技术。通过该技术人们可以不通过键盘的输入过程而直接通过语音进行操作,并且语音技术的应用已经成为一个具有竞争性的新兴高技术产业。如今,语音技术相关产品已经成为了我们生活的一部分,它的作用越来越被重视,人们对当前语音技术的提高也是越来越期待。二、语音处理系统的分类(1)按发音方式分为孤立词、

4、连接词和连续语音的语音识别系统。语音识别系统可能要求说话者以单字、单词、或是短语为发音单位,其间就必须要略微停顿,否则识别就会有问题。以前的语音识别系统,几乎都是以单字或单词为单位的孤立语音识别系统,随着连续语音识别技术渐趋成熟,连续词和连续语音这个最自然的说话方式,将成为语音识别系统的主流。(2)按词汇量大小分为小词表、中词表和大词表以及无限词汇量语音识别系统。如果语音识别系统只为你进行电话拔号,那它只要能听懂10个数字就行了,这属于小词汇量语音识别系统;如果它是为你自动转接话务,那它还应识别单位名、人名和时间等成千上百的词和字,这属于中等词汇量语音识别系统;如果它是把1篇口

5、述的演讲报告转换成为文字,这属于大词汇量语音识别系统。(3)按说话人适应范围分为特定人、限定人和非特定人语音识别系统。特定人系统是指系统在使用前必须由用户输入大量的发音数据、对其进行训练。非特定人系统则试图达到在系统构建成功之后,用户需要事先输入大量的训练数据,即可使用的目的。三、语音信号处理技术研究现状语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的系统,它是第一个可以识别十个英文数字的语音识别系统。但真正取得实质性进展,并将其作为一个重要的课题开展研究则是在60年代末70年代初。这首先是因为计算机技术的发展为语音识别的实现提供了硬件和软件的可能,更重要的是语

6、音信号线性预测编码(LPC)技术和动态时间规整(DTW)技术的提出,有效的解决了语音信号的特征提取和等长匹配问题。这一时期的语音识别主要基于模板匹配原理,研究的领域局限在特定人,小词汇表的孤立词识别,实现了基于线性预测倒谱和DTW技术的特定人孤立词语音识别系统;同时提出了矢量量化(VQ)和马尔可夫模型(HMM)理论。随着应用领域的扩大,小词汇表、特定人、孤立词等这些对语音识别的约束条件需要放宽,与此同时也带来了许多新的问题:第一,词汇表的扩大使得模板的选取和建立发生困难;第二,连续语音中,各个音素、音节以及词之间没有明显的边界,各个发音单位存在受上下文强烈影响的协同发音(Co-

7、articulation)现象;第三,非特定人识别时,不同的人说相同的话相应的声学特征有很大的差异,即使相同的人在不同的时间、生理、心理状态下,说同样内容的话也会有很大的差异;第四,识别的语音中有背景噪声或其他干扰。因此原有的模板匹配方法已不再适用。实验室语音识别研究的巨大突破产生于20世纪80年代末:人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍,第一次把这三个特性都集成在一个系统中,比较典型的是卡耐基梅隆大学的Sphinx系统,它是第一个高性能的非特定人、大词汇量连续语音识

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。