基于STFT的特殊词汇的研究

基于STFT的特殊词汇的研究

ID:40639615

大小:195.50 KB

页数:12页

时间:2019-08-05

基于STFT的特殊词汇的研究_第1页
基于STFT的特殊词汇的研究_第2页
基于STFT的特殊词汇的研究_第3页
基于STFT的特殊词汇的研究_第4页
基于STFT的特殊词汇的研究_第5页
资源描述:

《基于STFT的特殊词汇的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、学科分类号(二级)520.2040本科学生毕业论文(设计)题目:基于STFT的特殊词汇的研究姓名:学号:院 系     专业:网络工程指导教师(职称/学历)2012年 9 月 22 日大学教务处制11基于STFT的特殊词汇识别的研究摘要:语音信号处理是以语音语言学和数字信号处理为基础而形成的一门涉及面很广的综合性学科,与心理、生理学、计算机科学、通信与信息科学以及模式识别和人工智能等学科都有着非常密切的关系。本文介绍了语音信号的基础知识,对语音信号“shop”进行了短时分析,并在MATLAB平台上,对其进行仿真。短时傅

2、里叶变换(STFT,short-timeFouriertransform)是数字信号处理领域一种很重要的算法。是众多科学领域(特别是信号处理、图像处理、量子物理)里的重要的应用工具之一。关键词:词汇识别;短时傅里叶变换;MATLAB1绪论1.1语音识别的背景语音识别(speechRecognition)于1952年由贝尔研究所davis等人首先应用于试验系统的开发,1960年Denes等人成功制作出第一个计算机语音识别系统。而在70年代开始,大量的语音识别研究应用于各个领域,在敏感词孤立词方面取得较大进展,而进入八九十

3、年代之后语音识别的研究思路发生变化,由传统的基于标准模板匹配的技术思路开始转向基于统计模型(HMM)的技术思路,这使得语音识别的技术愈发成熟,由简单的特殊词逐渐向大词汇量,非特定人连续语音识别发展。在我国,不同种类的语音识别系统也已研制成功并且投入使用,在大词汇量,孤立字,连续语音识别方面均取得了较大成就。1.2语音识别研究现状目前,语音识别已经部分应用于实践当中,我们可以对计算机发出命令,将文本转换成音频读出来,或者用PC机记录各类语言。但是,计算机的识别率却不尽如人意,要进行大规模的样本采集,不断地理论创新,才能完

4、全的商业化。就语音现状而言,我们还有很长的一段路要走。中文识别领域,语音识别还未完善,目前的语音模型只是一种概率模型,所谓以语言为基础的文法模型还未取得进展。在硬件资源不断发展的大前提下,一些核心算法要有进一步改进。在适应性上,PC机大量的采集样本,增加了用户的繁琐性。男音、女音、童音、口音、方言,大量的声线样本如果不能被计算机准确的识别,那么系统便没有任何利用价值。在强健性上,语音识别系统也势必要进行完善,在嘈杂环境施工,或者在噪音环境中,计算机的识别会出现偏差,这种环境下必须要有特殊的抗噪设备才能完成任务。可是,这

5、对大多数用户来说是不太可行的。在地下通信,高速公路等特殊环境下的作业,会因为带宽的延迟或者减损而出现偏差,因而在特殊特征的处理中,技术应该有进一步的突破。不仅如此,在多语言混合,无限词汇,算法特征方面,我们的技术仍然还未得到完善,要做到语音识别服务于人类,还有很长的一段路要走。111.3语音识别的发展前景语音识别经历了很长一段时间的渐变过程,之前在巨型机上才能实现的系统现在在小型计算机上也可以发挥其作用,软件技术的不断提高也使得语音识别技术逐渐走向实用,而核心算法,特征提取,声线模型等领域我们也取得了长足的进步,软硬件

6、和理论的结合为我们提供了一个全新的全景。很显然,在不久的将来,它在不久的将来,很可能涉足我们生活的每一个领域,给我们的世界带来巨大的革新,前景是无法估量的。2MATLAB软件介绍2.1MATLAB概述MATLAB是矩阵实验室(MaxtrixLaboratory)的缩写,是以线性代数软件包和特征值计算的子程序为基础发展起来的,用于科学计算和数据可视化的开放型高级编程语言。其优点主要有:高效的数值计算及符号计算功能、图形处理的完整性及可视化、功能丰富的工具箱等。MATLAB为一款不断扩展的成熟的软件。2.2MATLAB功能

7、介绍MATLAB的基本数据为矩阵,指令形式与日常工程中的形式十分相似,因为解决问题的能力要比C等语言完成工作要简便。其功能主要有:数值分析、动态系统的建模和仿真、矩阵计算等,摆脱了传统的程序设计语言的模式,代表了计算机的先进水平。在MATLAB2011a中,新增81种产品更新和缺陷修复程序。3语音信号产生、感知及模型3.1语音信号的产生人的发音器主要有气管、肺、喉、咽鼻以及口。语音的产生是气流由肺部呼出,在喉以及口腔、嘴唇的各种作用下而发出的。语音发出的能量来源于肺部呼出的稳定气流。声带每闭合一次的时间即为基音周期,其

8、倒数为基音频率。基音频率取决于个人的声带大小、厚薄等,范围大致在64-450HZ之间。3.2语音信号模型语音有三种生成系统,声带以下为激励系统,声带到嘴唇是声道系统,嘴唇之外为辐射系统。激励模型分为浊音和清音,间歇的脉冲波为浊音的频谱图,斜三角波形为清音的频谱图,其频谱图形似低通滤波器,其Z变换的全极模型是G(z)=1/(1-g1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。