音频文字自动提取的研究与应用

音频文字自动提取的研究与应用

ID:11465708

大小:279.00 KB

页数:12页

时间:2018-07-12

音频文字自动提取的研究与应用_第1页
音频文字自动提取的研究与应用_第2页
音频文字自动提取的研究与应用_第3页
音频文字自动提取的研究与应用_第4页
音频文字自动提取的研究与应用_第5页
资源描述:

《音频文字自动提取的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、音频文字自动提取的研究与应用摘要:语言是人类最重要的交流工具,文字则是人类用来记录语言的符号系统。本文简要介绍了音频文字自动提取的研究与应用,提出语音识别和音频文字自动提取的重要性。音频文字自动提取从上个世纪五十年代的研究开始,到当前语音识别技术在国际和国内的发展状况。用文字对语音识别的内部模型即HMM模型在语音识别中的应用过程进行了描述。详细讲解了音频文字自动提取的设计与实现步骤,并给出了实验的结果与结果分析。关键词:语音识别;音频文字自动提取;隐马尔科夫模型;THERESEARCHANDAPPLICATIONOFAUTOMATICAUDIOTEXTEXTRACTIONAbstr

2、act:Speechisoneofthemostimportantformsofhumancommunication,whilethetextisatypeofsignusedtorecordthespeech.Theessayfirstlygaveabriefintroductiontobothstudyandapplicationofautomaticaudiotextextraction,thenrenouncedtheimportanceofspeechrecognitionandautomaticaudiotextextraction.Afterwards,theessa

3、yformulatedthedevelopmentofAATEsince1950swhenthetechwasstarted.ThenthewayhowHMMwhichistheinnermoduleofspeechrecognitionispresented.Lastly,there’redesignandrealizationoftheautomaticaudiotextextractionfollowedbyitsexperimentresultandanalysis.Keywords:speechrecognition;automaticaudiotextextractio

4、n;HMMmodel;目录1绪论11.1引言11.2背景及发展现状12语音识别原理22.1原理框图22.2ASR系统训练22.3HMM模型在语音识别中的应用23音频文字自动提取的设计与实现33.1音频素材类型的选取33.2音频素材格式及转码43.3内录获得音频素材43.4音频文字自动提取设计53.5模型的训练54实验54.1实验过程54.2结果及分析75总结与展望8参考文献91绪论1.1引言自动语音识别(AutomaticSpeechRecognition,ASR)技术近年来发展迅速,使人们用语言与计算机进行通信与交流已成为可能。与键盘和鼠标等传统的人机交互方式相比,语音提供了一种

5、更为自然的人机交互界面。音频文字自动提取是以语音识别系统的核心模块为基础,对参考文本和对应语音进行强制对准的过程,其目的在于将音频文字转换为文本文字。作为语音识别领域中一种常见的预处理技术,音频文字自动提取广泛应用在模型训练、多媒体检索、广播电视媒体、计算机辅助语言教学等方面,此外,还可为现场直播的新闻、演讲、会议等生成字幕;为语言教学、游戏娱乐、电影制作等生成多媒体库;为歌曲制作同步的歌词显示等。本文在简介语音识别系统的发展现状的基础上,着重论述音频文字自动提取技术的基本原理和实现过程,并结合实验结果对该技术存在的难点进行分析和讨论。1.2背景及发展现状语音识别最早是在1952年

6、由贝尔研究所工作人员提出,他们研究了世界上第一个能够识别10个英文数字发音的试验系统。正式大规模的研究语音识别是在进入70年代后,在一些词汇上取得了实质性的进展,到了九十年代以后,语音识别技术在应用及产品化方面有的很大的进展。如今在国际上语音识别已经从研究室走向生活应用,注重在实际环境下的语音识别建模,如语音增强和去噪等。现在语音识别更注重对语音信号中所蕴含信息的理解,语音识别从一个语言到多种语言甚至是混合语言的方向发展,语音识别应用产品方面也注意多种技术的组合,更贴近生活。我国语音识别的研究较晚,起步于20世纪50年代,但是由于科技的不断创新以及国家对科学技术的重视,近些年来我国

7、语音识别技术发展的相对较快,研究水平也从实验走向人们的生活。我国在1973年开始进行计算机语音识别,但由于环境所限制,当时的发展仍然很缓慢,进入80年代后,随着计算机等技术的普及,我国一些单位具备了研究语音技术的基本条件,恰好此时国际上对语音识别技术的研究重视并迅速发展,使得我国很多企业纷纷投入到语音识别的这项工作中去。1987年我国启动‘863’计划,暨高科技发展计划,语音识别也因此作为智能计算机研究的重要组成部分。随着‘863’计划的进行,我国开始有规划的对语音识

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。