音频文字自动提取的研究与应用

ID：11465708

大小：279.00 KB

页数：12页

时间：2018-07-12

资源描述：

《音频文字自动提取的研究与应用》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、音频文字自动提取的研究与应用摘要:语言是人类最重要的交流工具，文字则是人类用来记录语言的符号系统。本文简要介绍了音频文字自动提取的研究与应用，提出语音识别和音频文字自动提取的重要性。音频文字自动提取从上个世纪五十年代的研究开始，到当前语音识别技术在国际和国内的发展状况。用文字对语音识别的内部模型即HMM模型在语音识别中的应用过程进行了描述。详细讲解了音频文字自动提取的设计与实现步骤，并给出了实验的结果与结果分析。关键词：语音识别；音频文字自动提取；隐马尔科夫模型；THERESEARCHANDAPPLICATIONOFAUTOMATICAUDIOTEXTEXTRACTIONAbstr

2、act:Speechisoneofthemostimportantformsofhumancommunication，whilethetextisatypeofsignusedtorecordthespeech.Theessayfirstlygaveabriefintroductiontobothstudyandapplicationofautomaticaudiotextextraction,thenrenouncedtheimportanceofspeechrecognitionandautomaticaudiotextextraction.Afterwards,theessa

3、yformulatedthedevelopmentofAATEsince1950swhenthetechwasstarted.ThenthewayhowHMMwhichistheinnermoduleofspeechrecognitionispresented.Lastly,there’redesignandrealizationoftheautomaticaudiotextextractionfollowedbyitsexperimentresultandanalysis.Keywords:speechrecognition;automaticaudiotextextractio

4、n;HMMmodel;目录1绪论11.1引言11.2背景及发展现状12语音识别原理22.1原理框图22.2ASR系统训练22.3HMM模型在语音识别中的应用23音频文字自动提取的设计与实现33.1音频素材类型的选取33.2音频素材格式及转码43.3内录获得音频素材43.4音频文字自动提取设计53.5模型的训练54实验54.1实验过程54.2结果及分析75总结与展望8参考文献91绪论1.1引言自动语音识别（AutomaticSpeechRecognition,ASR）技术近年来发展迅速，使人们用语言与计算机进行通信与交流已成为可能。与键盘和鼠标等传统的人机交互方式相比，语音提供了一种

5、更为自然的人机交互界面。音频文字自动提取是以语音识别系统的核心模块为基础，对参考文本和对应语音进行强制对准的过程，其目的在于将音频文字转换为文本文字。作为语音识别领域中一种常见的预处理技术，音频文字自动提取广泛应用在模型训练、多媒体检索、广播电视媒体、计算机辅助语言教学等方面，此外，还可为现场直播的新闻、演讲、会议等生成字幕；为语言教学、游戏娱乐、电影制作等生成多媒体库；为歌曲制作同步的歌词显示等。本文在简介语音识别系统的发展现状的基础上，着重论述音频文字自动提取技术的基本原理和实现过程，并结合实验结果对该技术存在的难点进行分析和讨论。1.2背景及发展现状语音识别最早是在1952年

6、由贝尔研究所工作人员提出，他们研究了世界上第一个能够识别10个英文数字发音的试验系统。正式大规模的研究语音识别是在进入70年代后，在一些词汇上取得了实质性的进展，到了九十年代以后，语音识别技术在应用及产品化方面有的很大的进展。如今在国际上语音识别已经从研究室走向生活应用，注重在实际环境下的语音识别建模，如语音增强和去噪等。现在语音识别更注重对语音信号中所蕴含信息的理解，语音识别从一个语言到多种语言甚至是混合语言的方向发展，语音识别应用产品方面也注意多种技术的组合，更贴近生活。我国语音识别的研究较晚，起步于20世纪50年代，但是由于科技的不断创新以及国家对科学技术的重视，近些年来我国

7、语音识别技术发展的相对较快，研究水平也从实验走向人们的生活。我国在1973年开始进行计算机语音识别，但由于环境所限制，当时的发展仍然很缓慢，进入80年代后，随着计算机等技术的普及，我国一些单位具备了研究语音技术的基本条件，恰好此时国际上对语音识别技术的研究重视并迅速发展，使得我国很多企业纷纷投入到语音识别的这项工作中去。1987年我国启动‘863’计划，暨高科技发展计划，语音识别也因此作为智能计算机研究的重要组成部分。随着‘863’计划的进行，我国开始有规划的对语音识

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 12



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

音频文字自动提取的研究与应用

音频文字自动提取的研究与应用

相关文章

相关标签