基于microsoft speech sdk 的语音关键词检

基于microsoft speech sdk 的语音关键词检

ID:34554479

大小:499.02 KB

页数:9页

时间:2019-03-07

基于microsoft speech sdk 的语音关键词检_第1页
基于microsoft speech sdk 的语音关键词检_第2页
基于microsoft speech sdk 的语音关键词检_第3页
基于microsoft speech sdk 的语音关键词检_第4页
基于microsoft speech sdk 的语音关键词检_第5页
资源描述:

《基于microsoft speech sdk 的语音关键词检》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、心智与计算433心智与计算,Vol.1,No.4(2007),433-441文章编号:MC-2007-044收稿日期:2007-08-19出版日期:2007-12-30©2007MC–厦门大学信息与技术学院基于MicrosoftSpeechSDK的∗语音关键词检出系统的设计和实现林茜,欧建林,蔡骏(厦门大学智能科学与技术系,福建厦门361005)mikecai@xmu.edu.cn摘要:介绍了一个基于连续语音识别技术的语音关键词检出系统的实现.该系统使用微软语音开发平台MicrosoftSpeechSDK(SAPI)实现了从离线语音库中批量地检出含有指定关键词的语音文件,并提取

2、含有关键词的句子,标注出其中所有的关键词.通过设计关键词检出语法限制了语音识别的语言模型,从而达到检出关键词的目的.同时针对实际应用中需要经常更新关键词、语言模型不固定的问题,采用了动态更新检出语法的方法,使得系统具有实用性.系统还设计了语音命令控制语法以实现语音交互.关键词:关键词检出;MicrosoftSpeechSDK;语音识别中图分类号:TP391.42文献标识码:ATheDesignandImplementationofaSpeechKeywordsRetrievingApplicationBasedonMicrosoftSpeechSDKLINQian,OUJian-

3、Lin,CAIJun(DepartmentofCognitiveScience,XiamenUniversity,Xiamen361005,China)mikecai@xmu.edu.cnAbstract:Thedesignandimplementationofaspeechkeywordsretrievingsystemwhichisbasedoncontinuousspeechrecognitiontechniquesisreported.TheapplicationsystemisdevelopedwithMicrosoftSpeechSDK(SAPI).Itcanretr

4、ieveaudiofilescontainingapredefinedsetofkeywordsfromthecorpusinbatchprocessingandcanproperlymarkallrecognizedkeywords,therefore,thesentencescontainingthe∗基金项目:福建省自然科学基金项目2006J0043;the‘985InnovationProject’onInformationTechnologyofXiamenUniversity(2004-2007)underGrantNo.0000-X07204(厦门大学“985工程”

5、二期信息创新平台项目)基于MicrosoftSpeechSDK的语音关键词检出系统的设计和实现434keywordscanbelocatedinthespeechsentences.Therecognitionlanguagemodelisconfinedbythekeywordsretrievinggrammar,whichcanbemodifiedbygeneratingdynamicgrammar.Thechangeofkeywordsintheapplicationcanbeeasilyperformedbyupdatingthekeywordsretrievinggra

6、mmarcorrespondingly.Furthermore,thespeechcommandandcontrolgrammarisdesignedtofacilitatethespeech-commandmanipulationofthesystem.Keywords:keywordsretrieving;MicrosoftSpeechSDK;speechrecognition1引言语音侦听作为情报获取、追踪的基本途径之一,在军事安全和公共安全领域都有着重要的应用.其基本功能之一是根据需要为系统设定若干关键词,当通讯语音中出现了所设定的关键词的语音,系统就将对应的语音段保存在

7、存储设备中,以便进行详细的人工审听.不包含关键词内容的语音段则作删除或备份存档[1-3]处理.语音关键词识别(speechkeywordspotting或speechwordspotting)是实现此项功能的技术核心.作为语音识别领域的一个重要研究方向,语音关键词识别技术旨在从说话人的内容不受限的连续语音中辨认和确定一组预先定义好的特定词和特定短语.它无需像连续语音识别(continuousspeechrecognition,CSR)那样对连续语音的整体进行识别,而只需提取出语音

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。