基于.和sapi的图片语音识别系统

基于.和sapi的图片语音识别系统

ID:23190287

大小:60.00 KB

页数:7页

时间:2018-11-05

基于.和sapi的图片语音识别系统_第1页
基于.和sapi的图片语音识别系统_第2页
基于.和sapi的图片语音识别系统_第3页
基于.和sapi的图片语音识别系统_第4页
基于.和sapi的图片语音识别系统_第5页
资源描述:

《基于.和sapi的图片语音识别系统》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于.和SAPI的图片语音识别系统语音识别是计算机多媒体研究的一个热点。本文对语音识别技术进行了初步研究,成功利用.平台和借助微软SAPI接口实现了一个图片语音查找系统,并给出了该系统实例。关键词:SAPI;C#;.;语音识别1引言  语音识别是信息处理领域的一个重要方向,语音识别通常又可以分为两种工作方式:一种是连续语音听写,这种方式需要语音识别引擎对语音听写过程中上下文以及相同相似发音的词语进行分析、做出判断,实现难度较大。另一种是命令与控制方式(mandandcontrol),在此种方式下,语音识别引擎可以通过对

2、简短的命令语音进行识别,以便执行相应操作。  语音识别技术基础是非常复杂的。正是如此,它获得了世界上著名的公司与研究机构的青睐,语音识别技术正经历着日新月异的改变,其中一些产品已经取得较好的效果,用户可以在上述产品基础之上进行二次开发。2开发图片语音识别系统的条件  语音识别技术的发展涉及人机交互,自然语言处理,人工智能。这使开发人员难以从底层进行应用开发,欣慰的是一些公司与研究机构已经推出他们的研究成果,并且提供了供开发人员使用的开发平台与接口。其中影响比较大的有微软的SAPI、剑桥大学发布的HTK,IBM的viav

3、oice开发平台。本文采用微软的SpeechSDK5.1开发包,它不仅是一个免费的开发包,同时提供对中文的支持。2.1微软SAPI简介  微软的SpeechSDK是基于COM的视窗操作系统开发工具包。这个SDK中含有语音应用程序接口(SAPI)、微软连续语音识别引擎(MCSR)以及串联语音合成(又称文本到语音)引擎(TTS)等等。SAPI中还包括对于低层控制和高度适应性的直接语音管理、训练向导、事件、语法、编译、资源、语音识别管理以及文本到语音管理,其结构如图l所示。               图1SAPI结构  S

4、APIAPI在应用程序和语音引擎之间提供一个高级别的接口。SAPI实现了所有必需的对各种语音引擎的实时的控制和管理等低级别的细节。  SAPI引擎的两个基本类型是文本语音转换系统(TTS)和语音识别系统。TTS系统使用合成语音合成文本字符串和文件到声音音频流。语音识别技术转换人类的声音语音流到可读的文本字符串或者文件。2.2在.应用程序中使用SAPI的准备  安装SAPI5.1语音开发包。  由于SAPI基于anegePic.xml玫瑰大象狮子老虎仙人掌珠穆朗玛峰布达拉宫貂蝉十字军世界杯阿里巴巴乒乓球五星红旗……  采

5、用命令控制型Grammar是为了使语音识别结果准确有效,定义外部Grammar是为了保持以后系统的可扩展性。对于新输入的图片,只要将图片名字加入到图片名字中即可。  开始语音输入事件:privatevoidbtnStart_Click(objectsender,EventArgse){ssrc=nemar(1);srg.CmdLoadFromFile(""ManegePic.xml"",SpeechLoadOption.SLODynamic);//读入规则ssrc.Recognition+=nedSetRuleStat

6、e(srg.Rules.Item(0).Name,SpeechRuleState.SGDSActive);//激活规则}  其中识别最终事件是系统在完整处理输入音频之后得到的最后识别结果,怀疑事件则是因为系统在处理过程中的最相似识别结果。这两个事件在一些环境之下得到的识别结果不同。    识别怀疑事件:privatevoidHypo_Event(intStreamNumber,objectStreamPosition,ISpeechRecoResultResult){textBox2.Text=Result.Phras

7、eInfo.GetText(0,-1,true);}  将系统在处理过程中的最相似结果显示在textBox控件之中。  识别最终事件:voidssrc_Recognition(intStreamNumber,objectStreamPosition,SpeechRecognitionTypeRecognitionType,ISpeechRecoResultResult){textBox1.Text=Result.PhraseInfo.GetText(0,-1,true);//将系统最终结果显示在textBox控件之中。

8、try{Picturebox1.image=Result.PhraseInfo.GetText(0,-1,true).tostring()+”.jpg”;//显示识别结果的图片}Catch(Exceptione){}}  由于篇幅有限,这里仅仅给出了构建语音识别引擎与图片显示部分的代码。完整的系统可以在icrosoftCorpor

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。