欢迎来到天天文库
浏览记录
ID:30921987
大小:156.07 KB
页数:3页
时间:2019-01-04
《语音识别在多媒体课件中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、语音识别在多媒体课件中的应用研究于洪涛121内蒙古民族大学教育科学学院内蒙古通辽02800()2吉林大学高等教育研究所吉林长春130012内容提要:在介绍Macromedia公司的多媒体开发工具Authorwarc和微软公司的SpeechSDK5.1语音开发包的基础上,通过《FLASH动画设计》课件实例,详细的论述了Authorware中结合MSSpeechSDK5.1开发语音识别多媒体课件的方法。关键词:AuthorwareMSSpeechSDK多媒体课件语音识别一、引言语言是人类交流信息最口然
2、、最有效和方便的手段,让多媒体课件能听懂我们说的话,并按照我们的命令去运行,是多媒体课件开发所追求的1=1标。利用语音识别技术,就能够实现这个目标。语音识别是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的技术。目前,语音识别技术已经从实验室走向实用,许多公司都提供语音识别引擎,IBM公司的ViaVoice械入式语音识别系统,微软公司推出的SpeechSDK提供了一个语音识别和语音合成的二次开发平台,可以识别英语、简体中文和日语,这些语音识别系统为开发语音识别多媒体课件提供了物质条件。
3、kl前,国内许多学者利用SpeechSDK开发出了语音识别系统。例如《火车票查询系统中语音识别的研究及实现》l,J,《机器人手术网络遥控系统中的语音识别》l2J,都是利川SpeechSDK结介VC++开发的。VC卄开发工具,并不适合普通教师用来开发多媒体课件,那么,能不能在教师熟悉的开发软件,如Authorware中实现语音识别功能就是有待于解决的问题。二、Authorware发语音识别多媒体课件概述微软公司SpeechSDK提供关于语音(Speech)处理的一套应用程序编程接口SAPI(Spee
4、chApplicationProgrammingInterface)。SAPI提供了实现文字■语咅转换(Text-to-Speech)和语音识另!)(SpeechRecognition)程序的基本函数,简化了语音编程的难度,降低了语音编程的工作量。SpeechSDK采用COM标准开发,地层协议都以COM组件的形式完全独立于应用程序层,为应用人员屏蔽掉复杂的语音技术,充分体现了COM的优点。VC++、VB等程序都可以开发语音识别程序,日前,大部分基于SpeechSDK语音识别程序都是用VC++开发的
5、,用VC++、VB等开发工具开发多媒体课件,对人多数教师来说有一定的难度。Authorware是开发多媒体课件最常用的工具乙一,提供了十一•种交互,利用这些交互方式可以开发出优秀课件。许多教师都在运用Authorware开发课件,并H取得了丰富的研究成果。在论文《在Authorware中实现多媒体数据库的构造与査询》⑶中介绍了如何在Authorware中访问木地数据库,在论文《运用Authorware7.0制作多媒体课件的儿点技巧》⑷中介绍制多媒体课件经验技巧。笔者查阅了大量关于语音识別和Auth
6、orware的资料,H前国内还没有用Authorware结合SpeechSDK开发具冇语音识别的功能的多媒体课件的案例。而大部分教师都参加Authorware培训,冇一定的Authorware开发多媒体课件的经验,那么能不能用Aulhorware结合SpeechSDK开发语音识别多媒体课件那?Aulhorware并不支持COM编程,不能直接调用SpeechSDK。笔者通过搜索发现alSR.U32扩展函数⑸,alSR.U32是Authorware的一个外部函数,里血提供了一•组函数可以让Author
7、ware利用SpeechSDK实现语音识别。因此我们可以在Authorware屮通过调用外部两数來调用SpeechSDK來开发语音识别多媒体课件。三、《FLASH动画设计》语音识别课件实例(一)《FLASH动画设计》课件简介《FLASH动画设计》多媒体课件是用Authorware开发的,讲解FLASH的五种动画设计方法,既能用与课堂教学,乂适合于个别化学习,课件主菜单如图1所示图1Flash动画设计课件菜单(二)《FLASH动画设计》课件语音识别实现《FLASH动画设计》课件提供了鼠标交互和语音识
8、别两中方式來选取教学内容,用鼠标选取按钮或说出按钮的名称都能进入和应教学内容,关于鼠标交互请参考其他书籍,这里只讨论语音识别的方式。我们对以运用语音來控制课件的运行,说出教学内容的名字,进入相应的学习内容,说“上一页”、“下一页”来进行翻页,说“返回”返回到主菜单,说“退出”关闭课件。SpeechSDK提供了两种识别方式,听写识别方式和命令识别方式,山于听写识别方式识别率底,不能满足教学要求,在这里采用命令识别方式。本程序是用Authorware6.5开发,结构如图2。E2FLAS
此文档下载收益归作者所有