欢迎来到天天文库
浏览记录
ID:5268914
大小:348.74 KB
页数:5页
时间:2017-12-07
《vb60环境下的语音识别程序开发方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、万方数据第12卷第2期2010年6月河北软件职业技术学院学报JournalofHebeiSoftwareInstituteV01.12No.2Jun.2010文章编号:1673.2022(2010)02-0035-05VB6.0环境下的语音识别程序开发方法王军。童强(湖北师范学院计算机科学与技术学院,湖北黄石435002)摘要:语音识别技术是将音频数据转换成文本或其他形式的计算机可以处理的信息技术。语音识别程序就是基于该类技术的计算机应用程序。这类应用程序正越来越多地受到广大用户的青睐。通过介绍一种基于VB6.0环境下的语音识别程序的开发方法,并以此为切入点分析
2、该开发方法的优缺点及其应用前景。结合当前技术的发展趋势,展望这类技术的发展方向和可能的发展结果。关键词:语音识剐;VB6.O;MicrosoftSpeechSDK中图分类号:TP311.11文献标志码:A0引言语音识别是一个复杂的过程,语音识别技术,也被称为自动语音识别AutomaticSpeechRecog-nition(ASR),其目标是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。Iq语音识别技术的应用包括语音拨号、语音导航、室内设备
3、控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。圆语音识别技术具有广阔的应用前景,虽然语音识别技术目前尚未成熟,但很多领域也积极将其引入,掌握语音识别程序的基本开发方法有助于更好地运用这一新技术。1基于VB6.0环境下的语音识别程序的开发方法1.1开发工具语音识别程序一般是基于语音开发工具包开发的,目前常用的工具包有MicrosoftSpeechSDK和IBMVoiceType两种。前者是基于Windows平台开发该类应用程序的最佳工具,其SAPI(Mi—
4、crosoftWin32一compatiblespeechapplicationpro·gramminginterface)提供了实现文字一语音转换(Text—to—Speech)和语音识另1](SpeechRecognition)程序的基本函数,大大简化了语音编程的难度,降低了语音编程的工作量。13】因此,MicrosoftSpeechSDK备受语音识别程序开发者们的青睬。同时MicrosoftSpeechSDK中还包含着一系列支持COM(组件对象模型)组件的语音自动控制接口,只要具备支持OLE(对象连接与嵌入)自动控制的通用语言就可实现该类语音识别应用程序的
5、开发。而VB语言正是具备以上条件的通用性语言之一,因此在VB6.0环境下实现语音识别程序的开发就变得十分简单,这是因为在一些基于Windows的语言开发工具中都会提供与语音识别引擎的良好接口,这使得在基于这些语言开发工具下开发语音识别程序变得异常方便。在VisualBasic环境下,利用事件驱动的编程机制、易用的可视化设计工具,使用Windows内部的广泛应用程序接口(API)函数,以用动态链接库(DLL)、对象的链接与对象连接与嵌入(OLE)、开放式数据连接(ODBC)等技术,可以高效、快速地开发Windows环境下功能强大、图形界面丰富的收稿日期:2009-
6、-05—25基金项目:2009年湖北师范学院学生科研立项项目(200976)作者简介:王军(1987一),男,湖北黄冈人,主要研究方向为人机交互;童强(1968一),男,湖北黄石人,副教授,主要研究方向为人工智能、人机交互。万方数据河北软件职业技术学院学报第12卷应用软件系统。问基于VB6.0环境下的语音识别程序的软硬件配置要求为:安装MicrosoftSpeechSDK5.1,安装麦克风,安装VB6.0集成开发环境,安装Notepad2软件(用于编写XML文件,其他能编写XML文件的工具软件也可)。1.2开发目标语音识别系统的核心即为语音识别内核,语音识别内核
7、能识别音频输入信息并将其转化为应用程序能够识别的目标文本,该目标文本最终被作为命令输入来控制程序的执行。根据识别的对象不同,语音识别任务大体可分为三类,即孤立词识麦Jl
8、(isolatedwordrecognition)、关键词识别(或称关键词检出,keywordspotting)和连续语音识别。其中,孤立词识别的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界
9、”这两个词。[21根据语
此文档下载收益归作者所有