欢迎来到天天文库
浏览记录
ID:35191661
大小:1.71 MB
页数:59页
时间:2019-03-21
《探析asr与tts功能在语音增值业务平台中的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、北京邮电大学硕士学位论文ASR与TTS功能在语音增值业务平台中的设计与实现姓名:李国翼申请学位级别:硕士专业:计算机应用技术指导教师:廖建新20060222ASR与TTS功能在语音增值业务平台中的设计与实现摘要随着增值业务的不断发展和移动用户对内容需求的增大,传统的使用数据业务提供内容的方式已不能满足需求。语音增值业务系统通过以话音为主的方式向用户提供内容。作为语音增值业务系统的核心,语音增值业务平台采用VXML(VoiceExtensib[eMarkupLanguage)这一开放标准语言,给业务内容提供商的语音内容业务提供执行平台,进而建立起全新的“运营商——业务提供商—
2、—内容提供商”价值链。ASR(AutomaticSpeechRecognition)与TTS(TexttoSpeech)是语音增值业务平台开展语音业务所需的极为重要的媒体资源能力,它们优化了用户与语音增值业务平台的交互手段,提高了服务质量,而且促使了新的业务的出现。本文对作者攻读硕士学位期间的工作进行了回顾和总结。作者在课题设计期间负责语音增值业务平台中ASR和TTS功能的设计和实现。论文首先分别对语音增值业务系统与语音增值业务平台的概念和结构、ASR与TTS的原理及其标准进行丫介绍。接着重点设计了ASR和TTS功能在VAP(VoiceValue—addedServiceP
3、latform)中的一种基于API的实现方案。VAP的TTSC(TexttoSpeechClient)模块和RN(ResourseNote)模块受控于VXML模块,通过引擎的API与ASR或TTS服务器进行交互来提供ASR与TTS媒体资源。TTSC模块实现文本到语音文件的转换的功能,这种功能适用于对实时性无要求或合成的文本较小的场合。结合TTS引擎API的特点,TTSC模块采用了线程池模式来实现消息的并发处理及资源的动态分配。RN模块在VAP中负责提供各种媒体资源,它由消息分发模块RNManager、资源节点功能模块RNF(ResourceNoteFunction)等组成。
4、RNF模块实现了语音和DTMF音信号的识别及文本的播放,其实现依赖于其它由DSP(DigitalSignalProcess)语音卡提供的媒体资源能力。论文在对并发处理、实时性、资源协作、资源动态分配等关键问题的分析和解决的基础上,完成了RNF模块的设计和实现。论文分别在NMS和Ddialogic两种语音卡上对RNF模块进行了实现,并对这两种实现进行了比较。本文最后分析了基于API的实现方式的缺陷,提出了一种基于MRCP(MediaResourceControlProtoc01)协议的改进方案。使用MRCP协议作为VAP与ASR/TTS服务器的接口的好处是只需要进行一次编码就
5、可以集成所有支持该协议的引擎。论文基于MRCP和NIVlS的fusion对RNF进行了改进,并介绍了下一步的工作及对ASR与TTS的发展进行了展望。关键词:语音增值业务平台,ASR,ITS,MRCPTHEDESIGNANDIM口LEMENTATl0NOFASRANDTTSFUNCTl0NSINVOICEVALUE——ADDEDSERVICEPLATFORMABSTRACTWiththedevelopmentofvalue—addedserviceandtheincreaseinrequirementofmobileusersforcontent.thetraditional
6、Waythatitistoprovidecontentusingdataservicecan’tmeettheneed.AscoreofVoicevalue—addedservicesystemwhichprovidescontentmainlythroughtvoiceinteration.VAP(VoiceValue.addedServicePlatformlusesVXML(、,oiceExtensibleMarkupLanguage)whichisanopenandstardardlanguageandprovideaplatformonwhichvoicecont
7、entserviceofserviceandcontentprovidersruns.AndthenformthenewvaluechainthatiS“telecomunicatinoperator—serviceprovider—contentprovider”.ItiSnecessaryforVAPtObecoupledwithASR(AutomaticSpeechReconition)andTTS(TexttoSpeech)mediaresources,whichprovideabetterwayforcu
此文档下载收益归作者所有