欢迎来到天天文库
浏览记录
ID:34917494
大小:3.56 MB
页数:81页
时间:2019-03-14
《基于ROS的智能语音交互系统设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、广东工业大学硕士学位论文(工学硕士)基于ROS的智能语音交互系统设计与实现洪奕鑫二〇一八年五月广东工业大学硕士学位论文分类号:学校代号:11845UDC:密级:学号:2111504061广东工业大学硕士学位论文(工学硕士)基于ROS的智能语音交互系统设计与实现洪奕鑫指导教师姓名、职称:张浩川副教授学科(专业)或领域名称:控制科学与工程学生所属学院:自动化学院论文答辩日期:2018年5月29日ADissertationSubmittedtoGuangdongUniversityofTechnologyfortheDegreeofMaster(MasterofEng
2、ineeringScience)DesignandImplementationofIntelligentVoiceInteractionSystembasedonROSCandidate:HongYixinSupervisor:Prof.ZhangHaochuanMay2018SchoolofAutomationGuangdongUniversityofTechnologyGuangzhou,Guangdong,P.R.China,510006摘要摘要语音作为最自然的人机交互方式之一,近年来在人工智能技术的驱动下取得快速发展,时下语音交互技术正在各个领域潜移默化
3、的改变着人们的生活习惯。智能手机的普及是语音相关产品进入千家万户的契机。语音私人助理如苹果的Siri将语音交互技术带入新的发展高峰;如今智能音箱在家庭娱乐方面犹如新起之秀;与此同时,语音教育机器人层出不穷;某种意义上,语音交互正在悄然崛起。在云端技术架构下利用语音云平台构建具备语音交互功能的产品是当前主流的解决方案,终端设备只需负责语音信号的捕获与最终的音频输出,对于语音识别与语义理解等过程全部由语音云平台完成。该方案的特点是:将主要研发精力转移到终端语音信号处理方面,而在智能决策方面高度依赖于云端语音服务平台。虽然当前以语音交互为卖点的产品形式各异,但产品技术
4、实现方案殊途同归,因此在系统构建方面或多或少存在重复的设计工作,在产品研发阶段将增加开发周期与成本,不利于长远发展。ROS的出现为软件可重用性最大化提供解决方案,它是一种分布式软件设计框架,能够将不同的功能模块划分成节点,然后通过调节节点之间的通信链路以组合出功能差异的系统软件。针对上述在云端架构下构建的语音交互系统存在的一些问题,本文将利用ROS的软件特性对当前云端架构下的语音交互系统框架进行调整。主要工作内容包括以下几个方面:(1)调研传统语音交互系统的实现方案,梳理系统实现关键技术要点。深入研究ROS框架,并通过ROS软件设计思想对传统语音交互系统框架进行
5、调整,以增加系统的可扩展性与可维护性。(2)利用多特征融合与扫描的思想对传统语音端点检测算法进行改进,以提升系统在端点检测环节的准确率。同时为弥补该环节出现误判导致语音帧丢失影响语音识别过程,特别设计前后向语音帧缓存器。(3)为降低终端对云端语义理解服务的依赖,特别设计离线意图识别模型。主要目的在于为线上线下资源协同调度提供前提条件,以便提高系统的响应速度与交互过程的流畅性。关键词:语音交互;ROS;云端模式I广东工业大学硕士学位论文AbstractVoice,asoneofthemostnaturalman-machineinteractionmodes,ha
6、sachievedrapiddevelopmentdrivenbyartificialintelligencetechnologyinrecentyears.Nowadays,voiceinteractiontechnologyischangingpeople'slivinghabitsinvariousfields.Thepopularityofsmartphonesisanopportunityforvoice-relatedproductstoentermillionsofhouseholds.VoicepersonalassistantssuchasAp
7、ple'sSirihavebroughtvoiceinteractiontechnologytonewheightsofdevelopment;nowsmartspeakersarelikenewcomersinhomeentertainment;atthesametime,thereareendlessvoiceeducationrobots;inasense,voiceinteractionisquietlyemerging.Theuseofavoicecloudplatformtobuildaproductwithvoiceinteractioncapab
8、ilitiesunder
此文档下载收益归作者所有