欢迎来到天天文库
浏览记录
ID:37516064
大小:716.14 KB
页数:10页
时间:2019-05-24
《机器人听觉定位跟踪声源的研究与进展》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、万方数据第33卷第3期2009年5月燕山大学学报JournalofYanshanUniversityVbl.33No.3·May2009文章编号:1007—791X(2009)03-0199—07机器人听觉定位跟踪声源的研究与进展李从清垃’,孙立新1,戴士杰1j,李洙梁1(1.河北工业大学机械工程学院,天津300130;2.天津城市建设学院能源与机械工程系,天津300384;3.哈尔滨工业大学机器人技术与系统国家重点实验室,黑龙江哈尔滨150080)摘要:从基于麦克风阵列和基于人耳听觉机理两个方面综述了当前机器人听觉定位跟踪声源
2、目标的研究动态和发展方向。首先回顾了机器人听觉定位声源的研究历史;其次讨论了两种系统的优缺点;最后指出了未来机器人听觉定位跟踪声源的发展趋势。基于麦克风阵列的声源定位系统,盲波束形成技术是未来进一步研究内容。而基于人耳听觉机理的声源定位系统,运用计算听觉场景分析建立声源定位模型将是未来热点研究内容。关键词:机器人听觉;声源定位;麦克风阵列;计算听觉场景分析中图分类号:TP242.6·TN912.3文献标识码:A0引言机器人的听觉,与它的视觉相比,仍然是处在初期阶段研究的课题。可是,近些年来机器人听觉的研究已经成为机器人研究领域的
3、重要课题。听觉是智能机器人的重要标志之一,是实现人机交互、与环境交互的重要手段。由于声音具有绕过障碍物的特性,在机器人多信息采集系统中,听觉可以与机器人视觉相配合弥补其视觉有限性及不能穿过非透光障碍物的局限性n】。先前机器人导航主要使用测距传感器(如声纳),而跟踪主要依靠视觉拉1。这种形式在视觉场景内被广泛作为定位目标的方式。但是像人和大部分动物那样,视觉场被限制在小于l800的范围内。在真实世界中,听觉能带来3600的“听觉场景”。它能定位不在视觉场景内的声音目标,即定位由物体遮挡造成的模糊目标或在拐角处的声音目标。因此,研究
4、机器人听觉定位跟踪声源目标具有重要的理论意义和实际价值。本文首先论述了国内外基于麦克风阵列的机器人听觉定位跟踪声源系统的研究现状;介绍了当前国内外前沿研究课题的基于人耳听觉机理的双耳定位声源系统的研究进展情况;讨论了两种定位系统各自的优缺点;最后指出了未来机器人听觉定位声源的研究方向和发展趋势。1基于麦克风阵列的声源定位系统麦克风阵列是指由若干麦克风按照一定的方式布置在空间不同位置上组成的阵列。麦克风阵列具有很强的空间选择性,而且不需要移动麦克风就可以获得声源信号,同时还可以在一定范围内实现声源的自适应检测、定位和跟踪。麦克风阵
5、列声源定位是指用麦克风阵列采集声音信号,通过对多道声音信号进行分析和处理在空间中定出一个或多个声源的平面或空间坐标,得到声源的位置。现有声源定位技术可分为3类叫。第一类是基于最大输出功率的可控波束形成技术。它的基本思想是将各阵元采集来的信号进行加权求和形成波束,通过搜索声源的可能位置来引导该波束,修改权值使得麦克风阵列的输出信号功率最大。在传统的波束形成器中,权值取决于各阵元上信号的相位延迟,相位延迟与声达时间延迟(delayofarrival,DOA)有关,因此称为延时求和波束形成器(delay—and-sumbeamfo硼%
6、DASBF)。第收稿日期;2009-03-25基金项目:河北省自然科学基金资助项目(F2007000118):机器人技术与系统国家重点实验室开放基金研究资助项目(SKLRS200716):河北省教育厅基金资助项目(2007315)作者简介:。李从清(1962一),男,天津人,博士研究生,副教授,主要研究方向为机器人听觉系统,Email:congqin96206,@vip.sin&corn。万方数据200燕山大学学报2009二类是基于高分辨率谱估计技术。高分辨率谱估计开发了一种声视联合的机器人定位跟踪系统。该系主要有自回归(aut
7、oregression,AR)模型、最大统包括一个声音活动探测的概率声音定位子系统熵(maximumentropy,ME)法、最小方差估计和使用视觉摄象机的人脸跟踪子系统。它能联合这(minimumvarianceestimation,MVE)法和特征值些子系统弥补话者位置的偏差以及能有效地拒绝分解方法(multiplesignalclassification,MUSIC;从不希望方向进入的不需要的声音或噪音。声源定estimatingsignalparametersviarotationalinvari一位跟踪采用波达延迟方法
8、。但该系统不能从几个人antetechniques,ESPRIT)等方法。该定位的方法混合的声音中提取目标的声音,由声音和视觉系统一般都具有很高的定位精度,但这类方法的计算量产生各种信息也未进行融合。往往都比前类大的多。第三类是基于声达时间差(timediffe
此文档下载收益归作者所有