一种基于麦克风阵列的声源定位算法研究

一种基于麦克风阵列的声源定位算法研究

ID:9654958

大小:48.50 KB

页数:2页

时间:2018-05-04

一种基于麦克风阵列的声源定位算法研究_第1页
一种基于麦克风阵列的声源定位算法研究_第2页
资源描述:

《一种基于麦克风阵列的声源定位算法研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、一种基于麦克风阵列的声源定位算法研究一种基于麦克风阵列的声源定位算法研究引言  基于麦克风阵列的.LaximumLikelihood,ML)进行加权,得出声源到两两麦克风之间的时延差。但当定位环境混响或噪声较大时,基于GCC的声源定位算法性能会急剧下降,以致无法实现精确定位。为了消除混响及噪声影响,N.Zotkin提出利用延时累加波束成型技术与SRP-PHAT相结合的声源定位算法来解决混响和噪声的影响[8]。JacobBenesty在3.1实验参数设置  为了验证算法的有效性,构.LAGE模型[11]产生。声源采用的是语速较快的纯净语音源。为了方便分析,将声源位置定为(0,0,0)。输入语

2、音信号以48kHz的采样率进行采样,语音数据帧长为1024个采样点,相邻两帧重叠3/4,窗函数为汉明窗(Hamming)。测试的语音长度为10s。麦克风阵列的结构为十字型的13元阵,中心阵元坐标为(2,0,0),阵列的长和宽均为l=1.2m。阵元间的距离s=20cm,声源距阵列中心的距离为d=2m。麦克风阵列结构如图1所示。  图1麦克风阵列结构图  对于实验环境中噪声的影响,设定环境噪声服从高斯分布,且噪声信号与语音信号不相关。因此,相关函  空间搜索方法的优劣直接影响到算法的复杂度及系统的定位时间。传统的离散网格搜索方法存在两个主要问题,一是搜索空间针对整个搜索区域进行,而

3、对于实际的室内环境,部分高度空间出现声源的可能性几乎为零,因此需要对部分空间进行人为压缩;二是搜索网格设置过小,过为单一,导致整个搜索过程迭代次数过多,因此需要对离散网格方法进行局部改进。  考虑到实验所要定位的目标为发音者的头部,根据人头部的大小,设定初始的搜索网格大小为20cm20cm20cm。由于在会议室中,主要保持坐立两种状态,通过对人站立和入座后头部高度的测量,可测得人头部高度集中于100~190cm。由此可将搜索的起始坐标改为(-2,-3,-0.5),终止坐标设为(2,3,0.5)。搜索空间将由72m3改为24m3,初始的搜索网格数为3000。通过计算网格中心点得到的熵值

4、选取其中熵值最小的10个网格,并按照2cm2cm2cm的网格大小继续划分,计算网格中心点的熵值,并选择熵值最小点为声源的位置。  3.2仿真结果  在此,利用Matlab仿真软件对ME算法与GCC-PHAT算法进行比较。仿真中采用的语音数据为10s的男生连续语速录音,原始语音已通过录音软件CoolEdit进行编辑裁剪,尽可能消去非语音帧的存在,并从中任意抽取20帧数据进行分析。定位误差由声源估计位置(,)与声源位置(0,0,0)的距离表示。在混响时间为50ms,信噪比SNR=10dB仿真环境下,ME算法与GCC-PHAT算法的定位性能如图2所示。  图2两种定位算法定位精度比较  通过对

5、两种算法的定位性能进行比较可以看到,采用离散网格搜索方法可以保证将声源估计位置的定位误差准确地判定到20cm20cm20cm范围内,即初始网格大小。但在定位精度上,GCC-PHAT算法的平均定位误差为13.5cm,而ME算法的平均定位误差为5.7cm,优于GCC-PHAT算法。  4结论  本文提出了一种基于最小熵的麦克风阵列声源定位新方法,其特点是根据语音源符合拉普拉斯分布这一特性,采用最小熵值方法实现麦克风阵列时延估计,并利用离散网格方法对声源进行空间搜索。仿真实验结果表明,在同等混响或噪声条件下,本文方法的定位优于GCC-PHAT。考虑到实际语音环境的复杂性,下一步拟简化定位算法,增

6、强定位算法的实时性,并加强算法抗噪声和抗混响的能力,以进一步改进麦克风阵列声源的定位性能。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。