混响环境中的麦克风阵列语音声源定位与跟踪算法研究

混响环境中的麦克风阵列语音声源定位与跟踪算法研究

ID:33694873

大小:11.52 MB

页数:138页

时间:2019-02-28

混响环境中的麦克风阵列语音声源定位与跟踪算法研究_第1页
混响环境中的麦克风阵列语音声源定位与跟踪算法研究_第2页
混响环境中的麦克风阵列语音声源定位与跟踪算法研究_第3页
混响环境中的麦克风阵列语音声源定位与跟踪算法研究_第4页
混响环境中的麦克风阵列语音声源定位与跟踪算法研究_第5页
资源描述:

《混响环境中的麦克风阵列语音声源定位与跟踪算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、隶劫大◆粤博士学位论文万方数据混响环境中的麦克风阵列语音声源定位与跟踪算法研究本论文获国家自然科学基金项目(60971098)资助。万方数据RESEARCHONSPEECHSOURCELOCALIZATIONANDTRACKINGBASEDONMICROPHONEARRAYINREVERBERANTENVIRONMENTSADissertationSubmittedtoSoutheastUniversityFortheAcademicDegreeofDoctorofEngineeringBYXiaoyanZHAOSupervisedby

2、ProfessorZhenyangⅥUSchoolofInformationScienceandEngineeringSoutheastUniversityJune2014万方数据东南大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。研究生签名:亟dl莹。日

3、期:2Q出吐:!鱼东南大学学位论文使用授权声明东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布(包括以电子信息形式刊登)论文的全部内容或中、英文摘要等部分内容。论文的公布(包括以电子信息形式刊登)授权东南大学研究生院办理。研究生签名:趣垫!童!导师签名研究生签名:巡垫!墨!导师签名期:型I旦夕5.Ib万方数据摘要麦克风阵列己在诸多领域得到广泛应用,包括视频会

4、议、智能机器人、语音增强、语音识别、说话人识别和监控监听系统等。语音声源定位与跟踪在麦克风阵列应用中起着至关重要的作用。然而由于混响、噪声等不利因素的影响,实时的、鲁棒的语音声源定位与跟踪是一项非常困难的工作。本文以在含噪的混响环境中实现实时的、鲁棒的、较高精度的语音声源定位与跟踪为出发点,结合阵列信号处理和语音信号处理的特点,对基于麦克风阵列的语音声源定位与跟踪算法进行了深入地研究。论文的主要研究成果归纳如下:(1)基于聚类搜索的快速相位变换加权可控响应功率(SRP.PHAT:SteeredResponsePower-PhaseTra

5、nsform)声源定位算法。SRP.PHAT算法因其在混响环境中有较强的鲁棒性而成为目前最为流行的声源定位算法之一。然而巨大的计算量是SRP.PHAT算法被运用于实时定位系统的一个最大障碍。对于一个麦克风阵列系统,每个候选位置都对应于一组达到时间差(TDOA:TimeDifferencesofArrival),我们将这组TDOA表示为矢量的形式。利用相邻区域的TDOA矢量相似度比较大的特点,本文提出一种基于聚类搜索的快速SRP.PHAT声源定位算法,该算法包括训练和定位两个阶段。在训练阶段,采用聚类的方法将搜索空间划分为若干类别(子区域

6、),属于同一类别的方位角所对应的TDOA矢量具有较高的相似度,训练过程离线完成,将聚类结果存储于查询表中。在定位阶段,采取由粗到细的搜索策略,首先计算并比较各聚类中心的可控响应功率,确定声源所属的类别,然后计算并比较该类别内所有候选位置的可控响应功率,确定声源的具体方位角。仿真实验和真实环境实验的结果均表明,基于聚类搜索的SRP.PHAT声源定位算法能大幅度地减少计算量,并且能基本保持原算法的鲁棒性和定位精度。(2)基于三线快速搜索的SRP.PHAT算法。为降低SRP.PHAT算法的计算量,提出基于三线快速搜索的SRP.PHAT算法,该

7、算法适用于未知声源处于阵列的远场或近场的情形。基于三线快速搜索的SRP.PHAT算法受启发于柱坐标系下的空间功率谱分布规律,采取由粗到细的搜索策略,包括两个步骤:首先粗略地估计声源的水平方位角并判断声源是位于远场还是近场;然后根据判断结果采取不同的精细搜索方案,确定声源位置的最终估计结果。仿真数据和实际数据的实验结果均表明,本文算法在有效减少计算量的同时具有与原算法相近的定位性能。(3)基于压缩感知的声源定位算法。SRP—PHAT定位算法在混响环境中有较强的鲁棒性,然而在很恶劣的噪声和混响环境下,SRP.PHAT算法的定位性能急剧恶化。

8、本文提出一种基于压缩感知的声源定位算法。该算法将声源定位问题转化稀疏信号的重构问题,利用房间冲激响应构建字典,将每个位置的房间冲激响应作为区别于其它位置的特征。基于压缩感知的声源定位算法首先将麦克风接收信号

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。